Ggf. könnte man übrigens auch ein bisschen schummeln: dann lässt man den Song einfach per Winamp über die Soundkarte laufen, nimmt über das USB-Mikro und Aufnahme-SW auf und schiebt sich dann hinterher beide Spuren zurecht.
Dieses "Zurechtschieben" könnte Probleme machen - ich habe in Ermangelung eines zweiten Firepods versucht, 4 weitere Spuren über meine ESI Maya einzuschleusen. Das Problem sind nicht nur die unterschiedlichen Latenzen der ASIO-Geräte, da könnte man die Clips ja einfach an einem Referenzpunkt synchen. Das wirkliche Problem ist allerdings, dass die Clips nicht nur gegeneinander verschoben sondern auch noch ungleich lang sind! Sprich, man müsste die Signale noch stretchen. Ob das gut klingt? Probiert hab ichs noch nicht. Außerdem setzt dies vorraus, dass die Clips zueinander homogen gestreckt sind, sprich, der Clip vom einen Interface immer 1,0002 mal so schnell läuft wie der andere und diese Verzögerung nicht schwankt.
Hoffe ich bin verstanden worden, ist ein wenig schwierig zu erklären. 
In deinem Fall kann es also passieren, dass dein aufgenommener Clip sich dann gar nicht mehr ohne weiteres über das Playalong legen lässt, bzw du dich wunderst, warum du nach 2 Minuten auf einmal so untight gespielt hast 