Jak eksportować stemy audio do dystrybucji — DME, M&E, LtRt
Miks jest zamknięty, reżyser podpisał. Teraz musisz dostarczyć pliki — i tu zaczynają się schody. Dystrybutor żąda "stemów DME w 5.1", nadawca chce "printmaster plus M&E fully-filled", a platforma streamingowa dorzuca do listy "stereo LtRt fold-down". Trzy skróty, trzy różne zestawy plików, trzy okazje do pomyłki.
Stemy audio to nie kopia zapasowa sesji. To oddzielne deliverables — pliki, które dystrybutor, studio dubbingowe albo nadawca potrzebuje, żeby film funkcjonował na różnych rynkach i platformach. Źle przygotowane stemy oznaczają odrzucenie przez QC, opóźnienie premiery i koszt ponownego otwarcia sesji.
Czym są stemy — i czym nie są
Stem to submiks: grupa ścieżek tego samego typu, przetworzona i wyeksportowana z poziomu, na którym siedzi w finalnym miksie. Trzy podstawowe stemy to:
- DX (Dialogue) — wszystkie dialogi: produkcyjne, ADR, voiceover, narrator. Stem zawiera obróbkę (EQ, kompresja, de-essing), automatykę poziomów i reverb dialogowy.
- MX (Music) — cała muzyka: score, licensed tracks, source music. Z pełną obróbką i automatyką, tak jak brzmi w miksie.
- FX (Effects) — efekty dźwiękowe, sound design, Foley, atmosfery, ambience. Wszystko, co nie jest dialogiem ani muzyką.
Kluczowa zasada: DX + MX + FX = printmaster. Gdy zsumujsz trzy stemy na tych samych poziomach, musisz otrzymać dokładnie ten sam miks, który zatwierdził reżyser. Jeśli suma stemów brzmi inaczej niż printmaster — coś poszło nie tak.
Stemy to nie to samo co "multitrack export" ani "session backup". Multitrack to surowe ścieżki bez obróbki. Stem to gotowy submiks — z efektami, automatyką, w docelowej konfiguracji kanałowej.
DME — trzy stemy, pełna kontrola
DME to po prostu skrót od Dialogue + Music + Effects. Kiedy dystrybutor prosi o "DME", chce trzech osobnych stemów (DX, MX, FX), każdy w tej samej konfiguracji kanałowej co printmaster.
Konfiguracja kanałowa
Jeśli printmaster jest w 5.1, każdy stem DME musi być w 5.1 — sześć kanałów: L, C, R, Ls, Rs, LFE. To oznacza, że dla jednego formatu miksu dostarczasz:
- Printmaster 5.1 — 6 kanałów
- DX 5.1 — 6 kanałów
- MX 5.1 — 6 kanałów
- FX 5.1 — 6 kanałów
Razem 24 kanały audio w samych stemach i printmasterze. Przy Atmos (7.1.4 bed) liczba rośnie odpowiednio.
Dipped vs. undipped
Stemy mogą być dipped (z automatyką poziomów z miksu) albo undipped (na stałym, nominalnym poziomie). Większość platform i dystrybutorów wymaga stemów dipped — czyli takich, które po zsumowaniu odtworzą oryginalny miks. Jeśli w scenie muzyka była ściszona pod dialogiem, stem MX musi to odzwierciedlać.
Stemy undipped są przydatne dla re-recording mixera, który chce mieć swobodę. Ale w kontekście deliverables to wyjątek, nie reguła. Jeśli spec sheet nie precyzuje — domyślnie dostarczaj dipped.
Format plików
Standard branżowy:
- BWF (Broadcast Wave Format) — WAV z metadanymi timecode. 48 kHz, 24-bit, PCM.
- Każdy stem jako osobny plik lub zestaw plików mono (jeden plik na kanał).
- Nazewnictwo zgodne z konwencją platformy, np.
TYTUŁ_DX_51_YYYYMMDD.wav. - Wszystkie stemy tej samej długości, z identycznym timecode startu.
M&E — klucz do dystrybucji międzynarodowej
M&E (Music & Effects) to miks bez dialogu — MX + FX zsumowane razem. Studio dubbingowe bierze M&E, nagrywa dialogi w nowym języku i kładzie je na wierzch. Gotowa wersja językowa.
Brzmi prosto. W praktyce M&E to jeden z najtrudniejszych elementów deliverables.
Fully-filled M&E
Platformy streamingowe i dystrybutorzy wymagają M&E fully-filled. To znaczy: M&E musi zawierać absolutnie każdy dźwięk obecny w finalnym miksie oprócz dialogu. Każdy. Łącznie z dźwiękami, które w oryginalnym miksie były zamaskowane przez dialog.
Co to oznacza w praktyce:
- Foley pod dialogiem — kroki, szelesty ubrań, manipulacje rekwizytami w scenach dialogowych. W produkcyjnym nagraniu te dźwięki są złapane razem z dialogiem. Gdy usuniesz dialog, znikają. Foley artist musi je odtworzyć osobno.
- Atmosfery i room tone — ciągły ambient, który w oryginale był pod dialogiem. Musi płynnie przechodzić przez sceny dialogowe bez dziur i zmian charakteru.
- Walla i tłum — niespecyficzne odgłosy tłumu trafiają do M&E. Rozpoznawalne dialogi tłumu (okrzyki, skandowania) — na osobne ścieżki opcjonalne.
Unfilled M&E — czyli prosty miks MX + FX bez dodatkowych wypełnień — to minimum dla niskobudżetowych produkcji, które nie mają budżetu na Foley. Studio dubbingowe może z tego pracować, ale jakość wersji językowej będzie niższa. Sceny dialogowe będą brzmiały pusto.
Jak to wygląda w sesji
W Pro Tools typowy setup M&E wygląda tak:
- Stem MX (muzyka) — wyeksportowany z miksu.
- Stem FX (efekty) — wyeksportowany z miksu.
- Dodatkowe ścieżki Foley pokrywające sceny dialogowe.
- Wypełnienia atmosferami pod dialogiem.
- Suma tych elementów = M&E fully-filled.
M&E testuje się, odtwarzając go równocześnie z obrazem. Jeśli pod dialogiem słyszysz ciszę, dziurę w atmosferze albo nagłą zmianę charakteru ambientu — M&E nie jest fully-filled.
Netflix wymaga, żeby M&E w 5.1 dawało po zsumowaniu z DX dokładnie ten sam wynik co printmaster. To weryfikowalny warunek — i QC go sprawdza.
LtRt — stereo z zakodowanym surroundem
LtRt (Left total / Right total) to stereo downmix z miksu 5.1, w którym informacja surround jest zakodowana matrycowo metodą Dolby Surround (Pro Logic). Sygnał LtRt gra poprawnie jako zwykłe stereo, ale dekoder Dolby Pro Logic potrafi z niego odtworzyć cztery kanały: lewy, centrum, prawy i surround (mono).
LtRt vs. LoRo
Alternatywą jest LoRo (Left only / Right only) — konwencjonalny fold-down do stereo bez kodowania matrycowego. Różnica:
- LoRo — prosty downmix. Kanał C dodany do L i R z tłumieniem -3 dB, kanały surround dodane do L i R z tłumieniem -3 dB. Wynik: czyste stereo, bez możliwości dekodowania do surround.
- LtRt — kanały surround są sumowane do jednego sygnału "S" i dodawane z przesunięciem fazowym (90 stopni) do kanałów L i R. Dekoder Pro Logic rozpoznaje tę relację fazową i odtwarza surround.
Kiedy LtRt, kiedy LoRo
- Broadcast — nadawcy telewizyjni często wymagają LtRt jako standardowego stereo deliverable, bo dekodery Pro Logic w telewizorach mogą z niego odtworzyć quasi-surround.
- Netflix — akceptuje oba, preferuje LoRo. Specyfikacja mówi: "Lo/Ro or LT/RT mix to be mono compatible."
- Dystrybucja kinowa — DCP zawiera surround dyskretny, LtRt nie jest potrzebny.
- YouTube / web — LoRo lub dedykowany miks stereo. LtRt nie ma sensu, bo odbiorca i tak słucha na słuchawkach lub głośnikach laptopa.
Pułapki LtRt
LtRt to kompromis. Kodowanie matrycowe nie zachowuje pełnej separacji kanałów — dekodowany surround jest mono (nie stereo Ls/Rs jak w 5.1), a kanał centrum ma ograniczoną separację od L/R. Dlatego:
- Nie polegaj na automatycznym fold-down z DAW bez odsłuchu. Przełóż wynik na głośniki i posłuchaj, czy dialog jest czytelny i czy faza nie powoduje artefaktów.
- LtRt zwinięty do mono traci informację surround (sygnały w przeciwfazie się kasują). LoRo jest bezpieczniejszy pod kątem kompatybilności mono.
- Jeśli spec sheet nie precyzuje — zapytaj dystrybutora. Dostarczenie LtRt zamiast LoRo (lub odwrotnie) to powód do odrzucenia.
Printmaster — punkt odniesienia
Printmaster (PM) to finalny, zatwierdzony miks — jeden plik (lub zestaw plików mono) zawierający kompletny soundtrack. Wszystkie stemy, M&E i downmixy powinny być weryfikowane względem printmastera.
Typowy zestaw deliverables dla platformy streamingowej:
| Element | Format | Kanały |
|---|---|---|
| Printmaster | BWF, 48 kHz/24-bit | 5.1 (lub 7.1.4 Atmos) |
| DX stem | BWF, 48 kHz/24-bit | 5.1 |
| MX stem | BWF, 48 kHz/24-bit | 5.1 |
| FX stem | BWF, 48 kHz/24-bit | 5.1 |
| M&E fully-filled | BWF, 48 kHz/24-bit | 5.1 |
| Stereo Lo/Ro lub LtRt | BWF, 48 kHz/24-bit | 2.0 |
Przy dystrybucji kinowej dochodzi DCP z audio w MXF. Przy Atmos — ADM BWF z metadanymi obiektów.
Specyfikacje platform — co dokładnie żądają
Netflix
- Stemy DX, MX, FX w 5.1, dipped, sumujące się do printmastera.
- M&E fully-filled w 5.1.
- Stereo Lo/Ro (preferowane) lub LtRt.
- Loudness: -27 LKFS (±2 LU), dialogue-gated. True peak: -2 dBTP.
- Pliki PCM BWF, 48 kHz, 24-bit.
Broadcast (EBU R128)
- Printmaster stereo lub 5.1.
- M&E — zależy od nadawcy.
- Stereo LtRt wymagany przez wielu nadawców europejskich.
- Loudness: -23 LUFS (±0,5 LU), integrated. True peak: -1 dBTP.
Dystrybucja kinowa (DCP)
- Audio jako MXF, PCM, 48 kHz lub 96 kHz, 24-bit.
- Konfiguracja 5.1, 7.1 lub Atmos.
- Kanały mapowane według SMPTE ST 428-12.
- Stemy DME dostarczane osobno — nie w DCP, ale jako osobna paczka dla dystrybutora.
Najczęstsze błędy przy eksporcie stemów
Na podstawie typowych odrzuceń QC — lista problemów, które powtarzają się przy dostawach stemów.
Stemy nie sumują się do printmastera
Najczęstsza przyczyna: processing na master busie. Jeśli na stereo output sesji masz kompresor, EQ albo limiter, a stemy eksportujesz z busów przed master processingiem — suma stemów nie odtworzy printmastera. Rozwiązanie: eksportuj stemy przez ten sam łańcuch procesingu albo przenieś mastering na stemy.
M&E z dziurami
Brak Foley pod dialogiem. Brak ciągłej atmosfery. Nagła cisza w miejscu, gdzie w printmasterze jest dialog z tłem. Każda taka dziura to powód do zwrotu. Odsłuchaj M&E od początku do końca z obrazem — nie wyrywkowo.
Niezgodność formatów między stemami
Printmaster w 5.1, stemy w stereo. Albo jeden stem w 5.1, drugi w stereo, bo ktoś zapomniał ustawić routing. Albo sample rate 44.1 kHz zamiast 48 kHz w jednym z plików. Wszystkie stemy muszą mieć identyczną konfigurację kanałową, sample rate i bit depth.
Zła kolejność kanałów
Standard SMPTE definiuje kolejność 5.1 jako: L, C, R, Ls, Rs, LFE. Standard Film (DTS): L, R, C, LFE, Ls, Rs. Pomylenie tych kolejności oznacza, że dialog gra z lewego głośnika zamiast z centrum. QC złapie to natychmiast.
Brak timecode lub niezgodny start
Wszystkie stemy i printmaster muszą zaczynać się w tym samym timecode. BWF przechowuje timecode w metadanych. Jeśli eksportujesz z Pro Tools, upewnij się, że każdy bounce zaczyna się od tego samego punktu (zazwyczaj 01:00:00:00).
Jak eksportować stemy w Pro Tools — krok po kroku
- Zorganizuj routing — każdy typ ścieżek (dialog, muzyka, efekty) powinien mieć dedykowany Aux/VCA, przez który przechodzi do master busa.
- Przenieś master processing — jeśli masz pluginy na master faderze, zdecyduj, czy stemy mają je zawierać. Jeśli tak, eksportuj przez master bus. Jeśli nie, przenieś processing na poszczególne stemy.
- Bounce stemów — w Pro Tools użyj "Bounce Mix" z odpowiedniego busa. Wybierz BWF, 48 kHz, 24-bit, Interleaved lub Multiple Mono (zależy od wymagań platformy).
- Weryfikacja — zaimportuj stemy do czystej sesji, zsumuj, porównaj z printmasterem. Użyj null testu: odwróć fazę printmastera i dodaj do sumy stemów. Jeśli wynik jest ciszą — stemy się zgadzają.
- Eksport M&E — bounceuj M&E osobno, z wypełnieniami Foley i atmosferami.
- Eksport stereo — bounceuj LoRo lub LtRt z odpowiedniego downmix busa. Odsłuchaj na głośnikach stereo i w mono.
Checklist przed wysyłką
- Printmaster zmierzony pod target loudness platformy
- True peak poniżej limitu (-2 dBTP lub -1 dBTP)
- DX + MX + FX = printmaster (null test przechodzi)
- M&E fully-filled (odsłuch z obrazem, bez dziur)
- Kolejność kanałów zgodna ze standardem (SMPTE lub Film — sprawdź spec sheet)
- Wszystkie pliki: BWF, 48 kHz, 24-bit
- Identyczny timecode startu we wszystkich plikach
- Nazewnictwo zgodne z konwencją platformy
- Stereo Lo/Ro lub LtRt — zgodnie z wymaganiem spec sheetu
Nie masz pewności, jakie stemy i w jakim formacie potrzebujesz do swojej dystrybucji? Sprawdź naszą stronę deliverables, stemów i wersjonowania — przygotujemy kompletną paczkę plików dopasowaną do wymagań Twojej platformy.
Podsumowanie
Eksport stemów to nie techniczna formalność na końcu projektu. To osobny etap pracy, który wymaga planowania od początku miksu — poprawnego routingu, wypełnionego M&E, świadomego wyboru między LtRt a LoRo i weryfikacji każdego pliku przed wysyłką.
Trzy rzeczy, które decydują o tym, czy paczka przejdzie QC: stemy sumujące się do printmastera, M&E bez dziur pod dialogiem i poprawny format plików. Sprawdź spec sheet platformy docelowej zanim zaczniesz eksport — nie po tym, jak wyślesz pliki.

