Jak eksportować stemy audio do dystrybucji — DME, M&E, LtRt

Miks jest zamknięty, reżyser podpisał. Teraz musisz dostarczyć pliki — i tu zaczynają się schody. Dystrybutor żąda "stemów DME w 5.1", nadawca chce "printmaster plus M&E fully-filled", a platforma streamingowa dorzuca do listy "stereo LtRt fold-down". Trzy skróty, trzy różne zestawy plików, trzy okazje do pomyłki.

Stemy audio to nie kopia zapasowa sesji. To oddzielne deliverables — pliki, które dystrybutor, studio dubbingowe albo nadawca potrzebuje, żeby film funkcjonował na różnych rynkach i platformach. Źle przygotowane stemy oznaczają odrzucenie przez QC, opóźnienie premiery i koszt ponownego otwarcia sesji.

Czym są stemy — i czym nie są

Stem to submiks: grupa ścieżek tego samego typu, przetworzona i wyeksportowana z poziomu, na którym siedzi w finalnym miksie. Trzy podstawowe stemy to:

DX (Dialogue) — wszystkie dialogi: produkcyjne, ADR, voiceover, narrator. Stem zawiera obróbkę (EQ, kompresja, de-essing), automatykę poziomów i reverb dialogowy.
MX (Music) — cała muzyka: score, licensed tracks, source music. Z pełną obróbką i automatyką, tak jak brzmi w miksie.
FX (Effects) — efekty dźwiękowe, sound design, Foley, atmosfery, ambience. Wszystko, co nie jest dialogiem ani muzyką.

Kluczowa zasada: DX + MX + FX = printmaster. Gdy zsumujsz trzy stemy na tych samych poziomach, musisz otrzymać dokładnie ten sam miks, który zatwierdził reżyser. Jeśli suma stemów brzmi inaczej niż printmaster — coś poszło nie tak.

Stemy to nie to samo co "multitrack export" ani "session backup". Multitrack to surowe ścieżki bez obróbki. Stem to gotowy submiks — z efektami, automatyką, w docelowej konfiguracji kanałowej.

DME — trzy stemy, pełna kontrola

DME to po prostu skrót od Dialogue + Music + Effects. Kiedy dystrybutor prosi o "DME", chce trzech osobnych stemów (DX, MX, FX), każdy w tej samej konfiguracji kanałowej co printmaster.

Konfiguracja kanałowa

Jeśli printmaster jest w 5.1, każdy stem DME musi być w 5.1 — sześć kanałów: L, C, R, Ls, Rs, LFE. To oznacza, że dla jednego formatu miksu dostarczasz:

Printmaster 5.1 — 6 kanałów
DX 5.1 — 6 kanałów
MX 5.1 — 6 kanałów
FX 5.1 — 6 kanałów

Razem 24 kanały audio w samych stemach i printmasterze. Przy Atmos (7.1.4 bed) liczba rośnie odpowiednio.

Dipped vs. undipped

Stemy mogą być dipped (z automatyką poziomów z miksu) albo undipped (na stałym, nominalnym poziomie). Większość platform i dystrybutorów wymaga stemów dipped — czyli takich, które po zsumowaniu odtworzą oryginalny miks. Jeśli w scenie muzyka była ściszona pod dialogiem, stem MX musi to odzwierciedlać.

Stemy undipped są przydatne dla re-recording mixera, który chce mieć swobodę. Ale w kontekście deliverables to wyjątek, nie reguła. Jeśli spec sheet nie precyzuje — domyślnie dostarczaj dipped.

Format plików

Standard branżowy:

BWF (Broadcast Wave Format) — WAV z metadanymi timecode. 48 kHz, 24-bit, PCM.
Każdy stem jako osobny plik lub zestaw plików mono (jeden plik na kanał).
Nazewnictwo zgodne z konwencją platformy, np. TYTUŁ_DX_51_YYYYMMDD.wav.
Wszystkie stemy tej samej długości, z identycznym timecode startu.

M&E — klucz do dystrybucji międzynarodowej

M&E (Music & Effects) to miks bez dialogu — MX + FX zsumowane razem. Studio dubbingowe bierze M&E, nagrywa dialogi w nowym języku i kładzie je na wierzch. Gotowa wersja językowa.

Brzmi prosto. W praktyce M&E to jeden z najtrudniejszych elementów deliverables.

Fully-filled M&E

Platformy streamingowe i dystrybutorzy wymagają M&E fully-filled. To znaczy: M&E musi zawierać absolutnie każdy dźwięk obecny w finalnym miksie oprócz dialogu. Każdy. Łącznie z dźwiękami, które w oryginalnym miksie były zamaskowane przez dialog.

Co to oznacza w praktyce:

Foley pod dialogiem — kroki, szelesty ubrań, manipulacje rekwizytami w scenach dialogowych. W produkcyjnym nagraniu te dźwięki są złapane razem z dialogiem. Gdy usuniesz dialog, znikają. Foley artist musi je odtworzyć osobno.
Atmosfery i room tone — ciągły ambient, który w oryginale był pod dialogiem. Musi płynnie przechodzić przez sceny dialogowe bez dziur i zmian charakteru.
Walla i tłum — niespecyficzne odgłosy tłumu trafiają do M&E. Rozpoznawalne dialogi tłumu (okrzyki, skandowania) — na osobne ścieżki opcjonalne.

Unfilled M&E — czyli prosty miks MX + FX bez dodatkowych wypełnień — to minimum dla niskobudżetowych produkcji, które nie mają budżetu na Foley. Studio dubbingowe może z tego pracować, ale jakość wersji językowej będzie niższa. Sceny dialogowe będą brzmiały pusto.

Jak to wygląda w sesji

W Pro Tools typowy setup M&E wygląda tak:

Stem MX (muzyka) — wyeksportowany z miksu.
Stem FX (efekty) — wyeksportowany z miksu.
Dodatkowe ścieżki Foley pokrywające sceny dialogowe.
Wypełnienia atmosferami pod dialogiem.
Suma tych elementów = M&E fully-filled.

M&E testuje się, odtwarzając go równocześnie z obrazem. Jeśli pod dialogiem słyszysz ciszę, dziurę w atmosferze albo nagłą zmianę charakteru ambientu — M&E nie jest fully-filled.

Netflix wymaga, żeby M&E w 5.1 dawało po zsumowaniu z DX dokładnie ten sam wynik co printmaster. To weryfikowalny warunek — i QC go sprawdza.

LtRt — stereo z zakodowanym surroundem

LtRt (Left total / Right total) to stereo downmix z miksu 5.1, w którym informacja surround jest zakodowana matrycowo metodą Dolby Surround (Pro Logic). Sygnał LtRt gra poprawnie jako zwykłe stereo, ale dekoder Dolby Pro Logic potrafi z niego odtworzyć cztery kanały: lewy, centrum, prawy i surround (mono).

LtRt vs. LoRo

Alternatywą jest LoRo (Left only / Right only) — konwencjonalny fold-down do stereo bez kodowania matrycowego. Różnica:

LoRo — prosty downmix. Kanał C dodany do L i R z tłumieniem -3 dB, kanały surround dodane do L i R z tłumieniem -3 dB. Wynik: czyste stereo, bez możliwości dekodowania do surround.
LtRt — kanały surround są sumowane do jednego sygnału "S" i dodawane z przesunięciem fazowym (90 stopni) do kanałów L i R. Dekoder Pro Logic rozpoznaje tę relację fazową i odtwarza surround.

Kiedy LtRt, kiedy LoRo

Broadcast — nadawcy telewizyjni często wymagają LtRt jako standardowego stereo deliverable, bo dekodery Pro Logic w telewizorach mogą z niego odtworzyć quasi-surround.
Netflix — akceptuje oba, preferuje LoRo. Specyfikacja mówi: "Lo/Ro or LT/RT mix to be mono compatible."
Dystrybucja kinowa — DCP zawiera surround dyskretny, LtRt nie jest potrzebny.
YouTube / web — LoRo lub dedykowany miks stereo. LtRt nie ma sensu, bo odbiorca i tak słucha na słuchawkach lub głośnikach laptopa.

Pułapki LtRt

LtRt to kompromis. Kodowanie matrycowe nie zachowuje pełnej separacji kanałów — dekodowany surround jest mono (nie stereo Ls/Rs jak w 5.1), a kanał centrum ma ograniczoną separację od L/R. Dlatego:

Nie polegaj na automatycznym fold-down z DAW bez odsłuchu. Przełóż wynik na głośniki i posłuchaj, czy dialog jest czytelny i czy faza nie powoduje artefaktów.
LtRt zwinięty do mono traci informację surround (sygnały w przeciwfazie się kasują). LoRo jest bezpieczniejszy pod kątem kompatybilności mono.
Jeśli spec sheet nie precyzuje — zapytaj dystrybutora. Dostarczenie LtRt zamiast LoRo (lub odwrotnie) to powód do odrzucenia.

Printmaster — punkt odniesienia

Printmaster (PM) to finalny, zatwierdzony miks — jeden plik (lub zestaw plików mono) zawierający kompletny soundtrack. Wszystkie stemy, M&E i downmixy powinny być weryfikowane względem printmastera.

Typowy zestaw deliverables dla platformy streamingowej:

Element	Format	Kanały
Printmaster	BWF, 48 kHz/24-bit	5.1 (lub 7.1.4 Atmos)
DX stem	BWF, 48 kHz/24-bit	5.1
MX stem	BWF, 48 kHz/24-bit	5.1
FX stem	BWF, 48 kHz/24-bit	5.1
M&E fully-filled	BWF, 48 kHz/24-bit	5.1
Stereo Lo/Ro lub LtRt	BWF, 48 kHz/24-bit	2.0

Przy dystrybucji kinowej dochodzi DCP z audio w MXF. Przy Atmos — ADM BWF z metadanymi obiektów.

Specyfikacje platform — co dokładnie żądają

Netflix

Stemy DX, MX, FX w 5.1, dipped, sumujące się do printmastera.
M&E fully-filled w 5.1.
Stereo Lo/Ro (preferowane) lub LtRt.
Loudness: -27 LKFS (±2 LU), dialogue-gated. True peak: -2 dBTP.
Pliki PCM BWF, 48 kHz, 24-bit.

Broadcast (EBU R128)

Printmaster stereo lub 5.1.
M&E — zależy od nadawcy.
Stereo LtRt wymagany przez wielu nadawców europejskich.
Loudness: -23 LUFS (±0,5 LU), integrated. True peak: -1 dBTP.

Dystrybucja kinowa (DCP)

Audio jako MXF, PCM, 48 kHz lub 96 kHz, 24-bit.
Konfiguracja 5.1, 7.1 lub Atmos.
Kanały mapowane według SMPTE ST 428-12.
Stemy DME dostarczane osobno — nie w DCP, ale jako osobna paczka dla dystrybutora.

Najczęstsze błędy przy eksporcie stemów

Na podstawie typowych odrzuceń QC — lista problemów, które powtarzają się przy dostawach stemów.

Stemy nie sumują się do printmastera

Najczęstsza przyczyna: processing na master busie. Jeśli na stereo output sesji masz kompresor, EQ albo limiter, a stemy eksportujesz z busów przed master processingiem — suma stemów nie odtworzy printmastera. Rozwiązanie: eksportuj stemy przez ten sam łańcuch procesingu albo przenieś mastering na stemy.

M&E z dziurami

Brak Foley pod dialogiem. Brak ciągłej atmosfery. Nagła cisza w miejscu, gdzie w printmasterze jest dialog z tłem. Każda taka dziura to powód do zwrotu. Odsłuchaj M&E od początku do końca z obrazem — nie wyrywkowo.

Niezgodność formatów między stemami

Printmaster w 5.1, stemy w stereo. Albo jeden stem w 5.1, drugi w stereo, bo ktoś zapomniał ustawić routing. Albo sample rate 44.1 kHz zamiast 48 kHz w jednym z plików. Wszystkie stemy muszą mieć identyczną konfigurację kanałową, sample rate i bit depth.

Zła kolejność kanałów

Standard SMPTE definiuje kolejność 5.1 jako: L, C, R, Ls, Rs, LFE. Standard Film (DTS): L, R, C, LFE, Ls, Rs. Pomylenie tych kolejności oznacza, że dialog gra z lewego głośnika zamiast z centrum. QC złapie to natychmiast.

Brak timecode lub niezgodny start

Wszystkie stemy i printmaster muszą zaczynać się w tym samym timecode. BWF przechowuje timecode w metadanych. Jeśli eksportujesz z Pro Tools, upewnij się, że każdy bounce zaczyna się od tego samego punktu (zazwyczaj 01:00:00:00).

Jak eksportować stemy w Pro Tools — krok po kroku

Zorganizuj routing — każdy typ ścieżek (dialog, muzyka, efekty) powinien mieć dedykowany Aux/VCA, przez który przechodzi do master busa.
Przenieś master processing — jeśli masz pluginy na master faderze, zdecyduj, czy stemy mają je zawierać. Jeśli tak, eksportuj przez master bus. Jeśli nie, przenieś processing na poszczególne stemy.
Bounce stemów — w Pro Tools użyj "Bounce Mix" z odpowiedniego busa. Wybierz BWF, 48 kHz, 24-bit, Interleaved lub Multiple Mono (zależy od wymagań platformy).
Weryfikacja — zaimportuj stemy do czystej sesji, zsumuj, porównaj z printmasterem. Użyj null testu: odwróć fazę printmastera i dodaj do sumy stemów. Jeśli wynik jest ciszą — stemy się zgadzają.
Eksport M&E — bounceuj M&E osobno, z wypełnieniami Foley i atmosferami.
Eksport stereo — bounceuj LoRo lub LtRt z odpowiedniego downmix busa. Odsłuchaj na głośnikach stereo i w mono.

Checklist przed wysyłką

Printmaster zmierzony pod target loudness platformy
True peak poniżej limitu (-2 dBTP lub -1 dBTP)
DX + MX + FX = printmaster (null test przechodzi)
M&E fully-filled (odsłuch z obrazem, bez dziur)
Kolejność kanałów zgodna ze standardem (SMPTE lub Film — sprawdź spec sheet)
Wszystkie pliki: BWF, 48 kHz, 24-bit
Identyczny timecode startu we wszystkich plikach
Nazewnictwo zgodne z konwencją platformy
Stereo Lo/Ro lub LtRt — zgodnie z wymaganiem spec sheetu

Nie masz pewności, jakie stemy i w jakim formacie potrzebujesz do swojej dystrybucji? Sprawdź naszą stronę deliverables, stemów i wersjonowania — przygotujemy kompletną paczkę plików dopasowaną do wymagań Twojej platformy.

Podsumowanie

Eksport stemów to nie techniczna formalność na końcu projektu. To osobny etap pracy, który wymaga planowania od początku miksu — poprawnego routingu, wypełnionego M&E, świadomego wyboru między LtRt a LoRo i weryfikacji każdego pliku przed wysyłką.

Trzy rzeczy, które decydują o tym, czy paczka przejdzie QC: stemy sumujące się do printmastera, M&E bez dziur pod dialogiem i poprawny format plików. Sprawdź spec sheet platformy docelowej zanim zaczniesz eksport — nie po tym, jak wyślesz pliki.

Jak eksportować stemy audio do dystrybucji — DME, M&E, LtRt

Jak eksportować stemy audio do dystrybucji — DME, M&E, LtRt

Czym są stemy — i czym nie są

DME — trzy stemy, pełna kontrola

Konfiguracja kanałowa

Dipped vs. undipped

Format plików

M&E — klucz do dystrybucji międzynarodowej

Fully-filled M&E

Jak to wygląda w sesji

LtRt — stereo z zakodowanym surroundem

LtRt vs. LoRo

Kiedy LtRt, kiedy LoRo

Pułapki LtRt

Printmaster — punkt odniesienia

Specyfikacje platform — co dokładnie żądają

Netflix

Broadcast (EBU R128)

Dystrybucja kinowa (DCP)

Najczęstsze błędy przy eksporcie stemów

Stemy nie sumują się do printmastera

M&E z dziurami

Niezgodność formatów między stemami

Zła kolejność kanałów

Brak timecode lub niezgodny start

Jak eksportować stemy w Pro Tools — krok po kroku

Checklist przed wysyłką

Podsumowanie

Najnowsze posty

Jak dopasować ADR do produkcyjnego dialogu — reverb, EQ, ambience match

Kompresja audio dla edytorów wideo — co musisz wiedzieć

Normalizacja głośności — LUFS, True Peak i jak to zmierzyć