Słownik postprodukcji dźwięku — 50 terminów, które musisz znać
Branża używa skrótów i angielskich terminów, które dla nowych producentów i reżyserów brzmią jak kod. Poniższy słownik rozkłada najważniejsze pojęcia na czynniki pierwsze — bez akademickiego tonu, z naciskiem na to, co rzeczywiście spotykasz w pracy z ekipą dźwiękową.
Dialog i ADR
Dialog produkcyjny — audio nagrane na planie zdjęciowym podczas kręcenia scen. To podstawowy materiał dla edytora dialogów; jego jakość determinuje, ile pracy czeka na etapie postprodukcji.
ADR (Automated Dialogue Replacement, postsynchrony) — nagranie kwestii aktorskich w studio po zakończeniu zdjęć. Używany gdy dialog produkcyjny jest nie do uratowania technicznie, gdy zmieniono tekst po zdjęciach albo gdy reżyser potrzebuje innej interpretacji. Więcej o tym, kiedy i jak to działa, na naszej stronie montażu dialogów.
Room tone — nagranie „ciszy" w lokacji zdjęciowej — kilkadziesiąt sekund bez dialogu, ale z aktywnym tłem akustycznym pomieszczenia. Edytor używa room tone'u do wypełniania luk między kwestiami i wygładzania przejść między ujęciami.
Ambience / atmosfera — ciągłe tło akustyczne lokacji: ruch uliczny, klimatyzacja, wiatr, ptaki. Nie jest to dialog ani zamierzony efekt dźwiękowy — to przestrzeń, w której osadzona jest scena.
Checkerboard / szachownica — układ ścieżek dialogowych, w którym kolejne kwestie trafiają naprzemiennie na różne tracki. Dzięki temu mixer może niezależnie przetwarzać każde ujęcie — osobny EQ, kompresja, de-noise — bez wpływu na sąsiednie linie.
Fill / wypełnienie — ciągła warstwa room tone'u lub ambientu biegnąca pod całym dialogiem w scenie. Zapobiega martwej ciszy między kwestiami, którą ucho natychmiast słyszy jako błąd.
PFX (Production Effects) — dźwięki z nagrań produkcyjnych, które nie są dialogiem: kroki aktora, odłożenie kubka, zamknięcie drzwi. Edytor wydziela je na osobne ścieżki, żeby mixer mógł je kontrolować niezależnie od mowy.
Uchwyty / handles — fragmenty audio wykraczające poza punkty cięcia montażowego. Minimum dwie sekundy z każdej strony cięcia; bez nich nie ma materiału na crossfade'y i płynne przejścia między ujęciami.
Nakładki dialogowe — kwestie aktorów, które zachodzą na siebie w czasie: jeden aktor zaczyna mówić, zanim drugi skończy. Na planie daje to energię scenie, w postprodukcji komplikuje selekcję i cięcie.
Spotting session — seans roboczy, w którym reżyser i ekipa dźwiękowa oglądają zmontowany film i oznaczają: gdzie potrzebne ADR, jakich efektów brakuje, gdzie ma wejść muzyka. Zaczyna się po picture lock.
Foley i SFX
Foley — dźwięki nagrane w synchronizacji z obrazem przez specjalnie do tego wyznaczonego wykonawcę: kroki, szelest ubrań, manipulacje rekwizytami. Nazwa pochodzi od Jacka Foleya, pioniera tej techniki w Hollywood. Foley brzmi naturalniej niż biblioteki, bo jest nagrywany do konkretnych ruchów konkretnych postaci.
Foley artist — wykonawca foley. Pracuje na specjalnym planie wyposażonym w różne powierzchnie i rekwizyty, oglądając obraz i odtwarzając ruchy postaci w czasie rzeczywistym.
Twarde efekty / hard effects — synchroniczne efekty dźwiękowe przypisane do konkretnego zdarzenia w obrazie: strzał, trzaśnięcie drzwi, dzwonek telefonu. Inaczej niż atmosfery — mają precyzyjny punkt startu wynikający z akcji na ekranie.
Tła / backgrounds — ciągłe warstwy dźwiękowe tworzące przestrzeń sceny: wiatr w lesie, szum kawiarni, ruch w mieście. Budowane z połączenia nagrań produkcyjnych, bibliotek i materiałów nagranych specjalnie do projektu.
Walla — niespecyficzny szum tłumu: rozmowy w tle, okrzyki, ruch ludzi. Nagrywana w postprodukcji przez grupę aktorów głosowych improwizujących rozmowy bez rozpoznawalnych słów. Kluczowa przy scenach zbiorowych, gdzie produkcyjne tło jest zbyt cienkie lub zawiera rozpoznawalny dialog.
Sound design — projektowanie dźwięków, których nie można po prostu nagrać: brzmienie science-fiction, dźwięki potworów, efekty stylizowane, atmosfery budowane z warstw. To praca twórcza na pograniczu kompozycji i inżynierii dźwięku.
Wild track — dźwięk nagrany osobno od obrazu z myślą o późniejszej synchronizacji: nagranie ambientu lokacji, odgłosy maszyn, reakcje aktorów. Nie jest zsynchronizowany podczas nagrywania — sync następuje w postprodukcji.
Biblioteka SFX — zbiór gotowych efektów dźwiękowych na licencji do użycia w projekcie. Uzupełnia foley i nagrania własne; dla wielu typowych dźwięków jest szybszym rozwiązaniem niż nagrywanie od zera.
Miks i głośność
Re-recording mixing / miks końcowy — ostatni etap postprodukcji dźwięku: balansowanie dialogu, muzyki, efektów i foley w jedną spójną całość. Re-recording mixer odpowiada za narrację dźwiękową, dynamikę i dostosowanie miksu do docelowej platformy i formatu.
Mastering do obrazu — końcowy pass techniczny miksu: weryfikacja głośności pod specyfikacje platformy, eksport w docelowych formatach, przygotowanie plików do deliverables. Nie chodzi tylko o głośność — to sprawdzenie, że miks spełnia wszystkie wymagania QC platformy docelowej.
LUFS (Loudness Units Full Scale) — jednostka pomiaru postrzeganej głośności programu. Standardy: Netflix wymaga -27 LKFS ±2 LU (mierzony na dialogu), EBU R128 (europejski broadcast) wymaga -23 LUFS zintegrowanego. LUFS i LKFS to dwa oznaczenia tej samej wartości — LKFS to terminologia stosowana w normach ITU i Dolby, LUFS pochodzi z EBU.
True Peak / dBTP — pomiar szczytowy uwzględniający próbki między próbkami (inter-sample peaks), które zwykły peak meter pomija. Po konwersji do formatu lossy (np. AAC) inter-sample peaks mogą przekroczyć 0 dBFS i spowodować clipping. Limit Netflix: -2 dBTP; EBU R128: -1 dBTP.
Dialnorm — wartość metadanych w strumieniu Dolby Digital, wskazująca średnią głośność dialogu. Historycznie używana w broadcastcie amerykańskim. Odtwarzacze używają dialnorm do automatycznego dostosowania poziomu między kanałami.
LRA (Loudness Range) — miara zmienności dynamicznej programu. Niski LRA oznacza materiał silnie skompresowany, wysoki — dużą rozpiętość między cichymi i głośnymi fragmentami. Broadcast i streaming często definiują dopuszczalne zakresy LRA obok targetu LUFS.
Reverb match — dopasowanie charakterystyki akustycznej nagrań ADR lub poprawek dialogowych do brzmienia dialogu produkcyjnego. Bez reverb matchu ADR brzmi sucho i oderwanie nawet przy idealnej synchronizacji.
Dialogue match — automatyczne dopasowanie tonu spektralnego między kwestiami z różnych take'ów, mikrofonów lub lokacji. Narzędzia takie jak iZotope Dialogue Match analizują profil tonalny nagrania referencyjnego i aplikują go na materiał wymagający wyrównania.
Stem — submiks jednej kategorii ścieżek (dialog, muzyka, efekty), wyeksportowany z poziomu, na którym siedzi w finalnym miksie. DX + MX + FX zsumowane muszą odtworzyć printmaster.
DME (Dialogue + Music + Effects) — zestaw trzech oddzielnych stemów: DX, MX i FX. Nazwa skrótowa dla pakietu, który daje dystrybutorowi lub studiu dubbingowemu pełną kontrolę nad poszczególnymi warstwami ścieżki.
Deliverables i stemy
Printmaster — finalny, zatwierdzony miks. Punkt odniesienia dla wszystkich pozostałych deliverables — stemy, M&E i downmixy muszą być weryfikowane względem printmastera, najczęściej przez null test.
DX stem — stem dialogowy: produkcyjny dialog i ADR z pełną obróbką, na poziomie z finalnego miksu. Jeden z trzech składników DME.
MX stem — stem muzyczny: score kompozytora i source music. Zawiera automatykę poziomów z miksu — jeśli muzyka była ściszona pod dialogiem, stem MX to odzwierciedla (wersja dipped).
FX stem — stem efektów: sound design, twarde efekty, foley, atmosfery. Razem z DX i MX rekonstruuje printmaster.
M&E (Music & Effects) — miks bez dialogu, stworzony dla studiów dubbingowych: nowe dialogi nagrywane w innym języku są kładzione na wierzch M&E. Zawiera MX + FX plus wszelkie dodatkowe wypełnienia.
Fully-filled M&E — M&E zawierający absolutnie wszystkie dźwięki z finalnego miksu oprócz dialogu, łącznie z foley pod scenami dialogowymi i ciągłymi atmosferami wypełniającymi miejsca, gdzie w oryginale grał dialog. Netflix i większość dystrybutorów wymaga fully-filled. Unfilled M&E (sam MX + FX) zostawia dziury w scenach dialogowych.
LtRt (Left total / Right total) — stereofoniczny downmix z zakodowanym surroundem matrycowym (Dolby Surround / Pro Logic). Gra poprawnie jako stereo, ale dekoder Pro Logic potrafi z niego odtworzyć quasi-surround. Wymagany przez wielu europejskich nadawców telewizyjnych.
LoRo (Left only / Right only) — konwencjonalny fold-down do stereo bez kodowania matrycowego. Czysta kompatybilność mono; kanał centrum i surround tłumione -3 dB i sumowane do L i R. Bezpieczniejszy przy dystrybucji internetowej niż LtRt.
ADM BWF (Audio Definition Model Broadcast Wave Format) — format dostarczenia miksu Dolby Atmos: plik WAV z embeddowanymi metadanymi XML opisującymi obiekty dźwiękowe i ich ruch w przestrzeni 3D. Renderer Atmos odczytuje ADM BWF i generuje playback dla docelowego systemu głośnikowego.
Szczegóły dotyczące formatów eksportu i wymagań platform opisujemy na stronie deliverables, stemów i wersjonowania.
Workflow i formaty
AAF (Advanced Authoring Format) — format wymiany projektów między systemami montażowymi a postprodukcją dźwięku. Standardowa ścieżka: Avid Media Composer lub DaVinci Resolve eksportuje AAF; Pro Tools lub Nuendo go importuje. AAF przenosi klipy, timecode, uchwyty i metadane edycji.
OMF (Open Media Framework) — starszy poprzednik AAF. Nadal spotykany w starszych projektach i systemach; ma ograniczenia co do długości uchwytów i rozmiaru pliku. Jeśli masz wybór — AAF.
BWF (Broadcast Wave Format) — WAV z embeddowanymi metadanymi: timecode startu, sample rate, bit depth, identyfikator sesji. Standard dla profesjonalnych deliverables audio; każdy stem i printmaster powinien być dostarczony jako BWF.
Picture lock — moment, w którym montaż obrazu jest zamknięty i żadne dalsze zmiany nie będą wprowadzane. Postprodukcja dźwięku zaczyna się formalnie po picture lock; zmiany w obrazie po tym punkcie generują reconform.
Conform / reconform — dopasowanie sesji dźwiękowej do zmienionej wersji montażu obrazu. Każda zmiana cięcia po rozpoczęciu pracy dźwiękowej wymaga przesunięcia, dopasowania lub przebudowy odpowiednich fragmentów sesji.
Change list — dokument wysyłany przez montażystę obrazu przy reconformie: lista wszystkich zmian między poprzednią a nową wersją montażu z timecodes. Bez change listu reconform jest ręcznym szukaniem igły w stogu siana.
Handoff — przekazanie materiałów z montażu obrazu do postprodukcji dźwięku. Standardowy handoff: AAF z uchwytami, offline reference mix, raporty dźwiękowca planowego, ewentualnie split tracks z planu.
Szablon sesji — gotowy układ ścieżek i routingu w DAW przygotowany przed projektem: osobne ścieżki dla dialogu, ADR, room tone, foley, atmosfer, efektów i muzyki z wstępnie skonfigurowanymi procesorami. Redukuje czas setup i standaryzuje sposób organizacji materiału.
Specyfikacje i QC
QC (Quality Control) — techniczny przegląd finalnych deliverables pod kątem zgodności ze specyfikacją platformy lub nadawcy. Sprawdza głośność, true peak, sample rate, konfigurację kanałów, brak artefaktów, poprawność metadanych i kompletność paczki plików.
EBU R128 — europejski standard głośności dla broadcastu i streamingu: cel -23 LUFS (zintegrowany), tolerancja ±1 LU, limit true peak -1 dBTP. Stosowany przez większość europejskich nadawców publicznych i komercyjnych.
ATSC A/85 — północnoamerykański odpowiednik EBU R128: cel -24 LKFS (zintegrowany), tolerancja ±2 LU, limit true peak -2 dBTP. Standard używany przez nadawców w USA i Kanadzie.
ITU-R BS.1770 — norma ITU definiująca algorytm pomiaru głośności używany przez mierniki LUFS/LKFS. To matematyczny fundament pod EBU R128, ATSC A/85 i specyfikacje platform streamingowych — wszystkie opierają się na tym samym algorytmie pomiarowym.
Sample rate / częstotliwość próbkowania — liczba próbek audio na sekundę. Standard dla film i TV: 48 kHz. Materiał dostarczony w 44,1 kHz (standard muzyczny) będzie odrzucony przez QC platform filmowych; niezgodność sample rate między plikami w jednej paczce to jeden z częstszych błędów przy deliverables.
Bit depth — liczba bitów na próbkę, określająca rozdzielczość dynamiczną nagrania. Standard dla profesjonalnych deliverables: 24 bity. Materiał 16-bitowy (CD) ma mniejszy zapas dynamiczny; 32-bitowy float jest używany wewnętrznie w DAW, ale nie jest akceptowanym formatem dostawy.
Jeśli podczas pracy z ekipą dźwiękową pojawi się termin spoza tej listy — zapytaj. Dobra komunikacja między produkcją a postprodukcją zaczyna się od wspólnego języka.


