Kompresia v praxi. Dynamická kompresia Dynamický rozsah komprimovaný alebo štandardný

Táto skupina metód je založená na skutočnosti, že prenášané signály podliehajú nelineárnym amplitúdovým transformáciám a vo vysielacej a prijímacej časti sú nelinearity recipročné. Ak sa napríklad vo vysielači použije nelineárna funkcia Öu, v prijímači sa použije u2. Dôsledná aplikácia recipročných funkcií zabezpečí, že celková transformácia zostane lineárna.

Myšlienkou nelineárnych metód kompresie dát je, že vysielač môže pri rovnakej amplitúde výstupných signálov prenášať väčší rozsah zmien prenášaného parametra (teda väčší dynamický rozsah). Dynamický rozsah- toto je pomer najväčšej prípustnej amplitúdy signálu k najmenšej, vyjadrený v relatívnych jednotkách alebo decibeloch:

; (2.17)
. (2.18)

Prirodzená túžba zvýšiť dynamický rozsah znížením U min je obmedzená citlivosťou zariadenia a zvyšujúcim sa vplyvom rušenia a vlastného šumu.

Kompresia dynamického rozsahu sa najčastejšie vykonáva pomocou dvojice recipročných funkcií logaritmu a potenciácie. Prvá operácia zmeny amplitúdy je tzv kompresia(kompresiou), druhý - rozšírenie(naťahovanie). Výber týchto konkrétnych funkcií je spojený s ich najväčšími kompresnými schopnosťami.

Zároveň majú tieto metódy aj nevýhody. Prvým z nich je, že logaritmus malého čísla je záporný a v limite:

to znamená, že citlivosť je veľmi nelineárna.

Na zníženie týchto nedostatkov sú obe funkcie modifikované posunutím a aproximáciou. Napríklad pre telefónne kanály má približná funkcia tvar (typ A):

s A = 87,6. Zisk z kompresie je 24 dB.

Kompresia dát pomocou nelineárnych procedúr je realizovaná analógovými prostriedkami s veľkými chybami. Aplikácia digitálne média môže výrazne zlepšiť presnosť alebo výkon konverzie. Zároveň priame použitie finančných prostriedkov počítačová technológia(t. j. priamy výpočet logaritmov a exponentov) nebude poskytovať najlepšie výsledky z dôvodu nízkeho výkonu a hromadiacich sa chýb vo výpočtoch.

Kvôli obmedzeniam presnosti sa kompresia údajov kompresiou používa v nekritických prípadoch, napríklad na prenos reči cez telefón a rádiové kanály.

Efektívne kódovanie

Efektívne kódy navrhli K. Shannon, Fano a Huffman. Podstatou kódov je, že sú nerovnomerné, teda s nerovnakým počtom bitov a dĺžka kódu je nepriamo úmerná pravdepodobnosti jeho výskytu. Ďalšou skvelou vlastnosťou efektívnych kódov je, že nevyžadujú oddeľovače, t.j. špeciálne znaky, oddeľujúce susedné kombinácie kódov. To sa dosiahne dodržiavaním jednoduchého pravidla: kratšie kódy nie sú začiatkom dlhších. V tomto prípade je súvislý prúd bitov jedinečne dekódovaný, pretože dekodér deteguje najskôr kratšie kódové slová. Efektívne kódy boli dlho čisto akademické, no v poslednej dobe sa úspešne používajú pri vytváraní databáz, ako aj pri komprimácii informácií v moderných modemoch a softvérových archivátoroch.

Kvôli nerovnomernosti sa zavádza priemerná dĺžka kódu. Priemerná dĺžka - matematické očakávanie dĺžky kódu:

navyše l av má tendenciu k H(x) zhora (tj l av > H(x)).

S pribúdajúcim N sa splnenie podmienky (2.23) stáva silnejším.

Existujú dva typy efektívnych kódov: Shannon-Fano a Huffman. Pozrime sa, ako ich získať na príklade. Predpokladajme, že pravdepodobnosti symbolov v sekvencii majú hodnoty uvedené v tabuľke 2.1.

Tabuľka 2.1.

Pravdepodobnosti symbolov

N
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Symboly sú zoradené, to znamená, že sú uvedené v rade v zostupnom poradí pravdepodobností. Potom sa pomocou metódy Shannon-Fano periodicky opakuje nasledujúci postup: celá skupina udalostí sa rozdelí na dve podskupiny s rovnakými (alebo približne rovnakými) celkovými pravdepodobnosťami. Postup pokračuje dovtedy, kým jeden prvok nezostane v ďalšej podskupine, potom sa tento prvok odstráni a zadané akcie pokračujú so zvyšnými. Toto sa deje dovtedy, kým v posledných dvoch podskupinách nezostane iba jeden prvok. Pokračujme v našom príklade, ktorý je zhrnutý v tabuľke 2.2.

Tabuľka 2.2.

Shannon-Fano kódovanie

N P i
4 0.3 ja
0.2 ja II
6 0.15 ja ja
0.1 II
1 0.1 ja ja
9 0.05 II II
5 0.05 II ja
7 0.03 II II ja
8 0.02 II

Ako vidno z tabuľky 2.2, prvý symbol s pravdepodobnosťou p 4 = 0,3 sa zúčastnil dvoch postupov delenia do skupín a oba časy skončili v skupine číslo I. V súlade s tým je kódovaný dvojmiestnym kódom II. Druhý prvok v prvom štádiu rozdelenia patril do skupiny I, v druhom do skupiny II. Preto je jeho kód 10. Kódy zvyšných symbolov nepotrebujú ďalší komentár.

Nejednotné kódy sú zvyčajne zobrazené ako kódové stromy. Strom kódov je graf označujúci povolené kombinácie kódov. Smery hrán tohto grafu sú prednastavené, ako je znázornené na obr. 2.11 (výber smerov je ľubovoľný).

Navigujú v grafe nasledovne: vytvorte trasu pre vybraný symbol; počet bitov sa rovná počtu hrán v ceste a hodnota každého bitu sa rovná smeru zodpovedajúcej hrany. Trasa je vypracovaná z východiskového bodu (na výkrese je označená písmenom A). Napríklad cesta k vrcholu 5 pozostáva z piatich hrán, z ktorých všetky okrem poslednej majú smer 0; dostaneme kód 00001.

Vypočítajme entropiu a priemernú dĺžku slova pre tento príklad.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bitov

l avg = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 + 0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Ako vidíte, priemerná dĺžka slova je blízka entropii.

Huffmanove kódy sú konštruované pomocou iného algoritmu. Proces kódovania pozostáva z dvoch etáp. V prvej fáze sa postupne vykonajú jednotlivé kompresie abecedy. Jednorazová kompresia – nahradenie posledných dvoch symbolov (s najnižšou pravdepodobnosťou) jedným, s celkovou pravdepodobnosťou. Kompresie sa vykonávajú, kým nezostanú dva znaky. Zároveň sa vyplní kódovacia tabuľka, do ktorej sa zapíšu výsledné pravdepodobnosti a znázornia sa trasy, po ktorých sa nové symboly v ďalšej fáze pohybujú.

V druhej fáze nastáva skutočné kódovanie, ktoré začína od poslednej fázy: prvému z dvoch symbolov je priradený kód 1, druhému - 0. Potom prejdú do predchádzajúcej fázy. Kódy z nasledujúcej fázy sa priradia k symbolom, ktoré sa v tejto fáze nezúčastnili kompresie a kód symbolu získaný po zlepení sa dvakrát priradí k posledným dvom symbolom a pridá sa ku kódu horného znaku 1, nižšia - 0. Ak sa znak ďalej nezúčastňuje lepenia, jeho kód zostáva nezmenený. Postup pokračuje až do konca (teda do prvej fázy).

Tabuľka 2.3 ukazuje Huffmanovo kódovanie. Ako je zrejmé z tabuľky, kódovanie sa uskutočnilo v 7 etapách. Vľavo sú symboly pravdepodobnosti, vpravo sú medzikódy. Šípky ukazujú pohyby novovytvorených symbolov. V každej fáze sa posledné dva symboly líšia len v najmenej významnom bite, ktorý zodpovedá technike kódovania. Vypočítajme priemernú dĺžku slova:

l avg = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Toto je ešte bližšie k entropii: kód je ešte efektívnejší. Na obr. Obrázok 2.12 zobrazuje strom Huffmanovho kódu.

Tabuľka 2.3.

Huffmanovo kódovanie

N p i kód ja II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Oba kódy spĺňajú požiadavku jednoznačného dekódovania: ako je zrejmé z tabuliek, kratšie kombinácie nie sú začiatkom dlhších kódov.

So zvyšujúcim sa počtom symbolov sa zvyšuje účinnosť kódov, takže v niektorých prípadoch sú kódované väčšie bloky (napr. hovoríme o o textoch, môžete zakódovať niektoré z najčastejšie sa vyskytujúcich slabík, slov a dokonca aj fráz).

Účinok zavedenia takýchto kódov sa určuje ich porovnaním s jednotným kódom:

(2.24)

kde n je počet bitov jednotného kódu, ktorý je nahradený efektívnym.

Úpravy Huffmanových kódov

Klasický Huffmanov algoritmus je dvojpriechodový algoritmus, t.j. vyžaduje najprv zhromaždenie štatistík o symboloch a správach a potom vyššie popísané postupy. To je v praxi nepohodlné, pretože to zvyšuje čas potrebný na spracovanie správ a nahromadenie slovníka. Častejšie sa používajú jednopriechodové metódy, pri ktorých sa kombinujú postupy akumulácie a kódovania. Takéto metódy sa tiež nazývajú adaptívna kompresia podľa Huffmana [46].

Podstata adaptívnej kompresie podľa Huffmana spočíva v konštrukcii počiatočného kódového stromu a jeho postupnej modifikácii po príchode každého ďalšieho symbolu. Tak ako predtým, aj tu sú stromy binárne, t.j. Z každého vrcholu stromového grafu vychádzajú najviac dva oblúky. Je zvykom nazývať pôvodný vrchol rodičom a dva nasledujúce vrcholy sa k nemu pripájajú ako deti. Predstavme si pojem váha vrcholu – ide o počet znakov (slov) zodpovedajúcich danému vrcholu, získaný pri napájaní pôvodnej sekvencie. Je zrejmé, že súčet váh detí sa rovná váhe rodiča.

Po zavedení ďalšieho symbolu vstupnej sekvencie sa kódový strom zreviduje: váhy vrcholov sa prepočítajú a v prípade potreby sa vrcholy preusporiadajú. Pravidlo pre permutovanie vrcholov je nasledovné: váhy dolných vrcholov sú najmenšie a vrcholy umiestnené naľavo od grafu majú najmenšiu váhu.

Zároveň sú vrcholy očíslované. Číslovanie začína od spodných (visiacich, t.j. bez potomkov) vrcholov zľava doprava, potom sa presunie na špičková úroveň atď. pred očíslovaním posledného, ​​pôvodného vrcholu. V tomto prípade sa dosiahne nasledujúci výsledok: čím menšia je hmotnosť vrcholu, tým nižšie je jeho číslo.

Permutácia sa vykonáva hlavne pre závesné vrcholy. Pri permutácii treba brať do úvahy vyššie formulované pravidlo: vrcholy s väčšou hmotnosťou majú vyššie číslo.

Po prejdení sekvencie (nazýva sa aj kontrola alebo test) sú všetkým visiacim vrcholom priradené kombinácie kódov. Pravidlo pre prideľovanie kódov je podobné ako vyššie: počet bitov kódu sa rovná počtu vrcholov, cez ktoré trasa prechádza od zdroja k danému závesnému vrcholu, a hodnota konkrétneho bitu zodpovedá smeru od rodiča k „dieťaťu“ (povedzme, že prechod naľavo od rodiča zodpovedá hodnote 1, napravo - 0).

Výsledné kombinácie kódov sú uložené v pamäti kompresného zariadenia spolu s ich analógmi a tvoria slovník. Použitie algoritmu je nasledovné. Komprimovaná sekvencia znakov je rozdelená na fragmenty v súlade s existujúcim slovníkom, po ktorom je každý z fragmentov nahradený svojim kódom zo slovníka. Fragmenty, ktoré sa nenachádzajú v slovníku, vytvárajú nové visiace vrcholy, získavajú váhu a sú tiež zapísané do slovníka. Týmto spôsobom sa vytvorí adaptívny algoritmus na doplnenie slovníka.

Na zvýšenie účinnosti metódy je žiaduce zväčšiť veľkosť slovníka; v tomto prípade sa kompresný pomer zvyšuje. V praxi je veľkosť slovníka 4 - 16 KB pamäte.


Ilustrujme si daný algoritmus na príklade. Na obr. Obrázok 2.13 zobrazuje pôvodný diagram (nazývaný aj Huffmanov strom). Každý vrchol stromu je znázornený obdĺžnikom, v ktorom sú cez zlomok vpísané dve čísla: prvé znamená číslo vrcholu, druhé znamená jeho hmotnosť. Ako vidíte, súlad medzi váhami vrcholov a ich číslami je splnený.

Predpokladajme teraz, že symbol zodpovedajúci vrcholu 1 sa objaví druhýkrát v testovacej sekvencii. Hmotnosť vrcholu sa zmenila, ako je znázornené na obr. 2.14, v dôsledku čoho je porušené pravidlo pre číslovanie vrcholov. V ďalšej fáze zmeníme umiestnenie visiacich vrcholov, za ktoré vymeníme vrcholy 1 a 4 a prečíslujeme všetky vrcholy stromu. Výsledný graf je znázornený na obr. 2.15. Postup potom pokračuje rovnakým spôsobom.

Malo by sa pamätať na to, že každý visiaci vrchol v Huffmanovom strome zodpovedá špecifickému symbolu alebo skupine symbolov. Rodič sa líši od detí tým, že skupina symbolov, ktoré mu zodpovedajú, je o jeden symbol kratšia ako skupina jeho detí a tieto deti sú odlišné. posledný znak. Napríklad symboly „auto“ zodpovedajú rodičovi; potom deti môžu mať sekvencie „kara“ a „karp“.

Daný algoritmus nie je akademický a aktívne sa používa v programoch na archiváciu, a to aj pri komprimácii grafických údajov (o nich sa bude diskutovať nižšie).

Algoritmy Lempel-Ziv

Toto sú dnes najčastejšie používané kompresné algoritmy. Používajú sa vo väčšine archivačných programov (napríklad PKZIP. ARJ, LHA). Podstatou algoritmov je, že určitá množina symbolov je pri archivácii nahradená jej číslom v špeciálne vygenerovanom slovníku. Napríklad fráza „Číslo pre váš list...“, ktorá sa často nachádza v obchodnej korešpondencii, môže v slovníku zaberať pozíciu 121; potom namiesto prenosu alebo uloženia uvedenej frázy (30 bajtov) môžete uložiť číslo frázy (1,5 bajtu v binárnom desiatkovom formáte alebo 1 bajt v binárnom).

Algoritmy sú pomenované podľa autorov, ktorí ich prvýkrát navrhli v roku 1977. Prvým z nich je LZ77. Na archiváciu je vytvorené takzvané posuvné okno správy, pozostávajúce z dvoch častí. Prvá časť, väčší formát, slúži na vytvorenie slovníka a má veľkosť približne niekoľko kilobajtov. Druhá, menšia časť (väčšinou do 100 bajtov) prijíma aktuálne znaky prezeraného textu. Algoritmus sa snaží nájsť množinu znakov v slovníku, ktorá sa zhoduje so znakmi prijatými v okne zobrazenia. Ak je to úspešné, vygeneruje sa kód pozostávajúci z troch častí: posun v slovníku vzhľadom na jeho počiatočný podreťazec, dĺžka tohto podreťazca a znak nasledujúci za týmto podreťazcom. Napríklad vybraný podreťazec pozostáva zo znakov „app“ (celkovo 6 znakov), ďalší znak je „e“. Potom, ak má podreťazec adresu (miesto v slovníku) 45, potom záznam v slovníku vyzerá ako „45, 6. e“. Potom sa obsah okna posunie o pozíciu a vyhľadávanie pokračuje. Takto sa tvorí slovník.

Výhodou algoritmu je jednoducho formalizovaný algoritmus na zostavenie slovníka. Navyše je možné rozbaliť aj bez pôvodného slovníka (vhodné je mať testovaciu sekvenciu) – slovník sa tvorí pri rozopínaní.

Nevýhody algoritmu sa prejavujú so zväčšovaním veľkosti slovníka – zvyšuje sa čas vyhľadávania. Navyše, ak sa v aktuálnom okne objaví reťazec znakov, ktorý nie je v slovníku, každý znak sa zapíše trojprvkovým kódom, t.j. Výsledkom nie je stláčanie, ale naťahovanie.

Algoritmus LZSS navrhnutý v roku 1978 má najlepšie vlastnosti. Má rozdiely v podpore posuvných okien a výstupných kódoch kompresora. Okrem okna algoritmus generuje binárny strom podobný Huffmanovmu stromu na urýchlenie vyhľadávania zhôd: každý podreťazec opúšťajúci aktuálne okno sa pridá do stromu ako jeden z potomkov. Tento algoritmus vám umožňuje ďalej zväčšovať veľkosť aktuálneho okna (je žiaduce, aby sa jeho veľkosť rovnala mocnine dvoch: 128, 256 atď. bajtov). Sekvenčné kódy sú tiež tvorené odlišne: zavádza sa dodatočná 1-bitová predpona na rozlíšenie nekódovaných znakov od párov „offset, dĺžka“.

Ešte väčší stupeň kompresie sa dosiahne pri použití algoritmov ako LZW. Vyššie opísané algoritmy majú pevnú veľkosť okna, čo znemožňuje zadávanie fráz dlhších ako je veľkosť okna do slovníka. V algoritmoch LZW (a ich predchodcovi LZ78) má zobrazovacie okno neobmedzenú veľkosť a slovník zhromažďuje frázy (a nie zbierku znakov ako predtým). Slovník má neobmedzenú dĺžku a kodér (dekodér) pracuje vo frázovom čakacom režime. Keď sa vytvorí fráza, ktorá sa zhoduje so slovníkom, vydá sa kód zhody (t. j. kód tejto frázy v slovníku) a kód znaku, ktorý za ním nasleduje. Ak sa pri hromadení symbolov vytvorí nová fráza, zapíše sa tiež do slovníka, ako tá kratšia. Výsledkom je rekurzívna procedúra, ktorá poskytuje rýchle kódovanie a dekódovanie.

Dodatočnú funkciu kompresie poskytuje komprimované kódovanie opakujúcich sa znakov. Ak v sekvencii nasledujú niektoré znaky za sebou (napríklad v texte to môžu byť znaky „medzera“, v postupnosti čísel - po sebe idúce nuly atď.), potom má zmysel nahradiť ich dvojicou „znak; dĺžka“ alebo „znak, dĺžka““. V prvom prípade kód označuje znak, že sekvencia bude kódovaná (zvyčajne 1 bit), potom kód opakujúceho sa znaku a dĺžku sekvencie. V druhom prípade (poskytnutom pre najčastejšie sa opakujúce znaky) predpona jednoducho označuje znak opakovania.

Dynamická kompresia(Dynamic range compress, DRC) - zúženie (alebo rozšírenie v prípade expandéra) dynamického rozsahu zvukového záznamu. Dynamický rozsah, je rozdiel medzi najtichším a najhlasnejším zvukom. Niekedy bude najtichší zvuk v zvukovej stope o niečo hlasnejší ako hladina hluku a niekedy o niečo tichší ako najhlasnejší. Hardvérové ​​zariadenia a programy, ktoré vykonávajú dynamickú kompresiu, sa nazývajú kompresory, pričom sa rozlišujú štyri hlavné skupiny: samotné kompresory, obmedzovače, expandéry a brány.

Rúrkový analógový kompresor DBX 566

Stláčanie smerom nadol a nahor

Downkompresia(Kompresia smerom nadol) znižuje hlasitosť zvuku, keď začína prekračovať určitú hranicu, pričom tichšie zvuky zostávajú nezmenené. Extrémna verzia kompresie smerom nadol je obmedzovač. Zvýšte kompresiu Na druhej strane kompresia smerom nahor zvyšuje hlasitosť zvuku, ak je pod prahovou hodnotou, bez ovplyvnenia hlasnejších zvukov. Oba typy kompresie zároveň zužujú dynamický rozsah zvukového signálu.

Downkompresia

Zvýšte kompresiu

Expander a brána

Ak kompresor zníži dynamický rozsah, expandér ho zvýši. Keď úroveň signálu stúpne nad prahovú úroveň, expandér ju ešte zvýši, čím sa zvýši rozdiel medzi hlasitými a tichými zvukmi. Zariadenia ako toto sa často používajú pri nahrávaní bicích súprav na oddelenie zvukov jedného bubna od druhého.

Typ expandéra, ktorý sa používa nie na zosilnenie hlasných zvukov, ale na tlmenie tichých zvukov, ktoré neprekračujú prahovú úroveň (napríklad hluk na pozadí), sa nazýva Hluková brána. V takomto zariadení, akonáhle hladina zvuku klesne pod prahovú hodnotu, signál prestane prechádzať. Typicky sa brána používa na potlačenie hluku počas prestávok. Pri niektorých modeloch sa môžete uistiť, že zvuk sa po dosiahnutí prahovej úrovne náhle nezastaví, ale postupne zoslabne. V tomto prípade je rýchlosť poklesu nastavená ovládačom Decay.

Gate, rovnako ako iné typy kompresorov, môže byť frekvenčne závislé(t. j. liečiť určité frekvenčné pásma) a môže pracovať v režime bočný reťazec(Pozri nižšie).

Princíp činnosti kompresora

Signál vstupujúci do kompresora je rozdelený na dve kópie. Jedna kópia je odoslaná do zosilňovača, v ktorom je stupeň zosilnenia riadený externým signálom a druhá kópia generuje tento signál. Vstúpi do zariadenia nazývaného side-chain, kde sa signál meria a na základe týchto údajov sa vytvorí obálka, ktorá popisuje zmenu jeho objemu.
Takto je navrhnutá väčšina moderných kompresorov, ide o takzvaný feed-forward typ. V starších zariadeniach (typ spätnej väzby) sa úroveň signálu meria za zosilňovačom.

Existujú rôzne technológie analógového zosilňovania s premenlivým ziskom, z ktorých každá má svoje výhody a nevýhody: trubicová, optická s použitím fotorezistorov a tranzistor. Pri práci s digitálnym zvukom (v zvukový editor alebo DAW) môžu využívať vlastné matematické algoritmy alebo emulovať fungovanie analógových technológií.

Hlavné parametre kompresorov

Prah

Kompresor znižuje úroveň zvukového signálu, ak jeho amplitúda prekročí určitú prahovú hodnotu (prah). Zvyčajne sa uvádza v decibeloch, pričom nižší prah (napr. -60 dB) znamená, že sa spracuje viac zvuku ako vyšší prah (napr. -5 dB).

pomer

Miera zníženia úrovne je určená parametrom pomeru: pomer 4:1 znamená, že ak je vstupná úroveň 4 dB nad prahovou hodnotou, výstupná úroveň bude 1 dB nad prahovou hodnotou.
Napríklad:
Prah = −10 dB
Vstup = -6 dB (4 dB nad prahom)
Výstup = -9 dB (1 dB nad prahovou hodnotou)

Je dôležité mať na pamäti, že potlačenie úrovne signálu pokračuje ešte nejaký čas po poklese pod prahovú úroveň a tento čas je určený hodnotou parametra uvoľniť.

Kompresia s maximálnym pomerom ∞:1 sa nazýva obmedzujúca. To znamená, že každý signál nad prahovou úrovňou je zoslabený na prahovú úroveň (okrem krátkeho obdobia po náhlom zvýšení vstupnej hlasitosti). Ďalšie podrobnosti nájdete v časti „Obmedzovač“ nižšie.

Príklady rôznych hodnôt pomeru

Útok a uvoľnenie

Kompresor poskytuje určitú kontrolu nad tým, ako rýchlo reaguje na zmeny v dynamike signálu. Parameter Attack určuje čas, ktorý potrebuje kompresor na zníženie zosilnenia na úroveň určenú parametrom Ratio. Release určuje čas, počas ktorého kompresor naopak zvýši zosilnenie, alebo sa vráti do normálu, ak úroveň vstupného signálu klesne pod prahovú hodnotu.

Fázy útoku a uvoľnenia

Tieto parametre udávajú čas (zvyčajne v milisekundách), ktorý bude potrebný na zmenu zosilnenia o určité množstvo decibelov, zvyčajne o 10 dB. Napríklad v tomto prípade, ak je Attack nastavený na 1 ms, bude trvať 1 ms na zníženie zisku o 10 dB a 2 ms na zníženie zisku o 20 dB.

Na mnohých kompresoroch je možné upraviť parametre Attack a Release, ale na niektorých sú prednastavené a nie je možné ich upraviť. Niekedy sú označené ako „automatické“ alebo „závislé na programe“, t.j. meniť v závislosti od vstupného signálu.

Koleno

Ďalší parameter kompresora: tvrdé/mäkké koleno. Určuje, či bude začiatok kompresie náhly (tvrdý) alebo postupný (mäkký). Mäkké koleno znižuje viditeľnosť prechodu zo suchého signálu na komprimovaný signál, najmä pri vysokých hodnotách Ratio a náhlych nárastoch hlasitosti.

Hard Knee a Soft Knee kompresia

Vrchol a RMS

Kompresor môže reagovať na špičkové (krátkodobé maximálne) hodnoty alebo na priemernú úroveň vstupného signálu. Použitie špičkových hodnôt môže viesť k prudkým výkyvom v stupni kompresie a dokonca k skresleniu. Preto kompresory aplikujú priemernú funkciu (zvyčajne RMS) na vstupný signál, keď ho porovnávajú s prahovou hodnotou. To poskytuje pohodlnejšiu kompresiu, ktorá sa približuje ľudskému vnímaniu hlasitosti.

RMS je parameter, ktorý vyjadruje priemernú hlasitosť zvukovej stopy. Z matematického hľadiska RMS (Root Mean Square) je stredná kvadratická hodnota amplitúdy určitého počtu vzoriek:

Stereo prepojenie

Kompresor v režime stereo prepojenia aplikuje rovnaký zisk na oba stereo kanály. Tým sa zabráni stereo posunom, ktoré môžu byť výsledkom individuálneho spracovania ľavého a pravého kanála. K tomuto posunu dochádza, ak je napríklad hlasitý prvok posunutý mimo stredu.

Prírastok make-upu

Pretože kompresor znižuje celkovú úroveň signálu, zvyčajne pridáva možnosť pevného výstupného zisku na dosiahnutie optimálnej úrovne.

Pozerať sa dopredu

Funkcia dopredu je navrhnutá tak, aby riešila problémy spojené s príliš vysokými aj príliš nízkymi hodnotami Attack and Release. Príliš dlhý čas útoku nám neumožňuje efektívne zachytiť prechodové javy a príliš krátky čas útoku nemusí byť pre poslucháča pohodlný. Pri použití funkcie look-ahead je hlavný signál oneskorený vzhľadom na riadiaci signál, čo umožňuje spustiť kompresiu v predstihu, ešte predtým, ako signál dosiahne prahovú hodnotu.
Jedinou nevýhodou tejto metódy je časové oneskorenie signálu, ktoré je v niektorých prípadoch nežiaduce.

Použitie dynamickej kompresie

Kompresia sa používa všade, nielen v hudobných zvukových stopách, ale aj všade tam, kde je potrebné zvýšiť celkovú hlasitosť bez zvýšenia špičkových úrovní, kde sa používajú lacné zariadenia na reprodukciu zvuku alebo obmedzený prenosový kanál (ozvučenie a komunikačné systémy, amatérske rádio, atď.). atď.) .

Kompresia sa aplikuje počas prehrávania hudba v pozadí(v obchodoch, reštauráciách atď.), kde nie sú žiadúce viditeľné zmeny objemu.

Najdôležitejšou oblasťou použitia dynamickej kompresie je však hudobná produkcia a vysielanie. Kompresia sa používa na dodanie zvuku „hrúbku“ a „drive“, na lepšie spojenie nástrojov medzi sebou a najmä pri spracovaní vokálov.

Vokály v rockovej a popovej hudbe sú často komprimované, aby vynikli zo sprievodu a dodali mu jasnosť. Na potlačenie sykavých foném sa používa špeciálny typ kompresora ladeného len na určité frekvencie – de-esser.

V inštrumentálnych častiach sa kompresia používa aj pre efekty, ktoré priamo nesúvisia s hlasitosťou, napríklad rýchlo sa rozpadávajúce zvuky bicích môžu trvať dlhšie.

Elektronická tanečná hudba (EDM) často používa bočné reťazenie (pozri nižšie) – napríklad basová linka môže byť poháňaná kopacím bubnom alebo podobným nástrojom, aby sa zabránilo stretu basy a bubnov a vytvorila sa dynamická pulzácia.

Kompresia je široko používaná vo vysielaní (rádio, televízia, internetové vysielanie) na zvýšenie vnímanej hlasitosti a zároveň zníženie dynamického rozsahu zdrojového zvuku (zvyčajne CD). Väčšina krajín má zákonné obmedzenia na maximálnu okamžitú hlasitosť, ktorá sa môže vysielať. Typicky sú tieto obmedzenia implementované permanentnými hardvérovými kompresormi vo vzduchovom reťazci. Zvýšenie vnímanej hlasitosti navyše zlepšuje „kvalitu“ zvuku z pohľadu väčšiny poslucháčov.

pozri tiež Vojna hlasitosti.

Neustále zvyšovanie hlasitosti tej istej piesne remastrovanej na CD od roku 1983 do roku 2000.

Bočné reťazenie

Ďalším bežne sa vyskytujúcim spínačom kompresora je „bočný reťazec“. V tomto režime dochádza ku kompresii zvuku bez ohľadu na to vlastnú úroveň a v závislosti od úrovne signálu vstupujúceho do konektora, ktorý sa zvyčajne nazýva bočný reťazec.

Využití na to je viacero. Napríklad, spevák má pískanie a všetky „s“ vyčnievajú z celkového obrazu. Prejdete jeho hlasom cez kompresor a ten istý zvuk privediete do konektora bočného reťazca, ale prejde cez ekvalizér. Pomocou ekvalizéra vystrihnete všetky frekvencie okrem tých, ktoré používa spevák pri vyslovovaní písmena „s“. Typicky okolo 5 kHz, ale môže sa pohybovať od 3 kHz do 8 kHz. Ak potom prepnete kompresor do režimu bočného reťazca, hlas bude komprimovaný v momentoch, keď sa vysloví písmeno „s“. Výsledkom bolo zariadenie známe ako de-esser. Tento spôsob práce sa nazýva „frekvenčne závislý“.

Ďalšie využitie tejto funkcie sa nazýva „ducker“. Napríklad v rozhlasovej stanici hudba prechádza kompresorom a slová DJ-a prichádzajú cez vedľajší reťazec. Keď DJ začne chatovať, hlasitosť hudby sa automaticky zníži. Tento efekt je možné úspešne využiť aj pri nahrávaní, napríklad na zníženie hlasitosti klávesových partov pri speve.

Obmedzenie tehlovej steny

Kompresor a obmedzovač fungujú približne rovnako, dá sa povedať, že obmedzovač je kompresor s vysokým pomerom (od 10:1) a zvyčajne s nízkym Attack time.

Existuje koncept Brick wall limiting – limitovanie s veľmi vysokým pomerom (20:1 a viac) a veľmi rýchlym útokom. Ideálne je, ak signál vôbec neprekročí prahovú úroveň. Výsledok bude pre ucho nepríjemný, ale zabráni sa tým poškodeniu zariadenia na reprodukciu zvuku alebo prebytku šírku pásma kanál. Mnoho výrobcov integruje do svojich zariadení obmedzovače práve na tento účel.

Clipper vs. Obmedzovač, mäkké a tvrdé strihanie

Kompresia je jednou z najviac mýtických tém v produkcii zvuku. Hovorí sa, že Beethoven ňou dokonca vystrašil susedove deti :(

Dobre, v skutočnosti použitie kompresie nie je o nič ťažšie ako použitie skreslenia, hlavnou vecou je pochopiť princíp jeho fungovania a mať dobrú kontrolu. To je to, čo teraz spolu uvidíme.

Čo je kompresia zvuku

Prvá vec, ktorú treba pochopiť pred prípravou, je kompresia. práca s dynamickým rozsahom zvuku. A na druhej strane to nie je nič iné ako rozdiel medzi najhlasnejšími a najtichšími úrovňami signálu:

takže, kompresia je kompresia dynamického rozsahu. Áno, Len kompresia dynamického rozsahu, alebo inými slovami zníženie úrovne hlasitých častí signálu a zvýšenie hlasitosti tichých častí. Nikdy viac.

Možno sa celkom rozumne čudujete, prečo je potom taký humbuk spojený? Prečo všetci hovoria o receptoch na správne nastavenie kompresora, no nikto ich nezdieľa? Prečo, napriek obrovskému množstvu cool pluginov, mnohé štúdiá stále používajú drahé, vzácne modely kompresorov? Prečo niektorí výrobcovia používajú kompresory pri extrémnych nastaveniach, zatiaľ čo iní ich nepoužívajú vôbec? A ktorý z nich má nakoniec pravdu?

Problémy vyriešené kompresiou

Odpovede na takéto otázky ležia v rovine pochopenia úlohy kompresie pri práci so zvukom. A umožňuje:

  1. Zdôraznite útok zvuk, vďaka čomu je výraznejší;
  2. „Nastavenie“ jednotlivých častí nástrojov do mixu, pridávajúc im silu a „hmotnosť“;
  3. Urobte skupiny nástrojov alebo celý mix súdržnejšími, taký jediný monolit;
  4. Riešenie konfliktov medzi nástrojmi pomocou bočného reťazca;
  5. Opravte chyby speváka alebo hudobníkov vyrovnávanie ich dynamiky;
  6. S určitým nastavením pôsobiť ako umelecký efekt.

Ako vidíte, nejde o menej významný tvorivý proces ako napríklad vymýšľanie melódií alebo vytváranie zaujímavých timbrov. Navyše, ktorýkoľvek z vyššie uvedených problémov možno vyriešiť pomocou 4 hlavných parametrov.

Základné parametre kompresora

Napriek obrovskému počtu softvérových a hardvérových modelov kompresorov sa všetky „kúzla“ kompresie vyskytujú vtedy, keď správne nastavenie hlavné parametre: Threshold, Ratio, Attack and Release. Pozrime sa na ne podrobnejšie:

Prah alebo prah odozvy, dB

Tento parameter umožňuje nastaviť hodnotu, od ktorej bude kompresor pracovať (teda komprimovať audio signál). Ak teda nastavíme prah na -12dB, kompresor bude pracovať len v tých častiach dynamického rozsahu, ktoré túto hodnotu presahujú. Ak je všetok náš zvuk tichší ako -12db, kompresor ním jednoducho prejde bez toho, aby to nejako ovplyvnil.

Pomer alebo kompresný pomer

Parameter ratio určuje, do akej miery bude signál prekračujúci prahovú hodnotu komprimovaný. Trochu matematiky na dokončenie obrazu: povedzme, že sme nastavili kompresor s prahom -12dB, pomer 2:1 a naplnili ho bubnovou slučkou, v ktorej je hlasitosť kopacieho bubna -4dB. Aký bude v tomto prípade výsledok činnosti kompresora?

V našom prípade úroveň kopnutia presahuje prah o 8 dB. Tento rozdiel podľa pomeru bude komprimovaný na 4dB (8dB / 2). V kombinácii s nespracovanou časťou signálu to povedie k tomu, že po spracovaní kompresorom bude hlasitosť kopacieho bubna -8db (prah -12dB + komprimovaný signál 4dB).

Útok, slečna

Toto je čas, po ktorom bude kompresor reagovať na prekročenie prahu odozvy. To znamená, ak je čas útoku vyšší ako 0 ms - kompresor začne stláčať prekročenie prahového signálu nie okamžite, ale po určitom čase.

Uvoľnenie alebo zotavenie, ms

Opak útoku - hodnota tohto parametra umožňuje určiť, za ako dlho sa úroveň signálu vráti pod prahovú hodnotu kompresor prestane stláčať.

Skôr než prejdeme ďalej, dôrazne odporúčam odobrať dobre známu vzorku, umiestniť akýkoľvek kompresor na jeho kanál a experimentovať s vyššie uvedenými parametrami po dobu 5-10 minút, aby sa materiál bezpečne zafixoval.

Všetky ostatné parametre sú voliteľné. Môžu sa líšiť medzi rôznymi modelmi kompresorov, čo je čiastočne dôvod, prečo výrobcovia používajú rôzne modely na špecifické účely (napríklad jeden kompresor pre vokály, druhý pre skupinu bicích, tretí pre hlavný kanál). Nebudem sa podrobne zaoberať týmito parametrami, ale len uvediem všeobecné informácie Aby ste pochopili, o čo tu ide:

  • Koleno alebo zalomenie (tvrdé/mäkké koleno). Tento parameter určuje, ako rýchlo sa bude kompresný pomer (pomer) aplikovať: tvrdo pozdĺž krivky alebo hladko. Všimol som si, že v režime Soft Knee kompresor nepracuje lineárne, ale začne plynulo (pokiaľ je to vhodné, keď hovoríme o milisekundách) komprimovať zvuk už pred prahovou hodnotou. Na spracovanie skupín kanálov a celkového mixu sa často používa mäkké koleno (keďže funguje nepozorovane) a na zdôraznenie útoku a iných vlastností jednotlivých nástrojov sa používa tvrdé koleno;
  • Režim odozvy: Peak/RMS. Režim Peak je opodstatnený, keď potrebujete striktne obmedziť amplitúdové zhluky, ako aj na signály s komplexným tvarom, ktorých dynamiku a čitateľnosť je potrebné plne sprostredkovať. RMS režim je veľmi šetrný k zvuku, umožňuje vám ho zhustiť pri zachovaní ataku;
  • Predvídavosť (Lookahead). To je čas, počas ktorého bude kompresor vedieť, čo naň prichádza. Druh predbežnej analýzy prichádzajúcich signálov;
  • Make-up alebo Gain. Parameter, ktorý umožňuje kompenzovať pokles hlasitosti v dôsledku kompresie.

Najprv a najviac hlavná rada , čo eliminuje všetky ďalšie otázky o kompresii: ak a) rozumiete princípu kompresie, b) pevne viete, ako ten či onen parameter vplýva na zvuk a c) stihli ste vyskúšať niekoľko v praxi rôzne modelyuž nepotrebuješ radu.

Myslím to úplne vážne. Ak ste pozorne čítali tento príspevok, experimentovali ste so štandardným kompresorom vášho DAW a jedným alebo dvoma zásuvnými modulmi, ale stále ste nepochopili, v akých prípadoch je potrebné nastaviť veľké hodnoty útoku, aký pomer použiť a v akom režime spracovať zdrojový signál - potom budete pokračovať v hľadaní hotových receptov na internete a bezmyšlienkovite ich aplikovať kdekoľvek.

Recepty na jemné ladenie kompresora je to niečo ako recepty na doladenie reverbu alebo chorusu - nedáva to zmysel a nemá to nič spoločné s kreativitou. Preto vytrvalo opakujem jediný správny recept: vyzbrojte sa týmto článkom, dobrými monitorovými slúchadlami, zásuvným modulom na vizuálnu kontrolu priebehu a strávte večer v spoločnosti pár kompresorov.

Konajte!

, Prehrávače médií

Nahrávky, najmä tie staršie, ktoré boli nahrané a vyrobené pred rokom 1982, boli oveľa menej pravdepodobné, že budú zmiešané, aby bola nahrávka hlasnejšia. Reprodukujú prirodzenú hudbu s prirodzeným dynamickým rozsahom, ktorý je zachovaný na zázname a stratený vo väčšine štandardných digitálnych formátov alebo formátov s vysokým rozlíšením.

Samozrejme, existujú výnimky – vypočujte si nedávny album Stevena Wilsona od MA Recordings alebo Reference Recordings a budete počuť, aké dobré môže byť digitálne audio. Ale to je zriedkavé; väčšina moderných zvukových nahrávok je hlasná a komprimovaná.

Kompresia hudby sa v poslednej dobe stala predmetom veľkej kritiky, ale stavím sa, že takmer všetky vaše obľúbené nahrávky sú komprimované. Niektoré z nich sú menej, niektoré viac, ale stále stlačené. Kompresia dynamického rozsahu je obetným baránkom pre zle znejúcu hudbu, ale vysoko komprimovaná hudba nie je ničím novým: počúvajte albumy Motown zo 60. rokov. To isté možno povedať o klasickej tvorbe Led Zeppelin či mladších albumoch Wilca a Radiohead. Kompresia dynamického rozsahu znižuje prirodzený vzťah medzi najhlasnejšími a najjemnejšími zvukmi v nahrávke, takže šepot môže byť hlasný ako výkrik. Je dosť ťažké nájsť pop music za posledných 50 rokov, ktorá by nebola komprimovaná.

Nedávno som mal pekný rozhovor so zakladateľom a redaktorom časopisu Tape Op Larrym Craneom o dobrých, zlých a škaredých aspektoch kompresie. Larry Crane spolupracoval s kapelami a umelcami ako Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi a Richmond Fontaine. Vedie aj nahrávacie štúdio Jackpot! v Portlande v Oregone, ktorý bol domovom The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him a mnohých, mnohých ďalších.

Ako príklad prekvapivo neprirodzene znejúcich, no stále skvelých skladieb uvádzam Spoonov album z roku 2014 They Want My Soul. Crane sa smeje a hovorí, že to počúva v aute, pretože to tam znie skvele. Čo nás privádza k ďalšej odpovedi na otázku, prečo je hudba komprimovaná: pretože kompresia a dodatočná „čistota“ uľahčujú počúvanie na hlučných miestach.

Larry Crane v práci. Autor fotografie: Jason Quigley

Keď ľudia hovoria, že sa im páči zvuk zvukovej nahrávky, myslím, že sa im páči hudba, akoby zvuk a hudba boli neoddeliteľné pojmy. Ale pre seba tieto pojmy rozlišujem. Z pohľadu audiofila môže byť zvuk drsný a surový, ale to bude pre väčšinu poslucháčov jedno.

Mnohí rýchlo obviňujú masteringových inžinierov z nadmerného používania kompresie, ale kompresia sa aplikuje priamo počas nahrávania, počas mixovania a až potom počas masteringu. Pokiaľ ste neboli osobne prítomní na každej z týchto fáz, nebudete môcť povedať, ako zneli nástroje a vokálne party na samom začiatku procesu.

Crane bol na vážkach: „Ak chce hudobník znieť zámerne bláznivo a skreslene ako nahrávky Guided by Voices, potom na tom nie je nič zlé – túžba vždy prevažuje nad kvalitou zvuku.“ Hlas interpreta je takmer vždy komprimovaný a to isté sa deje s basou, bicími, gitarami a syntetizátormi. Kompresia udržuje hlasitosť vokálov pri správnu úroveň v celej skladbe alebo trochu vyčnieva od ostatných zvukov.

Správne vykonaná kompresia môže spôsobiť, že bicie budú znieť živšie alebo zámerne zvláštne. Aby hudba znela skvele, musíte vedieť používať potrebné nástroje. Preto trvá roky, kým prídete na to, ako používať kompresiu bez toho, aby ste to preháňali. Ak mixový technik príliš stlačí gitarový part, masteringový inžinier už nebude môcť úplne obnoviť chýbajúce frekvencie.

Ak by hudobníci chceli, aby ste počúvali hudbu, ktorá neprešla fázami mixovania a masteringu, vydali by ju na pulty obchodov priamo zo štúdia. Crane hovorí, že ľudia, ktorí tvoria, upravujú, mixujú a ovládajú nahranú hudbu, nie sú na to, aby prekážali hudobníkom – umelcom pomáhajú od začiatku, už viac ako sto rokov.

Títo ľudia sú súčasťou procesu tvorby, ktorého výsledkom sú úžasné umelecké diela. Crane dodáva: "Nechcete verziu 'Dark Side of the Moon', ktorá nebola namiešaná a zvládnutá." Pink Floyd vydali pieseň tak, ako ju chceli počuť.




Hore