Stiskanje v praksi. Dinamično stiskanje Dinamični razpon stisnjen ali standarden

Ta skupina metod temelji na dejstvu, da so oddani signali podvrženi nelinearnim amplitudnim transformacijam, v oddajnem in sprejemnem delu pa so nelinearnosti recipročne. Na primer, če se nelinearna funkcija Öu uporablja v oddajniku, se u 2 uporablja v sprejemniku. Dosledna uporaba recipročnih funkcij bo zagotovila, da celotna transformacija ostane linearna.

Ideja nelinearnih metod stiskanja podatkov je v tem, da lahko oddajnik z enako amplitudo izhodnih signalov odda večji razpon sprememb oddanega parametra (torej večji dinamični razpon). Dinamično območje- to je razmerje med največjo dovoljeno amplitudo signala in najmanjšo, izraženo v relativnih enotah ali decibelih:

; (2.17)
. (2.18)

Naravna želja po povečanju dinamičnega razpona z zmanjšanjem U min je omejena z občutljivostjo opreme in naraščajočim vplivom motenj in lastnega šuma.

Najpogosteje se kompresija dinamičnega obsega izvede z uporabo para recipročnih funkcij logaritma in potenciranja. Prva operacija spreminjanja amplitude se imenuje stiskanje(s stiskanjem), drugi - širitev(raztezanje). Izbira teh posebnih funkcij je povezana z njihovimi največjimi zmožnostmi stiskanja.

Hkrati imajo te metode tudi slabosti. Prvi od teh je, da je logaritem majhnega števila negativen in v meji:

to pomeni, da je občutljivost zelo nelinearna.

Za zmanjšanje teh pomanjkljivosti sta obe funkciji spremenjeni s premikom in aproksimacijo. Na primer, za telefonske kanale ima aproksimirana funkcija obliko (tip A):

z A=87,6. Dobiček zaradi kompresije je 24 dB.

Stiskanje podatkov z uporabo nelinearnih postopkov je izvedeno analogno z velikimi napakami. Aplikacija digitalni mediji lahko bistveno izboljša natančnost ali učinkovitost pretvorbe. Hkrati pa neposredna poraba sredstev računalniška tehnologija(to je neposredno izračunavanje logaritmov in eksponentov) ne bo dalo najboljših rezultatov zaradi nizke učinkovitosti in kopičenja računskih napak.

Zaradi omejitev natančnosti se stiskanje podatkov s stiskanjem uporablja v nekritičnih primerih, na primer za prenos govora po telefonskih in radijskih kanalih.

Učinkovito kodiranje

Učinkovite kode so predlagali K. Shannon, Fano in Huffman. Bistvo kod je, da so neenakomerne, to je z neenakim številom bitov, dolžina kode pa je obratno sorazmerna z verjetnostjo njenega pojava. Druga odlična lastnost učinkovitih kod je, da ne potrebujejo ločil, tj. posebne znake, ki ločuje sosednje kombinacije kod. To dosežemo z upoštevanjem preprostega pravila: krajše kode niso začetek daljših. V tem primeru je zvezni tok bitov enolično dekodiran, ker dekoder najprej zazna krajše kodne besede. Učinkovite kode so bile dolgo zgolj akademske narave, v zadnjem času pa se uspešno uporabljajo pri ustvarjanju baz podatkov, pa tudi pri stiskanju informacij v sodobnih modemih in programskih arhivarjih.

Zaradi neenakomernosti je uvedena povprečna dolžina kode. Povprečna dolžina - matematično pričakovanje dolžine kode:

poleg tega l av teži k H(x) od zgoraj (to je l av > H(x)).

Izpolnjenost pogoja (2.23) postaja močnejša, ko N narašča.

Obstajata dve vrsti učinkovitih kod: Shannon-Fano in Huffman. Poglejmo, kako jih pridobiti na primeru. Predpostavimo, da imajo verjetnosti simbolov v zaporedju vrednosti, podane v tabeli 2.1.

Tabela 2.1.

Verjetnosti simbolov

n
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simboli so razvrščeni, to je predstavljeni v vrsti po padajočem vrstnem redu verjetnosti. Nato se po metodi Shannon-Fano periodično ponavlja naslednji postopek: celotno skupino dogodkov razdelimo na dve podskupini z enakimi (ali približno enakimi) skupnimi verjetnostmi. Postopek se nadaljuje, dokler en element ne ostane v naslednji podskupini, nakar se ta element izloči, navedena dejanja pa se nadaljujejo s preostalimi. To se zgodi, dokler v zadnjih dveh podskupinah ne ostane le en element. Nadaljujmo z našim primerom, ki je povzet v tabeli 2.2.

Tabela 2.2.

Shannon-Fano kodiranje

n P i
4 0.3 jaz
0.2 jaz II
6 0.15 jaz jaz
0.1 II
1 0.1 jaz jaz
9 0.05 II II
5 0.05 II jaz
7 0.03 II II jaz
8 0.02 II

Kot je razvidno iz tabele 2.2, je prvi simbol z verjetnostjo p 4 = 0,3 sodeloval v dveh postopkih delitve v skupine in obakrat končal v skupini številka I. V skladu s tem je kodiran z dvomestno kodo II. Drugi element na prvi stopnji delitve je pripadal skupini I, na drugi - skupini II. Zato je njegova koda 10. Kode preostalih simbolov ne potrebujejo dodatnih komentarjev.

Običajno so neenotne kode prikazane kot kodna drevesa. Kodno drevo je graf, ki prikazuje dovoljene kombinacije kod. Smeri robov tega grafa so prednastavljene, kot je prikazano na sliki 2.11 (izbira smeri je poljubna).

Po grafu krmarijo na naslednji način: ustvarijo pot za izbrani simbol; število bitov zanj je enako številu robov v poti, vrednost vsakega bita pa je enaka smeri ustreznega roba. Pot je začrtana od izhodišča (na risbi je označena s črko A). Na primer, pot do točke 5 je sestavljena iz petih robov, od katerih imajo vsi razen zadnjega smer 0; dobimo kodo 00001.

Izračunajmo entropijo in povprečno dolžino besede za ta primer.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bita

l povprečje = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Kot lahko vidite, je povprečna dolžina besede blizu entropije.

Huffmanove kode so izdelane z uporabo drugačnega algoritma. Postopek kodiranja je sestavljen iz dveh stopenj. Na prvi stopnji se zaporedoma izvajajo posamezne stiskanja abecede. Enkratno stiskanje - zamenjava zadnjih dveh simbolov (z najmanjšo verjetnostjo) z enim, s skupno verjetnostjo. Stiskanja se izvajajo, dokler ne ostaneta dva znaka. Hkrati se izpolni kodirna tabela, v katero se vnesejo nastale verjetnosti in upodobljene poti, po katerih se premikajo novi simboli na naslednji stopnji.

Na drugi stopnji pride do dejanskega kodiranja, ki se začne od zadnje stopnje: prvemu od obeh simbolov je dodeljena koda 1, drugemu - 0. Po tem se premaknejo na prejšnjo stopnjo. Kode iz naslednje stopnje so dodeljene simbolom, ki v tej fazi niso sodelovali pri stiskanju, koda simbola, dobljenega po lepljenju, pa je dvakrat dodeljena zadnjima dvema simboloma in dodana kodi zgornjega znaka 1, spodnji - 0. Če znak ne sodeluje pri lepljenju, njegova koda ostane nespremenjena. Postopek se nadaljuje do konca (to je do prve stopnje).

Tabela 2.3 prikazuje Huffmanovo kodiranje. Kot je razvidno iz tabele, je kodiranje potekalo v 7 fazah. Na levi so verjetnosti simbolov, na desni so vmesne kode. Puščice prikazujejo premike novo oblikovanih simbolov. Na vsaki stopnji se zadnja dva simbola razlikujeta le v najmanj pomembnem bitu, ki ustreza tehniki kodiranja. Izračunajmo povprečno dolžino besede:

l povprečje = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

To je še bližje entropiji: koda je še bolj učinkovita. Na sl. Slika 2.12 prikazuje Huffmanovo kodno drevo.

Tabela 2.3.

Huffmanovo kodiranje

n p i Koda jaz II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Obe kodi izpolnjujeta zahtevo po nedvoumnem dekodiranju: kot je razvidno iz tabel, krajše kombinacije niso začetek daljših kod.

Z večanjem števila simbolov se povečuje učinkovitost kod, zato so v nekaterih primerih kodirani večji bloki (npr. govorimo o o besedilih, lahko kodirate nekaj najpogostejših zlogov, besed in celo fraz).

Učinek uvedbe takih kod se določi s primerjavo z enotno kodo:

(2.24)

kjer je n število bitov enotne kode, ki se nadomesti z efektivno.

Modifikacije Huffmanovih kod

Klasični Huffmanov algoritem je algoritem z dvema prehodoma, tj. zahteva najprej zbiranje statističnih podatkov o simbolih in sporočilih, nato pa zgoraj opisane postopke. To je v praksi neprijetno, ker podaljša čas, ki je potreben za obdelavo sporočil in kopičenje slovarja. Pogosteje se uporabljajo metode z enim prehodom, pri katerih so kombinirani postopki kopičenja in kodiranja. Takšne metode imenujemo tudi adaptivna kompresija po Huffmanu [46].

Bistvo prilagodljive kompresije po Huffmanu se spušča v konstrukcijo začetnega kodnega drevesa in njegovo zaporedno spreminjanje po prihodu vsakega naslednjega simbola. Kot prej so drevesa tukaj binarna, tj. Iz vsakega oglišča drevesnega grafa izhajata največ dva loka. Običajno je, da prvotno vozlišče imenujemo nadrejeno, dve naslednji točki, povezani z njim, pa kot otroka. Predstavimo koncept teže vozlišč - to je število znakov (besed), ki ustrezajo danemu vozlišču, pridobljeno pri hranjenju izvirnega zaporedja. Očitno je vsota tež otrok enaka teži staršev.

Po uvedbi naslednjega simbola vhodnega zaporedja se kodno drevo revidira: preračunajo se uteži oglišč in po potrebi se oglišča prerazporedijo. Pravilo za permutacijo vozlišč je naslednje: uteži nižjih vozlišč so najmanjše, vozlišča, ki se nahajajo na levi strani grafa, pa imajo najmanjše uteži.

Hkrati so točke oštevilčene. Številčenje se začne od spodnjih (visečih, tj. brez otrok) oglišč od leve proti desni, nato pa se premakne na najvišji nivo itd. pred oštevilčenjem zadnje, prvotne točke. V tem primeru dosežemo naslednji rezultat: manjša kot je teža vozlišča, manjše je njegovo število.

Permutacija se izvaja predvsem za viseča oglišča. Pri permutiranju je treba upoštevati zgoraj formulirano pravilo: vozlišča z večjo težo imajo večje število.

Po prehodu zaporedja (imenuje se tudi kontrola ali test) so vsem visečim točkam dodeljene kodne kombinacije. Pravilo za dodeljevanje kod je podobno zgornjemu: število bitov kode je enako številu vozlišč, skozi katere poteka pot od izvira do danega visečega vozlišča, vrednost posameznega bita pa ustreza smeri od starša do "otroka" (recimo, gredo levo od starša ustreza vrednosti 1, desno - 0).

Nastale kombinacije kod so shranjene v pomnilniku kompresijske naprave skupaj z njihovimi analogi in tvorijo slovar. Uporaba algoritma je naslednja. Stisnjeno zaporedje znakov se razdeli na fragmente v skladu z obstoječim slovarjem, nakar se vsak od fragmentov nadomesti s svojo kodo iz slovarja. Fragmenti, ki jih v slovarju ne najdemo, tvorijo nova viseča oglišča, pridobijo težo in se tudi vnesejo v slovar. Na ta način se oblikuje prilagodljivi algoritem za dopolnjevanje slovarja.

Za povečanje učinkovitosti metode je zaželeno povečati velikost slovarja; v tem primeru se poveča kompresijsko razmerje. V praksi je velikost slovarja 4 - 16 KB pomnilnika.


Naj navedeni algoritem ponazorimo s primerom. Na sl. Slika 2.13 prikazuje originalni diagram (imenuje se tudi Huffmanovo drevo). Vsako oglišče drevesa je prikazano s pravokotnikom, v katerega sta skozi ulomek vpisani dve števili: prvo pomeni številko oglišča, drugo njegovo težo. Kot lahko vidite, je ujemanje med utežmi oglišč in njihovim številom izpolnjeno.

Predpostavimo zdaj, da se simbol, ki ustreza točki 1, pojavi drugič v testnem zaporedju. Teža oglišča se je spremenila, kot je prikazano na sl. 2.14, zaradi česar je kršeno pravilo o oštevilčevanju vozlišč. Na naslednji stopnji spremenimo lokacijo visečih oglišč, pri čemer zamenjamo oglišča 1 in 4 ter preštevilčimo vsa oglišča drevesa. Nastali graf je prikazan na sl. 2.15. Postopek se nato nadaljuje na enak način.

Ne smemo pozabiti, da vsako viseče oglišče v Huffmanovem drevesu ustreza določenemu simbolu ali skupini simbolov. Starš se od otrok razlikuje po tem, da je skupina simbolov, ki mu ustrezajo, en simbol krajša od skupine njegovih otrok, ti ​​otroci pa so drugačni. zadnji znak. Na primer, simboli "avto" ustrezajo staršu; potem imajo lahko otroci zaporedji "kara" in "karp".

Navedeni algoritem ni akademski in se aktivno uporablja v programih za arhiviranje, tudi pri stiskanju grafičnih podatkov (o njih bomo razpravljali spodaj).

Lempel–Ziv algoritmi

To so danes najpogosteje uporabljeni algoritmi stiskanja. Uporabljajo se v večini programov za arhiviranje (npr. PKZIP. ARJ, LHA). Bistvo algoritmov je, da se določen niz simbolov med arhiviranjem nadomesti z njegovo številko v posebej generiranem slovarju. Na primer, besedna zveza »Odhodna številka za vaše pismo ...«, ki jo pogosto najdemo v poslovni korespondenci, lahko zasede 121. mesto v slovarju; potem lahko namesto prenosa ali shranjevanja omenjene fraze (30 bajtov) shranite številko fraze (1,5 bajta v dvojiški decimalni obliki ali 1 bajt v binarni).

Algoritmi so poimenovani po avtorjih, ki so jih prvi predlagali leta 1977. Od teh je prvi LZ77. Za arhiviranje se ustvari tako imenovano drsno okno za sporočila, sestavljeno iz dveh delov. Prvi del, večji format, služi za oblikovanje slovarja in je velik približno nekaj kilobajtov. Drugi, manjši del (običajno velikosti do 100 bajtov) prejme trenutne znake besedila, ki si ga ogledujete. Algoritem poskuša najti nabor znakov v slovarju, ki se ujema s prejetimi v oknu za ogled. Če je to uspešno, se ustvari koda, sestavljena iz treh delov: odmik v slovarju glede na začetni podniz, dolžina tega podniza in znak, ki sledi temu podnizu. Na primer, izbrani podniz je sestavljen iz znakov "app" (skupaj 6 znakov), naslednji znak je "e". Potem, če ima podniz naslov (mesto v slovarju) 45, je vnos v slovarju videti kot "45, 6. e". Po tem se vsebina okna premakne po položaju in iskanje se nadaljuje. Tako nastane slovar.

Prednost algoritma je enostavno formaliziran algoritem za sestavljanje slovarja. Poleg tega je mogoče razpakirati brez originalnega slovarja (priporočljivo je imeti testno zaporedje) - slovar se oblikuje med razpakiranjem.

Slabosti algoritma se pokažejo s povečevanjem velikosti slovarja - daljša se čas iskanja. Poleg tega, če se v trenutnem oknu pojavi niz znakov, ki ni v slovarju, je vsak znak zapisan s kodo treh elementov, tj. Rezultat ni stiskanje, ampak raztezanje.

Najboljše lastnosti ima algoritem LZSS, predlagan leta 1978. Ima razlike v podpori drsnega okna in izhodnih kodah kompresorja. Poleg okna algoritem ustvari binarno drevo, podobno Huffmanovemu drevesu, da pospeši iskanje ujemanj: vsak podniz, ki zapusti trenutno okno, je dodan drevesu kot eden od otrok. Ta algoritem vam omogoča nadaljnje povečanje velikosti trenutnega okna (zaželeno je, da je njegova velikost enaka potenci dveh: 128, 256 itd. bajtov). Zaporedne kode so oblikovane tudi drugače: uvedena je dodatna 1-bitna predpona za razlikovanje nekodiranih znakov od parov "odmik, dolžina".

Še večja stopnja stiskanja je dosežena z uporabo algoritmov, kot je LZW. Prej opisani algoritmi imajo fiksno velikost okna, zaradi česar v slovar ni mogoče vnašati besednih zvez, daljših od velikosti okna. V algoritmih LZW (in njihovem predhodniku LZ78) ima okno za ogled neomejeno velikost, slovar pa kopiči fraze (in ne zbirko znakov kot prej). Slovar ima neomejeno dolžino, kodirnik (dekoder) pa deluje v načinu čakanja fraze. Ko se oblikuje fraza, ki se ujema s slovarjem, se izda koda ujemanja (tj. koda te fraze v slovarju) in koda znaka, ki ji sledi. Če ob kopičenju simbolov nastane nova fraza, se tudi ta vnese v slovar, tako kot krajša. Rezultat je rekurziven postopek, ki omogoča hitro kodiranje in dekodiranje.

Dodatna funkcija stiskanja je zagotovljena s stisnjenim kodiranjem ponavljajočih se znakov. Če v zaporedju nekateri znaki sledijo v vrsti (na primer v besedilu so to lahko znaki "presledek", v zaporedju številk - zaporedne ničle itd.), Potem jih je smiselno nadomestiti s parom "znak; dolžina" ali "znak, dolžina". V prvem primeru koda označuje znak, s katerim bo zaporedje kodirano (običajno 1 bit), nato kodo ponavljajočega se znaka in dolžino zaporedja. V drugem primeru (za najpogosteje ponavljajoče se znake) predpona preprosto označuje znak za ponavljanje.

Dinamično stiskanje(Dynamic range compression, DRC) - zožitev (ali razširitev v primeru razširitve) dinamičnega obsega fonograma. Dinamično območje, je razlika med najtišjim in najglasnejšim zvokom. Včasih bo najtišji zvok v zvočnem zapisu nekoliko glasnejši od ravni hrupa, včasih pa nekoliko tišji od najglasnejšega. Strojne naprave in programe, ki izvajajo dinamično stiskanje, imenujemo kompresorji, med katerimi ločimo štiri glavne skupine: same kompresorje, omejevalnike, ekspanderje in vrata.

Cevni analogni kompresor DBX 566

Stiskanje navzdol in navzgor

Kompresija navzdol(Kompresija navzdol) zmanjša glasnost zvoka, ko ta začne presegati določen prag, tišje zvoke pa pusti nespremenjene. Ekstremna različica stiskanja navzdol je omejevalnik. Povečajte kompresijo Stiskanje navzgor po drugi strani poveča glasnost zvoka, če je pod pragom, ne da bi vplivalo na glasnejše zvoke. Obe vrsti kompresije obenem zožita dinamični razpon zvočnega signala.

Kompresija navzdol

Povečajte kompresijo

Ekspander in vrata

Če kompresor zmanjša dinamični razpon, ga ekspander poveča. Ko se nivo signala dvigne nad mejno raven, ga ekspander še poveča in s tem poveča razliko med glasnimi in tihimi zvoki. Naprave, kot je ta, se pogosto uporabljajo pri snemanju kompleta bobnov za ločevanje zvokov enega bobna od drugega.

Imenuje se vrsta ekspanderja, ki se ne uporablja za ojačanje glasnih zvokov, ampak za dušenje tihih zvokov, ki ne presegajo mejne vrednosti (na primer hrupa v ozadju). Vrata za hrup. V taki napravi, takoj ko raven zvoka postane nižja od praga, signal preneha prehajati. Običajno se vrata uporabljajo za dušenje hrupa med premori. Pri nekaterih modelih lahko zagotovite, da se zvok ne prekine nenadoma, ko doseže raven praga, ampak postopoma zbledi. V tem primeru je stopnja upadanja nastavljena z nadzorom upadanja.

Gate, tako kot druge vrste kompresorjev, je lahko odvisno od frekvence(tj. zdravljenje določenih frekvenčnih pasovih) in lahko deluje v načinu stranska veriga(glej spodaj).

Načelo delovanja kompresorja

Signal, ki vstopa v kompresor, se razdeli na dve kopiji. Ena kopija je poslana v ojačevalnik, v katerem je stopnja ojačanja nadzorovana z zunanjim signalom, druga kopija pa ta signal ustvari. Vstopi v napravo, imenovano side-chain, kjer se izmeri signal in na podlagi teh podatkov ustvari ovojnico, ki opisuje spremembo njegove prostornine.
Tako je zasnovana večina sodobnih kompresorjev, to je tako imenovani feed-forward tip. V starejših napravah (tip povratne informacije) se raven signala meri po ojačevalniku.

Obstajajo različne analogne tehnologije ojačevanja s spremenljivim ojačanjem, vsaka s svojimi prednostmi in slabostmi: cevna, optična z uporabo fotouporov in tranzistor. Pri delu z digitalnim zvokom (in urejevalnik zvoka ali DAW) lahko uporabljajo lastniške matematične algoritme ali posnemajo delovanje analognih tehnologij.

Glavni parametri kompresorjev

Prag

Kompresor zmanjša nivo zvočnega signala, če njegova amplituda preseže določeno mejno vrednost (prag). Običajno je podana v decibelih, pri čemer nižji prag (npr. -60 dB) pomeni, da bo obdelanega več zvoka kot višji prag (npr. -5 dB).

razmerje

Količina znižanja ravni je določena s parametrom razmerja: razmerje 4:1 pomeni, da če je vhodna raven 4 dB nad pragom, bo izhodna raven 1 dB nad pragom.
Na primer:
Prag = −10 dB
Vhod = −6 dB (4 dB nad pragom)
Izhod = −9 dB (1 dB nad pragom)

Pomembno je upoštevati, da se zatiranje ravni signala nadaljuje še nekaj časa po tem, ko ta pade pod mejno raven, ta čas pa je določen z vrednostjo parametra sprostitev.

Stiskanje z največjim razmerjem ∞:1 imenujemo omejitev. To pomeni, da je vsak signal nad pragom oslabljen na nivo praga (razen za kratek čas po nenadnem povečanju vhodne glasnosti). Za več podrobnosti glejte »Omejevalnik« spodaj.

Primeri različnih vrednosti razmerij

Napadi in sprosti

Kompresor zagotavlja določen nadzor nad tem, kako hitro se odziva na spremembe v dinamiki signala. Parameter Attack določa čas, ki je potreben, da kompresor zmanjša ojačanje na raven, določeno s parametrom Ratio. Sprostitev določa čas, v katerem kompresor, nasprotno, poveča ojačanje ali se vrne v normalno stanje, če raven vhodnega signala pade pod mejno vrednost.

Fazi napada in sprostitve

Ti parametri nakazujejo čas (običajno v milisekundah), ki bo potreben, da se ojačanje spremeni za določeno količino decibelov, običajno 10 dB. Na primer, če je v tem primeru Attack nastavljen na 1 ms, bo trajalo 1 ms, da se ojačenje zmanjša za 10 dB, in 2 ms, da se ojačenje zmanjša za 20 dB.

Pri mnogih kompresorjih je mogoče prilagoditi parametre Attack in Release, pri nekaterih pa so vnaprej nastavljeni in jih ni mogoče prilagoditi. Včasih so označeni kot "samodejni" ali "odvisni od programa", tj. spremeniti glede na vhodni signal.

koleno

Drug parameter kompresorja: trdo/mehko koleno. Določa, ali bo začetek stiskanja nenaden (trdo) ali postopen (mehko). Mehko koleno zmanjša opaznost prehoda iz suhega signala v stisnjen signal, zlasti pri visokih vrednostih Ratio in nenadnih povečanjih glasnosti.

Kompresija trdega in mehkega kolena

Vrh in RMS

Kompresor se lahko odzove na najvišje (kratkotrajne največje) vrednosti ali na povprečno raven vhodnega signala. Uporaba najvišjih vrednosti lahko povzroči ostra nihanja v stopnji stiskanja in celo popačenje. Zato kompresorji uporabijo povprečno funkcijo (običajno RMS) za vhodni signal, ko ga primerjajo z vrednostjo praga. To zagotavlja udobnejšo kompresijo, ki je bližje človeškemu dojemanju glasnosti.

RMS je parameter, ki odraža povprečno glasnost zvočnega zapisa. Z matematičnega vidika je RMS (Root Mean Square) povprečna kvadratna vrednost amplitude določenega števila vzorcev:

Stereo povezovanje

Kompresor v načinu stereo povezovanja uporabi enako ojačanje za oba stereo kanala. S tem se izognete stereo premikom, ki so lahko posledica posamezne obdelave levega in desnega kanala. Do tega premika pride, če je na primer glasen element premaknjen izven sredine.

Pridobitev ličila

Ker kompresor zmanjša celotno raven signala, običajno doda možnost fiksnega izhodnega ojačanja, da doseže optimalno raven.

Glej naprej

Funkcija vnaprejšnjega pogleda je zasnovana za reševanje težav, povezanih s previsokimi in prenizkimi vrednostmi Attack in Release. Predolg napadalni čas nam ne omogoča učinkovitega prestrezanja prehodnih pojavov, prekratek napadalni čas pa morda ne bo ugoden za poslušalca. Pri uporabi funkcije look-ahead je glavni signal zakasnjen glede na kontrolni signal, kar vam omogoča, da začnete stiskanje vnaprej, še preden signal doseže vrednost praga.
Edina pomanjkljivost te metode je časovni zamik signala, ki je v nekaterih primerih nezaželen.

Uporaba dinamičnega stiskanja

Stiskanje se uporablja povsod, ne samo v glasbenih zvočnih zapisih, ampak tudi povsod, kjer je treba povečati celotno glasnost brez povečanja najvišjih ravni, kjer se uporablja poceni oprema za reprodukcijo zvoka ali omejen prenosni kanal (sistemi za ozvočenje in komuniciranje, amaterski radio, itd.).

Med predvajanjem se uporabi kompresija glasba v ozadju(v trgovinah, restavracijah itd.), kjer niso zaželene opazne spremembe v glasnosti.

Toda najpomembnejše področje uporabe dinamične kompresije je glasbena produkcija in oddajanje. Kompresija se uporablja za "gostoto" in "drive" zvoka, za boljše medsebojno združevanje inštrumentov in predvsem pri obdelavi vokalov.

Vokali v rock in pop glasbi so pogosto stisnjeni, da izstopajo iz spremljave in dodajo jasnost. Za zatiranje sibilantnih fonemov se uporablja posebna vrsta kompresorja, uglašenega samo na določene frekvence - de-esser.

V inštrumentalnih delih se stiskanje uporablja tudi za učinke, ki niso neposredno povezani z glasnostjo, na primer, hitro upadajoče zvoke bobnov je mogoče narediti dolgotrajnejše.

Elektronska plesna glasba (EDM) pogosto uporablja stransko veriženje (glejte spodaj) - na primer, basovsko linijo lahko poganja boben ali podobno, da se prepreči trčenje basa in bobnov ter ustvari dinamično utripanje.

Stiskanje se pogosto uporablja pri oddajanju (radio, televizija, internetno oddajanje) za povečanje zaznane glasnosti ob zmanjšanju dinamičnega razpona izvornega zvoka (običajno CD-ja). Večina držav ima zakonske omejitve glede največje trenutne glasnosti, ki se lahko oddaja. Običajno se te omejitve izvajajo s stalnimi strojnimi kompresorji v zračni verigi. Poleg tega povečanje zaznane glasnosti izboljša "kakovost" zvoka z vidika večine poslušalcev.

Poglej tudi Vojna glasnosti.

Dosledno povečevanje glasnosti iste skladbe, predelane za CD od 1983 do 2000.

Stransko veriženje

Drugo stikalo kompresorja, ki ga pogosto srečamo, je "stranska veriga". V tem načinu pride do stiskanja zvoka ne glede na njegovo lastni ravni, in odvisno od ravni signala, ki vstopa v konektor, ki se običajno imenuje stranska veriga.

Za to obstaja več načinov uporabe. Na primer, pevec šeplja in vsi "s" izstopajo iz celotne slike. Njegov glas spustiš skozi kompresor in isti zvok dovajaš v konektor stranske verige, vendar skozi izenačevalnik. Z izenačevalnikom izrežete vse frekvence razen tistih, ki jih uporablja pevec pri izgovorjavi črke »s«. Običajno okoli 5 kHz, vendar se lahko giblje od 3 kHz do 8 kHz. Če nato kompresor preklopite v stranski način, bo glas stisnjen v tistih trenutkih, ko se izgovori črka "s". To je povzročilo napravo, znano kot de-esser. Ta način delovanja se imenuje "odvisno od frekvence".

Druga uporaba te funkcije se imenuje "ducker". Na primer, na radijski postaji gre glasba skozi kompresor, DJ-jeve besede pa skozi stransko verigo. Ko DJ začne klepetati, se glasnost glasbe samodejno zmanjša. Ta učinek je mogoče uspešno uporabiti tudi pri snemanju, na primer za zmanjšanje glasnosti delov klaviature med petjem.

Omejitev opečne stene

Kompresor in limiter delujeta približno enako, lahko rečemo, da je limiter kompresor z visokim razmerjem (od 10:1) in običajno nizkim časom napada.

Obstaja koncept omejevanja opečne stene - omejevanje z zelo visokim razmerjem (20:1 in več) in zelo hitrim napadom. V idealnem primeru ne dovoli, da bi signal sploh presegel raven praga. Rezultat bo neprijeten za uho, vendar bo to preprečilo poškodbe opreme za reprodukcijo zvoka ali pasovna širina kanal. Mnogi proizvajalci prav za ta namen v svoje naprave vgrajujejo omejevalnike.

Clipper vs. Omejevalnik, mehak in trd kliping

Kompresija je ena izmed najbolj mitov polnih tem v produkciji zvoka. Pravijo, da je Beethoven z njo celo strašil sosedove otroke:(

V redu, pravzaprav uporaba stiskanja ni nič težja od uporabe popačenja, glavna stvar je razumeti načelo njegovega delovanja in imeti dober nadzor. To bova zdaj skupaj videla.

Kaj je stiskanje zvoka

Prva stvar, ki jo morate razumeti pred pripravo, je stiskanje. delo z dinamičnim obsegom zvoka. In posledično ni nič drugega kot razlika med najglasnejšim in najtišjim nivojem signala:

Torej, stiskanje je stiskanje dinamičnega obsega. ja Samo kompresijo dinamičnega razpona ali z drugimi besedami znižanje glasnosti glasnih delov signala in povečanje glasnosti tihih delov. Nič več.

Morda se povsem upravičeno sprašujete, zakaj je potem tak hype povezan? Zakaj vsi govorijo o receptih za pravilne nastavitve kompresorja, vendar jih nihče ne deli? Zakaj kljub ogromnemu številu kul vtičnikov številni studii še vedno uporabljajo drage, redke modele kompresorjev? Zakaj nekateri proizvajalci uporabljajo kompresorje pri ekstremnih nastavitvah, drugi pa jih sploh ne uporabljajo? In kateri od njih ima na koncu prav?

Težave rešuje stiskanje

Odgovori na tovrstna vprašanja ležijo v ravnini razumevanja vloge kompresije pri delu z zvokom. In omogoča:

  1. Poudarite napad zvok, zaradi česar je bolj izrazit;
  2. “Nastavljanje” posameznih delov inštrumentov v miks, ki jim doda moč in "težo";
  3. Naredite skupine instrumentov ali celotno mešanico bolj povezano, tak en sam monolit;
  4. Rešite spore med orodji uporaba stranske verige;
  5. Popravite napake pevca ali glasbenikov, izravnavanje njihove dinamike;
  6. Z določeno nastavitvijo deluje kot umetniški učinek.

Kot lahko vidite, to ni nič manj pomemben ustvarjalni proces kot na primer ustvarjanje melodij ali ustvarjanje zanimivih tonov. Poleg tega je katero koli od zgornjih težav mogoče rešiti z uporabo 4 glavnih parametrov.

Osnovni parametri kompresorja

Kljub ogromnemu številu modelov programske in strojne opreme kompresorjev se vsa "čarovnija" stiskanja pojavi, ko pravilna nastavitev glavni parametri: prag, razmerje, napad in sprostitev. Oglejmo si jih podrobneje:

Prag ali odzivni prag, dB

Ta parameter vam omogoča, da nastavite vrednost, od katere bo deloval kompresor (to je stiskanje zvočnega signala). Torej, če nastavimo prag na -12dB, bo kompresor deloval le v tistih delih dinamičnega območja, ki presegajo to vrednost. Če je ves naš zvok tišji od -12 db, ga bo kompresor preprosto prepustil, ne da bi kakor koli vplival nanj.

Razmerje ali kompresijsko razmerje

Parameter razmerja določa, koliko bo stisnjen signal, ki presega prag. Malo matematike za popolno sliko: recimo, da smo nastavili kompresor s pragom -12 dB, razmerje 2:1 in mu napajali zanko bobna, v kateri je glasnost udarnega bobna -4 dB. Kakšen bo v tem primeru rezultat delovanja kompresorja?

V našem primeru stopnja udarca presega prag za 8 dB. Ta razlika glede na razmerje bo stisnjena na 4 dB (8 dB / 2). V kombinaciji z neobdelanim delom signala bo to vodilo do dejstva, da bo po obdelavi s kompresorjem glasnost udarnega bobna -8db (prag -12dB + stisnjen signal 4dB).

Napad, ga

To je čas, po katerem se kompresor odzove na prekoračitev odzivnega praga. Se pravi, če je čas napada nad 0ms - kompresor začne kompresijo preseganje signala praga ne takoj, ampak po določenem času.

Sprostitev ali obnovitev, ms

Nasprotje od napada - vrednost tega parametra vam omogoča, da določite, kako dolgo se raven signala vrne pod prag kompresor bo prenehal stiskati.

Preden nadaljujemo, toplo priporočam, da vzamete dobro znani vzorec, postavite kateri koli kompresor na njegov kanal in eksperimentirate z zgornjimi parametri 5-10 minut, da varno pritrdite material

Vse drugi parametri so neobvezni. Med različnimi modeli kompresorjev se lahko razlikujejo, delno tudi zato producenti uporabljajo različne modele za posebne namene (na primer en kompresor za vokale, drugi za skupino bobnov, tretji za glavni kanal). Ne bom se podrobneje ukvarjal s temi parametri, ampak bom le dal splošne informacije Da bi razumeli, za kaj gre:

  • Koleno ali pregib (trdo/mehko koleno). Ta parameter določa, kako hitro bo uporabljeno kompresijsko razmerje (razmerje): trdo po krivulji ali gladko. Opažam, da v načinu Soft Knee kompresor ne deluje linearno, ampak začne gladko (kolikor je to primerno, ko govorimo o milisekundah) kompresirati zvok že pred mejno vrednostjo. Za obdelavo skupin kanalov in celotnega miksa se pogosto uporablja soft knee (saj deluje neopazno), za poudarjanje atake in drugih lastnosti posameznih instrumentov pa se uporablja hard knee;
  • Način odziva: Peak/RMS. Način Peak je upravičen, ko morate strogo omejiti izbruhe amplitude, pa tudi pri signalih s kompleksno obliko, katerih dinamiko in berljivost je treba v celoti prenesti. Način RMS je zelo nežen do zvoka, kar vam omogoča, da ga zgostite, hkrati pa ohranite napad;
  • Foresight (Lookahead). To je čas, v katerem bo kompresor vedel, kaj ga čaka. Nekakšna predhodna analiza dohodnih signalov;
  • Ličila ali pridobitev. Parameter, ki vam omogoča kompenzacijo zmanjšanja glasnosti zaradi stiskanja.

Najprej in večina glavni nasvet , ki odpravlja vsa nadaljnja vprašanja o kompresiji: če a) razumete princip kompresije, b) trdno veste, kako ta ali oni parameter vpliva na zvok, in c) ste uspeli nekaj preizkusiti v praksi različni modeline rabiš nobenega nasveta več.

Popolnoma resno mislim. Če ste pozorno prebrali to objavo, eksperimentirali s standardnim kompresorjem vašega DAW in enim ali dvema vtičnikoma, vendar še vedno niste razumeli, v katerih primerih morate nastaviti velike napadalne vrednosti, kakšno razmerje uporabiti in v katerem načinu obdelati izvorni signal - potem boste še naprej iskali po internetu že pripravljene recepte in jih nepremišljeno uporabljali kjer koli.

Recepti za fino nastavitev kompresorja je nekako kot recepti za fino uravnavanje odjeka ali zbora - nima smisla in nima nobene zveze z ustvarjalnostjo. Zato vztrajno ponavljam edini pravi recept: oborožite se s tem člankom, dobrimi monitorskimi slušalkami, dodatkom za vizualni nadzor valovne oblike in preživite večer v družbi parih kompresorjev.

Ukrepajte!

, Medijski predvajalniki

Plošče, zlasti starejše, ki so bile posnete in proizvedene pred letom 1982, je bilo veliko manj verjetno, da bi jih mešali, da bi bil posnetek glasnejši. Reproducirajo naravno glasbo z naravnim dinamičnim razponom, ki se ohrani na plošči in izgubi v večini standardnih digitalnih formatov ali formatov visoke ločljivosti.

Pri tem seveda obstajajo izjeme – poslušajte nedavni album Stevena Wilsona pri založbi MA Recordings ali Reference Recordings in slišali boste, kako dober je lahko digitalni zvok. Vendar je to redko; večina sodobnih zvočnih posnetkov je glasnih in stisnjenih.

Kompresija glasbe je v zadnjem času deležna številnih kritik, vendar sem pripravljen staviti, da so skoraj vsi vaši najljubši posnetki stisnjeni. Nekatere so manj, nekatere bolj, a še vedno stisnjene. Stiskanje dinamičnega razpona je grešni kozel za slabo zvenečo glasbo, vendar močno stisnjena glasba ni nič novega: poslušajte albume Motown iz 60. let. Enako lahko rečemo za klasična dela Led Zeppelin ali mlajše albume Wilca in Radiohead. Stiskanje dinamičnega obsega zmanjša naravno razmerje med najglasnejšim in najtišjim zvokom v posnetku, zato je lahko šepet tako glasen kot krik. Težko je najti pop glasbo zadnjih 50 let, ki ni bila stisnjena.

Nedavno sem imel prijeten klepet z ustanoviteljem in urednikom revije Tape Op Larryjem Craneom o dobrih, slabih in grdih vidikih stiskanja. Larry Crane je sodeloval s skupinami in izvajalci, kot so Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi in Richmond Fontaine. Vodi tudi snemalni studio Jackpot! v Portlandu v Oregonu, kjer so nastopali The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him in mnogi, mnogi drugi.

Kot primer presenetljivo nenaravno zvenečih, a vseeno odličnih pesmi navajam Spoonov album They Want My Soul iz leta 2014. Crane se smeje in pravi, da ga posluša v avtu, ker tam zveni odlično. Kar nas pripelje do drugega odgovora na vprašanje, zakaj je glasba stisnjena: ker kompresija in dodatna "jasnost" olajšata poslušanje na hrupnih mestih.

Larry Crane v službi. Avtor fotografije: Jason Quigley

Ko ljudje rečejo, da jim je všeč zvok zvočnega posnetka, mislim, da jim je všeč glasba, kot da sta zvok in glasba neločljiva pojma. Zase pa razlikujem te pojme. Z vidika avdiofila je zvok lahko grob in surov, vendar to večini poslušalcev ne bo pomembno.

Mnogi inženirje masteringa hitro obtožijo prekomerne uporabe kompresije, vendar se kompresija izvaja neposredno med snemanjem, med mešanjem in šele nato med masteringom. Če niste bili osebno prisotni na vsaki od teh stopenj, ne boste mogli povedati, kako so instrumenti in vokalni deli zveneli na samem začetku procesa.

Crane je bil na udaru: "Če želi glasbenik namerno zveneti noro in popačeno, kot so plošče Guided by Voices, potem ni s tem nič narobe - želja vedno prevlada nad kakovostjo zvoka." Izvajalčev glas je skoraj vedno stisnjen, enako se dogaja z basom, bobni, kitarami in sintetizatorji. Stiskanje ohranja glasnost vokala pri prava raven v celotni pesmi ali nekoliko izstopa od ostalih zvokov.

Pravilno opravljeno stiskanje lahko povzroči, da bobni zvenijo bolj živahno ali namenoma čudno. Da bi glasba zvenela odlično, morate znati uporabljati potrebna orodja. Zato so potrebna leta, da ugotovimo, kako uporabljati stiskanje, ne da bi pri tem pretiravali. Če mojster miksa preveč stisne kitarski del, inženir masteringa ne bo mogel več v celoti obnoviti manjkajočih frekvenc.

Če bi glasbeniki želeli, da poslušate glasbo, ki še ni šla skozi faze miksanja in masteringa, bi jo dali na police trgovin naravnost iz studia. Crane pravi, da ljudje, ki ustvarjajo, urejajo, miksajo in obvladujejo posneto glasbo, niso tam, da bi bili v napoto glasbenikom – umetnikom pomagajo že od začetka, več kot sto let.

Ti ljudje so del procesa ustvarjanja, katerega rezultat so neverjetna umetniška dela. Crane dodaja: "Nočete različice 'Dark Side of the Moon', ki ni bila miksana in masterirana." Pink Floyd so pesem izdali tako, kot so jo želeli slišati.




Vrh