Compresia în practică. Compresie dinamică Gamă dinamică comprimată sau standard

Acest grup de metode se bazează pe faptul că semnalele transmise suferă transformări neliniare de amplitudine, iar în părțile de emisie și de recepție neliniaritățile sunt reciproce. De exemplu, dacă funcția neliniară Öu este utilizată în transmițător, u 2 este utilizat în receptor. Aplicarea consecventă a funcțiilor reciproce va asigura că transformarea generală rămâne liniară.

Ideea metodelor de compresie a datelor neliniare este că transmițătorul poate, cu aceeași amplitudine a semnalelor de ieșire, să transmită o gamă mai mare de modificări ale parametrului transmis (adică un interval dinamic mai mare). Interval dinamic- acesta este raportul dintre cea mai mare amplitudine permisă a semnalului și cea mai mică, exprimată în unități relative sau decibeli:

; (2.17)
. (2.18)

Dorința naturală de a crește intervalul dinamic prin scăderea U min este limitată de sensibilitatea echipamentului și de influența crescândă a interferenței și a zgomotului propriu.

Cel mai adesea, compresia în intervalul dinamic se realizează folosind o pereche de funcții reciproce de logaritm și potențare. Se numește prima operație de modificare a amplitudinii comprimare(prin compresie), al doilea - expansiune(întinderea). Alegerea acestor funcții particulare este asociată cu cele mai mari capacități de compresie ale acestora.

În același timp, aceste metode au și dezavantaje. Prima dintre acestea este că logaritmul unui număr mic este negativ și în limită:

adică sensibilitatea este foarte neliniară.

Pentru a reduce aceste neajunsuri, ambele funcții sunt modificate prin deplasare și aproximare. De exemplu, pentru canalele telefonice funcția aproximativă are forma (tip A):

cu A=87,6. Câștigul de la compresie este de 24 dB.

Comprimarea datelor folosind proceduri neliniare este implementată prin mijloace analogice cu erori mari. Aplicație medii digitale poate îmbunătăți semnificativ acuratețea sau performanța conversiei. În același timp, utilizarea directă a fondurilor tehnologia calculatoarelor(adică calcularea directă a logaritmilor și exponenților) nu va da cele mai bune rezultate din cauza performanței scăzute și a acumularii erorilor de calcul.

Datorită limitărilor de precizie, compresia datelor prin compresie este utilizată în cazuri necritice, de exemplu, pentru transmiterea vorbirii prin canale telefonice și radio.

Codare eficientă

Codurile eficiente au fost propuse de K. Shannon, Fano și Huffman. Esența codurilor este că sunt inegale, adică cu un număr inegal de biți, iar lungimea codului este invers proporțională cu probabilitatea apariției acestuia. O altă mare caracteristică a codurilor eficiente este că nu necesită delimitatori, de exemplu. caractere speciale, separând combinațiile de coduri adiacente. Acest lucru se realizează respectând o regulă simplă: codurile mai scurte nu sunt începutul celor mai lungi. În acest caz, fluxul continuu de biți este decodificat în mod unic deoarece decodorul detectează mai întâi cuvintele de cod mai scurte. Codurile eficiente au fost mult timp pur academice, dar recent au fost folosite cu succes în crearea de baze de date, precum și în comprimarea informațiilor în modemurile moderne și arhivatoarele software.

Din cauza neuniformității, se introduce lungimea medie a codului. Lungimea medie - așteptarea matematică a lungimii codului:

mai mult, l av tinde spre H(x) de sus (adică l av > H(x)).

Îndeplinirea condiției (2.23) devine mai puternică pe măsură ce N crește.

Există două tipuri de coduri eficiente: Shannon-Fano și Huffman. Să vedem cum să le obținem folosind un exemplu. Să presupunem că probabilitățile simbolurilor din succesiune au valorile date în tabelul 2.1.

Tabelul 2.1.

Probabilități simbol

N
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simbolurile sunt ordonate, adică prezentate într-un rând în ordinea descrescătoare a probabilităților. După aceasta, folosind metoda Shannon-Fano, se repetă periodic următoarea procedură: întregul grup de evenimente este împărțit în două subgrupe cu aceleași (sau aproximativ aceleași) probabilități totale. Procedura continuă până când un element rămâne în următorul subgrup, după care acest element este eliminat, iar acțiunile specificate continuă cu cele rămase. Acest lucru se întâmplă până când rămâne un singur element în ultimele două subgrupe. Să continuăm cu exemplul nostru, care este rezumat în Tabelul 2.2.

Tabelul 2.2.

Codificare Shannon-Fano

N P i
4 0.3 eu
0.2 eu II
6 0.15 eu eu
0.1 II
1 0.1 eu eu
9 0.05 II II
5 0.05 II eu
7 0.03 II II eu
8 0.02 II

După cum se poate observa din tabelul 2.2, primul simbol cu ​​probabilitatea p 4 = 0,3 a participat la două proceduri de împărțire în grupuri și de ambele ori a ajuns în grupul numărul I. În conformitate cu aceasta, este codificat cu un cod II din două cifre. Al doilea element din prima etapă de despărțire a aparținut grupului I, al doilea - grupului II. Prin urmare, codul său este 10. Codurile simbolurilor rămase nu necesită comentarii suplimentare.

De obicei, codurile neuniforme sunt descrise ca arbori de coduri. Un arbore de cod este un grafic care indică combinațiile de cod permise. Direcțiile marginilor acestui grafic sunt prestabilite, așa cum se arată în Fig. 2.11 (alegerea direcțiilor este arbitrară).

Ei navighează în grafic după cum urmează: creează o rută pentru simbolul selectat; numărul de biți pentru acesta este egal cu numărul de muchii din traseu, iar valoarea fiecărui bit este egală cu direcția muchiei corespunzătoare. Traseul se întocmește din punctul de plecare (în desen este marcat cu litera A). De exemplu, traseul către vârful 5 este format din cinci muchii, toate, cu excepția ultimei, având direcția 0; primim codul 00001.

Să calculăm entropia și lungimea medie a cuvântului pentru acest exemplu.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 biți

l avg = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

După cum puteți vedea, lungimea medie a cuvântului este aproape de entropie.

Codurile Huffman sunt construite folosind un algoritm diferit. Procedura de codare constă în două etape. În prima etapă, compresiile unice ale alfabetului sunt efectuate secvenţial. Compresie unică - înlocuirea ultimelor două simboluri (cu cele mai mici probabilități) cu unul, cu o probabilitate totală. Compresiunile sunt efectuate până când rămân două caractere. În același timp, este completat un tabel de codificare, în care sunt introduse probabilitățile rezultate și sunt descrise rutele de-a lungul cărora noile simboluri se deplasează în etapa următoare.

În a doua etapă, are loc codificarea propriu-zisă, care începe din ultima etapă: primului dintre cele două simboluri i se atribuie codul 1, al doilea - 0. După aceasta, se trece la etapa anterioară. Codurile din etapa ulterioară sunt atribuite simbolurilor care nu au participat la compresie în această etapă, iar codul simbolului obținut după lipire este atribuit de două ori ultimelor două simboluri și adăugat la codul caracterului superior 1, mai mic - 0. Dacă caracterul nu este mai departe în lipire participă, codul său rămâne neschimbat. Procedura continuă până la final (adică până la prima etapă).

Tabelul 2.3 prezintă codarea Huffman. După cum se poate observa din tabel, codificarea a fost efectuată în 7 etape. În stânga sunt probabilitățile simbol, în dreapta sunt codurile intermediare. Săgețile arată mișcările simbolurilor nou formate. În fiecare etapă, ultimele două simboluri diferă doar în bitul cel mai puțin semnificativ, care corespunde tehnicii de codificare. Să calculăm lungimea medie a cuvântului:

l medie = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Acest lucru este și mai aproape de entropie: codul este și mai eficient. În fig. Figura 2.12 prezintă arborele de cod Huffman.

Tabelul 2.3.

Codare Huffman

N p i cod eu II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Ambele coduri satisfac cerința unei decodări clare: așa cum se poate vedea din tabele, combinațiile mai scurte nu reprezintă începutul codurilor mai lungi.

Pe măsură ce numărul de simboluri crește, eficiența codurilor crește, astfel încât în ​​unele cazuri sunt codificate blocuri mai mari (de exemplu, dacă despre care vorbim despre texte, puteți codifica unele dintre cele mai frecvente silabe, cuvinte și chiar fraze).

Efectul introducerii unor astfel de coduri este determinat prin compararea acestora cu un cod uniform:

(2.24)

unde n este numărul de biți ai codului uniform care este înlocuit cu cel efectiv.

Modificări ale codurilor Huffman

Algoritmul clasic Huffman este un algoritm cu două treceri, adică. necesită mai întâi colectarea de statistici despre simboluri și mesaje și apoi procedurile descrise mai sus. Acest lucru este incomod în practică, deoarece crește timpul necesar procesării mesajelor și acumulării unui dicționar. Mai des, sunt utilizate metode cu o singură trecere, în care procedurile de acumulare și codare sunt combinate. Astfel de metode sunt numite și compresie adaptivă conform lui Huffman [46].

Esența compresiei adaptive conform lui Huffman se rezumă la construirea unui arbore de cod inițial și la modificarea lui secvențială după sosirea fiecărui simbol următor. Ca și înainte, arborii de aici sunt binari, adică. Cel mult două arce emană din fiecare vârf al graficului arborelui. Se obișnuiește să se numească vârful original părinte, iar cele două vârfuri ulterioare conectate la el ca copii. Să introducem conceptul de greutate a vârfurilor - acesta este numărul de caractere (cuvinte) corespunzător unui punct dat, obținut la alimentarea secvenței inițiale. Evident, suma greutăților copiilor este egală cu greutatea părintelui.

După introducerea următorului simbol al secvenței de intrare, arborele de cod este revizuit: ponderile nodurilor sunt recalculate și, dacă este necesar, vârfurile sunt rearanjate. Regula pentru permutarea nodurilor este următoarea: ponderile vârfurilor inferioare sunt cele mai mici, iar vârfurile situate în stânga graficului au cele mai mici ponderi.

În același timp, vârfurile sunt numerotate. Numerotarea începe de la vârfurile inferioare (atârnând, adică fără copii) de la stânga la dreapta, apoi trece la nivel superior etc. înainte de a numerota ultimul vârf original. În acest caz, se obține următorul rezultat: cu cât greutatea unui vârf este mai mică, cu atât numărul acestuia este mai mic.

Permutarea se realizează în principal pentru vârfuri suspendate. La permutare trebuie luată în considerare regula formulată mai sus: vârfurile cu greutate mai mare au un număr mai mare.

După trecerea secvenței (se mai numește și control sau test), tuturor nodurilor suspendate li se atribuie combinații de coduri. Regula de atribuire a codurilor este similară cu cea de mai sus: numărul de biți ai codului este egal cu numărul de vârfuri prin care trece ruta de la sursă la vârful suspendat dat, iar valoarea unui anumit bit corespunde direcției de la părinte la „copil” (să zicem, a merge la stânga părintelui corespunde valorii 1, la dreapta - 0).

Combinațiile de cod rezultate sunt stocate în memoria dispozitivului de compresie împreună cu analogii lor și formează un dicționar. Utilizarea algoritmului este după cum urmează. Secvența de caractere comprimată este împărțită în fragmente în conformitate cu dicționarul existent, după care fiecare dintre fragmente este înlocuit cu codul său din dicționar. Fragmentele care nu se găsesc în dicționar formează noi vârfuri suspendate, capătă greutate și sunt, de asemenea, introduse în dicționar. În acest fel, se formează un algoritm adaptiv pentru completarea dicționarului.

Pentru a crește eficiența metodei, este de dorit să creșteți dimensiunea dicționarului; în acest caz raportul de compresie crește. În practică, dimensiunea dicționarului este de 4 - 16 KB de memorie.


Să ilustrăm algoritmul dat cu un exemplu. În fig. Figura 2.13 prezintă diagrama originală (se mai numește și arborele Huffman). Fiecare vârf al arborelui este arătat printr-un dreptunghi în care două numere sunt înscrise printr-o fracție: primul înseamnă numărul vârfului, al doilea înseamnă greutatea acestuia. După cum puteți vedea, corespondența dintre ponderile vârfurilor și numerele lor este satisfăcută.

Să presupunem acum că simbolul corespunzător vârfului 1 apare a doua oară în secvența de testare. Greutatea vârfului s-a schimbat așa cum se arată în Fig. 2.14, în urma căruia se încalcă regula de numerotare a vârfurilor. În etapa următoare, schimbăm locația vârfurilor suspendate, pentru care schimbăm vârfurile 1 și 4 și renumerotăm toate vârfurile arborelui. Graficul rezultat este prezentat în Fig. 2.15. Procedura continuă apoi în același mod.

Trebuie amintit că fiecare vârf agățat din arborele Huffman corespunde unui anumit simbol sau unui grup de simboluri. Părintele diferă de copii prin aceea că grupul de simboluri care îi corespunde este cu un simbol mai scurt decât cel al copiilor săi, iar acești copii sunt diferiți ultimul personaj. De exemplu, simbolurile „mașină” corespund părintelui; atunci copiii pot avea secvențele „kara” și „karp”.

Algoritmul dat nu este academic și este utilizat în mod activ în programele de arhivare, inclusiv la comprimarea datelor grafice (vor fi discutate mai jos).

algoritmi Lempel–Ziv

Aceștia sunt cei mai des utilizați algoritmi de compresie astăzi. Sunt folosite în majoritatea programelor de arhivare (de exemplu, PKZIP. ARJ, LHA). Esența algoritmilor este că un anumit set de simboluri este înlocuit în timpul arhivării cu numărul său într-un dicționar special generat. De exemplu, expresia „Numărul de ieșire pentru scrisoarea ta...”, care se găsește adesea în corespondența de afaceri, poate ocupa poziția 121 în dicționar; apoi, în loc să transmiteți sau să stocați fraza menționată (30 de octeți), puteți stoca numărul frazei (1,5 octeți în formă zecimală binară sau 1 octet în binar).

Algoritmii sunt numiți după autorii care i-au propus pentru prima dată în 1977. Dintre acestea, primul este LZ77. Pentru arhivare, este creată o așa-numită fereastră glisantă pentru mesaje, formată din două părți. Prima parte, un format mai mare, servește la formarea unui dicționar și are o dimensiune de aproximativ câțiva kiloocteți. A doua parte, mai mică (de obicei, până la 100 de octeți în dimensiune) acceptă caracterele curente ale textului care este vizualizat. Algoritmul încearcă să găsească în dicționar un set de caractere care să se potrivească cu cele primite în fereastra de vizualizare. Dacă aceasta are succes, se generează un cod format din trei părți: offset-ul din dicționar în raport cu subșirul său inițial, lungimea acestui subșir și caracterul care urmează acestui subșir. De exemplu, subșirul selectat este format din caracterele „app” (6 caractere în total), următorul caracter este „e”. Apoi, dacă subșirul are o adresă (loc în dicționar) 45, atunci intrarea din dicționar arată ca „45, 6. e”. După aceasta, conținutul ferestrei este mutat în funcție de poziție, iar căutarea continuă. Așa se formează un dicționar.

Avantajul algoritmului este un algoritm ușor de formalizat pentru compilarea unui dicționar. În plus, este posibil să dezarhivați fără dicționarul original (este recomandabil să aveți o secvență de testare) - dicționarul se formează în timpul dezarhivării.

Dezavantajele algoritmului apar pe măsură ce dimensiunea dicționarului crește - timpul de căutare crește. În plus, dacă în fereastra curentă apare un șir de caractere care nu se află în dicționar, fiecare caracter este scris cu un cod de trei elemente, adică. Rezultatul nu este compresia, ci întinderea.

Algoritmul LZSS, propus în 1978, are cele mai bune caracteristici. Are diferențe între suportul ferestrelor glisante și codurile de ieșire ale compresorului. În plus față de fereastră, algoritmul generează un arbore binar similar cu un arbore Huffman pentru a accelera căutarea potrivirilor: fiecare subșir care părăsește fereastra curentă este adăugat arborelui ca unul dintre copii. Acest algoritm vă permite să măriți și mai mult dimensiunea ferestrei curente (este de dorit ca dimensiunea acesteia să fie egală cu o putere de doi: 128, 256, etc. octeți). Codurile de secvență sunt, de asemenea, formate diferit: este introdus un prefix suplimentar de 1 bit pentru a distinge caracterele necodificate de perechile „offset, lungime”.

Un grad și mai mare de compresie se obține atunci când se utilizează algoritmi precum LZW. Algoritmii descriși anterior au o dimensiune fixă ​​a ferestrei, ceea ce face imposibilă introducerea în dicționar a frazelor mai lungi decât dimensiunea ferestrei. În algoritmii LZW (și predecesorul lor LZ78), fereastra de vizualizare are o dimensiune nelimitată, iar dicționarul acumulează fraze (și nu o colecție de caractere, ca înainte). Dicționarul are o lungime nelimitată, iar codificatorul (decodorul) funcționează în modul de așteptare a frazei. Când se formează o expresie care se potrivește cu dicționarul, este emis un cod de potrivire (adică codul acestei fraze în dicționar) și codul caracterului care îl urmează. Dacă, pe măsură ce simbolurile se acumulează, se formează o nouă frază, aceasta este și ea introdusă în dicționar, ca și cea mai scurtă. Rezultatul este o procedură recursivă care oferă codificare și decodare rapidă.

O caracteristică suplimentară de compresie este furnizată de codificarea comprimată a caracterelor care se repetă. Dacă într-o secvență urmează unele caractere pe rând (de exemplu, în text acestea pot fi caractere „spațiu”, într-o secvență de numere - zerouri consecutive etc.), atunci are sens să le înlocuiești cu perechea „caracter; lungime” sau „semn, lungime””. În primul caz, codul indică semnul că secvența va fi codificată (de obicei 1 bit), apoi codul caracterului care se repetă și lungimea secvenței. În al doilea caz (prevăzut pentru caracterele care se repetă cel mai frecvent), prefixul indică pur și simplu un semn de repetiție.

Compresie dinamică(Dynamic range compression, DRC) - îngustarea (sau extinderea în cazul unui expander) a intervalului dinamic al fonogramei. Interval dinamic, este diferența dintre cel mai silențios și cel mai puternic sunet. Uneori, cel mai silențios sunet dintr-o coloană sonoră va fi puțin mai puternic decât nivelul de zgomot, iar uneori puțin mai silențios decât cel mai tare. Dispozitivele hardware și programele care efectuează compresie dinamică se numesc compresoare, distingând între ele patru grupe principale: compresoare în sine, limitatoare, expansoare și porți.

Compresor analog cu tub DBX 566

Compresie în jos și în sus

Downcompresie(Compresia în jos) reduce volumul unui sunet atunci când acesta începe să depășească un anumit prag, lăsând sunetele mai silentioase neschimbate. O versiune extremă a compresiei în jos este limitator. Creșteți compresia Compresia în sus, pe de altă parte, crește volumul unui sunet dacă acesta este sub un prag, fără a afecta sunetele mai puternice. În același timp, ambele tipuri de compresie îngustează intervalul dinamic al semnalului audio.

Downcompresie

Creșteți compresia

Expander și Poartă

Dacă un compresor reduce intervalul dinamic, un expandor îl mărește. Când nivelul semnalului crește peste nivelul pragului, expander-ul îl crește și mai mult, crescând astfel diferența dintre sunetele puternice și cele slabe. Dispozitive ca acesta sunt adesea folosite la înregistrarea unui set de tobe pentru a separa sunetele unei tobe de alta.

Un tip de expandor care nu este folosit pentru a amplifica sunetele puternice, ci pentru a atenua sunetele silențioase care nu depășesc un nivel de prag (de exemplu, zgomotul de fundal) se numește Poarta de zgomot. Într-un astfel de dispozitiv, de îndată ce nivelul sunetului devine mai mic decât pragul, semnalul încetează să mai treacă. De obicei, o poartă este folosită pentru a suprima zgomotul în timpul pauzelor. La unele modele, vă puteți asigura că sunetul nu se oprește brusc când atinge un nivel de prag, ci se estompează treptat. În acest caz, rata de dezintegrare este setată de controlul Decay.

Gate, ca și alte tipuri de compresoare, poate fi dependent de frecventa(adică tratați anumite benzi de frecventa) și poate funcționa în modul lanț lateral(vezi mai jos).

Principiul de funcționare a compresorului

Semnalul care intră în compresor este împărțit în două copii. O copie este trimisă la un amplificator, în care gradul de amplificare este controlat de un semnal extern, iar a doua copie generează acest semnal. Acesta intră într-un dispozitiv numit side-chain, unde se măsoară semnalul și, pe baza acestor date, se creează un plic care descrie modificarea volumului acestuia.
Așa sunt proiectate majoritatea compresoarelor moderne, acesta este așa-numitul tip feed-forward. La dispozitivele mai vechi (tip feedback), nivelul semnalului este măsurat după amplificator.

Există diverse tehnologii analogice de amplificare cu câștig variabil, fiecare cu propriile sale avantaje și dezavantaje: tub, optică cu fotorezistoare și tranzistor. Când lucrați cu audio digital (în editor de sunet sau DAW) poate folosi algoritmi matematici proprietari sau emula funcționarea tehnologiilor analogice.

Principalii parametri ai compresoarelor

Prag

Un compresor reduce nivelul unui semnal audio dacă amplitudinea acestuia depășește o anumită valoare de prag (prag). De obicei este specificat în decibeli, cu un prag mai mic (de ex. -60 dB) ceea ce înseamnă că va fi procesat mai mult audio decât un prag mai mare (de exemplu -5 dB).

raport

Valoarea reducerii nivelului este determinată de parametrul raport: raport 4:1 înseamnă că, dacă nivelul de intrare este cu 4 dB peste prag, nivelul de ieșire va fi cu 1 dB peste prag.
De exemplu:
Prag = −10 dB
Intrare = -6 dB (4 dB peste prag)
Ieșire = -9 dB (1 dB peste prag)

Este important să rețineți că suprimarea nivelului de semnal continuă o perioadă de timp după ce scade sub nivelul pragului, iar acest timp este determinat de valoarea parametrului eliberare.

Compresia cu un raport maxim de ∞:1 se numește limitare. Aceasta înseamnă că orice semnal peste nivelul pragului este atenuat la nivelul pragului (cu excepția unei perioade scurte după o creștere bruscă a volumului de intrare). Consultați „Limitator” de mai jos pentru mai multe detalii.

Exemple de diferite valori ale raportului

Atacare și eliberare

Un compresor oferă un anumit control asupra cât de repede răspunde la modificările dinamicii semnalului. Parametrul Attack determină timpul necesar compresorului pentru a reduce câștigul la un nivel determinat de parametrul Ratio. Release determină timpul în care compresorul, dimpotrivă, crește câștigul sau revine la normal dacă nivelul semnalului de intrare scade sub valoarea pragului.

Fazele de atac și eliberare

Acești parametri indică timpul (de obicei în milisecunde) necesar pentru a modifica câștigul cu o anumită cantitate de decibeli, de obicei 10 dB. De exemplu, în acest caz, dacă Attack este setat la 1 ms, va dura 1 ms pentru a reduce câștigul cu 10 dB și 2 ms pentru a reduce câștigul cu 20 dB.

Pe multe compresoare, parametrii Attack și Release pot fi ajustați, dar la unele sunt prestabiliți și nu pot fi ajustați. Uneori sunt desemnate ca „automate” sau „dependente de program”, adică. se modifică în funcție de semnalul de intrare.

Genunchi

Un alt parametru al compresorului: genunchi dur/moale. Acesta determină dacă începutul compresiei va fi brusc (dur) sau gradual (moale). Genunchiul moale reduce vizibilitatea tranziției de la semnalul uscat la semnalul comprimat, în special la valori mari ale raportului și creșteri bruște de volum.

Compresie genunchi dur și genunchi moale

Vârf și RMS

Compresorul poate răspunde la valori de vârf (maxim pe termen scurt) sau la nivelul mediu al semnalului de intrare. Utilizarea valorilor de vârf poate duce la fluctuații bruște ale gradului de compresie și chiar la distorsiuni. Prin urmare, compresoarele aplică o funcție medie (de obicei RMS) semnalului de intrare atunci când îl compară cu o valoare de prag. Acest lucru oferă o compresie mai confortabilă, mai aproape de percepția umană a zgomotului.

RMS este un parametru care reflectă volumul mediu al unei coloane sonore. Din punct de vedere matematic, RMS (Root Mean Square) este valoarea rădăcină pătrată medie a amplitudinii unui anumit număr de eșantioane:

Legătura stereo

Un compresor în modul de legătură stereo aplică același câștig la ambele canale stereo. Acest lucru evită schimbările stereo care pot rezulta din procesarea individuală a canalelor stânga și dreapta. Această deplasare are loc dacă, de exemplu, un element puternic este decentrat.

Câștig de machiaj

Deoarece compresorul reduce nivelul general al semnalului, de obicei adaugă o opțiune fixă ​​de câștig de ieșire pentru a atinge nivelul optim.

Priveste inainte

Funcția de anticipare este concepută pentru a rezolva problemele asociate atât cu valori prea mari, cât și prea scăzute de atac și eliberare. Un timp de atac prea lung nu ne permite să interceptăm efectiv tranzitorii, iar un timp de atac prea scurt poate să nu fie confortabil pentru ascultător. Când utilizați funcția de anticipare, semnalul principal este întârziat în raport cu semnalul de control, acest lucru vă permite să începeți compresia în avans, chiar înainte ca semnalul să atingă valoarea de prag.
Singurul dezavantaj al acestei metode este întârzierea semnalului, care în unele cazuri este nedorită.

Utilizarea compresiei dinamice

Compresia este folosită peste tot, nu numai în coloanele sonore muzicale, ci și oriunde este necesară creșterea volumului general fără creșterea nivelurilor de vârf, acolo unde se utilizează echipamente ieftine de reproducere a sunetului sau un canal de transmisie limitat (sisteme de adresare și comunicații, radio amator, etc.) .

Compresia este aplicată în timpul redării muzica de fundal(în magazine, restaurante etc.) unde nu se dorește orice modificări vizibile de volum.

Dar cel mai important domeniu de aplicare a compresiei dinamice este producția și difuzarea muzicii. Compresia este folosită pentru a da sunetului „grosime” și „drive”, pentru a combina mai bine instrumentele între ele, și mai ales atunci când procesează vocea.

Vocele din muzica rock și pop sunt adesea comprimate pentru a le face să iasă în evidență față de acompaniament și să adauge claritate. Un tip special de compresor reglat doar la anumite frecvențe - un de-esser - este folosit pentru a suprima fonemele sibilante.

În părțile instrumentale, compresia este folosită și pentru efecte care nu sunt direct legate de volum, de exemplu, sunetele de tobe care se deteriorează rapid pot fi făcute mai durabile.

Muzica electronică de dans (EDM) utilizează adesea înlănțuirea laterală (vezi mai jos) - de exemplu, linia de bas poate fi condusă de o tobă de picior sau similar pentru a preveni ciocnirea basului și a tobelor și pentru a crea o pulsație dinamică.

Compresia este utilizată pe scară largă în difuzare (radio, televiziune, transmisie pe internet) pentru a crește volumul perceput, reducând în același timp intervalul dinamic al sursei audio (de obicei, CD). Majoritatea țărilor au restricții legale cu privire la volumul maxim instantaneu care poate fi difuzat. De obicei, aceste limitări sunt implementate de compresoare hardware permanente din lanțul de aer. În plus, creșterea volumului perceput îmbunătățește „calitatea” sunetului din perspectiva majorității ascultătorilor.

Vezi si Războiul zgomotului.

Creșterea constantă a volumului aceleiași piese remasterizate pentru CD din 1983 până în 2000.

Înlănțuire laterală

Un alt comutator al compresorului frecvent întâlnit este „lanțul lateral”. În acest mod, compresia sunetului are loc indiferent de el propriul nivel, și în funcție de nivelul semnalului care intră în conector, care se numește de obicei lanț lateral.

Există mai multe utilizări pentru aceasta. De exemplu, vocalistul are un cioc și toate „s”-urile ies în evidență din imaginea de ansamblu. Îi treci vocea printr-un compresor și introduci același sunet în conectorul lanțului lateral, dar a trecut printr-un egalizator. Cu un egalizator, tăiați toate frecvențele, cu excepția celor folosite de vocalist atunci când pronunțați litera „s”. De obicei, în jur de 5 kHz, dar poate varia de la 3 kHz la 8 kHz. Dacă apoi puneți compresorul în modul de lanț lateral, vocea va fi comprimată în acele momente în care se pronunță litera „s”. Acest lucru a dus la un dispozitiv cunoscut sub numele de de-esser. Acest mod de lucru se numește „dependent de frecvență”.

O altă utilizare a acestei funcții se numește „ducker”. De exemplu, la un post de radio, muzica trece printr-un compresor, iar cuvintele DJ-ului vin printr-un lanț lateral. Când DJ-ul începe să converseze, volumul muzicii scade automat. Acest efect poate fi folosit cu succes și în înregistrare, de exemplu, pentru a reduce volumul părților de la tastatură în timp ce cântați.

Limitarea zidului de cărămidă

Compresorul și limitatorul funcționează aproximativ la fel; putem spune că limitatorul este un compresor cu un raport mare (de la 10:1) și, de obicei, un timp de atac scăzut.

Există un concept de limitare a zidului de cărămidă - limitare cu un raport foarte mare (20:1 și mai sus) și un atac foarte rapid. În mod ideal, nu permite semnalului să depășească deloc nivelul pragului. Rezultatul va fi neplăcut pentru ureche, dar acest lucru va preveni deteriorarea echipamentului de reproducere a sunetului sau excesul lățime de bandă canal. Mulți producători integrează limitatoare în dispozitivele lor tocmai în acest scop.

Clipper vs. Limitator, tăiere moale și tare

Compresia este unul dintre cele mai pline de mituri în producția de sunet. Se spune că Beethoven i-a speriat chiar și pe copiii vecinului cu ea:(

Bine, de fapt, utilizarea compresiei nu este mai dificilă decât utilizarea distorsiunii, principalul lucru este să înțelegeți principiul funcționării acesteia și să aveți un control bun. Asta vom vedea împreună acum.

Ce este compresia audio

Primul lucru de înțeles înainte de pregătire este compresia. lucrul cu gama dinamică a sunetului. Și, la rândul său, nu este altceva decât diferența dintre cele mai puternice și cele mai silentioase niveluri de semnal:

Asa de, compresia este compresia intervalului dinamic. Da, Doar compresie în intervalul dinamic, sau cu alte cuvinte scăderea nivelului părților puternice ale semnalului și creșterea volumului părților silentioase. Nu mai.

S-ar putea să vă întrebați în mod rezonabil de ce este conectat un astfel de hype atunci? De ce toată lumea vorbește despre rețete pentru setările corecte ale compresorului, dar nimeni nu le împărtășește? De ce, în ciuda numărului uriaș de plugin-uri cool, multe studiouri folosesc încă modele scumpe și rare de compresoare? De ce unii producători folosesc compresoare la setări extreme, în timp ce alții nu le folosesc deloc? Și care dintre ele are dreptate până la urmă?

Probleme rezolvate prin compresie

Răspunsurile la astfel de întrebări se află în planul înțelegerii rolului compresiei în lucrul cu sunetul. Și permite:

  1. Subliniați atacul sunet, făcându-l mai pronunțat;
  2. „Setarea” părților individuale ale instrumentelor în mix, adăugându-le putere și „greutate”;
  3. Faceți mai coezive grupurile de instrumente sau un amestec întreg, un astfel de monolit unic;
  4. Rezolvarea conflictelor dintre instrumente folosind sidechain;
  5. Corectați greșelile vocalistului sau ale muzicienilor, nivelându-le dinamica;
  6. Cu o anumită setare acționează ca un efect artistic.

După cum puteți vedea, acesta nu este un proces creativ mai puțin semnificativ decât, să zicem, a veni cu melodii sau a crea timbre interesante. Mai mult, oricare dintre problemele de mai sus poate fi rezolvată folosind 4 parametri principali.

Parametrii de bază ai compresorului

În ciuda numărului mare de modele software și hardware de compresoare, toată „magia” compresiei are loc atunci când setare corectă parametri principali: prag, raport, atac și eliberare. Să le privim mai detaliat:

Pragul sau pragul de răspuns, dB

Acest parametru vă permite să setați valoarea de la care va funcționa compresorul (adică comprimați semnalul audio). Deci, dacă setăm pragul la -12dB, compresorul va funcționa numai în acele părți ale intervalului dinamic care depășesc această valoare. Dacă tot sunetul nostru este mai silențios de -12db, compresorul îl va trece pur și simplu fără a-l afecta în vreun fel.

Raport sau raport de compresie

Parametrul raport determină cât de mult va fi comprimat un semnal care depășește pragul. Puțină matematică pentru a completa imaginea: să presupunem că am configurat un compresor cu un prag de -12dB, raport 2:1 și i-am alimentat o buclă de tobă în care volumul tobei este -4dB. Care va fi rezultatul funcționării compresorului în acest caz?

În cazul nostru, nivelul kick-ului depășește pragul cu 8 dB. Această diferență în funcție de raport va fi comprimată la 4dB (8dB / 2). Combinat cu partea neprocesată a semnalului, acest lucru va duce la faptul că, după procesarea de către un compresor, volumul tobei va fi de -8db (pragul -12dB + semnal comprimat 4dB).

Atacul, dna

Acesta este timpul după care compresorul va răspunde la depășirea pragului de răspuns. Adică, dacă timpul de atac este peste 0 ms - compresorul începe compresia depășirea semnalului de prag nu imediat, ci după un timp specificat.

Eliberare sau recuperare, ms

Opusul unui atac - valoarea acestui parametru vă permite să specificați cât timp după ce nivelul semnalului revine sub prag compresorul se va opri din comprimare.

Înainte de a merge mai departe, vă recomand insistent să luați o probă binecunoscută, să plasați orice compresor pe canalul său și să experimentați cu parametrii de mai sus timp de 5-10 minute pentru a fixa în siguranță materialul.

Toate alți parametri sunt opționali. Ele pot diferi între diferite modele de compresoare, motiv pentru care producătorii folosesc modele diferite în scopuri specifice (de exemplu, un compresor pentru voce, altul pentru un grup de tobe, un al treilea pentru canalul principal). Nu mă voi opri asupra acestor parametri în detaliu, ci doar voi da Informații generale Pentru a înțelege despre ce este vorba:

  • Genunchi sau îndoire (genunchi dur/moale). Acest parametru determină cât de repede va fi aplicat raportul (raportul) de compresie: dur de-a lungul unei curbe sau fără probleme. Remarc că în modul Soft Knee compresorul nu funcționează liniar, ci începe să comprima lin (în măsura în care acest lucru poate fi potrivit când vorbim de milisecunde) sunetul. deja înainte de valoarea pragului. Pentru a procesa grupuri de canale și amestecul general, se folosește adesea soft knee (deoarece funcționează neobservat), iar pentru a sublinia atacul și alte caracteristici ale instrumentelor individuale, se folosește hard knee;
  • Mod de răspuns: Vârf/RMS. Modul Peak este justificat atunci când trebuie să limitați strict exploziile de amplitudine, precum și pe semnalele cu o formă complexă, a căror dinamică și lizibilitate trebuie să fie transmise pe deplin. Modul RMS este foarte blând cu sunetul, permițându-ți să-l îngrozi în timp ce menții atacul;
  • Previziune (privire). Acesta este timpul în care compresorul va ști ce se întâmplă cu el. Un fel de analiză preliminară a semnalelor de intrare;
  • Machiaj sau câștig. Un parametru care vă permite să compensați scăderea volumului ca urmare a compresiei.

În primul rând și cel mai sfatul principal , care elimină toate întrebările ulterioare despre compresie: dacă a) înțelegeți principiul compresiei, b) știți cu fermitate cum afectează acest sau acel parametru sunetul și c) ați reușit să încercați mai multe în practică diferite modelenu mai ai nevoie de sfaturi.

Sunt absolut serios. Dacă ați citit cu atenție această postare, ați experimentat cu compresorul standard al DAW-ului dvs. și unul sau două plug-in-uri, dar tot nu ați înțeles în ce cazuri trebuie să setați valori mari de atac, ce raport să utilizați și în ce mod să procesați semnal sursă - atunci veți continua să căutați pe internet rețete gata preparate, aplicându-le fără gânduri oriunde.

Rețete de reglare fină a compresoarelor este un fel de rețete pentru reglarea fină a unei reverb sau refren - nu are sens și nu are nimic de-a face cu creativitatea. Prin urmare, repet cu insistență singura rețetă corectă: înarmați-vă cu acest articol, căști monitor bune, un plug-in pentru controlul vizual al formei de undă și petreceți seara în compania câtorva compresoare.

Ia măsuri!

, Playere media

Discurile, în special cele mai vechi care au fost înregistrate și produse înainte de 1982, erau mult mai puțin probabil să fie amestecate pentru a face înregistrarea mai tare. Ele reproduc muzică naturală cu o gamă dinamică naturală care se păstrează pe înregistrare și se pierde în majoritatea formatelor digitale standard sau de înaltă definiție.

Există, desigur, excepții de la acest lucru – ascultați albumul recent al lui Steven Wilson de la MA Recordings sau Reference Recordings și veți auzi cât de bun poate fi sunetul digital. Dar acest lucru este rar; majoritatea înregistrărilor audio moderne sunt puternice și comprimate.

Compresia muzicii a fost supusă multor critici în ultima vreme, dar sunt dispus să pariez că aproape toate înregistrările tale preferate sunt comprimate. Unele dintre ele sunt mai puține, altele sunt mai multe, dar totuși comprimate. Compresia din gama dinamică este un țap ispășitor pentru muzica care sună prost, dar muzica foarte comprimată nu este nimic nou: ascultați albumele Motown din anii '60. Același lucru se poate spune despre lucrările clasice ale lui Led Zeppelin sau despre albumele mai tinere ale lui Wilco și Radiohead. Compresia în intervalul dinamic reduce relația naturală dintre cele mai puternice și cele mai blânde sunete dintr-o înregistrare, astfel încât o șoaptă poate fi la fel de puternică ca un țipăt. Este destul de greu să găsești muzică pop din ultimii 50 de ani care să nu fi fost comprimată.

Am avut recent o discuție plăcută cu fondatorul și editorul revistei Tape Op, Larry Crane, despre aspectele bune, rele și urâte ale compresiei. Larry Crane a lucrat cu trupe și artiști precum Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi și Richmond Fontaine. De asemenea, conduce studioul de înregistrări Jackpot! în Portland, Oregon, care a fost casa The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him și mulți, mulți alții.

Ca exemplu de cântece surprinzător de nenaturale, dar totuși grozave, citez albumul lui Spoon din 2014, They Want My Soul. Crane râde și spune că o ascultă în mașină pentru că sună grozav acolo. Ceea ce ne aduce la un alt răspuns la întrebarea de ce muzica este comprimată: deoarece compresia și „claritatea” suplimentară fac mai ușor de auzit în locurile zgomotoase.

Larry Crane la serviciu. Fotografie de Jason Quigley

Când oamenii spun că le place sunetul unei înregistrări audio, cred că le place muzica, de parcă sunetul și muzica ar fi termeni inseparabili. Dar pentru mine, diferențiez aceste concepte. Din perspectiva unui audiofil, sunetul poate fi dur și brut, dar asta nu va conta pentru majoritatea ascultătorilor.

Mulți se grăbesc să-i acuze pe inginerii de mastering că folosesc excesiv compresia, dar compresia este aplicată direct în timpul înregistrării, în timpul mixării și abia apoi în timpul masterizării. Dacă nu ați fost personal prezent la fiecare dintre aceste etape, nu veți putea spune cum au sunat instrumentele și părțile vocale chiar la începutul procesului.

Crane era pe un val: „Dacă un muzician vrea să sune intenționat nebun și distorsionat precum înregistrările Guided by Voices, atunci nu este nimic în neregulă în asta – dorința depășește întotdeauna calitatea sunetului.” Vocea interpretului este aproape întotdeauna comprimată și același lucru se întâmplă cu bas, tobe, chitare și sintetizatoare. Compresia menține volumul vocii la nivelul potrivit pe tot parcursul cântecului sau iese puțin în evidență de restul sunetelor.

Compresia făcută corect poate face ca tobele să sune mai vioi sau mai ciudat în mod intenționat. Pentru a face muzica să sune grozav, trebuie să fiți capabil să utilizați instrumentele necesare. Acesta este motivul pentru care durează ani de zile pentru a-ți da seama cum să folosești compresia fără a exagera. Dacă inginerul de mixare comprimă prea mult partea de chitară, inginerul de mastering nu va mai putea restabili complet frecvențele lipsă.

Dacă muzicienii ar fi vrut să asculți muzică care nu a trecut prin etapele de mixare și masterizare, ar fi lansat-o pe rafturile magazinelor direct din studio. Crane spune că oamenii care creează, editează, mixează și stăpânesc muzică înregistrată nu sunt acolo pentru a le sta în calea muzicienilor - i-au ajutat pe artiști încă de la început, de mai bine de o sută de ani.

Acești oameni fac parte din procesul de creație care are ca rezultat opere de artă uimitoare. Crane adaugă: „Nu vrei o versiune a „Dark Side of the Moon” care să nu fi fost amestecată și stăpânită”. Pink Floyd a lansat melodia așa cum au vrut ei să o audă.




Top