Tömörítés a gyakorlatban. Dinamikus tömörítés Dinamikus tartomány tömörített vagy szabványos

Ez a módszercsoport azon alapul, hogy a továbbított jelek nemlineáris amplitúdó transzformáción mennek keresztül, és az adó és a vevő részben a nemlinearitások kölcsönösek. Például, ha az Öu nemlineáris függvényt használjuk az adóban, akkor az u 2 a vevőben. A reciprok függvények következetes alkalmazása biztosítja, hogy az általános transzformáció lineáris maradjon.

A nemlineáris adattömörítési módszerek lényege, hogy az adó a kimenő jelek azonos amplitúdójával nagyobb változási tartományt tud továbbítani az átvitt paraméterben (azaz nagyobb dinamikatartományban). Dinamikus hatókör- ez a legnagyobb megengedett jelamplitúdó és a legkisebb aránya, relatív egységekben vagy decibelekben kifejezve:

; (2.17)
. (2.18)

A dinamikus tartomány U min csökkentésével történő növelésének természetes vágyát a berendezés érzékenysége, valamint az interferencia és az önzaj növekvő hatása korlátozza.

A dinamikatartomány-tömörítést leggyakrabban a logaritmus és a potenciálás reciprok függvénye segítségével hajtják végre. Az amplitúdó megváltoztatásának első műveletét ún tömörítés(tömörítéssel), a második - terjeszkedés(nyújtás). Ezeknek a különleges funkcióknak a kiválasztása a legnagyobb tömörítési képességükhöz kapcsolódik.

Ugyanakkor ezeknek a módszereknek vannak hátrányai is. Ezek közül az első az, hogy egy kis szám logaritmusa negatív és a határértékben van:

vagyis az érzékenység nagyon nemlineáris.

E hiányosságok csökkentése érdekében mindkét függvényt eltolás és közelítés segítségével módosítjuk. Például a telefoncsatornák esetében a közelítő függvény alakja (A típus):

ahol A=87,6. A tömörítésből származó nyereség 24 dB.

A nemlineáris eljárásokkal történő adattömörítést analóg eszközökkel valósítják meg, nagy hibákkal. Alkalmazás digitális média jelentősen javíthatja az átalakítás pontosságát vagy teljesítményét. Ugyanakkor a pénzeszközök közvetlen felhasználása számítógépes technológia(vagyis a logaritmusok és kitevők közvetlen kiszámítása) nem fogja a legjobb eredményt adni az alacsony teljesítmény és a felhalmozódó számítási hibák miatt.

A pontossági korlátok miatt a tömörítéssel történő adattömörítést nem kritikus esetekben alkalmazzák, például a beszéd telefon- és rádiócsatornákon történő továbbítására.

Hatékony kódolás

A hatékony kódokat K. Shannon, Fano és Huffman javasolta. A kódok lényege, hogy egyenetlenek, azaz egyenlőtlen bitszámúak, és a kód hossza fordítottan arányos az előfordulási valószínűségével. A hatékony kódok másik nagy tulajdonsága, hogy nem igényelnek határolót, pl. speciális karakterek, elválasztja a szomszédos kódkombinációkat. Ez egy egyszerű szabály betartásával érhető el: a rövidebb kódok nem a hosszabbak kezdete. Ebben az esetben a folyamatos bitfolyam egyedi dekódolásra kerül, mivel a dekódoló először a rövidebb kódszavakat érzékeli. A hatékony kódok régóta tisztán akadémiai jellegűek, de a közelmúltban sikeresen alkalmazzák őket adatbázisok létrehozására, valamint a modern modemek és szoftverarchívumok információtömörítésére.

Az egyenetlenségek miatt az átlagos kódhossz kerül bevezetésre. Átlagos hossz - a kód hosszának matematikai elvárása:

sőt, l av felülről H(x)-re hajlik (azaz l av > H(x)).

A (2.23) feltétel teljesülése az N növekedésével erősebbé válik.

Kétféle hatékony kód létezik: Shannon-Fano és Huffman. Nézzük meg, hogyan szerezhetjük meg őket egy példa segítségével. Tegyük fel, hogy a sorozatban szereplő szimbólumok valószínűségei a 2.1. táblázatban megadott értékekkel rendelkeznek.

2.1. táblázat.

Szimbólum valószínűségek

N
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

A szimbólumok rangsoroltak, azaz egy sorban, a valószínűségek csökkenő sorrendjében jelennek meg. Ezt követően a Shannon-Fano módszerrel a következő eljárás periodikusan megismétlődik: a teljes eseménycsoportot két alcsoportra osztjuk azonos (vagy megközelítőleg azonos) összvalószínűséggel. Az eljárás addig folytatódik, amíg egy elem nem marad a következő alcsoportban, ezután ez az elem megszűnik, és a megadott műveletek folytatódnak a többivel. Ez addig történik, amíg az utolsó két alcsoportban már csak egy elem marad. Folytassuk példánkkal, amelyet a 2.2. táblázat foglal össze.

2.2. táblázat.

Shannon-Fano kódolás

N P i
4 0.3 én
0.2 én II
6 0.15 én én
0.1 II
1 0.1 én én
9 0.05 II II
5 0.05 II én
7 0.03 II II én
8 0.02 II

Amint a 2.2. táblázatból látható, az első szimbólum p 4 = 0,3 valószínűséggel két csoportra osztási eljárásban vett részt, és mindkét alkalommal az I. számú csoportba került. Ennek megfelelően kétjegyű kóddal van kódolva II. A második elem a felosztás első szakaszában az I. csoportba, a másodiknál ​​a II. csoportba tartozott. Ezért a kódja 10. A fennmaradó szimbólumok kódjai nem igényelnek további megjegyzéseket.

Általában a nem egységes kódokat kódfaként ábrázolják. A kódfa egy gráf, amely a megengedett kódkombinációkat jelzi. Ennek a gráfnak az éleinek irányai előre be vannak állítva, amint az a 2.11. ábrán látható (az irányok megválasztása tetszőleges).

A következőképpen navigálnak a grafikonon: útvonalat készítenek a kiválasztott szimbólumhoz; a bitek száma megegyezik az útvonal éleinek számával, és minden bit értéke megegyezik a megfelelő él irányával. Az útvonalat a kiindulási ponttól kezdjük meg (a rajzon A betűvel jelöljük). Például az 5. csúcshoz vezető útvonal öt élből áll, amelyek mindegyikének iránya az utolsó kivételével 0; 00001 kódot kapunk.

Számítsuk ki ennek a példának az entrópiáját és átlagos szóhosszát.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bit

l átlag = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Mint látható, az átlagos szóhossz közel van az entrópiához.

A Huffman-kódokat más algoritmussal állítják össze. A kódolási eljárás két szakaszból áll. Az első szakaszban az ábécé egyszeri tömörítését egymás után hajtják végre. Egyszeri tömörítés - az utolsó két szimbólum cseréje (a legkisebb valószínűséggel) eggyel, teljes valószínűséggel. A tömörítéseket addig hajtják végre, amíg két karakter marad. Ezzel egyidejűleg egy kódolási táblázat is kitöltésre kerül, amelybe beírják a kapott valószínűségeket, és ábrázolják azokat az útvonalakat, amelyek mentén az új szimbólumok a következő szakaszban mozognak.

A második szakaszban megtörténik a tényleges kódolás, amely az utolsó szakasztól kezdődik: a két szimbólum közül az elsőhöz 1-es kódot rendelünk, a másodikhoz 0-t. Ezt követően továbblépnek az előző szakaszra. A következő szakasz kódjait azokhoz a szimbólumokhoz rendeljük hozzá, amelyek ebben a szakaszban nem vettek részt a tömörítésben, és a ragasztás után kapott szimbólum kódját kétszer hozzárendeljük az utolsó két szimbólumhoz, és hozzáadjuk a felső karakter kódjához 1, a alsó - 0. Ha a karakter nincs tovább a ragasztásban részt vesz, akkor a kódja változatlan marad. Az eljárás a végéig (vagyis az első szakaszig) folytatódik.

A 2.3. táblázat a Huffman kódolást mutatja. Amint az a táblázatból látható, a kódolás 7 szakaszban történt. A bal oldalon a szimbólumvalószínűségek, a jobb oldalon a köztes kódok láthatók. A nyilak az újonnan kialakult szimbólumok mozgását mutatják. Minden szakaszban az utolsó két szimbólum csak a legkevésbé szignifikáns bitben tér el, ami megfelel a kódolási technikának. Számítsuk ki az átlagos szóhosszt:

l átlag = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Ez még közelebb áll az entrópiához: a kód még hatékonyabb. ábrán. A 2.12. ábra a Huffman kódfát mutatja.

2.3. táblázat.

Huffman kódolás

N p i kód én II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Mindkét kód kielégíti az egyértelmű dekódolás követelményét: a táblázatokból látható, hogy a rövidebb kombinációk nem jelentik a hosszabb kódok kezdetét.

A szimbólumok számának növekedésével a kódok hatékonysága növekszik, így bizonyos esetekben nagyobb blokkokat kódolnak (pl. arról beszélünk a szövegekkel kapcsolatban kódolhatja a leggyakrabban előforduló szótagokat, szavakat és akár kifejezéseket is).

Az ilyen kódok bevezetésének hatását egy egységes kóddal való összehasonlítás határozza meg:

(2.24)

ahol n az egységes kód bitjeinek száma, amelyet a hatékony bittel helyettesítenek.

Huffman kódok módosításai

A klasszikus Huffman-algoritmus egy kétmenetes algoritmus, azaz. először statisztikát kell gyűjteni a szimbólumokról és üzenetekről, majd a fent leírt eljárásokat. Ez a gyakorlatban kényelmetlen, mert megnöveli az üzenetek feldolgozásának és a szótár felhalmozásának idejét. Gyakrabban egymenetes módszereket használnak, amelyekben az akkumulációs és kódolási eljárásokat kombinálják. Az ilyen módszereket Huffman szerint adaptív tömörítésnek is nevezik [46].

Az adaptív tömörítés lényege Huffman szerint egy kezdeti kódfa felépítésében és minden következő szimbólum érkezése utáni szekvenciális módosításában rejlik. Mint korábban, a fák itt is binárisak, azaz. A fagráf minden csúcsából legfeljebb két ív indul ki. Szokás az eredeti csúcsot szülőnek, a hozzá kapcsolódó két következő csúcsot pedig gyermekként nevezni. Vezessük be a csúcssúly fogalmát - ez az egy adott csúcsnak megfelelő karakterek (szavak) száma, amelyet az eredeti sorozat betáplálásakor kapunk. Nyilvánvalóan a gyerekek súlyainak összege megegyezik a szülő súlyával.

A bemeneti sorozat következő szimbólumának bevezetése után a kódfa átdolgozásra kerül: a csúcsok súlyát újraszámítjuk, és szükség esetén a csúcsokat átrendezzük. A csúcsok permutálásának szabálya a következő: az alsó csúcsok súlya a legkisebb, és a gráf bal oldalán található csúcsok súlya a legkisebb.

Ugyanakkor a csúcsok meg vannak számozva. A számozás az alsó (függő, azaz gyermektelen) csúcsoktól balról jobbra indul, majd a felső szint stb. az utolsó, eredeti csúcs számozása előtt. Ebben az esetben a következő eredményt érjük el: minél kisebb egy csúcs súlya, annál kisebb a száma.

A permutációt főként függő csúcsokra hajtják végre. A permutálásnál figyelembe kell venni a fent megfogalmazott szabályt: a nagyobb súlyú csúcsok száma nagyobb.

A szekvencia átadása után (ezt vezérlésnek vagy tesztnek is nevezik) az összes függő csúcshoz kódkombinációt rendelnek. A kódok hozzárendelésének szabálya hasonló a fentiekhez: a kód bitjeinek száma megegyezik azon csúcsok számával, amelyeken keresztül az útvonal a forrástól az adott függő csúcsig halad, egy adott bit értéke pedig az iránynak felel meg. a szülőtől a „gyerekig” (mondjuk a szülőtől balra haladva az 1 értéknek felel meg, jobbra - 0 ).

Az így kapott kódkombinációkat a tömörítő eszköz memóriájában tárolják analógjaikkal együtt, és szótárt alkotnak. Az algoritmus használata a következő. A tömörített karaktersorozat a meglévő szótárnak megfelelően töredékekre van osztva, majd mindegyik töredéket lecseréli a szótárból származó kódjára. A szótárban nem található töredékek új függő csúcsokat képeznek, súlyt kapnak, és bekerülnek a szótárba is. Ily módon egy adaptív algoritmus jön létre a szótár feltöltésére.

A módszer hatékonyságának növelése érdekében kívánatos a szótár méretének növelése; ebben az esetben a tömörítési arány nő. A gyakorlatban a szótár mérete 4-16 KB memória.


Egy példával illusztráljuk az adott algoritmust. ábrán. A 2.13. ábra az eredeti diagramot mutatja (ezt Huffman-fának is nevezik). A fa minden csúcsát egy téglalap jelzi, amelybe két szám van beleírva egy törten keresztül: az első a csúcs számát, a második a súlyát jelenti. Mint látható, a csúcsok súlya és a számok közötti megfelelés teljesül.

Tegyük fel, hogy az 1. csúcsnak megfelelő szimbólum másodszor is megjelenik a tesztsorozatban. A csúcs súlya az ábrán látható módon megváltozott. 2.14, aminek következtében megsérül a csúcsok számozására vonatkozó szabály. A következő lépésben megváltoztatjuk a függő csúcsok helyét, ehhez felcseréljük az 1-es és 4-es csúcsokat, és átszámozzuk a fa összes csúcsát. Az eredményül kapott grafikon a ábrán látható. 2.15. Ezután az eljárás ugyanúgy folytatódik.

Emlékeztetni kell arra, hogy a Huffman-fában minden függő csúcs egy adott szimbólumnak vagy szimbólumcsoportnak felel meg. A szülő abban különbözik a gyerekektől, hogy a neki megfelelő szimbólumcsoport egy szimbólummal rövidebb, mint a gyermekeié, és ezek a gyerekek különbözőek. utolsó karakter. Például az "autó" szimbólumok a szülőnek felelnek meg; akkor a gyerekeknél előfordulhat a „kara” és a „karp” szekvencia.

Az adott algoritmus nem akadémikus, és aktívan használják az archiváló programokban, beleértve a grafikus adatok tömörítését is (az alábbiakban lesz szó).

Lempel–Ziv algoritmusok

Ezek ma a leggyakrabban használt tömörítési algoritmusok. A legtöbb archiváló programban használatosak (például PKZIP. ARJ, LHA). Az algoritmusok lényege, hogy egy bizonyos szimbólumkészletet az archiválás során annak száma helyettesít egy speciálisan generált szótárban. Például az üzleti levelezésben gyakran előforduló „A leveled kimenő száma...” kifejezés a 121. helyet foglalhatja el a szótárban; akkor az említett frázis (30 bájt) továbbítása vagy tárolása helyett a frázisszámot tárolhatja (1,5 bájt bináris decimális formában vagy 1 bájt bináris formában).

Az algoritmusokat azokról a szerzőkről nevezték el, akik először javasolták őket 1977-ben. Ezek közül az első az LZ77. Az archiváláshoz két részből álló, úgynevezett üzenet csúszó ablak készül. Az első, nagyobb formátumú rész szótár kialakítására szolgál, mérete körülbelül több kilobájt. A második, kisebb rész (általában legfeljebb 100 bájt méretű) a megtekintett szöveg aktuális karaktereit fogadja. Az algoritmus megpróbálja megtalálni a szótárban a megtekintő ablakban kapott karakterkészletet. Ha ez sikeres, egy kód jön létre, amely három részből áll: a szótárban a kezdeti részkarakterlánchoz viszonyított eltolásából, ennek a részkarakterláncnak a hosszából és az ezt követő karakterből. Például a kiválasztott részkarakterlánc "app" karakterekből áll (összesen 6 karakter), a következő karakter az "e". Ekkor, ha az alkarakterlánc címe (helye a szótárban) 45, akkor a szótár bejegyzése így néz ki: „45, 6. e”. Ezt követően az ablak tartalma pozíciónként eltolódik, és a keresés folytatódik. Így jön létre a szótár.

Az algoritmus előnye a könnyen formalizálható szótár összeállítási algoritmus. Ezenkívül az eredeti szótár nélkül is kicsomagolható (célszerű egy tesztsorrend) - a szótár a kibontás során jön létre.

Az algoritmus hátrányai a szótár méretének növekedésével – a keresési idő növekedésével – jelentkeznek. Ezen túlmenően, ha az aktuális ablakban olyan karaktersor jelenik meg, amely nem szerepel a szótárban, minden karakter egy három elemből álló kóddal íródik, pl. Az eredmény nem kompresszió, hanem nyújtás.

Az 1978-ban javasolt LZSS algoritmus rendelkezik a legjobb tulajdonságokkal. Különbségek vannak a tolóablak támogatásában és a kompresszor kimeneti kódjaiban. Az algoritmus az ablakon kívül egy Huffman-fához hasonló bináris fát is generál, hogy felgyorsítsa az egyezések keresését: minden, az aktuális ablakot elhagyó részkarakterlánc hozzáadódik a fához az egyik gyermekként. Ez az algoritmus lehetővé teszi az aktuális ablak méretének további növelését (kívánatos, hogy a mérete egyenlő legyen kettő hatványával: 128, 256 stb. bájt). A szekvenciakódokat is eltérően alakítják ki: egy további 1 bites előtagot vezetnek be a kódolatlan karakterek megkülönböztetésére az „eltolás, hosszúságú” pároktól.

Még nagyobb fokú tömörítés érhető el, ha olyan algoritmusokat használunk, mint az LZW. A korábban ismertetett algoritmusok fix ablakmérettel rendelkeznek, ami lehetetlenné teszi az ablakméretnél hosszabb kifejezések szótárba bevitelét. Az LZW algoritmusokban (és elődjükben, az LZ78-ban) a megtekintési ablak korlátlan méretű, és a szótárban kifejezések halmozódnak fel (és nem karaktergyűjtemény, mint korábban). A szótár korlátlan hosszúságú, a kódoló (dekódoló) pedig frázisvárakozó módban működik. Amikor a szótárnak megfelelő kifejezést alakítanak ki, egy megfelelő kód kerül kiadásra (vagyis ennek a szótárnak a kódja) és az azt követő karakter kódja. Ha a szimbólumok felhalmozódásával új kifejezés jön létre, akkor az is bekerül a szótárba, akárcsak a rövidebb. Az eredmény egy rekurzív eljárás, amely gyors kódolást és dekódolást biztosít.

További tömörítési funkciót biztosít az ismétlődő karakterek tömörített kódolása. Ha egy sorozatban néhány karakter egy sorban következik (például a szövegben ezek lehetnek „szóköz” karakterek, egy számsorozatban - egymást követő nullák stb.), akkor érdemes ezeket a „karakter” párral helyettesíteni; hossz” vagy „jel, hossz””. Az első esetben a kód jelzi a jelet, hogy a sorozat kódolásra kerül (általában 1 bites), majd az ismétlődő karakter kódját és a sorozat hosszát. A második esetben (amely a leggyakrabban előforduló ismétlődő karakterekre vonatkozik) az előtag egyszerűen ismétlődő jelet jelez.

Dinamikus tömörítés(Dynamic range compression, DRC) - a hangfelvétel dinamikatartományának szűkítése (vagy bővítő esetén bővítése). Dinamikus hatókör, a különbség a leghalkabb és a leghangosabb hang között. Néha a hangsáv leghalkabb hangja kicsit hangosabb, mint a zajszint, néha pedig egy kicsit halkabb, mint a leghangosabb. A dinamikus tömörítést végző hardvereszközöket és programokat tömörítőknek nevezzük, négy fő csoportot megkülönböztetve: maguk a kompresszorok, limiterek, bővítők és kapuk.

Cső analóg kompresszor DBX 566

Lefelé és felfelé irányuló tömörítés

Lenyomás(Lefelé tömörítés) csökkenti a hang hangerejét, ha az kezd meghaladni egy bizonyos küszöböt, így a halkabb hangok változatlanok maradnak. A lefelé irányuló tömörítés extrém változata az korlátozó. Növelje a tömörítést A felfelé irányuló tömörítés viszont növeli a hang hangerejét, ha az egy küszöb alatt van, anélkül, hogy ez befolyásolná a hangosabb hangokat. Ugyanakkor mindkét típusú tömörítés szűkíti az audiojel dinamikatartományát.

Lenyomás

Növelje a tömörítést

Expander és Gate

Ha egy kompresszor csökkenti a dinamikatartományt, egy bővítő növeli azt. Ha a jelszint a küszöbszint fölé emelkedik, a bővítő tovább növeli azt, ezzel növelve a hangos és halk hangok közötti különbséget. Az ehhez hasonló eszközöket gyakran használják dobkészlet rögzítésekor, hogy elválasszák az egyik dob hangját a másiktól.

Az a típusú bővítő, amelyet nem a hangos hangok erősítésére, hanem a küszöbértéket nem meghaladó halk hangok (például háttérzaj) csillapítására használnak, az ún. Zajkapu. Egy ilyen készülékben, amint a hangszint a küszöbérték alá csökken, a jel megszűnik. Általában egy kaput használnak a zaj elnyomására szünetek alatt. Egyes modelleken gondoskodhat arról, hogy a hang ne szűnik meg hirtelen, amikor elér egy küszöbszintet, hanem fokozatosan elhalkul. Ebben az esetben a csillapítási sebességet a Decay vezérlő határozza meg.

Gate, mint más típusú kompresszorok, lehet frekvencia függő(vagyis kezelni bizonyos frekvenciasávok), és ebben a módban is működhet oldallánc(lásd alább).

A kompresszor működési elve

A kompresszorba belépő jel két másolatra oszlik. Az egyik másolatot egy erősítőhöz küldik, amelyben az erősítés mértékét külső jel szabályozza, a második másolat pedig ezt a jelet generálja. Belép egy oldalláncnak nevezett eszközbe, ahol megmérik a jelet, és ezen adatok alapján egy burkot hoznak létre, amely leírja a térfogatának változását.
A legtöbb modern kompresszor így van kialakítva, ez az úgynevezett feed-forward típus. Régebbi készülékekben (visszacsatolásos típusú) a jelszintet az erősítő után mérik.

Különféle analóg változó erősítésű erősítési technológiák léteznek, mindegyiknek megvannak a maga előnyei és hátrányai: cső, fényellenállást használó optikai és tranzisztor. Ha digitális hanggal dolgozik (be hangszerkesztő vagy DAW) szabadalmaztatott matematikai algoritmusokat használhat, vagy emulálhatja az analóg technológiák működését.

A kompresszorok fő paraméterei

Küszöb

A kompresszor csökkenti az audiojel szintjét, ha az amplitúdója túllép egy bizonyos küszöbértéket (küszöböt). Általában decibelben adják meg, alacsonyabb küszöbértékkel (pl. -60 dB), ami azt jelenti, hogy több hang kerül feldolgozásra, mint egy magasabb küszöbérték (pl. -5 dB).

hányados

A szintcsökkentés mértékét az arányparaméter határozza meg: a 4:1 arány azt jelenti, hogy ha a bemeneti szint 4 dB-lel a küszöb felett van, akkor a kimeneti szint 1 dB-lel a küszöb felett lesz.
Például:
Küszöb = −10 dB
Bemenet = –6 dB (4 dB a küszöb felett)
Kimenet = –9 dB (1 dB küszöb felett)

Fontos szem előtt tartani, hogy a jelszint elnyomása még egy ideig folytatódik, miután az a küszöbszint alá esik, és ezt az időt a paraméter értéke határozza meg. kiadás.

A ∞:1 maximális arányú tömörítést korlátozónak nevezzük. Ez azt jelenti, hogy minden, a küszöbszint feletti jel a küszöbszintre csillapodik (kivéve a bemeneti hangerő hirtelen növekedését követő rövid ideig). További részletekért lásd a „Limiter” részt alább.

Példák különböző arányértékekre

Támadás és elengedés

A kompresszor bizonyos mértékig szabályozza, hogy milyen gyorsan reagál a jeldinamika változásaira. Az Attack paraméter határozza meg azt az időt, amely alatt a kompresszor az erősítést a Ratio paraméter által meghatározott szintre csökkenti. A kioldás azt az időt határozza meg, ameddig a kompresszor ezzel szemben növeli az erősítést, vagy visszaáll a normál értékre, ha a bemeneti jel szintje a küszöbérték alá esik.

Támadás és elengedés fázisai

Ezek a paraméterek azt az időt (általában ezredmásodpercben) jelzik, amely alatt az erősítés bizonyos decibellel, általában 10 dB-lel megváltozik. Például ebben az esetben, ha az Attack 1 ms-ra van állítva, akkor 1 ms kell az erősítést 10 dB-lel, 2 ms pedig 20 dB-lel csökkenteni.

Sok kompresszoron az Attack and Release paraméterek állíthatók, de egyeseknél ezek előre be vannak állítva és nem állíthatók be. Néha „automatikusnak” vagy „programfüggőnek” jelölik, pl. a bemeneti jeltől függően változik.

Térd

Egy másik kompresszor paraméter: kemény/puha térd. Meghatározza, hogy a tömörítés hirtelen (kemény) vagy fokozatos (lágy) indul-e. A puha térd csökkenti a száraz jelről a tömörített jelre való átmenet észrevehetőségét, különösen magas arányértékek és hirtelen hangerőnövekedés esetén.

Kemény térd és lágy térd kompresszió

Csúcs és RMS

A kompresszor reagálhat a csúcsértékekre (rövid távú maximum) vagy a bemeneti jel átlagos szintjére. A csúcsértékek használata a tömörítés mértékének éles ingadozását, sőt torzítását is okozhatja. Ezért a kompresszorok egy átlagos függvényt (általában RMS-t) alkalmaznak a bemeneti jelre, amikor azt egy küszöbértékkel hasonlítják össze. Ez kényelmesebb tömörítést biztosít, közelebb áll az emberi hangosság észleléséhez.

Az RMS egy olyan paraméter, amely a hangsáv átlagos hangerejét tükrözi. Matematikai szempontból az RMS (Root Mean Square) bizonyos számú minta amplitúdójának négyzetes középértéke:

Sztereó linkelés

A sztereó összekapcsolási módban lévő kompresszor mindkét sztereó csatornára ugyanazt az erősítést alkalmazza. Ezzel elkerülhető a sztereó eltolódás, amely a bal és a jobb csatorna egyéni feldolgozásából eredhet. Ez az eltolódás akkor következik be, ha például egy hangos elemet a középponttól eltérően pásztáznak.

Smink nyereség

Mivel a kompresszor csökkenti az általános jelszintet, általában egy rögzített kimeneti erősítés opciót ad hozzá az optimális szint eléréséhez.

Előretekint

Az előretekintés funkciót úgy tervezték, hogy megoldja a túl magas és túl alacsony Támadás és elengedés értékekkel kapcsolatos problémákat. A túl hosszú támadási idő nem teszi lehetővé a tranziensek hatékony elfogását, a túl rövid támadási idő pedig nem biztos, hogy kényelmes a hallgató számára. Az előretekintés funkció használatakor a fő jel késleltetett a vezérlőjelhez képest, ez lehetővé teszi a tömörítés előzetes elindítását, még mielőtt a jel elérné a küszöbértéket.
Ennek a módszernek az egyetlen hátránya a jel késleltetése, ami bizonyos esetekben nem kívánatos.

Dinamikus tömörítés használata

A tömörítést mindenhol alkalmazzák, nem csak a zenei hangsávokban, hanem mindenhol, ahol a teljes hangerő növelése szükséges a csúcsszintek növelése nélkül, ahol olcsó hangvisszaadó berendezéseket vagy korlátozott átviteli csatornát használnak (hangos hangosító és kommunikációs rendszerek, amatőr rádió, stb.) .

Lejátszás közben a rendszer tömörítést alkalmaz háttérzene(üzletekben, éttermekben stb.), ahol nem kívánatos a hangerő észrevehető változása.

De a dinamikus tömörítés legfontosabb alkalmazási területe a zenegyártás és a műsorszórás. A tömörítést a hang "vastagságának" és "hajtásának" adására, a hangszerek egymás közötti jobb kombinálására, és különösen az ének feldolgozásánál használják.

A rock- és popzene énekhangjait gyakran tömörítik, hogy kiemelkedjenek a kíséretből, és egyértelműbbé tegyék őket. Egy speciális, csak bizonyos frekvenciákra hangolt kompresszort - egy de-esser -t használnak a szibáló fonémák elnyomására.

A hangszeres részeken a tömörítést olyan effekteknél is alkalmazzák, amelyek nem közvetlenül kapcsolódnak a hangerőhöz, például a gyorsan lecsengő dobhangok tartósabbá tehetők.

Az elektronikus tánczene (EDM) gyakran oldalláncolást használ (lásd alább) – például a basszusvonalat rúgódob vagy hasonló hajthatja, hogy megakadályozza a basszus és a dob ütközését, és dinamikus lüktetést kelt.

A tömörítést széles körben használják műsorszórásban (rádió, televízió, internetes műsorszórás), hogy növeljék az észlelt hangerőt, miközben csökkentik a forrás hang (általában CD) dinamikatartományát. A legtöbb országban törvényi korlátozások vonatkoznak a sugározható maximális pillanatnyi hangerőre. Általában ezeket a korlátozásokat a légláncban lévő állandó hardveres kompresszorok valósítják meg. Ezenkívül az észlelt hangerő növelése a legtöbb hallgató szemszögéből javítja a hang "minőségét".

Lásd még Hangosság háború.

1983-tól 2000-ig folyamatosan növelték ugyanazon dal hangerejét, amelyet CD-re újramasztereltek.

Oldalláncolás

Egy másik gyakran előforduló kompresszorkapcsoló az „oldallánc”. Ebben az üzemmódban a hangtömörítés attól függetlenül megtörténik saját szint, és a csatlakozóba belépő jel szintjétől függően, amit oldalláncnak szoktak nevezni.

Ennek többféle felhasználása is van. Például az énekesnek lispje van, és az összes „s” kiemelkedik az összképből. A hangját egy kompresszoron vezeti át, és ugyanazt a hangot táplálja be az oldallánc csatlakozójába, de egy hangszínszabályzón keresztül. Egy hangszínszabályzóval minden frekvenciát levág, kivéve azokat, amelyeket az énekes az „s” betű kiejtésekor használ. Általában 5 kHz körül, de 3 kHz és 8 kHz között is lehet. Ha ezután a kompresszort oldallánc üzemmódba állítja, a hang azokban a pillanatokban lesz tömörítve, amikor az „s” betűt kiejtik. Ennek eredménye egy de-esser néven ismert eszköz. Ezt a munkamódszert „frekvenciafüggőnek” nevezik.

Ennek a funkciónak egy másik felhasználási módja a „ducker”. Például egy rádióállomásnál a zene egy kompresszoron megy keresztül, a DJ szavai pedig egy oldalláncon. Amikor a DJ csevegni kezd, a zene hangereje automatikusan csökken. Ez az effekt felvételnél is sikeresen használható, például éneklés közben a billentyűs részek hangerejének csökkentésére.

Téglafal korlátozó

A kompresszor és a limiter nagyjából egyformán működik, mondhatjuk, hogy a limiter nagy Arányú (10:1-től) és általában alacsony támadási idővel rendelkező kompresszor.

Létezik a téglafal-korlátozás koncepciója – nagyon magas arányú (20:1 és afölötti) limitálás és nagyon gyors támadás. Ideális esetben egyáltalán nem engedi, hogy a jel túllépje a küszöbszintet. Az eredmény kellemetlen lesz a fül számára, de ez megakadályozza a hangvisszaadó berendezés károsodását vagy a túlzott mértékű károsodást sávszélesség csatorna. Sok gyártó éppen erre a célra épít be korlátozókat a készülékeibe.

Clipper vs. Limiter, lágy és kemény nyírás

A tömörítés az egyik leginkább mítoszokkal teli téma a hangképzésben. Azt mondják, Beethoven még a szomszéd gyerekeit is megijesztette vele:(

Oké, valójában a tömörítés használata nem nehezebb, mint a torzítás, a lényeg az, hogy megértsük a működési elvét, és jól vezéreljük. Ezt fogjuk most együtt látni.

Mi az a hangtömörítés

Az első dolog, amit meg kell érteni az előkészítés előtt, a tömörítés. a hang dinamikus tartományával dolgozik. Ez pedig nem más, mint a leghangosabb és leghalkabb jelszint közötti különbség:

Így, A tömörítés a dinamikatartomány tömörítése. Igen, Éppen dinamikatartomány-tömörítés, vagy más szóval a jel hangos részeinek szintjének csökkentése és a csendes részek hangerejének növelése. Nem több.

Felmerülhet benned a kérdés, hogy akkor miért van ilyen hírverés? Miért beszél mindenki a megfelelő kompresszorbeállítás receptjeiről, de senki sem osztja meg őket? Miért használ sok stúdió még mindig drága, ritka kompresszormodelleket a nagyszerű beépülő modulok hatalmas száma ellenére? Miért használnak egyes gyártók extrém beállításokon a kompresszorokat, míg mások egyáltalán nem? És végül melyiküknek van igaza?

Tömörítéssel megoldott problémák

Az ilyen kérdésekre adott válaszok abban rejlenek, hogy megértsük a tömörítés szerepét a hanggal való munkában. És lehetővé teszi:

  1. Hangsúlyozza a támadást hang, így kifejezettebb;
  2. A hangszer egyes részeinek „beállítása” a mixbe, erőt és „súlyt” adva hozzájuk;
  3. Tegye egységesebbé a hangszercsoportokat vagy egy egész mixet, ilyen egyetlen monolit;
  4. Az eszközök közötti konfliktusok feloldása oldallánc használata;
  5. Javítsa ki az énekes vagy a zenészek hibáit, kiegyenlítik dinamikájukat;
  6. Egy bizonyos beállítással művészi hatásként működnek.

Mint látható, ez nem kevésbé jelentős alkotói folyamat, mint mondjuk dallamok kitalálása vagy érdekes hangszínek létrehozása. Ezenkívül a fenti problémák bármelyike ​​megoldható 4 fő paraméter használatával.

A kompresszor alapvető paraméterei

A kompresszorok nagyszámú szoftver- és hardvermodellje ellenére a tömörítés minden „varázslata” akkor következik be helyes beállítás fő paraméterek: Küszöb, Arány, Támadás és Elengedés. Nézzük meg őket részletesebben:

Küszöb vagy válaszküszöb, dB

Ez a paraméter lehetővé teszi, hogy beállítsa azt az értéket, amelytől kezdve a kompresszor működni fog (vagyis tömörítse az audiojelet). Tehát, ha a küszöböt -12 dB-re állítjuk, akkor a kompresszor csak a dinamikatartomány azon részein fog működni, amelyek túllépik ezt az értéket. Ha minden hangunk halkabb, mint -12db, akkor a kompresszor egyszerűen átengedi, anélkül, hogy bármilyen módon befolyásolná.

Arány vagy tömörítési arány

Az arány paraméter határozza meg, hogy a küszöbértéket meghaladó jel mennyire lesz tömörítve. Egy kis matek, hogy teljes legyen a kép: tegyük fel, hogy beállítottunk egy -12 dB küszöbű, 2:1 arányú kompresszort, és betápláltunk egy dobhurkot, amelyben -4 dB a rúgódob hangereje. Mi lesz ebben az esetben a kompresszor működésének eredménye?

Esetünkben a rúgás szintje 8 dB-lel haladja meg a küszöböt. Ez az arány szerinti különbség 4dB-re (8dB / 2) tömörül. Ez a jel feldolgozatlan részével kombinálva azt eredményezi, hogy a kompresszoros feldolgozás után a dob hangereje -8db lesz (küszöb -12dB + tömörített jel 4dB).

Támadás, ms

Ez az az idő, amely után a kompresszor reagál a válaszküszöb túllépésére. Vagyis ha a támadási idő 0 ms felett van - a kompresszor megkezdi a tömörítést a küszöbjel túllépése nem azonnal, hanem meghatározott idő elteltével.

Elengedés vagy helyreállítás, ms

A támadás ellentéte - ennek a paraméternek az értéke lehetővé teszi annak megadását, hogy a jelszint mennyi ideig térjen vissza a küszöb alá. a kompresszor abbahagyja a tömörítést.

Mielőtt továbblépnénk, erősen ajánlom, hogy vegyünk egy jól ismert mintát, helyezzünk el egy kompresszort a csatornájára, és kísérletezzünk a fenti paraméterekkel 5-10 percig az anyag biztonságos rögzítése érdekében.

Minden egyéb paraméterek megadása nem kötelező. Különböző kompresszormodellenként eltérőek lehetnek, részben ezért is használnak a gyártók különböző modelleket meghatározott célokra (például egy kompresszort az énekhanghoz, egy másikat egy dobcsoporthoz, egy harmadikat a mestercsatornához). Ezeken a paramétereken nem fogok részletesen foglalkozni, csak közlöm Általános információ Hogy megértsük, miről van szó:

  • Térd vagy hajlás (kemény/puha térd). Ez a paraméter határozza meg, hogy a tömörítési arány (arány) milyen gyorsan kerül alkalmazásra: görbe mentén keményen vagy egyenletesen. Megjegyzem, Soft Knee módban a kompresszor nem lineárisan működik, hanem simán elkezdi tömöríteni a hangot (amennyire ez megfelelő lehet, ha ezredmásodpercekről beszélünk). már a küszöbérték előtt. A csatornacsoportok és a teljes mix feldolgozásához gyakran használnak lágy térd (mivel észrevétlenül működik), az egyes hangszerek támadási és egyéb jellemzőinek hangsúlyozására pedig kemény térdet használnak;
  • Válaszmód: csúcs/RMS. A Peak mód akkor indokolt, ha szigorúan korlátozni kell az amplitúdójú burstokat, valamint összetett alakú jeleknél, amelyek dinamikáját és olvashatóságát teljes mértékben közvetíteni kell. Az RMS mód nagyon gyengéd a hangzáshoz, lehetővé téve annak sűrűsítését, miközben fenntartja a támadást;
  • Előrelátás (előretekintés). Ez az az idő, amely alatt a kompresszor tudni fogja, hogy mi történik vele. A bejövő jelek egyfajta előzetes elemzése;
  • Smink vagy nyereség. Olyan paraméter, amely lehetővé teszi a tömörítés következtében fellépő hangerő-csökkenés kompenzálását.

Először és a legtöbb fő tanács , amely kiküszöböli a tömörítéssel kapcsolatos további kérdéseket: ha a) megértette a tömörítés elvét, b) határozottan tudja, hogy ez vagy az a paraméter hogyan befolyásolja a hangzást, és c) sikerült a gyakorlatban kipróbálnia többet különböző modellekmár nincs szüksége tanácsra.

teljesen komolyan gondolom. Ha figyelmesen elolvasta ezt a bejegyzést, kísérletezett a DAW szabványos kompresszorával és egy vagy két beépülő modullal, de még mindig nem értette, milyen esetekben kell nagy támadási értékeket beállítani, milyen arányt kell használni és milyen módban kell feldolgozni a forrásjel - akkor továbbra is kész receptek után kutat az interneten, és meggondolatlanul alkalmazza őket bárhol.

Kompresszor finomhangolási receptek olyan, mint a reverb vagy refrén finomhangolásának receptje – ennek semmi értelme, és semmi köze a kreativitáshoz. Ezért kitartóan ismétlem az egyetlen helyes receptet: fegyverkezz fel ezzel a cikkel, jó monitorfejhallgatóval, egy plug-innel a hullámforma vizuális vezérléséhez, és töltsd az estét pár kompresszor társaságában.

Cselekszik!

, Médialejátszók

A lemezeket, különösen a régebbieket, amelyeket 1982 előtt rögzítettek és készítettek, sokkal kevésbé valószínű, hogy keverték, hogy hangosabbá tegyék a felvételt. Természetes zenét reprodukálnak természetes dinamikatartománnyal, amely megmarad a lemezen, és elveszik a legtöbb szabványos digitális vagy nagyfelbontású formátumban.

Ez alól persze vannak kivételek – hallgasd meg Steven Wilson legutóbbi albumát az MA Recordingstól vagy a Reference Recordingstól, és megtudhatod, milyen jó lehet a digitális hang. De ez ritka; a legtöbb modern hangfelvétel hangos és tömörített.

A zenetömörítést sok kritika érte az utóbbi időben, de hajlandó vagyok fogadni, hogy szinte az összes kedvenc felvételed tömörítve van. Némelyikük kevesebb, van, amelyik több, de mégis tömörítve. A dinamikatartomány-tömörítés bűnbak a rosszul hangzó zenékért, de az erősen tömörített zene nem újdonság: hallgass Motown-albumokat a '60-as évekből. Ugyanez mondható el a Led Zeppelin klasszikus műveiről vagy a Wilco és a Radiohead fiatalabb albumairól. A dinamikatartomány-tömörítés csökkenti a felvétel leghangosabb és leghalkabb hangjai közötti természetes kapcsolatot, így a suttogás olyan hangos lehet, mint a sikoly. Elég nehéz olyan popzenét találni az elmúlt 50 évből, amely ne lett volna tömörítve.

Nemrég jót beszélgettem a Tape Op magazin alapítójával és szerkesztőjével, Larry Crane-nel a tömörítés jó, rossz és csúnya aspektusairól. Larry Crane olyan zenekarokkal és előadókkal dolgozott együtt, mint Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi és Richmond Fontaine. Ő vezeti a Jackpot stúdiót is! Portlandben, Oregonban, ahol a The Breeders, a The Decemberists, az Eddie Vedder, a Pavement, az R.E.M., a She & Him és még sokan mások otthona volt.

A meglepően természetellenesen hangzó, de mégis nagyszerű dalokra példaként Spoon 2014-es They Want My Soul című albumát említem. Crane nevet, és azt mondja, hogy a kocsiban hallgatja, mert ott remekül szól. Ez elvezet bennünket arra a kérdésre, hogy miért van tömörítve a zene: mert a tömörítés és a további „tisztaság” megkönnyíti a hallást a zajos helyeken.

Larry Crane a munkahelyén. Fotó: Jason Quigley

Amikor az emberek azt mondják, hogy szeretik egy hangfelvétel hangját, azt hiszem, szeretik a zenét, mintha a hang és a zene elválaszthatatlan fogalmak lennének. De magam számára megkülönböztetem ezeket a fogalmakat. Az audiofil szemszögéből a hang durva és nyers lehet, de ez a legtöbb hallgató számára nem számít.

Sokan gyorsan vádolják a mastering mérnököket a tömörítés túlzott használatával, de a tömörítést közvetlenül a rögzítés, a keverés és csak azután alkalmazzák a mastering során. Hacsak nem volt személyesen jelen ezeken a szakaszokon, nem fogja tudni megmondani, hogyan szólaltak meg a hangszerek és a vokális részek a folyamat legelején.

Crane nagyon megfordult: „Ha egy zenész szándékosan őrültnek és torznak akar hangzani, mint a Guided by Voices lemezei, akkor nincs ezzel semmi baj – a vágy mindig felülmúlja a hangminőséget.” Az előadó hangja szinte mindig tömörített, és ugyanez történik basszusgitárral, dobbal, gitárral és szintetizátorral is. A tömörítés fenntartja az ének hangerejét a megfelelő szint az egész dalban, vagy egy kicsit kiemelkedik a többi hang közül.

A megfelelően végzett tömörítés élénkebbé vagy szándékosan furcsává teheti a dobok hangját. Ahhoz, hogy a zene nagyszerűen szóljon, tudnia kell használni a szükséges eszközöket. Ez az oka annak, hogy évekbe telik rájönni, hogyan lehet túlzásba vinni a tömörítést. Ha a mixmérnök túlságosan tömöríti a gitárrészt, a mastering mérnök többé nem tudja teljesen helyreállítani a hiányzó frekvenciákat.

Ha a zenészek azt akarták volna, hogy olyan zenét hallgass, amely még nem ment át a keverés és a mastering szakaszán, akkor egyenesen a stúdióból a boltok polcaira engednék. Crane szerint azok az emberek, akik zenei felvételeket készítenek, szerkesztenek, kevernek és készítenek, nem azért vannak, hogy a zenészek útjába álljanak – ők a kezdetek óta, több mint száz éve segítik a művészeket.

Ezek az emberek részei annak az alkotási folyamatnak, amely csodálatos műalkotásokat eredményez. Crane hozzáteszi: "Nem akarod a "Dark Side of the Moon" olyan verzióját, amelyet nem kevertek és nem mastereltek." A Pink Floyd úgy adta ki a dalt, ahogy hallani akarták.




Top