Saspiešana praksē. Dinamiskā saspiešana Dinamiskais diapazons saspiests vai standarta

Šī metožu grupa ir balstīta uz to, ka pārraidītie signāli tiek pakļauti nelineārām amplitūdas transformācijām, un raidošajā un uztverošajā daļā nelinearitātes ir savstarpēji apgrieztas. Piemēram, ja raidītājs izmanto nelineāru funkciju Öu , uztvērējs izmanto u 2 . Secīgā savstarpējo funkciju piemērošana novedīs pie tā, ka kopējā transformācija paliek lineāra.

Nelineāro datu saspiešanas metožu ideja ir tāda, ka raidītājs ar tādu pašu izejas signālu amplitūdu var pārraidīt lielāku pārraidītā parametra izmaiņu diapazonu (tas ir, lielāku dinamisko diapazonu). Dinamiskais diapazons ir lielākās pieļaujamās signāla amplitūdas attiecība pret mazāko, kas izteikta relatīvās vienībās vai decibelos:

; (2.17)
. (2.18)

Dabisko vēlmi palielināt dinamisko diapazonu, samazinot U min, ierobežo iekārtas jutība un traucējumu un iekšējā trokšņa ietekmes palielināšanās.

Visbiežāk dinamiskā diapazona saspiešana tiek veikta, izmantojot savstarpēju logaritmu un pastiprināšanas funkcijas. Tiek izsaukta pirmā amplitūdas maiņas darbība saspiešana(saspiešana), otrais - paplašināšana(stiept). Šo funkciju izvēle ir saistīta ar to lielāko saspiešanas iespēju.

Tajā pašā laikā šīm metodēm ir arī trūkumi. Pirmais no tiem ir tāds, ka neliela skaitļa logaritms ir negatīvs un robežās:

tas ir, jutība ir ļoti nelineāra.

Lai samazinātu šos trūkumus, abas funkcijas tiek modificētas ar novirzi un tuvināšanu. Piemēram, telefona kanāliem aptuvenajai funkcijai ir šāda forma (A tips):

kur A=87,6. Kompresijas ieguvums šajā gadījumā ir 24 dB.

Datu saspiešana ar nelineārām procedūrām tiek realizēta ar analogiem līdzekļiem ar lielām kļūdām. Pieteikums digitālie mediji var ievērojami uzlabot reklāmguvuma precizitāti vai veiktspēju. Tajā pašā laikā tieša līdzekļu izmantošana datorzinātne(t.i., tiešs logaritmu un eksponentu aprēķins) nedos labāko rezultātu zemās veiktspējas un uzkrājošo aprēķinu kļūdu dēļ.

Datu saspiešana ar saspiešanu precizitātes ierobežojumu dēļ tiek izmantota nekritiskos gadījumos, piemēram, balss pārraidei pa telefonu un radio kanāliem.

Efektīva kodēšana

Efektīvus kodus ierosināja K. Šenons, Fano un Hafmens. Kodu būtība ir tajā, ka tie ir nevienmērīgi, tas ir, ar nevienādu ciparu skaitu, un koda garums ir apgriezti proporcionāls tā rašanās varbūtībai. Vēl viena lieliska efektīvo kodu iezīme ir tā, ka tiem nav nepieciešami norobežotāji, t.i. īpašās rakstzīmes atdalot blakus esošo kodu kombinācijas. Tas tiek panākts, ievērojot vienkāršu noteikumu: īsāki kodi nav sākums garākiem kodiem. Šajā gadījumā nepārtrauktā bitu plūsma tiek nepārprotami dekodēta, jo dekodētājs vispirms nosaka īsākus modeļus. Efektīvi kodi jau sen ir tīri akadēmiski, taču pēdējā laikā tos veiksmīgi izmanto datu bāzu veidošanā, kā arī informācijas saspiešanā mūsdienu modemos un programmatūras arhivējos.

Nevienmērīguma dēļ tiek ieviests vidējais koda garums. Vidējais garums — koda garuma matemātiskā sagaidīšana:

turklāt l cf tiecas uz H(x) no augšas (tas ir, l cf > H(x)).

Nosacījuma (2.23) izpilde kļūst spēcīgāka, palielinoties N.

Ir divu veidu efektīvi kodi: Shannon-Fano un Huffman. Ņemsim piemēru, lai tos iegūtu. Pieņemsim, ka secības rakstzīmju varbūtībām ir vērtības, kas norādītas 2.1. tabulā.

2.1. tabula.

Simbolu varbūtības

N
pi 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simboli ir sarindoti, tas ir, tie tiek parādīti sērijās dilstošā varbūtību secībā. Pēc tam saskaņā ar Šenona-Fano metodi periodiski atkārtojas šāda procedūra: visa notikumu grupa tiek sadalīta divās apakšgrupās ar vienādām (vai aptuveni vienādām) kopējām varbūtībām. Procedūra turpinās, līdz nākamajā apakšgrupā paliek viens elements, pēc tam šis elements tiek likvidēts, un norādītās darbības turpinās ar atlikušajiem. Tas turpinās, līdz pēdējās divās apakšgrupās ir palicis tikai viens elements. Turpināsim aplūkot mūsu piemēru, kas apkopots 2.2. tabulā.

2.2. tabula.

Šenona-Fano kodēšana

N Pi
4 0.3 es
0.2 es II
6 0.15 es es
0.1 II
1 0.1 es es
9 0.05 II II
5 0.05 II es
7 0.03 II II es
8 0.02 II

Kā redzams 2.2. tabulā, pirmais simbols ar varbūtību p 4 = 0,3 piedalījās divās grupās sadalīšanas procedūrās un abas reizes iekļuva grupā ar numuru I . Attiecīgi tas ir kodēts ar divciparu kodu II. Otrais elements sadalīšanas pirmajā posmā piederēja I grupai, otrajā - II grupai. Tāpēc tā kods ir 10. Atlikušo rakstzīmju kodiem papildu komentāri nav nepieciešami.

Parasti neviendabīgie kodi tiek attēloti kā kodu koki. Kodu koks ir grafiks, kas norāda atļautās kodu kombinācijas. Šī grafika malu virzieni ir sākotnēji iestatīti, kā parādīts 2.11. attēlā (virzienu izvēle ir patvaļīga).

Pēc grafika tie tiek vadīti šādi: sastāda maršrutu izvēlētajam simbolam; bitu skaits tam ir vienāds ar malu skaitu maršrutā, un katra bita vērtība ir vienāda ar atbilstošās malas virzienu. Maršrutu zīmē no sākuma punkta (zīmējumā tas atzīmēts ar burtu A). Piemēram, maršruts uz virsotni 5 sastāv no piecām malām, no kurām visām, izņemot pēdējo, ir virziens 0; mēs saņemam kodu 00001.

Šajā piemērā mēs aprēķinām vārda entropiju un vidējo garumu.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 biti

lav = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 + 0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Kā redzat, vidējais vārda garums ir tuvu entropijai.

Huffman kodi tiek veidoti pēc cita algoritma. Kodēšanas procedūra sastāv no diviem posmiem. Pirmajā posmā secīgi tiek veikta vienreizēja alfabēta saspiešana. Vienreizēja saspiešana - pēdējo divu rakstzīmju (ar mazāko varbūtību) aizstāšana ar vienu, ar kopējo varbūtību. Saspiešana tiek veikta, līdz paliek divas rakstzīmes. Tajā pašā laikā tiek aizpildīta kodēšanas tabula, kurā tiek ierakstītas iegūtās varbūtības, un tiek attēloti arī maršruti, pa kuriem nākošajā posmā iziet jaunie simboli.

Otrajā posmā notiek faktiskā kodēšana, kas sākas no pēdējā posma: pirmajai no divām rakstzīmēm tiek piešķirts kods 1, otrajai - 0. Pēc tam viņi pāriet uz iepriekšējo posmu. Nākamā posma kodi tiek piešķirti rakstzīmēm, kas šajā posmā nepiedalījās saspiešanā, un pēc līmēšanas iegūtās rakstzīmes kods tiek divreiz piešķirts pēdējām divām rakstzīmēm un pievienots augšējās rakstzīmes kodam 1, apakšējais - 0. Ja rakstzīme nav tālāk līmēšanā piedalās, tā kods paliek nemainīgs. Procedūra turpinās līdz beigām (tas ir, līdz pirmajam posmam).

2.3. tabulā parādīts Huffman kodējums. Kā redzams tabulā, kodēšana tika veikta 7 posmos. Kreisajā pusē ir simbolu varbūtības, labajā pusē - starpkodi. Bultiņas parāda jaunizveidoto simbolu kustības. Katrā posmā pēdējās divas rakstzīmes atšķiras tikai ar vismazāko bitu, kas atbilst kodēšanas tehnikai. Aprēķiniet vidējo vārda garumu:

lav = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Tas ir vēl tuvāk entropijai: kods ir vēl efektīvāks. Uz att. 2.12 parāda Hafmena koda koku.

2.3. tabula.

Hafmena kodējums

N pi kodu es II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Abi kodi apmierina viennozīmīgas dekodēšanas prasību: kā redzams no tabulām, īsākas kombinācijas nav garāku kodu sākums.

Palielinoties simbolu skaitam, palielinās kodu efektivitāte, tāpēc dažos gadījumos tiek kodēti lielāki bloki (piemēram, ja mēs runājam par tekstiem, varat iekodēt dažas no visizplatītākajām zilbēm, vārdiem un pat frāzēm).

Šādu kodu ieviešanas efektu nosaka, salīdzinot tos ar vienotu kodu:

(2.24)

kur n ir vienotā koda ciparu skaits, kas tiek aizstāts ar spēkā esošo.

Hafmena kodu modifikācijas

Klasiskais Hafmena algoritms attiecas uz divkāršu, t.i. vispirms ir nepieciešama statistikas kopa par simboliem un ziņojumiem un pēc tam iepriekš aprakstītās procedūras. Praksē tas ir neērti, jo tas palielina ziņojumu apstrādes un vārdnīcas uzkrāšanas laiku. Biežāk tiek izmantotas vienas piespēles metodes, kurās tiek apvienotas uzkrāšanas un kodēšanas procedūras. Šādas metodes sauc arī par Huffman adaptīvo kompresiju [46].

Adaptīvās saspiešanas būtība saskaņā ar Hafmanu ir samazināta līdz sākotnējā koda koka uzbūvei un tā turpmākajai modifikācijai pēc katras nākamās rakstzīmes ierašanās. Tāpat kā iepriekš, koki šeit ir bināri, t.i. no katras grafkoka virsotnes nāk ne vairāk kā divi loki. Sākotnējo virsotni ir pieņemts saukt par vecāku, bet nākamās divas ar to saistītās virsotnes - par bērniem. Ieviesīsim virsotnes svara jēdzienu - tas ir noteiktai virsotnei atbilstošo rakstzīmju (vārdu) skaits, kas iegūts, iesniedzot sākotnējo secību. Acīmredzot bērnu svaru summa ir vienāda ar vecāku svaru.

Pēc nākamā ievades secības simbola ieviešanas tiek pārskatīts kodu koks: tiek pārrēķināti virsotņu svari un, ja nepieciešams, pārkārtotas virsotnes. Virsotņu permutācijas noteikums ir šāds: apakšējo virsotņu svari ir mazākie, un virsotnēm, kas atrodas grafika kreisajā pusē, ir vismazākais svars.

Tajā pašā laikā virsotnes ir numurētas. Numerācija sākas no apakšējām (karājas, t.i. bez bērniem) virsotnēm no kreisās puses uz labo, pēc tam tiek pārsūtīta uz augstākais līmenis utt. līdz pēdējās, sākotnējās virsotnes numerācijai. Šajā gadījumā tiek sasniegts šāds rezultāts: jo mazāks ir virsotnes svars, jo mazāks ir tās skaits.

Permutācija tiek veikta galvenokārt piekārtām virsotnēm. Pārkārtojot, jāņem vērā iepriekš formulētais noteikums: virsotnēm ar lielu svaru arī ir lielāks skaits.

Pēc secības iziešanas (to sauc arī par kontroli vai testu), kodu kombinācijas tiek piešķirtas visām piekārtajām virsotnēm. Koda piešķiršanas noteikums ir līdzīgs iepriekšminētajam: koda bitu skaits ir vienāds ar virsotņu skaitu, caur kurām maršruts iet no avota uz doto piekārto virsotni, un konkrētā bita vērtība atbilst virzienam no vecāks uz "bērnu" (teiksim, pārvietošanās pa kreisi no vecāka atbilst vērtībai 1, pa labi - 0 ).

Iegūtās kodu kombinācijas tiek ievadītas saspiešanas ierīces atmiņā kopā ar to kolēģiem un veido vārdnīcu. Algoritma izmantošana ir šāda. Saspiestā rakstzīmju secība tiek sadalīta fragmentos atbilstoši pieejamajai vārdnīcai, pēc kuras katrs no fragmentiem tiek aizstāts ar tā kodu no vārdnīcas. Fragmenti, kas nav atrodami vārdnīcā, veido jaunas nokarenas virsotnes, pieņemas svarā un tiek ievadīti arī vārdnīcā. Tādējādi veidojas adaptīvs vārdnīcas papildināšanas algoritms.

Lai palielinātu metodes efektivitāti, vēlams palielināt vārdnīcas apjomu; šajā gadījumā tiek palielināta kompresijas pakāpe. Praksē vārdnīcas apjoms ir 4 - 16 KB atmiņas.


Ilustrēsim iepriekš minēto algoritmu ar piemēru. Uz att. 2.13 parāda sākotnējo diagrammu (saukta arī par Huffman koku). Katra koka virsotne ir parādīta ar taisnstūri, kurā caur daļskaitli tiek ievadīti divi cipari: pirmais norāda virsotnes numuru, otrais - tā svaru. Kā redzat, atbilstība starp virsotņu svariem un to skaitļiem ir apmierināta.

Tagad pieņemsim, ka simbols, kas atbilst virsotnei 1, testa secībā parādās otro reizi. Virsotnes svars ir mainījies, kā parādīts attēlā. 2.14, kā rezultātā tiek pārkāpts virsotņu numerācijas noteikums. Nākamajā posmā mēs mainām piekārto virsotņu atrašanās vietu, kurām mēs samainām virsotnes 1 un 4 un pārnumurējam visas koka virsotnes. Iegūtais grafiks ir parādīts attēlā. 2.15. Pēc tam procedūra turpinās tādā pašā veidā.

Jāatceras, ka katrs Hafmena koka piekārtais mezgls atbilst noteiktam raksturam vai to grupai. Vecāks no bērniem atšķiras ar to, ka viņam atbilstošā tēlu grupa ir par vienu varoni īsāka nekā tā bērniem, un šie bērni ir atšķirīgi pēdējais varonis. Piemēram, vecāks atbilst rakstzīmēm "kar"; tad bērniem var būt secības "kara" un "karp".

Iepriekš minētais algoritms nav akadēmisks un tiek aktīvi izmantots arhivēšanas programmās, tostarp saspiežot grafiskos datus (tie tiks apspriesti tālāk).

Lempel-Ziva algoritmi

Šie ir mūsdienās visbiežāk izmantotie saspiešanas algoritmi. Tos izmanto lielākajā daļā programmu - arhivētāju (piemēram, PKZIP, ARJ, LHA). Algoritmu būtība ir tāda, ka arhivēšanas laikā noteikta rakstzīmju kopa tiek aizstāta ar tās numuru speciāli izveidotā vārdnīcā. Piemēram, frāze "Izejošais numurs jūsu vēstulei ...", kas bieži sastopama biznesa sarakstē, vārdnīcā var ieņemt 121. pozīciju; tad tā vietā, lai pārraidītu vai saglabātu frāzi (30 baiti), varat saglabāt frāzes numuru (1,5 baiti BCD vai 1 baiti binārajā formā).

Algoritmi ir nosaukti to autoru vārdā, kuri tos pirmo reizi ierosināja 1977. gadā. No tiem pirmais ir LZ77. Arhivēšanai tiek izveidots tā sauktais ziņojumu slīdošais logs, kas sastāv no divām daļām. Pirmā daļa, lielāka formāta, kalpo vārdnīcas veidošanai, un tās izmērs ir vairāki kilobaiti. Otrā, mazākā daļa (parasti līdz 100 baitiem) saņem pašreizējās skatītā teksta rakstzīmes. Algoritms mēģina vārdnīcā atrast rakstzīmju kopu, kas atbilst tām, kas saņemtas skata logā. Ja tas izdodas, tiek izveidots kods, kas sastāv no trim daļām: nobīde vārdnīcā attiecībā pret tās sākotnējo apakšvirkni, šīs apakšvirknes garums un rakstzīme, kas seko šai apakšvirknei. Piemēram, atlasītā apakšvirkne sastāv no rakstzīmēm "app" (kopā 6 rakstzīmes), pēc tās esošā rakstzīme ir "e". Tad, ja apakšvirknei ir adrese (vieta vārdnīcā) 45, tad ieraksts vārdnīcā izskatās kā "45, 6. e". Pēc tam loga saturs tiek pārvietots par pozīciju, un meklēšana turpinās. Tādējādi tiek veidota vārdnīca.

Algoritma priekšrocība ir viegli formalizējams vārdnīcas kompilācijas algoritms. Turklāt izsaiņošana iespējama bez sākotnējās vārdnīcas (vēlams, lai tajā pašā laikā būtu testa secība) - vārdnīca tiek veidota izsaiņošanas laikā.

Algoritma trūkumi parādās, palielinoties vārdnīcas izmēram - palielinās meklēšanas laiks. Turklāt, ja pašreizējā logā parādās rakstzīmju virkne, kas nav vārdnīcā, katra rakstzīme tiek rakstīta ar trīs elementu kodu, t.i. Tā nav saspiešana, bet paplašināšana.

1978. gadā piedāvātajam LZSS algoritmam ir vislabākā veiktspēja. Tam ir atšķirības bīdāmā loga uzturēšanā un kompresora izvades kodos. Papildus logam algoritms veido bināro koku, kas ir līdzīgs Hafmena kokam, lai paātrinātu sakritību meklēšanu: katra apakšvirkne, kas atstāj pašreizējo logu, tiek pievienota kokam kā viens no bērniem. Šis algoritms ļauj papildus palielināt pašreizējā loga izmēru (vēlams, lai tā vērtība būtu vienāda ar divu jaudu: 128, 256 utt. baiti). Arī secības kodi tiek veidoti atšķirīgi: tiek ieviests papildu 1 bita prefikss, lai atšķirtu nekodētas rakstzīmes no pāriem "nobīde, garums".

Vēl lielāka saspiešanas pakāpe tiek iegūta, izmantojot tādus algoritmus kā LZW. Iepriekš aprakstītajiem algoritmiem ir fiksēts loga izmērs, kas neļauj vārdnīcā ievadīt frāzes, kas garākas par loga izmēru. LZW algoritmos (un to priekšgājējā LZ78) skata logam ir neierobežots izmērs, un vārdnīcā tiek uzkrātas frāzes (un nevis rakstzīmju kolekcija, kā iepriekš). Vārdnīcai ir neierobežots garums, un kodētājs (dekodētājs) darbojas frāzes gaidīšanas režīmā. Kad tiek izveidota vārdnīcai atbilstoša frāze, tiek atgriezts atbilstības kods (t.i., šīs frāzes kods vārdnīcā) un tai sekojošās rakstzīmes kods. Ja, rakstzīmēm uzkrājoties, veidojas jauna frāze, tā tiek ievadīta vārdnīcā, kā arī īsāka. Rezultāts ir rekursīva procedūra, kas nodrošina ātru kodēšanu un dekodēšanu.

Papildu saspiešanas iespēju nodrošina atkārtotu rakstzīmju saspiesta kodēšana. Ja secībā pēc kārtas seko dažas rakstzīmes (piemēram, tekstā tās var būt "atstarpes" rakstzīmes, ciparu secībā - secīgas nulles utt.), tad ir jēga tās aizstāt ar "rakstzīmju pāri". ; garums" vai "zīme, garums". Pirmajā gadījumā kods norāda zīmi, ka secība tiks kodēta (parasti 1 bits), tad atkārtotās rakstzīmes kodu un secības garumu. Otrajā gadījumā (paredzēts visbiežāk sastopamajām rakstzīmēm), kas atkārtojas, prefikss vienkārši norāda atkārtojumu zīmi.

Dinamiskā saspiešana(Dynamic range compression, DRC) - fonogrammas dinamiskā diapazona sašaurināšanās (vai paplašinātāja gadījumā paplašināšana). Dinamiskais diapazons, ir atšķirība starp klusāko un skaļāko skaņu. Dažreiz klusākā skaņa fonogrammā būs nedaudz skaļāka par trokšņa līmeni un dažreiz nedaudz klusāka par skaļāko. Aparatūras ierīces un programmas, kas veic dinamisku saspiešanu, sauc par kompresoriem, starp tiem izšķirot četras galvenās grupas: paši kompresori, ierobežotāji, paplašinātāji un vārti.

Caurules analogais kompresors DBX 566

Uz leju un uz augšu kompresija

pazemināšana(Saspiešana uz leju) samazina skaņas skaļumu, kad tas pārsniedz noteiktu slieksni, atstājot klusākas skaņas nemainīgas. Ekstrēma pazemināšanas versija ir ierobežotājs. Uz augšu kompresija(Uz augšu kompresija), gluži pretēji, palielina skaņas skaļumu, ja tas ir zem sliekšņa vērtības, neietekmējot skaļākas skaņas. Tajā pašā laikā abi saspiešanas veidi sašaurina audio signāla dinamisko diapazonu.

pazemināšana

Uz augšu kompresija

Paplašinātājs un vārti

Ja kompresors samazina dinamisko diapazonu, paplašinātājs to palielina. Kad signāla līmenis kļūst virs sliekšņa līmeņa, paplašinātājs to vēl vairāk palielina, tādējādi palielinot atšķirību starp skaļām un klusām skaņām. Šādas ierīces bieži izmanto, ierakstot bungu komplektu, lai atdalītu vienas bungas skaņas no otras.

Paplašinātāja veids, ko izmanto nevis skaļu, bet klusu skaņu, kas nepārsniedz sliekšņa līmeni (piemēram, fona troksni), klusināšanai. trokšņu vārti. Šādā ierīcē, tiklīdz skaņas līmenis kļūst mazāks par slieksni, signāls pārstāj iet. Parasti vārtus izmanto, lai apspiestu troksni pauzēs. Dažos modeļos varat pārliecināties, ka, sasniedzot sliekšņa līmeni, skaņa neapstājas pēkšņi, bet pakāpeniski izzūd. Šajā gadījumā samazināšanās ātrumu nosaka samazināšanās kontrole.

Vārti, tāpat kā cita veida kompresori, var būt atkarībā no frekvences(t.i., ārstējiet noteiktus frekvenču joslas) un var darboties režīmā sānu ķēde(Skatīt zemāk).

Kompresora darbības princips

Kompresorā ienākošais signāls tiek sadalīts divās eksemplāros. Viena kopija tiek nosūtīta uz pastiprinātāju, kurā pastiprinājumu kontrolē ārējs signāls, otrā kopija veido šo signālu. Tas nonāk ierīcē, ko sauc par sānu ķēdi, kur tiek mērīts signāls, un, pamatojoties uz šiem datiem, tiek izveidots aploksne, kas apraksta tā apjoma izmaiņas.
Šādi ir sakārtoti lielākā daļa mūsdienu kompresoru, tas ir tā sauktais padeves veids. Vecākās ierīcēs (atgriezeniskās saites veids) signāla līmenis tiek mērīts pēc pastiprinātāja.

Ir dažādas analogās tehnoloģijas kontrolētai pastiprināšanai (mainīga pastiprinājuma pastiprināšanai), katrai no tām ir savas priekšrocības un trūkumi: lampas, optiskās, izmantojot fotorezistorus un tranzistorus. Strādājot ar digitālo audio (skaņas redaktorā vai DAW), var izmantot patentētus matemātiskos algoritmus vai emulēt analogās tehnoloģijas.

Kompresoru galvenie parametri

Slieksnis

Kompresors samazina audio signāla līmeni, ja tā amplitūda pārsniedz noteiktu sliekšņa vērtību (slieksni). To parasti norāda decibelos ar zemāku slieksni (piemēram, -60 dB), kas nozīmē, ka tiks apstrādāts vairāk skaņas nekā augstāks slieksnis (piemēram, -5 dB).

Attiecība

Līmeņa samazināšanas apjomu nosaka attiecības parametrs: attiecība 4:1 nozīmē, ka, ja ievades līmenis ir 4 dB virs sliekšņa, izejas līmenis būs par 1 dB virs sliekšņa.
Piemēram:
Slieksnis = -10 dB
Ieejas signāls = -6 dB (4 dB virs sliekšņa)
Izejas signāls = -9 dB (1 dB virs sliekšņa)

Ir svarīgi paturēt prātā, ka signāla līmeņa slāpēšana turpinās kādu laiku pēc tam, kad tas nokrīt zem sliekšņa līmeņa, un šo laiku nosaka parametra vērtība atbrīvot.

Saspiešanu ar maksimālo attiecību ∞:1 sauc par ierobežojošu. Tas nozīmē, ka jebkurš signāls, kas pārsniedz sliekšņa līmeni, tiek vājināts līdz sliekšņa līmenim (izņemot īsu laiku pēc pēkšņa ieejas skaļuma palielinājuma). Sīkāku informāciju skatiet sadaļā "Ierobežotājs".

Dažādu attiecību vērtību piemēri

Uzbrukums un atlaišana

Kompresors nodrošina zināmu kontroli pār to, cik ātri tas reaģē uz mainīgo signāla dinamiku. Parametrs Attack nosaka laiku, kas nepieciešams, lai kompresors samazinātu pastiprinājumu līdz līmenim, kas norādīts parametrā Ratio. Atlaišana nosaka laiku, kas nepieciešams, lai kompresors palielinātu pastiprinājumu vai atgrieztos normālā stāvoklī, ja ievades līmenis nokrītas zem sliekšņa.

Uzbrukuma un atbrīvošanas fāzes

Šie parametri norāda laiku (parasti milisekundēs), kas nepieciešams, lai pastiprinājums mainītos par noteiktu decibelu skaitu, parasti 10 dB. Piemēram, šajā gadījumā, ja opcija Attack ir iestatīta uz 1 ms, pastiprinājuma samazināšanai būs nepieciešams 1 ms par 10 dB un 2 ms par 20 dB.

Daudzos kompresoros Attack and Release parametrus var pielāgot, bet dažos tie ir iepriekš iestatīti un nav regulējami. Dažreiz tos sauc par "automātiskiem" vai "atkarīgiem no programmas", t.i. mainīt atkarībā no ieejas signāla.

celis

Vēl viena kompresora iespēja: ciets/mīksts celis. Tas nosaka, vai saspiešanas sākšana būs pēkšņa (cieta) vai pakāpeniska (mīksta). Mīkstais ceļgals samazina signāla pārejas no sausa uz saspiestu redzamību, īpaši pie lielām attiecībām un pēkšņa skaļuma pieauguma.

Cietā ceļa un mīkstā ceļa saspiešana

Maksimums un RMS

Kompresors var reaģēt uz maksimālo (īstermiņa maksimumu) vērtībām vai vidējo ieejas signāla līmeni. Maksimālo vērtību izmantošana var izraisīt lielas kompresijas pakāpes svārstības un pat izkropļojumus. Tāpēc, salīdzinot to ar sliekšņa vērtību, kompresori izmanto ieejas signāla vidējā noteikšanas funkciju (parasti RMS). Tas nodrošina ērtāku saspiešanu, kas ir tuvāk cilvēka uztverei par skaļumu.

RMS ir parametrs, kas atspoguļo fonogrammas vidējo skaļumu. No matemātiskā viedokļa RMS (Root Mean Square) ir noteikta skaita paraugu amplitūdas vidējā kvadrātiskā vērtība:

stereo savienošana

Kompresors stereo savienojuma režīmā abiem stereo kanāliem piemēro vienādu pastiprinājumu. Tādējādi tiek novērsta stereo paneļa maiņa, kas var rasties, apstrādājot kreiso un labo kanālu atsevišķi. Šāda nobīde rodas, ja, piemēram, jebkurš skaļš elements tiek panoramēts ārpus centra.

grima pieaugums

Tā kā kompresors samazina kopējo signāla līmeni, parasti izvadei tiek pievienota fiksēta pastiprinājuma opcija, lai iegūtu optimālo līmeni.

Skaties uz priekšu

Izskatīšanas funkcija ir paredzēta, lai atrisinātu problēmas, kas saistītas gan ar pārāk lielām, gan pārāk mazām Attack and Release vērtībām. Pārāk ilgs uzbrukuma laiks neļauj efektīvi pārtvert pārejas, un pārāk īss uzbrukuma laiks var nebūt ērts klausītājam. Izmantojot skatīšanās uz priekšu funkciju, galvenais signāls tiek aizkavēts attiecībā pret vadības signālu, kas ļauj sākt saspiešanu jau iepriekš, pat pirms signāls sasniedz sliekšņa vērtību.
Vienīgais šīs metodes trūkums ir signāla laika aizkave, kas dažos gadījumos ir nevēlama.

Dinamiskās saspiešanas izmantošana

Kompresiju izmanto visur, ne tikai mūzikas fonogrammās, bet arī visur, kur nepieciešams palielināt kopējo skaļumu, nepalielinot pīķa līmeņus, kur tiek izmantotas lētas skaņas reproducēšanas iekārtas vai ierobežots pārraides kanāls (publiskās apraides un sakaru sistēmas, amatieru radio u.c. .) .

Atskaņošanas laikā lietota saspiešana fona mūzika(veikalos, restorānos utt.), kur jebkādas manāmas apjoma izmaiņas nav vēlamas.

Bet vissvarīgākais dinamiskās saspiešanas pielietojums ir mūzikas producēšana un apraide. Saspiešana tiek izmantota, lai piešķirtu skaņai "biezumu" un "dzīt", lai labāk saskaņotu instrumentus savā starpā, un jo īpaši, apstrādājot vokālu.

Vokāls rokmūzikā un popmūzikā parasti tiek saspiests, lai tie izceltos no pavadījuma un pievienotu skaidrību. Lai nomāktu šņākošas fonēmas, tiek izmantots īpašs kompresora veids, kas noregulēts tikai uz noteiktām frekvencēm - de-esser.

Instrumentālajās partijās kompresija tiek izmantota arī efektiem, kas nav tieši saistīti ar skaļumu, piemēram, ātri izdziestošas ​​bungu skaņas var kļūt garākas.

Elektroniskajā deju mūzikā (EDM) bieži tiek izmantota sānu ķēde (skat. zemāk) – piemēram, basa līniju var vadīt ar sitienu vai tamlīdzīgi, lai novērstu basa/bungas konfliktu un radītu dinamisku pulsāciju.

Kompresiju plaši izmanto apraidē (radio, TV, internets), lai palielinātu uztverto skaļumu, vienlaikus samazinot oriģinālā audio (parasti kompaktdiska) dinamisko diapazonu. Lielākajā daļā valstu ir likumīgi ierobežojumi momentānajam maksimālajam apraides skaļumam. Parasti šos ierobežojumus ievieš pastāvīgi aparatūras kompresori gaisa ķēdē. Turklāt uztveramā skaļuma palielināšana uzlabo skaņas "kvalitāti" no lielākās daļas klausītāju viedokļa.

Skatīt arī Skaļuma karš.

Secīgs tās pašas dziesmas skaļuma palielinājums, kas pārveidots kompaktdiskam no 1983. līdz 2000. gadam.

sānu ķēde

Vēl viens izplatīts kompresora slēdzis ir "sānu ķēde". Šajā režīmā skaņa tiek saspiesta nevis atkarībā no tā līmeņa, bet gan atkarībā no signāla līmeņa, kas nonāk savienotājā, ko parasti sauc par sānu ķēdi.

Šim nolūkam ir vairāki lietojumi. Piemēram, vokālists ļima un visi burti "s" izceļas no kopējā attēla. Jūs izlaižat viņa balsi caur kompresoru, un tā pati skaņa tiek ievadīta sānu ķēdes ligzdā, bet tiek izlaista caur ekvalaizeru. Ekvalaizerā jūs noņemat visas frekvences, izņemot tās, kuras vokālists izmanto, izrunājot burtu "c". Parasti aptuveni 5 kHz, bet var būt no 3 kHz līdz 8 kHz. Ja pēc tam kompresoru ievietojat sānu ķēdes režīmā, tad balss saspiešana notiks tajos brīžos, kad tiek izrunāts burts “s”. Tādējādi tika iegūta ierīce, kas pazīstama kā "de-esser" (de-esser). Šo darbības veidu sauc par frekvences atkarīgu.

Vēl viens šīs funkcijas lietojums tiek saukts par "ducker". Piemēram, radiostacijā mūzika iet caur kompresoru, bet dīdžeja vārdi – pa sānu ķēdi. Kad dīdžejs sāk tērzēt, mūzikas skaļums automātiski samazināsies. Šo efektu var veiksmīgi izmantot arī ierakstā, piemēram, lai dziedāšanas laikā samazinātu klaviatūras daļu skaļumu.

ķieģeļu sienas ierobežojums

Kompresors un ierobežotājs darbojas aptuveni vienādi, mēs varam teikt, ka ierobežotājs ir kompresors ar augstu Ratio (no 10:1) un parasti zemu uzbrukuma laiku.

Pastāv ķieģeļu sienas ierobežošanas koncepcija - ierobežošana ar ļoti augstu attiecību (no 20:1 un vairāk) un ļoti ātru uzbrukumu. Ideālā gadījumā tas neļauj signālam vispār pārsniegt sliekšņa līmeni. Rezultāts būs nepatīkams ausij, taču tas novērsīs skaņas reproducēšanas iekārtu bojājumus vai pārsniegšanu joslas platums kanālu. Daudzi ražotāji savās ierīcēs integrē ierobežotājus tieši šim nolūkam.

Clipper vs. Ierobežotājs, mīksta un cieta griešana

Kompresija ir viena no mītiskākajām tēmām skaņas producēšanā. Viņi saka, ka Bēthovens pat nobiedējis kaimiņu bērnus:(

Labi, patiesībā kompresijas pielietošana nav grūtāka nekā kropļojumu izmantošana, galvenais ir saprast, kā tas darbojas, un labi kontrolēt. Ko mēs tagad esam kopā un pārliecināties.

Kas ir audio saspiešana

Pirmā lieta, kas jāsaprot pirms sagatavošanas, ir tā, ka kompresija ir strādāt ar skaņas dinamisko diapazonu. Un, savukārt, tas ir nekas vairāk kā atšķirība starp skaļāko un klusāko signāla līmeni:

Tātad šeit tas ir saspiešana ir dinamiskā diapazona saspiešana. Jā, Vienkārši dinamiskā diapazona saspiešana vai citiem vārdiem sakot samaziniet signāla skaļo daļu skaļumu un palieliniet kluso daļu skaļumu. Vairāk ne.

Jūs varat diezgan pamatoti brīnīties, kāds ir šādas ažiotāžas iemesls? Kāpēc visi runā par pareizas kompresora noregulēšanas receptēm, bet neviens ar tām nedalās? Kāpēc, neskatoties uz milzīgo foršo spraudņu skaitu, daudzas studijas joprojām izmanto dārgus retus kompresoru modeļus? Kāpēc daži ražotāji kompresorus izmanto ekstremālos iestatījumos, bet citi tos neizmanto vispār? Un kuram galu galā ir taisnība?

Problēmas, kuras atrisina saspiešana

Atbildes uz šādiem jautājumiem meklējamas kompresijas lomas darbā ar skaņu izpratnes plaknē. Un tas ļauj:

  1. Uzsveriet uzbrukumu skaņu, padarīt to izteiktāku;
  2. "Iesēdiniet" atsevišķas instrumentu daļas maisījumā, pievienojot tiem jaudu un "svaru";
  3. Padariet instrumentu grupas vai visu miksu saliedētāku, tāds viens monolīts;
  4. Atrisiniet konfliktus starp rīkiem izmantojot sānu ķēdi;
  5. Izlabojiet vokālista vai mūziķu trūkumus, izlīdzinot to dinamiku;
  6. Ar noteiktu iestatījumu darbojas kā māksliniecisks efekts.

Kā redzams, šis ir ne mazāk nozīmīgs radošais process kā, teiksim, melodiju izdomāšana vai interesantu tembru atskaņošana. Šajā gadījumā jebkuru no iepriekšminētajiem uzdevumiem var atrisināt, izmantojot 4 galvenos parametrus.

Kompresora galvenie parametri

Neskatoties uz milzīgo kompresoru programmatūras un aparatūras modeļu skaitu, visa saspiešanas "maģija" notiek ar pareiziem galveno parametru iestatījumiem: slieksnis, attiecība, uzbrukums un atbrīvošana. Apsvērsim tos sīkāk:

Slieksnis vai slieksnis, dB

Šis parametrs ļauj iestatīt vērtību, kādā kompresors darbosies (t.i., saspiest audio signālu). Tātad, ja mēs iestatīsim slieksni uz -12 dB, kompresors iedarbināsies tikai tajās dinamiskā diapazona vietās, kas pārsniedz šo vērtību. Ja visa mūsu skaņa ir klusāka par -12db, kompresors vienkārši izlaidīs to caur sevi, to nekādā veidā neietekmējot.

Attiecība vai malu attiecība

Attiecības parametrs nosaka, cik daudz signāls tiks saspiests, ja tas pārsniegs slieksni. Nedaudz matemātikas, lai pabeigtu attēlu: pieņemsim, ka mēs uzstādījām kompresoru ar slieksni -12 dB, attiecību 2:1 un padevām tam bungas cilpu ar sitiena skaļumu -4 dB. Kāds būs kompresora darbības rezultāts šajā gadījumā?

Mūsu gadījumā sitiena līmenis pārsniedz slieksni par 8 dB. Šī atšķirība tiks saspiesta līdz 4 dB (8 dB / 2) atbilstoši attiecībai. Kopā ar neapstrādāto signāla daļu tas novedīs pie tā, ka pēc kompresora apstrādes sitiena skaļums būs -8db (slieksnis -12dB + 4dB saspiests signāls).

Uzbrukums, ms

Šis ir laiks, pēc kura kompresors reaģēs uz sliekšņa pārsniegšanu. Tas ir, ja uzbrukuma laiks pārsniedz 0 ms − kompresors sāk saspiest sliekšņa signāla pārsniegšana nav momentāna, bet pēc noteiktā laika.

Atbrīvošana vai atjaunošana, ms

Pretējs uzbrukumam - šī parametra vērtība ļauj norādīt, cik ilgi pēc signāla līmeņa atgriešanās zem sliekšņa kompresors pārtrauks saspiešanu.

Pirms mēs turpinām, es ļoti iesaku paņemt labi zināmu paraugu, pievienot jebkuru kompresoru tā kanālam un eksperimentēt ar iepriekš minētajiem parametriem 5-10 minūtes, lai droši nostiprinātu materiālu.

Visi citi parametri nav obligāti. Tie var atšķirties dažādos kompresoru modeļos, un daļēji tāpēc ražotāji izmanto dažādus modeļus jebkuram konkrētam mērķim (piemēram, vienu kompresoru vokālam, otru bungu grupai, trešo galveno kanālu). Sīkāk pie šiem parametriem nekavēšos, bet tikai sniegšu Galvenā informācija lai saprastu, par ko ir runa:

  • Celis vai salocījums (ciets/mīksts ceļgalis). Šis parametrs nosaka, cik ātri tiks piemērota saspiešanas pakāpe (attiecība): cieta uz līknes vai gluda. Es atzīmēju, ka Soft Knee režīmā kompresors nedarbojas taisnā līnijā, bet iedarbojas vienmērīgi (cik tas var būt lietderīgi, ja mēs runājam par milisekundēm), lai pastiprinātu skaņu jau pirms sliekšņa vērtības. Lai apstrādātu kanālu grupas un kopējo miksu, biežāk tiek izmantots mīkstais ceļgals (jo tas darbojas nemanāmi), bet cietais ceļgals tiek izmantots, lai uzsvērtu uzbrukumu un citas atsevišķu instrumentu īpašības;
  • Reakcijas režīms: maksimums/RMS. Peak režīms ir attaisnojams, ja nepieciešams stingri ierobežot amplitūdas uzliesmojumus, kā arī signāliem ar sarežģītu formu, kuru dinamika un lasāmība ir pilnībā jānodod. RMS režīms ir ļoti maigs pret skaņu, ļaujot to kondensēt, vienlaikus saglabājot uzbrukumu;
  • Iepriekšēja doma (skats uz priekšu). Šis ir laiks, kurā kompresors zinās, ko sagaidīt. Sava veida ienākošo signālu iepriekšēja analīze;
  • Aplauzums vai peļņa. Parametrs, kas ļauj kompensēt apjoma samazināšanos saspiešanas rezultātā.

Pirmkārt un lielākā daļa galvenais padoms , kas novērš visus turpmākos jautājumus par saspiešanu: ja a) saprotat saspiešanas principu, b) stingri zināt, kā tas vai cits parametrs ietekmē skaņu, un c) paspējāt izmēģināt vairākus dažādi modeļitev nevajag nekādu padomu.

Es esmu pilnīgi nopietns. Ja uzmanīgi izlasījāt šo ierakstu, eksperimentējāt ar parasto DAW kompresoru un vienu vai diviem spraudņiem, taču nesapratāt, kādos gadījumos ir jāiestata lielas uzbrukuma vērtības, kuru attiecību izmantot un kādā režīmā apstrādāt oriģinālu. signālu, tad meklēsiet internetā gatavas receptes, tās nepārdomāti pielietojot jebkur.

Kompresora precīzās noregulēšanas receptes tas ir kā receptes reverba vai kora precizēšanai - bez jebkādas nozīmes un nekāda sakara ar radošumu. Tāpēc neatlaidīgi atkārtoju vienīgo patieso recepti: apbruņojies ar šo rakstu, labām monitora austiņām, spraudni viļņu formas vizuālai kontrolei un pavadi vakaru pāris kompresoru kompānijā.

Darīt!

, multivides atskaņotāji

Ierakstus, īpaši vecākus ierakstus, kas tika ierakstīti un izgatavoti pirms 1982. gada, bija daudz retāk miksēt, lai padarītu ierakstu skaļāku. Tie atveido dabisku mūziku ar dabisku dinamisko diapazonu, kas tiek saglabāts ierakstā un zaudēts lielākajā daļā standarta vai augstas izšķirtspējas digitālo formātu.

Protams, šeit ir izņēmumi – klausieties nesen izdoto Stīvena Vilsona albumu no MA Recordings vai Reference Recordings un dzirdēsiet, cik laba var būt digitālā skaņa. Bet tas notiek reti, lielākā daļa mūsdienu skaņu ierakstu ir skaļi un saspiesti.

Mūzikas kompresija pēdējā laikā ir daudz kritizēta, taču esmu gatavs derēt, ka gandrīz visi jūsu iecienītākie ieraksti ir saspiesti. Dažas no tām mazāk, dažas vairāk, bet tomēr saspiestas. Dinamiskā diapazona saspiešana ir grēkāzis, kas tiek vainots sliktās mūzikas skaņās, taču ļoti saspiesta mūzika nav nekas jauns: klausieties Motown 60. gadu albumus. To pašu var teikt par Led Zeppelin klasiku vai jaunākiem Wilco un Radiohead albumiem. Dinamiskā diapazona saspiešana samazina dabisko attiecību starp visskaļākajām un klusākajām skaņām ierakstā, tāpēc čuksts var būt tikpat skaļš kā kliedziens. Ir diezgan grūti atrast pēdējo 50 gadu popmūziku, kas nebūtu saspiesta.

Nesen man bija jauka tērzēšana ar žurnāla Tape Op dibinātāju un redaktoru Leriju Kreinu par saspiešanas labajiem, sliktajiem un "ļaunajiem" aspektiem. Lerijs Kreins ir strādājis ar tādām grupām un māksliniekiem kā Stefans Markuss, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi un Richmond Fontaine. Viņš arī vada ierakstu studiju Jackpot! Portlendā, Oregonas štatā, kas ir bijusi mājvieta The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him un daudziem, daudziem citiem.

Kā piemēru pārsteidzoši raibām, bet tomēr lieliskām dziesmām es minu Spoon 2014. gadā izdoto "They Want My Soul". Crane smejas un saka, ka klausās to mašīnā, jo tur tas skan lieliski. Tas mūs noved pie vēl vienas atbildes uz jautājumu, kāpēc mūzika tiek saspiesta: jo saspiešana un papildu "skaidrība" padara to vieglāk dzirdēt trokšņainās vietās.

Lerijs Kreins darbā. Fotogrāfs Džeisons Kiglijs

Kad cilvēki saka, ka viņiem patīk audio ieraksta skaņa, es uzskatu, ka viņiem patīk mūzika, it kā skaņa un mūzika būtu nedalāmi termini. Bet sev es šos jēdzienus nošķiru. No mūzikas mīļotāja viedokļa skaņa var būt raupja un neapstrādāta, taču lielākajai daļai klausītāju tas nebūs svarīgi.

Daudzi steidz apsūdzēt meistaru inženierus kompresijas ļaunprātīgā izmantošanā, taču kompresija tiek pielietota tieši ieraksta laikā, miksēšanas laikā un tikai pēc tam masteringa laikā. Ja vien jūs neesat personīgi klāt katrā no šiem posmiem, jūs nevarēsit pateikt, kā instrumenti un vokāls skanēja pašā procesa sākumā.

Crane bija liesmās: "Ja mūziķis vēlas apzināti padarīt skaņu traku un sagrozītu kā Guided by Voices ierakstus, tad tur nav nekā slikta - vēlme vienmēr atsver skaņas kvalitāti." Izpildītāja balss gandrīz vienmēr ir saspiesta, tas pats notiek ar basu, bungām, ģitārām un sintezatoriem. Izmantojot kompresiju, vokāla skaļums tiek saglabāts pareizais līmenis visā dziesmā vai nedaudz izceļas no pārējām skaņām.

Pareizi veikta saspiešana var padarīt bungas dzīvīgākas vai apzināti dīvainas. Lai mūzika izklausītos lieliski, jums ir jāspēj izmantot šim nolūkam nepieciešamos rīkus. Tāpēc ir vajadzīgi gadi, lai saprastu, kā izmantot kompresiju un nepārspīlēt. Ja miksa inženieris pārāk daudz saspiež ģitāras daļu, tad mastering inženieris vairs nevarēs pilnībā atjaunot trūkstošās frekvences.

Ja mūziķi vēlētos, lai jūs klausāties mūziku, kas nav izgājusi miksēšanas un māsterēšanas posmus, tad viņi to izlaistu veikalu plauktos tieši no studijas. Kreins stāsta, ka cilvēki, kas rada, rediģē, miksē un meistaro mūzikas ierakstus, nav paredzēti, lai mūziķiem traucētu – viņi izpildītājiem palīdz jau no pašiem pirmsākumiem, tas ir, jau vairāk nekā simts gadus.

Šie cilvēki ir daļa no radošā procesa, kura rezultātā tiek radīti pārsteidzoši mākslas darbi. Crane piebilst: "Jūs nevēlaties "Dark Side of the Moon" versiju, kas nav sajaukta un apgūta." Pink Floyd izdeva dziesmu tā, kā gribēja to dzirdēt.




Tops