Saspiešana praksē. Dinamiskā saspiešana Dinamiskais diapazons saspiests vai standarta

Šī metožu grupa ir balstīta uz to, ka pārraidītie signāli tiek pakļauti nelineāras amplitūdas transformācijām, un raidošajā un uztverošajā daļā nelinearitāte ir abpusēja. Piemēram, ja raidītājā tiek izmantota nelineārā funkcija Öu, uztvērējā tiek izmantota u 2. Konsekventa savstarpējo funkciju piemērošana nodrošinās, ka vispārējā transformācija paliek lineāra.

Nelineāro datu saspiešanas metožu ideja ir tāda, ka raidītājs ar tādu pašu izejas signālu amplitūdu var pārraidīt lielāku pārraidītā parametra izmaiņu diapazonu (tas ir, lielāku dinamisko diapazonu). Dinamiskais diapazons- šī ir lielākās pieļaujamās signāla amplitūdas attiecība pret mazāko, kas izteikta relatīvās vienībās vai decibelos:

; (2.17)
. (2.18)

Dabisko vēlmi palielināt dinamisko diapazonu, samazinot U min, ierobežo iekārtas jutība un pieaugošā traucējumu un paštrokšņu ietekme.

Visbiežāk dinamiskā diapazona saspiešana tiek veikta, izmantojot logaritma un potenciācijas savstarpēju funkciju pāri. Tiek izsaukta pirmā amplitūdas maiņas darbība saspiešana(ar saspiešanu), otrais - paplašināšana(stiepšanās). Šo konkrēto funkciju izvēle ir saistīta ar to lielākajām saspiešanas iespējām.

Tajā pašā laikā šīm metodēm ir arī trūkumi. Pirmais no tiem ir tāds, ka neliela skaitļa logaritms ir negatīvs un ir robežās:

tas ir, jutība ir ļoti nelineāra.

Lai samazinātu šos trūkumus, abas funkcijas tiek modificētas ar pārvietojumu un tuvināšanu. Piemēram, telefona kanāliem aptuvenajai funkcijai ir šāda forma (A tips):

ar A=87,6. Kompresijas ieguvums ir 24 dB.

Datu saspiešana, izmantojot nelineāras procedūras, tiek realizēta ar analogiem līdzekļiem ar lielām kļūdām. Pieteikums digitālie mediji var ievērojami uzlabot reklāmguvuma precizitāti vai veiktspēju. Tajā pašā laikā tieša līdzekļu izmantošana datortehnoloģijas(tas ir, logaritmu un eksponentu tieša aprēķināšana) nedos labākos rezultātus zemās veiktspējas un uzkrājošo aprēķinu kļūdu dēļ.

Precizitātes ierobežojumu dēļ datu saspiešana ar saspiešanu tiek izmantota nekritiskos gadījumos, piemēram, runas pārraidīšanai pa telefonu un radio kanāliem.

Efektīva kodēšana

Efektīvus kodus ierosināja K. Šenons, Fano un Hafmens. Kodu būtība ir tāda, ka tie ir nevienmērīgi, tas ir, ar nevienādu bitu skaitu, un koda garums ir apgriezti proporcionāls tā rašanās varbūtībai. Vēl viena lieliska efektīvo kodu iezīme ir tā, ka tiem nav nepieciešami norobežotāji, t.i. īpašās rakstzīmes, atdalot blakus esošās kodu kombinācijas. To panāk, ievērojot vienkāršu noteikumu: īsāki kodi nav sākums garākiem kodiem. Šajā gadījumā nepārtrauktā bitu plūsma tiek unikāli dekodēta, jo dekodētājs vispirms nosaka īsākos koda vārdus. Efektīvi kodi jau sen ir tīri akadēmiski, taču pēdējā laikā tos veiksmīgi izmanto datu bāzu veidošanā, kā arī informācijas saspiešanā mūsdienu modemos un programmatūras arhivējos.

Nevienmērīguma dēļ tiek ieviests vidējais koda garums. Vidējais garums — koda garuma matemātiskā sagaidīšana:

turklāt l av tiecas uz H(x) no augšas (tas ir, l av > H(x)).

Nosacījuma (2.23) izpilde kļūst spēcīgāka, palielinoties N.

Ir divu veidu efektīvi kodi: Shannon-Fano un Huffman. Apskatīsim, kā tos iegūt, izmantojot piemēru. Pieņemsim, ka simbolu varbūtībām secībā ir vērtības, kas norādītas 2.1. tabulā.

2.1. tabula.

Simbolu varbūtības

N
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simboli ir sarindoti, tas ir, parādīti rindā dilstošā varbūtību secībā. Pēc tam, izmantojot Šenona-Fano metodi, periodiski tiek atkārtota šāda procedūra: visa notikumu grupa tiek sadalīta divās apakšgrupās ar vienādām (vai aptuveni vienādām) kopējām varbūtībām. Procedūra turpinās, līdz nākamajā apakšgrupā paliek viens elements, pēc tam šis elements tiek likvidēts, un norādītās darbības turpinās ar atlikušajiem. Tas notiek, līdz pēdējās divās apakšgrupās ir palicis tikai viens elements. Turpināsim ar mūsu piemēru, kas apkopots 2.2. tabulā.

2.2. tabula.

Šenona-Fano kodēšana

N P i
4 0.3 es
0.2 es II
6 0.15 es es
0.1 II
1 0.1 es es
9 0.05 II II
5 0.05 II es
7 0.03 II II es
8 0.02 II

Kā redzams 2.2. tabulā, pirmais simbols ar varbūtību p 4 = 0,3 piedalījās divās grupās sadalīšanas procedūrās un abas reizes nokļuva grupā I. Saskaņā ar to tas ir kodēts ar divciparu kodu II. Otrais elements sadalīšanas pirmajā posmā piederēja I grupai, otrajā - II grupai. Tāpēc tā kods ir 10. Pārējo simbolu kodiem papildu komentāri nav nepieciešami.

Parasti neviendabīgie kodi tiek attēloti kā kodu koki. Kodu koks ir grafiks, kas norāda atļautās kodu kombinācijas. Šī grafika malu virzieni ir iepriekš iestatīti, kā parādīts 2.11. attēlā (virzienu izvēle ir patvaļīga).

Viņi pārvietojas grafikā šādi: izveido maršrutu izvēlētajam simbolam; bitu skaits tam ir vienāds ar malu skaitu maršrutā, un katra bita vērtība ir vienāda ar atbilstošās malas virzienu. Maršrutu sastāda no sākuma punkta (zīmējumā tas atzīmēts ar burtu A). Piemēram, maršruts uz virsotni 5 sastāv no piecām malām, no kurām visām, izņemot pēdējo, ir virziens 0; mēs saņemam kodu 00001.

Aprēķināsim šī piemēra entropiju un vidējo vārda garumu.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 biti

l vid. = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 + 0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Kā redzat, vidējais vārda garums ir tuvu entropijai.

Huffman kodi tiek konstruēti, izmantojot citu algoritmu. Kodēšanas procedūra sastāv no diviem posmiem. Pirmajā posmā secīgi tiek veiktas atsevišķas alfabēta saspiešanas. Vienreizēja saspiešana - pēdējo divu simbolu (ar mazāko varbūtību) aizstāšana ar vienu, ar kopējo varbūtību. Saspiešana tiek veikta, līdz paliek divas rakstzīmes. Tajā pašā laikā tiek aizpildīta kodēšanas tabula, kurā tiek ievadītas iegūtās varbūtības, un tiek attēloti maršruti, pa kuriem nākamajā posmā pārvietojas jauni simboli.

Otrajā posmā notiek faktiskā kodēšana, kas sākas no pēdējā posma: pirmajam no diviem simboliem tiek piešķirts kods 1, otrajam - 0. Pēc tam viņi pāriet uz iepriekšējo posmu. Nākamā posma kodi tiek piešķirti simboliem, kas šajā posmā nav piedalījušies saspiešanā, un pēc līmēšanas iegūtā simbola kods tiek divreiz piešķirts pēdējiem diviem simboliem un pievienots augšējās rakstzīmes kodam 1, apakšējais - 0. Ja rakstzīme nav tālāk līmēšanā piedalās, tā kods paliek nemainīgs. Procedūra turpinās līdz beigām (tas ir, līdz pirmajam posmam).

2.3. tabulā parādīts Hafmena kodējums. Kā redzams tabulā, kodēšana tika veikta 7 posmos. Kreisajā pusē ir simbolu varbūtības, labajā pusē ir starpkodi. Bultiņas parāda jaunizveidoto simbolu kustības. Katrā posmā pēdējie divi simboli atšķiras tikai ar vismazāko bitu, kas atbilst kodēšanas tehnikai. Aprēķināsim vidējo vārda garumu:

l vid. = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Tas ir vēl tuvāk entropijai: kods ir vēl efektīvāks. Attēlā 2.12. attēlā parādīts Hafmena koda koks.

2.3. tabula.

Hafmena kodēšana

N p i kodu es II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Abi kodi apmierina viennozīmīgas dekodēšanas prasību: kā redzams no tabulām, īsākas kombinācijas nav garāku kodu sākums.

Palielinoties simbolu skaitam, palielinās kodu efektivitāte, tāpēc dažos gadījumos tiek kodēti lielāki bloki (piemēram, ja mēs runājam par par tekstiem, varat iekodēt dažas no visbiežāk sastopamajām zilbēm, vārdiem un pat frāzēm).

Šādu kodu ieviešanas efektu nosaka, salīdzinot tos ar vienotu kodu:

(2.24)

kur n ir vienotā koda bitu skaits, kas aizstāts ar efektīvo.

Hafmena kodu modifikācijas

Klasiskais Hafmena algoritms ir divu pakāpju algoritms, t.i. vispirms ir jāsavāc statistikas dati par simboliem un ziņojumiem un pēc tam jāveic iepriekš aprakstītās procedūras. Praksē tas ir neērti, jo palielina laiku, kas nepieciešams ziņojumu apstrādei un vārdnīcas uzkrāšanai. Biežāk tiek izmantotas vienas piespēles metodes, kurās tiek apvienotas uzkrāšanas un kodēšanas procedūras. Šādas metodes sauc arī par adaptīvo kompresiju saskaņā ar Hafmenu [46].

Adaptīvās saspiešanas būtība saskaņā ar Hafmanu ir saistīta ar sākotnējā koda koka uzbūvi un tā secīgu modifikāciju pēc katra nākamā simbola ierašanās. Tāpat kā iepriekš, koki šeit ir bināri, t.i. No katras koka grafika virsotnes izplūst ne vairāk kā divi loki. Sākotnējo virsotni pieņemts saukt par vecāku, un divas nākamās virsotnes, kas ar to savienotas kā bērnus. Ieviesīsim virsotņu svara jēdzienu - tas ir noteiktai virsotnei atbilstošo rakstzīmju (vārdu) skaits, kas iegūts, ievadot sākotnējo secību. Acīmredzot bērnu svaru summa ir vienāda ar vecāku svaru.

Pēc nākamā ievades secības simbola ieviešanas tiek pārskatīts koda koks: tiek pārrēķināti virsotņu svari un, ja nepieciešams, virsotnes tiek pārkārtotas. Virsotņu permutācijas noteikums ir šāds: apakšējo virsotņu svars ir mazākais, un virsotnēm, kas atrodas grafika kreisajā pusē, ir vismazākais svars.

Tajā pašā laikā virsotnes ir numurētas. Numerācija sākas no apakšējām (karājas, t.i., ja nav bērnu) virsotnēm no kreisās puses uz labo, pēc tam pāriet uz augstākais līmenis utt. pirms pēdējās, sākotnējās virsotnes numerācijas. Šajā gadījumā tiek sasniegts šāds rezultāts: jo mazāks ir virsotnes svars, jo mazāks ir tās skaitlis.

Permutācija tiek veikta galvenokārt piekārtām virsotnēm. Permutējot jāņem vērā iepriekš formulētais noteikums: virsotnēm ar lielāku svaru ir lielāks skaits.

Pēc secības nokārtošanas (to sauc arī par kontroli vai testu), visām piekārtajām virsotnēm tiek piešķirtas kodu kombinācijas. Kodu piešķiršanas noteikums ir līdzīgs iepriekšminētajam: koda bitu skaits ir vienāds ar virsotņu skaitu, caur kurām maršruts iet no avota uz doto piekārto virsotni, un konkrētā bita vērtība atbilst virzienam. no vecāka uz “bērnu” (teiksim, pa kreisi no vecāka atbilst vērtībai 1, pa labi - 0 ).

Iegūtās kodu kombinācijas tiek saglabātas kompresijas ierīces atmiņā kopā ar to analogiem un veido vārdnīcu. Algoritma izmantošana ir šāda. Saspiestā rakstzīmju secība tiek sadalīta fragmentos saskaņā ar esošo vārdnīcu, pēc tam katrs no fragmentiem tiek aizstāts ar tā kodu no vārdnīcas. Fragmenti, kas nav atrodami vārdnīcā, veido jaunas nokarenās virsotnes, iegūst svaru un tiek ievadīti arī vārdnīcā. Tādā veidā veidojas adaptīvs algoritms vārdnīcas papildināšanai.

Lai palielinātu metodes efektivitāti, vēlams palielināt vārdnīcas apjomu; šajā gadījumā kompresijas pakāpe palielinās. Praksē vārdnīcas apjoms ir 4 - 16 KB atmiņas.


Ilustrēsim doto algoritmu ar piemēru. Attēlā 2.13. attēlā parādīta sākotnējā diagramma (to sauc arī par Hafmena koku). Katra koka virsotne ir parādīta ar taisnstūri, kurā caur daļskaitli ir ierakstīti divi skaitļi: pirmais apzīmē virsotnes numuru, otrais – tās svaru. Kā redzat, atbilstība starp virsotņu svariem un to skaitļiem ir apmierināta.

Tagad pieņemsim, ka simbols, kas atbilst virsotnei 1, parādās otro reizi testa secībā. Virsotnes svars ir mainījies, kā parādīts attēlā. 2.14, kā rezultātā tiek pārkāpts virsotņu numerācijas noteikums. Nākamajā posmā mēs mainām karājošo virsotņu atrašanās vietu, kurām mēs samainām virsotnes 1 un 4 un pārnumurējam visas koka virsotnes. Iegūtais grafiks ir parādīts attēlā. 2.15. Pēc tam procedūra turpinās tādā pašā veidā.

Jāatceras, ka katra nokarenā virsotne Hafmena kokā atbilst noteiktam simbolam vai simbolu grupai. Vecāks no bērniem atšķiras ar to, ka viņam atbilstošā simbolu grupa ir par vienu simbolu īsāka nekā tā bērniem, un šie bērni ir atšķirīgi pēdējais varonis. Piemēram, simboli "auto" atbilst vecākam; tad bērniem var būt secības "kara" un "karp".

Dotais algoritms nav akadēmisks un tiek aktīvi izmantots arhivēšanas programmās, arī grafisko datu saspiešanā (par tiem tiks runāts tālāk).

Lempel-Ziv algoritmi

Šie ir mūsdienās visbiežāk izmantotie saspiešanas algoritmi. Tos izmanto lielākajā daļā arhivēšanas programmu (piemēram, PKZIP. ARJ, LHA). Algoritmu būtība ir tāda, ka noteikta simbolu kopa arhivēšanas laikā tiek aizstāta ar tās numuru speciāli ģenerētā vārdnīcā. Piemēram, frāze “Jūsu vēstules izejošais numurs...”, kas bieži sastopama lietišķajā sarakstē, vārdnīcā var ieņemt 121. pozīciju; tad minētās frāzes (30 baiti) pārsūtīšanas vai saglabāšanas vietā varat saglabāt frāzes numuru (1,5 baiti binārā decimāldaļā vai 1 baits binārā formā).

Algoritmi ir nosaukti to autoru vārdā, kuri tos pirmo reizi ierosināja 1977. gadā. No tiem pirmais ir LZ77. Arhivēšanai tiek izveidots tā sauktais ziņojumu bīdāmais logs, kas sastāv no divām daļām. Pirmā daļa, lielāka formāta, kalpo vārdnīcas veidošanai, un tās izmērs ir aptuveni vairāki kilobaiti. Otrā, mazākā daļa (parasti līdz 100 baitiem) saņem pašreizējās skatītā teksta rakstzīmes. Algoritms vārdnīcā mēģina atrast rakstzīmju kopu, kas atbilst tām, kas saņemtas skatīšanās logā. Ja tas ir veiksmīgs, tiek ģenerēts kods, kas sastāv no trim daļām: nobīde vārdnīcā attiecībā pret tās sākotnējo apakšvirkni, šīs apakšvirknes garums un rakstzīme, kas seko šai apakšvirknei. Piemēram, atlasītā apakšvirkne sastāv no rakstzīmēm "app" (kopā 6 rakstzīmes), nākamā rakstzīme ir "e". Tad, ja apakšvirknei ir adrese (vieta vārdnīcā) 45, tad ieraksts vārdnīcā izskatās kā “45, 6. e”. Pēc tam loga saturs tiek pārvietots pēc pozīcijas, un meklēšana turpinās. Tā veidojas vārdnīca.

Algoritma priekšrocība ir viegli formalizējams vārdnīcas sastādīšanas algoritms. Turklāt ir iespējams izvilkt bez oriģinālās vārdnīcas (vēlams, lai būtu testa secība) - vārdnīca tiek veidota izsaiņošanas laikā.

Algoritma trūkumi parādās, palielinoties vārdnīcas izmēram - meklēšanas laiks palielinās. Turklāt, ja pašreizējā logā parādās rakstzīmju virkne, kas nav vārdnīcā, katra rakstzīme tiek rakstīta ar trīs elementu kodu, t.i. Rezultāts nav saspiešana, bet stiepšanās.

1978. gadā piedāvātajam LZSS algoritmam ir vislabākās īpašības. Tam ir atšķirības bīdāmo logu atbalstā un kompresora izvades kodos. Papildus logam algoritms ģenerē Hafmena kokam līdzīgu bināro koku, lai paātrinātu atbilstības meklēšanu: katra apakšvirkne, kas atstāj pašreizējo logu, tiek pievienota kokam kā viens no bērniem. Šis algoritms ļauj vēl vairāk palielināt pašreizējā loga izmēru (vēlams, lai tā izmērs būtu vienāds ar divu jaudu: 128, 256 utt. baiti). Arī secības kodi tiek veidoti atšķirīgi: tiek ieviests papildu 1 bita prefikss, lai atšķirtu nekodētas rakstzīmes no pāriem “nobīde, garums”.

Izmantojot tādus algoritmus kā LZW, tiek iegūta vēl lielāka saspiešanas pakāpe. Iepriekš aprakstītajiem algoritmiem ir fiksēts loga izmērs, kas neļauj vārdnīcā ievadīt frāzes, kas garākas par loga izmēru. LZW algoritmos (un to priekšgājējā LZ78) skatīšanās logam ir neierobežots izmērs, un vārdnīcā tiek uzkrātas frāzes (nevis rakstzīmju kolekcija, kā iepriekš). Vārdnīcai ir neierobežots garums, un kodētājs (dekodētājs) darbojas frāzes gaidīšanas režīmā. Kad tiek izveidota vārdnīcai atbilstoša frāze, tiek izdots atbilstības kods (t.i., šīs frāzes kods vārdnīcā) un tai sekojošās rakstzīmes kods. Ja, simboliem uzkrājoties, veidojas jauna frāze, tā arī tiek ievadīta vārdnīcā, tāpat kā īsākā. Rezultāts ir rekursīva procedūra, kas nodrošina ātru kodēšanu un dekodēšanu.

Papildu saspiešanas funkciju nodrošina atkārtotu rakstzīmju saspiests kodējums. Ja pēc kārtas dažas rakstzīmes seko pēc kārtas (piemēram, tekstā tās var būt “atstarpes” rakstzīmes, ciparu secībā - secīgas nulles utt.), tad ir jēga tās aizstāt ar pāri “rakstzīme; garums” vai “zīme, garums””. Pirmajā gadījumā kods norāda zīmi, ka secība tiks kodēta (parasti 1 bits), pēc tam atkārtojošās rakstzīmes kodu un secības garumu. Otrajā gadījumā (paredzēts visbiežāk sastopamajām rakstzīmēm), kas atkārtojas, prefikss vienkārši norāda uz atkārtojuma zīmi.

Dinamiskā saspiešana(Dynamic range compression, DRC) - fonogrammas dinamiskā diapazona sašaurināšanās (vai paplašināšanas gadījumā). Dinamiskais diapazons, ir atšķirība starp klusāko un skaļāko skaņu. Dažreiz klusākā skaņa skaņu celiņā būs nedaudz skaļāka par trokšņa līmeni un dažreiz nedaudz klusāka par skaļāko. Aparatūras ierīces un programmas, kas veic dinamisku saspiešanu, sauc par kompresoriem, izšķirot četras galvenās grupas: paši kompresori, ierobežotāji, paplašinātāji un vārti.

Caurules analogais kompresors DBX 566

Saspiešana uz leju un uz augšu

Samazināšana(Saspiešana uz leju) samazina skaņas skaļumu, kad tā sāk pārsniegt noteiktu slieksni, atstājot klusākas skaņas nemainīgas. Ekstrēma lejupvērstās saspiešanas versija ir ierobežotājs. Palieliniet kompresiju No otras puses, kompresija uz augšu palielina skaņas skaļumu, ja tā ir zem sliekšņa, neietekmējot skaļākas skaņas. Tajā pašā laikā abi saspiešanas veidi sašaurina audio signāla dinamisko diapazonu.

Samazināšana

Palieliniet kompresiju

Paplašinātājs un vārti

Ja kompresors samazina dinamisko diapazonu, paplašinātājs to palielina. Kad signāla līmenis paaugstinās virs sliekšņa līmeņa, paplašinātājs to vēl vairāk palielina, tādējādi palielinot atšķirību starp skaļām un klusām skaņām. Šādas ierīces bieži izmanto, ierakstot bungu komplektu, lai atdalītu vienas bungas skaņas no otras.

Tiek saukts paplašinātāja veids, ko izmanto nevis skaļu skaņu pastiprināšanai, bet klusu skaņu vājināšanai, kas nepārsniedz sliekšņa līmeni (piemēram, fona troksni). Trokšņa vārti. Šādā ierīcē, tiklīdz skaņas līmenis kļūst mazāks par slieksni, signāls pārstāj iet. Parasti vārtus izmanto, lai apspiestu troksni paužu laikā. Dažos modeļos varat pārliecināties, ka, sasniedzot sliekšņa līmeni, skaņa neapstājas pēkšņi, bet pakāpeniski izzūd. Šajā gadījumā samazināšanās ātrumu nosaka samazināšanās kontrole.

Vārti, tāpat kā cita veida kompresori, var būt atkarībā no frekvences(t.i., ārstējiet noteiktus frekvenču joslas) un var darboties režīmā sānu ķēde(Skatīt zemāk).

Kompresora darbības princips

Kompresorā ienākošais signāls tiek sadalīts divās eksemplāros. Viena kopija tiek nosūtīta uz pastiprinātāju, kurā pastiprinājuma pakāpi kontrolē ārējs signāls, un otrā kopija ģenerē šo signālu. Tas nonāk ierīcē, ko sauc par sānu ķēdi, kur tiek mērīts signāls un, pamatojoties uz šiem datiem, tiek izveidots apvalks, kas apraksta tā skaļuma izmaiņas.
Tā ir veidota lielākā daļa mūsdienu kompresoru, tas ir tā sauktais padeves uz priekšu tips. Vecākās ierīcēs (atgriezeniskās saites veids) signāla līmenis tiek mērīts pēc pastiprinātāja.

Ir dažādas analogās mainīga pastiprinājuma pastiprināšanas tehnoloģijas, katrai no tām ir savas priekšrocības un trūkumi: lampas, optiskās, izmantojot fotorezistorus, un tranzistoru. Strādājot ar digitālo audio (in skaņas redaktors vai DAW) var izmantot patentētus matemātiskos algoritmus vai atdarināt analogo tehnoloģiju darbību.

Kompresoru galvenie parametri

Slieksnis

Kompresors samazina audio signāla līmeni, ja tā amplitūda pārsniedz noteiktu sliekšņa vērtību (slieksni). To parasti norāda decibelos ar zemāku slieksni (piemēram, -60 dB), kas nozīmē, ka tiks apstrādāts vairāk audio nekā augstāks slieksnis (piemēram, -5 dB).

attiecība

Līmeņa samazinājuma apjomu nosaka attiecības parametrs: attiecība 4:1 nozīmē, ka, ja ievades līmenis ir 4 dB virs sliekšņa, izejas līmenis būs par 1 dB virs sliekšņa.
Piemēram:
Slieksnis = –10 dB
Ievade = –6 dB (4 dB virs sliekšņa)
Izvade = –9 dB (1 dB virs sliekšņa)

Ir svarīgi paturēt prātā, ka signāla līmeņa slāpēšana turpinās kādu laiku pēc tam, kad tas nokrīt zem sliekšņa līmeņa, un šo laiku nosaka parametra vērtība atbrīvot.

Saspiešanu ar maksimālo attiecību ∞:1 sauc par ierobežojošu. Tas nozīmē, ka jebkurš signāls, kas pārsniedz sliekšņa līmeni, tiek vājināts līdz sliekšņa līmenim (izņemot īsu laiku pēc pēkšņa ievades skaļuma palielinājuma). Plašāku informāciju skatiet tālāk sadaļā "Ierobežotājs".

Dažādu attiecību vērtību piemēri

Uzbrukums un atlaišana

Kompresors nodrošina zināmu kontroli pār to, cik ātri tas reaģē uz signāla dinamikas izmaiņām. Parametrs Attack nosaka laiku, kas nepieciešams, lai kompresors samazinātu pastiprinājumu līdz līmenim, ko nosaka parametrs Ratio. Atlaišana nosaka laiku, kurā kompresors, gluži pretēji, palielina pastiprinājumu vai atgriežas normālā stāvoklī, ja ieejas signāla līmenis nokrītas zem sliekšņa vērtības.

Uzbrukuma un atbrīvošanas fāzes

Šie parametri norāda laiku (parasti milisekundēs), kas nepieciešams, lai mainītu pastiprinājumu par noteiktu decibelu daudzumu, parasti par 10 dB. Piemēram, šajā gadījumā, ja Attack ir iestatīts uz 1 ms, pastiprinājuma samazināšanai būs nepieciešama 1 ms, bet pastiprinājuma samazināšanai par 20 dB būs nepieciešama 2 ms.

Daudzos kompresoros Attack and Release parametrus var regulēt, bet dažiem tie ir iepriekš iestatīti un tos nevar pielāgot. Dažreiz tie tiek apzīmēti kā “automātiski” vai “atkarīgi no programmas”, t.i. mainīt atkarībā no ieejas signāla.

celis

Vēl viens kompresora parametrs: ciets/mīksts celis. Tas nosaka, vai saspiešanas sākums būs pēkšņs (ciets) vai pakāpenisks (mīksts). Mīkstais ceļgals samazina pārejas pamanāmību no sausa signāla uz saspiestu signālu, īpaši pie lielām Ratio vērtībām un pēkšņa skaļuma pieauguma.

Cietā ceļa un mīkstā ceļa kompresija

Maksimums un RMS

Kompresors var reaģēt uz maksimālo (īstermiņa maksimumu) vērtībām vai vidējo ieejas signāla līmeni. Maksimālo vērtību izmantošana var izraisīt krasas kompresijas pakāpes svārstības un pat izkropļojumus. Tāpēc kompresori ievades signālam izmanto vidējo funkciju (parasti RMS), salīdzinot to ar sliekšņa vērtību. Tas nodrošina ērtāku saspiešanu, tuvāk cilvēka uztverei par skaļumu.

RMS ir parametrs, kas atspoguļo skaņu celiņa vidējo skaļumu. No matemātiskā viedokļa RMS (Root Mean Square) ir noteikta skaita paraugu amplitūdas vidējā kvadrātiskā vērtība:

Stereo savienošana

Kompresors stereo savienojuma režīmā abiem stereo kanāliem piemēro vienādu pastiprinājumu. Tādējādi tiek novērsta stereo nobīde, kas var rasties, atsevišķi apstrādājot kreiso un labo kanālu. Šī nobīde notiek, ja, piemēram, skaļš elements tiek panoramēts ārpus centra.

Grima pieaugums

Tā kā kompresors samazina kopējo signāla līmeni, tas parasti pievieno fiksētu izejas pastiprinājuma opciju, lai sasniegtu optimālo līmeni.

Skaties uz priekšu

Izskatīšanas funkcija ir paredzēta, lai atrisinātu problēmas, kas saistītas gan ar pārāk augstām, gan pārāk zemām Uzbrukuma un Atbrīvošanas vērtībām. Pārāk ilgs uzbrukuma laiks neļauj mums efektīvi pārtvert pārejošus notikumus, un pārāk īss uzbrukuma laiks var nebūt ērts klausītājam. Izmantojot priekšskatīšanas funkciju, galvenais signāls tiek aizkavēts attiecībā pret vadības signālu, kas ļauj sākt saspiešanu iepriekš, pat pirms signāls sasniedz sliekšņa vērtību.
Vienīgais šīs metodes trūkums ir signāla laika aizkave, kas dažos gadījumos ir nevēlama.

Dinamiskās saspiešanas izmantošana

Kompresiju izmanto visur, ne tikai mūzikas skaņu celiņos, bet arī visur, kur nepieciešams palielināt kopējo skaļumu, nepalielinot pīķa līmeņus, kur tiek izmantotas lētas skaņas reproducēšanas iekārtas vai ierobežots pārraides kanāls (publiskās apraides un sakaru sistēmas, amatieru radio, utt.) .

Atskaņošanas laikā tiek izmantota saspiešana fona mūzika(veikalos, restorānos utt.), kur nekādas manāmas apjoma izmaiņas nav vēlamas.

Bet vissvarīgākā dinamiskās saspiešanas pielietojuma joma ir mūzikas producēšana un apraide. Saspiešana tiek izmantota, lai piešķirtu skaņai "biezumu" un "dzīt", lai labāk apvienotu instrumentus savā starpā, un jo īpaši, apstrādājot vokālu.

Vokāls rokmūzikā un popmūzikā bieži tiek saspiests, lai tie izceltos no pavadījuma un pievienotu skaidrību. Lai nomāktu sibilējošās fonēmas, tiek izmantots īpašs kompresora veids, kas noregulēts tikai uz noteiktām frekvencēm - de-esser.

Instrumentālajās partijās kompresiju izmanto arī tādiem efektiem, kas nav tieši saistīti ar skaļumu, piemēram, ātri brūkošas bungu skaņas var padarīt garākas.

Elektroniskajā deju mūzikā (EDM) bieži tiek izmantota sānu ķēde (skatiet tālāk) — piemēram, basa līniju var virzīt bungas vai līdzīgi, lai novērstu basu un bungu sadursmi un radītu dinamisku pulsāciju.

Kompresiju plaši izmanto apraidei (radio, televīzija, interneta apraide), lai palielinātu uztverto skaļumu, vienlaikus samazinot avota audio (parasti CD) dinamisko diapazonu. Lielākajā daļā valstu ir juridiski ierobežojumi maksimālajam momentānajam skaļumam, ko var pārraidīt. Parasti šos ierobežojumus ievieš pastāvīgi aparatūras kompresori gaisa ķēdē. Turklāt, palielinot uztverto skaļumu, no lielākās daļas klausītāju viedokļa uzlabojas skaņas "kvalitāte".

Skatīt arī Skaļuma karš.

No 1983. gada līdz 2000. gadam konsekventi palielinot tās pašas dziesmas skaļumu, kas pārveidots kompaktdiskam.

Sānu ķēde

Vēl viens bieži sastopams kompresora slēdzis ir “sānu ķēde”. Šajā režīmā skaņas saspiešana notiek neatkarīgi no tā savs līmenis, un atkarībā no signāla līmeņa, kas nonāk savienotājā, ko parasti sauc par sānu ķēdi.

Šim nolūkam ir vairāki lietojumi. Piemēram, vokālistei ir ļips un visi “s” izceļas no kopējā attēla. Jūs izlaižat viņa balsi caur kompresoru un ievadāt to pašu skaņu sānu ķēdes savienotājā, bet izlaižat caur ekvalaizeru. Izmantojot ekvalaizeru, jūs izslēdzat visas frekvences, izņemot tās, kuras vokālists izmanto, izrunājot burtu “s”. Parasti aptuveni 5 kHz, bet var būt no 3 kHz līdz 8 kHz. Ja pēc tam kompresoru ievietosiet sānu ķēdes režīmā, balss tiks saspiesta tajos brīžos, kad tiek izrunāts burts “s”. Tā rezultātā tika izveidota ierīce, kas pazīstama kā de-esser. Šo darba veidu sauc par “atkarīgu no frekvences”.

Vēl viens šīs funkcijas lietojums tiek saukts par "ducker". Piemēram, radiostacijā mūzika iet caur kompresoru, un dīdžeja vārdi nāk caur sānu ķēdi. Kad dīdžejs sāk tērzēt, mūzikas skaļums automātiski samazinās. Šo efektu var veiksmīgi izmantot arī ierakstā, piemēram, lai dziedāšanas laikā samazinātu klaviatūras daļu skaļumu.

Ķieģeļu sienas ierobežojums

Kompresors un ierobežotājs darbojas aptuveni vienādi, mēs varam teikt, ka ierobežotājs ir kompresors ar augstu Ratio (no 10:1) un parasti zemu Uzbrukuma laiku.

Pastāv ķieģeļu sienas ierobežošanas koncepcija - ierobežošana ar ļoti augstu attiecību (20:1 un vairāk) un ļoti ātru uzbrukumu. Ideālā gadījumā tas neļauj signālam vispār pārsniegt sliekšņa līmeni. Rezultāts būs nepatīkams ausij, taču tas novērsīs skaņas reproducēšanas iekārtu bojājumus vai pārmērību joslas platums kanālu. Daudzi ražotāji savās ierīcēs integrē ierobežotājus tieši šim nolūkam.

Clipper vs. Ierobežotājs, mīksta un cieta griešana

Kompresija ir viena no mītu apvītākajām tēmām skaņas producēšanā. Saka, ka Bēthovens ar viņu pat nobiedējis kaimiņu bērnus:(

Labi, patiesībā kompresijas izmantošana nav grūtāka nekā kropļojumu izmantošana, galvenais ir saprast tās darbības principu un labi kontrolēt. Tas ir tas, ko mēs tagad redzēsim kopā.

Kas ir audio saspiešana

Pirmā lieta, kas jāsaprot pirms sagatavošanas, ir kompresija. darbs ar skaņas dinamisko diapazonu. Un, savukārt, tas ir nekas vairāk kā atšķirība starp skaļāko un klusāko signāla līmeni:

Tātad, saspiešana ir dinamiskā diapazona saspiešana. Jā, Vienkārši dinamiskā diapazona saspiešana vai citiem vārdiem sakot signāla skaļo daļu līmeņa pazemināšana un kluso daļu skaļuma palielināšana. Vairāk ne.

Jūs varat pamatoti brīnīties, kāpēc tad šāda ažiotāža ir saistīta? Kāpēc visi runā par pareizu kompresora iestatījumu receptēm, bet neviens ar tām nedalās? Kāpēc, neskatoties uz milzīgo foršo spraudņu skaitu, daudzas studijas joprojām izmanto dārgus, retus kompresoru modeļus? Kāpēc daži ražotāji kompresorus izmanto ekstremālos iestatījumos, bet citi tos neizmanto vispār? Un kuram no viņiem galu galā ir taisnība?

Problēmas atrisinātas ar saspiešanu

Atbildes uz šādiem jautājumiem slēpjas kompresijas lomas darbā ar skaņu izpratnes plaknē. Un tas ļauj:

  1. Uzsveriet uzbrukumu skaņa, padarot to izteiktāku;
  2. Atsevišķu instrumentu daļu “iestādīšana” maisījumā, pievienojot tiem jaudu un “svaru”;
  3. Padariet instrumentu grupas vai visu miksu saliedētāku, tāds viens monolīts;
  4. Atrisiniet konfliktus starp rīkiem izmantojot sānu ķēdi;
  5. Izlabojiet vokālista vai mūziķu kļūdas, izlīdzinot to dinamiku;
  6. Ar noteiktu iestatījumu darbojas kā māksliniecisks efekts.

Kā redzams, šis ir ne mazāk nozīmīgs radošais process kā, teiksim, melodiju izdomāšana vai interesantu tembru radīšana. Turklāt jebkuru no iepriekš minētajām problēmām var atrisināt, izmantojot 4 galvenos parametrus.

Kompresora pamatparametri

Neskatoties uz milzīgo kompresoru programmatūras un aparatūras modeļu skaitu, visa saspiešanas “maģija” rodas, kad pareizs iestatījums galvenie parametri: slieksnis, attiecība, uzbrukums un atbrīvošana. Apskatīsim tos sīkāk:

Slieksnis vai reakcijas slieksnis, dB

Šis parametrs ļauj iestatīt vērtību, no kuras kompresors darbosies (tas ir, saspiest audio signālu). Tātad, ja mēs iestatīsim slieksni uz -12 dB, kompresors darbosies tikai tajās dinamiskā diapazona daļās, kas pārsniedz šo vērtību. Ja visa mūsu skaņa ir klusāka par -12db, kompresors to vienkārši izlaidīs cauri, to nekādā veidā neietekmējot.

Attiecība vai kompresijas pakāpe

Attiecības parametrs nosaka, cik daudz signāls, kas pārsniedz slieksni, tiks saspiests. Nedaudz matemātikas, lai pabeigtu attēlu: pieņemsim, ka mēs uzstādījām kompresoru ar slieksni -12 dB, attiecību 2:1 un ievadījām tam bungas cilpu, kurā atsitiena cilindra skaļums ir -4 dB. Kāds būs kompresora darbības rezultāts šajā gadījumā?

Mūsu gadījumā sitiena līmenis pārsniedz slieksni par 8 dB. Šī atšķirība atbilstoši attiecībai tiks saspiesta līdz 4dB (8dB / 2). Apvienojumā ar neapstrādāto signāla daļu tas novedīs pie tā, ka pēc apstrādes ar kompresoru sitiena bungas skaļums būs -8db (slieksnis -12dB + saspiests signāls 4dB).

Uzbrukums, ms

Šis ir laiks, pēc kura kompresors reaģēs uz reakcijas sliekšņa pārsniegšanu. Tas ir, ja uzbrukuma laiks pārsniedz 0 ms - kompresors sāk kompresiju sliekšņa signāla pārsniegšana ne uzreiz, bet pēc noteikta laika.

Atbrīvošana vai atjaunošana, ms

Pretējs uzbrukumam - šī parametra vērtība ļauj norādīt, cik ilgi pēc signāla līmeņa atgriešanās zem sliekšņa kompresors pārtrauks saspiešanu.

Pirms mēs turpinām, es ļoti iesaku paņemt labi zināmu paraugu, novietot jebkuru kompresoru uz tā kanāla un eksperimentēt ar iepriekš minētajiem parametriem 5-10 minūtes, lai droši nostiprinātu materiālu.

Visi citi parametri nav obligāti. Tie var atšķirties dažādos kompresoru modeļos, tāpēc daļēji ražotāji izmanto dažādus modeļus īpašiem mērķiem (piemēram, vienu kompresoru vokālam, otru bungu grupai, trešo galveno kanālu). Sīkāk pie šiem parametriem nekavēšos, bet tikai sniegšu Galvenā informācija Lai saprastu, par ko ir runa:

  • Celis vai salocījums (ciets/mīksts ceļgalis). Šis parametrs nosaka, cik ātri tiks piemērota saspiešanas pakāpe (attiecība): stingri pa līkni vai vienmērīgi. Es atzīmēju, ka Soft Knee režīmā kompresors nedarbojas lineāri, bet sāk vienmērīgi (ciktāl tas var būt piemērots, ja mēs runājam par milisekundēm) saspiest skaņu jau pirms sliekšņa vērtības. Lai apstrādātu kanālu grupas un kopējo miksu, bieži tiek izmantots mīksts ceļgals (jo tas darbojas nemanot), un, lai uzsvērtu atsevišķu instrumentu uzbrukumu un citas īpašības, tiek izmantots cietais ceļgals;
  • Reakcijas režīms: maksimums/RMS. Peak režīms ir attaisnojams, ja jums ir stingri jāierobežo amplitūdas pārrāvumi, kā arī signāliem ar sarežģītu formu, kuru dinamika un lasāmība ir pilnībā jānodod. RMS režīms ir ļoti maigs pret skaņu, ļaujot to sabiezēt, vienlaikus saglabājot uzbrukumu;
  • Prognozēšana (skats uz priekšu). Šis ir laiks, kurā kompresors zinās, kas tam nāk. Sava veida ienākošo signālu iepriekšēja analīze;
  • Aplauzums vai peļņa. Parametrs, kas ļauj kompensēt apjoma samazināšanos saspiešanas rezultātā.

Pirmkārt un lielākā daļa galvenais padoms , kas novērš visus turpmākos jautājumus par saspiešanu: ja jūs a) saprotat saspiešanas principu, b) stingri zināt, kā tas vai cits parametrs ietekmē skaņu, un c) izdevās izmēģināt vairākus praksē dažādi modeļitev vairs nevajag nekādu padomu.

Es esmu pilnīgi nopietns. Ja uzmanīgi izlasījāt šo ziņu, eksperimentējāt ar sava DAW standarta kompresoru un vienu vai diviem spraudņiem, taču joprojām nesapratāt, kādos gadījumos ir jāiestata lielas uzbrukuma vērtības, kāda attiecība jāizmanto un kurā režīmā apstrādāt avota signāls - tad turpināsi meklēt gatavās receptes internetā, nepārdomāti pielietojot tās jebkur.

Kompresora precīzās regulēšanas receptes tas ir kā receptes reverba vai kora precizēšanai - tam nav jēgas, un tam nav nekāda sakara ar radošumu. Tāpēc neatlaidīgi atkārtoju vienīgo pareizo recepti: apbruņojies ar šo rakstu, labām monitora austiņām, spraudni viļņu formas vizuālai kontrolei un pavadi vakaru pāris kompresoru kompānijā.

Darīt!

, Multivides atskaņotāji

Ieraksti, īpaši vecāki, kas ierakstīti un ražoti pirms 1982. gada, bija daudz retāk miksēti, lai padarītu ierakstu skaļāku. Tie atveido dabisku mūziku ar dabisku dinamisko diapazonu, kas tiek saglabāts ierakstā un zaudēts lielākajā daļā standarta digitālo vai augstas izšķirtspējas formātu.

Protams, ir izņēmumi — klausieties Stīvena Vilsona neseno albumu no MA Recordings vai Reference Recordings, un jūs dzirdēsiet, cik labs var būt digitālais audio. Bet tas notiek reti; lielākā daļa mūsdienu skaņu ierakstu ir skaļi un saspiesti.

Mūzikas kompresija pēdējā laikā ir daudz kritizēta, taču esmu gatavs derēt, ka gandrīz visi jūsu iecienītākie ieraksti ir saspiesti. Daži no tiem ir mazāk, daži ir vairāk, bet tomēr saspiesti. Dinamiskā diapazona saspiešana ir grēkāzis slikti skanošai mūzikai, taču ļoti saspiesta mūzika nav nekas jauns: klausieties Motown albumus no 60. gadiem. To pašu var teikt par Led Zeppelin klasiskajiem darbiem vai jaunākajiem Wilco un Radiohead albumiem. Dinamiskā diapazona saspiešana samazina dabiskās attiecības starp visskaļākajām un maigākajām skaņām ierakstā, tāpēc čuksts var būt tikpat skaļš kā kliedziens. Ir diezgan grūti atrast pēdējo 50 gadu popmūziku, kas nebūtu saspiesta.

Nesen man bija jauka tērzēšana ar žurnāla Tape Op dibinātāju un redaktoru Leriju Kreinu par saspiešanas labajām, sliktajām un neglītajām pusēm. Lerijs Kreins ir strādājis ar tādām grupām un māksliniekiem kā Stefans Markuss, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi un Richmond Fontaine. Viņš arī vada ierakstu studiju Jackpot! Portlendā, Oregonas štatā, kur atradās The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him un daudzi, daudzi citi.

Kā piemēru pārsteidzoši nedabiski skanošām, bet tomēr lieliskām dziesmām es minu Spoon 2014. gada albumu They Want My Soul. Crane smejas un saka, ka klausās to mašīnā, jo tur tas skan lieliski. Tas mūs noved pie citas atbildes uz jautājumu, kāpēc mūzika tiek saspiesta: jo saspiešana un papildu “dzidrums” padara to vieglāk dzirdēt trokšņainās vietās.

Lerijs Kreins darbā. Fotogrāfs Džeisons Kiglijs

Kad cilvēki saka, ka viņiem patīk audio ieraksta skaņa, es domāju, ka viņiem patīk mūzika, it kā skaņa un mūzika būtu nedalāmi termini. Bet sev es šos jēdzienus nošķiru. No audiofila viedokļa skaņa var būt raupja un neapstrādāta, taču lielākajai daļai klausītāju tas nebūs svarīgi.

Daudzi steidz apsūdzēt meistaru inženierus pārmērīgā kompresijas izmantošanā, taču kompresija tiek pielietota tieši ierakstīšanas laikā, miksēšanas laikā un tikai pēc tam masteringa laikā. Ja vien jūs neesat personīgi klāt katrā no šiem posmiem, jūs nevarēsit pateikt, kā instrumenti un vokālās partijas skanēja pašā procesa sākumā.

Crane bija sajūsmā: "Ja mūziķis ar nolūku vēlas izklausīties traks un izkropļots kā Guided by Voices ieraksti, tad tur nav nekā slikta — vēlme vienmēr atsver skaņas kvalitāti." Izpildītāja balss gandrīz vienmēr ir saspiesta, un tas pats notiek ar basu, bungām, ģitārām un sintezatoriem. Saspiešana saglabā vokāla skaļumu pie pareizais līmenis visā dziesmā vai nedaudz izceļas no pārējām skaņām.

Pareizi veikta saspiešana var padarīt bungas dzīvīgākas vai apzināti dīvainas. Lai mūzika skanētu lieliski, ir jāprot izmantot nepieciešamos rīkus. Tāpēc ir vajadzīgi gadi, lai saprastu, kā izmantot saspiešanu, nepārspīlējot to. Ja miksa inženieris pārāk daudz saspiež ģitāras daļu, meistarības inženieris vairs nevarēs pilnībā atjaunot trūkstošās frekvences.

Ja mūziķi vēlētos, lai jūs klausāties mūziku, kas nav izgājusi miksēšanas un māsterēšanas posmus, viņi to izlaistu veikalu plauktos tieši no studijas. Crane saka, ka cilvēki, kas rada, rediģē, miksē un meistaro ierakstīto mūziku, nav paredzēti, lai traucētu mūziķiem — viņi ir palīdzējuši māksliniekiem kopš pirmsākumiem, vairāk nekā simts gadus.

Šie cilvēki ir daļa no radīšanas procesa, kura rezultātā tiek radīti pārsteidzoši mākslas darbi. Crane piebilst: "Jūs nevēlaties "Dark Side of the Moon" versiju, kas nav sajaukta un apgūta." Pink Floyd izdeva dziesmu tā, kā gribēja to dzirdēt.




Tops