Компресија во пракса. Динамична компресија Динамички опсег компримиран или стандарден

Оваа група методи се заснова на фактот дека пренесените сигнали подлежат на нелинеарни амплитудни трансформации, а во деловите што предаваат и примаат нелинеарностите се реципрочни. На пример, ако нелинеарната функција Öu се користи во предавателот, u 2 се користи во приемникот. Доследната примена на реципрочните функции ќе обезбеди целокупната трансформација да остане линеарна.

Идејата за нелинеарни методи за компресија на податоци е дека предавателот може, со иста амплитуда на излезните сигнали, да пренесе поголем опсег на промени во пренесениот параметар (односно, поголем динамички опсег). Динамички опсег- ова е односот на најголемата дозволена амплитуда на сигналот до најмалата, изразена во релативни единици или децибели:

; (2.17)
. (2.18)

Природната желба да се зголеми динамичкиот опсег со намалување на U min е ограничена од чувствителноста на опремата и зголеменото влијание на пречки и само-шум.

Најчесто, компресија на динамички опсег се врши со користење на пар реципрочни функции на логаритам и потенцирање. Првата операција на промена на амплитудата се нарекува компресија(со компресија), вториот - проширување(истегнување). Изборот на овие одредени функции е поврзан со нивните најголеми способности за компресија.

Во исто време, овие методи имаат и недостатоци. Првиот од нив е дека логаритамот на мал број е негативен и во граница:

односно чувствителноста е многу нелинеарна.

За да се намалат овие недостатоци, двете функции се менуваат со поместување и приближување. На пример, за телефонски канали, приближната функција има форма (тип А):

со А=87,6. Добивката од компресија е 24 dB.

Компресирањето на податоците со помош на нелинеарни процедури се спроведува со аналогни средства со големи грешки. Апликација дигитални медиумиможе значително да ја подобри точноста или перформансите на конверзијата. Во исто време, директното користење на средствата компјутерска технологија(односно директното пресметување на логаритми и експоненти) нема да даде најдобри резултати поради ниските перформанси и акумулирањето на грешките во пресметката.

Поради ограничувањата на точноста, компресија на податоци со компресија се користи во некритични случаи, на пример, за пренос на говор преку телефонски и радио канали.

Ефикасно кодирање

Ефикасните кодови беа предложени од К. Шенон, Фано и Хафман. Суштината на кодовите е дека тие се нерамни, односно со нееднаков број на битови, а должината на кодот е обратно пропорционална на веројатноста за нејзино појавување. Друга одлична карактеристика на ефикасните кодови е тоа што тие не бараат разграничувачи, т.е. специјални ликови, одвојувајќи соседни комбинации на кодови. Ова се постигнува со следење на едноставно правило: пократките кодови не се почеток на подолгите. Во овој случај, континуираниот тек на битови е уникатно декодиран бидејќи декодерот прво ги детектира пократките кодни зборови. Ефикасните кодови одамна се чисто академски, но неодамна тие успешно се користат при креирање бази на податоци, како и во компресирање на информации во современите модеми и софтверски архиви.

Поради нерамномерност, се воведува просечна должина на кодот. Просечна должина - математичко очекување на должината на кодот:

згора на тоа, l av има тенденција кон H(x) одозгора (т.е. l av > H(x)).

Исполнувањето на условот (2.23) станува посилно со зголемувањето на N.

Постојат два вида ефикасни кодови: Шенон-Фано и Хафман. Ајде да погледнеме како да ги добиеме користејќи пример. Да претпоставиме дека веројатностите на симболите во низата ги имаат вредностите дадени во Табела 2.1.

Табела 2.1.

Веројатности за симболи

Н
стр i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Симболите се рангирани, односно претставени во низа по опаѓачки редослед на веројатности. По ова, користејќи го методот Шенон-Фано, периодично се повторува следнава постапка: целата група настани се дели на две подгрупи со исти (или приближно исти) вкупни веројатности. Постапката продолжува додека еден елемент не остане во следната подгрупа, по што овој елемент се елиминира, а наведените дејства продолжуваат со останатите. Ова се случува додека не остане само еден елемент во последните две подгрупи. Да продолжиме со нашиот пример, кој е сумиран во Табела 2.2.

Табела 2.2.

Шенон-Фано кодирање

Н P i
4 0.3 Јас
0.2 Јас II
6 0.15 Јас Јас
0.1 II
1 0.1 Јас Јас
9 0.05 II II
5 0.05 II Јас
7 0.03 II II Јас
8 0.02 II

Како што може да се види од табела 2.2, првиот симбол со веројатност p 4 = 0.3 учествувал во две постапки за делење во групи и двата пати завршувале во групата број I. Во согласност со ова, тој е кодиран со двоцифрена шифра II. Вториот елемент во првата фаза од поделбата припаѓаше на групата I, во втората - на групата II. Затоа, неговата шифра е 10. Шифрите на преостанатите симболи не бараат дополнителни коментари.

Вообичаено, неуниформните кодови се прикажуваат како стебла на кодови. Дрвото на кодови е график кој покажува дозволени комбинации на кодови. Насоките на рабовите на овој график се претходно поставени, како што е прикажано на сл. 2.11 (изборот на насоките е произволен).

Тие се движат низ графиконот на следниов начин: креирајте рута за избраниот симбол; бројот на битови за него е еднаков на бројот на рабовите во трасата, а вредноста на секој бит е еднаква на насоката на соодветниот раб. Трасата е изготвена од почетната точка (на цртежот е означена со буквата А). На пример, маршрутата до темето 5 се состои од пет рабови, од кои сите освен последниот имаат насока 0; Добиваме код 00001.

Ајде да ја пресметаме ентропијата и просечната должина на зборот за овој пример.

H(x) = -(0.3 log 0.3 + 0.2 log 0.2 + 2 0.1 log 0.1+ 2 0.05 log 0.05+

0,03 лог 0,03 + 0,02 лог 0,02) = 2,23 бита

l просек = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Како што можете да видите, просечната должина на зборот е блиску до ентропијата.

Хафмановите кодови се конструирани со помош на различен алгоритам. Постапката за кодирање се состои од две фази. Во првата фаза, секвенцијално се вршат единечни компресии на азбуката. Еднократна компресија - замена на последните два симболи (со најмали веројатности) со еден, со вкупна веројатност. Компресијата се вршат додека не останат два знака. Во исто време, се пополнува табела за кодирање, во која се внесуваат добиените веројатности и се прикажани правците по кои се движат новите симболи во следната фаза.

Во втората фаза, се случува вистинското кодирање, кое започнува од последната фаза: на првиот од двата симболи му е доделен код 1, на вториот - 0. По ова, тие се префрлаат на претходната фаза. Шифрите од следната фаза се доделуваат на симболите кои не учествувале во компресија во оваа фаза, а кодот на симболот добиен по лепењето двапати се доделува на последните два симболи и се додава на шифрата на горниот знак 1, долен - 0. Доколку знакот не е понатаму во лепењето учествува, неговиот код останува непроменет. Постапката продолжува до крај (односно до првата фаза).

Табелата 2.3 го прикажува кодирањето на Хафман. Како што може да се види од табелата, кодирањето беше спроведено во 7 фази. Лево се веројатностите на симболите, десно се средните шифри. Стрелките ги прикажуваат движењата на новоформираните симболи. Во секоја фаза, последните два симболи се разликуваат само во најмалку значајниот бит, што одговара на техниката на кодирање. Да ја пресметаме просечната должина на зборот:

l просек = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Ова е уште поблиску до ентропијата: кодот е уште поефикасен. На сл. Слика 2.12 го прикажува дрвото на кодот Хафман.

Табела 2.3.

Хафман кодирање

Н стр i код Јас II III IV В VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Двата кодови го задоволуваат барањето за недвосмислено декодирање: како што може да се види од табелите, пократките комбинации не се почеток на подолгите кодови.

Како што се зголемува бројот на симболи, се зголемува и ефикасноста на кодовите, така што во некои случаи се кодираат поголеми блокови (на пример, ако ние зборуваме заза текстовите, можете да шифрирате некои од најчесто појавуваните слогови, зборови, па дури и фрази).

Ефектот од воведувањето на таквите кодови се одредува со нивно споредување со униформа шифра:

(2.24)

каде n е бројот на битови од униформниот код кој се заменува со ефективниот.

Модификации на Хафманови кодови

Класичниот Хафман алгоритам е алгоритам со две премини, т.е. бара прво собирање статистички податоци за симболите и пораките, а потоа и постапките опишани погоре. Ова е незгодно во пракса бидејќи го зголемува времето потребно за обработка на пораките и акумулирање на речник. Почесто се користат методи со еден премин, во кои се комбинираат процедурите за акумулација и кодирање. Ваквите методи се нарекуваат и адаптивна компресија според Хафман [46].

Суштината на адаптивната компресија според Хафман се сведува на конструкцијата на почетното кодно дрво и неговата секвенцијална модификација по пристигнувањето на секој следен симбол. Како и досега, дрвјата овде се бинарни, т.е. Од секое теме на графикот на дрвото произлегуваат најмногу два лака. Вообичаено е првобитното теме да се нарекува родител, а двете последователни темиња поврзани со него како деца. Ајде да го воведеме концептот на тежина на темето - ова е бројот на знаци (зборови) што одговараат на дадено теме, добиен при хранење на оригиналната низа. Очигледно, збирот на тежините на децата е еднаков на тежината на родителот.

По воведувањето на следниот симбол на влезната низа, дрвото на кодот се ревидира: тежините на темињата повторно се пресметуваат и, доколку е потребно, темињата се преуредуваат. Правилото за пермутирање на темињата е следново: тежините на долните темиња се најмали, а темињата лоцирани лево од графикот имаат најмала тежина.

Во исто време, темињата се нумерирани. Нумерирањето започнува од долните (виси, т.е. нема деца) темиња од лево кон десно, а потоа се движи кон највисоко нивоитн. пред да го нумерира последното, оригинално теме. Во овој случај, се постигнува следниот резултат: колку е помала тежината на темето, толку е помал нејзиниот број.

Пермутацијата се врши главно за висечки темиња. При пермутирање, мора да се земе предвид правилото формулирано погоре: темињата со поголема тежина имаат поголем број.

Откако ќе се помине низата (исто така се нарекува контрола или тест), на сите висечки темиња им се доделуваат комбинации на кодови. Правилото за доделување кодови е слично на горенаведеното: бројот на битови од кодот е еднаков на бројот на темиња низ кои трасата поминува од изворот до даденото висечко теме, а вредноста на одреден бит одговара на насоката од родителот до „детето“ (да речеме, одењето лево од родителот одговара на вредноста 1, надесно - 0 ).

Добиените комбинации на кодови се складираат во меморијата на уредот за компресија заедно со нивните аналози и формираат речник. Употребата на алгоритмот е како што следува. Компресираната низа на знаци е поделена на фрагменти во согласност со постоечкиот речник, по што секој од фрагментите се заменува со својот код од речникот. Фрагментите што не се наоѓаат во речникот формираат нови висечки темиња, добиваат тежина и се внесуваат и во речникот. На овој начин се формира адаптивен алгоритам за надополнување на речникот.

За да се зголеми ефикасноста на методот, пожелно е да се зголеми големината на речникот; во овој случај се зголемува односот на компресија. Во пракса, големината на речникот е 4 - 16 KB меморија.


Дадениот алгоритам да го илустрираме со пример. На сл. Слика 2.13 го прикажува оригиналниот дијаграм (исто така се нарекува и дрво Хафман). Секое теме на дрвото е прикажано со правоаголник во кој два броја се впишани преку дропка: првиот значи број на темето, вториот значи неговата тежина. Како што можете да видите, кореспонденцијата помеѓу тежините на темињата и нивните броеви е задоволена.

Дозволете ни сега да претпоставиме дека симболот што одговара на Вертекс 1 се појавува втор пат во секвенцата на тестот. Тежината на темето се смени како што е прикажано на Сл. 2.14, како резултат на што е нарушено правилото за нумерирање на темиња. Во следната фаза, ја менуваме локацијата на висечките темиња, за кои ги разменуваме темињата 1 и 4 и ги преименуваме сите темиња на дрвото. Резултирачкиот графикон е прикажан на сл. 2.15. Постапката потоа продолжува на ист начин.

Треба да се запомни дека секој висечки темел во дрвото Хафман одговара на специфичен симбол или група на симболи. Родителот се разликува од децата по тоа што групата симболи што му одговараат е еден симбол пократка од онаа на неговите деца, а овие деца се различни последен лик. На пример, симболите „автомобил“ одговараат на родителот; Тогаш децата може да имаат секвенци „Кара“ и „Карп“.

Дадениот алгоритам не е академски и активно се користи во програми за архивирање, вклучително и при компресирање на графички податоци (за нив ќе се дискутира подолу).

Лемпел-Зив алгоритми

Овие се најчесто користените алгоритми за компресија денес. Тие се користат во повеќето програми за архивирање (на пример, pkzip. Arj, LHA). Суштината на алгоритмите е дека одреден сет на симболи се заменува за време на архивирањето според неговиот број во специјално генериран речник. На пример, фразата „Појдовниот број за вашето писмо...“, која често се среќава во деловната кореспонденција, може да ја заземе позицијата 121 во речникот; потоа, наместо да ја пренесете или зачувате споменатата фраза (30 бајти), можете да ја зачувате фразата број (1,5 бајти во бинарна децимална форма или 1 бајт во бинарна форма).

Алгоритмите се именувани по авторите кои за прв пат ги предложиле во 1977 година. Од нив, првиот е LZ77. За архивирање, се создава т.н. прозорец за лизгање на пораки, кој се состои од два дела. Првиот дел, поголем формат, служи за формирање на речник и има големина од околу неколку килобајти. Вториот, помал дел (обично до 100 бајти во големина) ги добива тековните знаци на текстот што се гледа. Алгоритмот се обидува да најде збир на карактери во речникот што одговара на оние добиени во прозорецот за гледање. Ако ова е успешно, се генерира код кој се состои од три дела: поместувањето во речникот во однос на неговата почетна подниза, должината на оваа подниза и знакот што следи по оваа подниза. На пример, избраната подлога се состои од ликовите „апликација“ (вкупно 6 карактери), следниот лик е „Е“. Потоа, ако поднизата има адреса (место во речникот) 45, тогаш записот во речникот изгледа како „45, 6. e“. По ова, содржината на прозорецот се поместува по позиција и пребарувањето продолжува. Така се формира речник.

Предноста на алгоритмот е лесно формализиран алгоритам за составување речник. Покрај тоа, можно е да се отпакува без оригиналниот речник (препорачливо е да имате тест низа) - речникот се формира при отпакување.

Недостатоците на алгоритмот се појавуваат како што се зголемува големината на речникот - се зголемува времето на пребарување. Дополнително, ако во тековниот прозорец се појави низа знаци што ја нема во речникот, секој знак се запишува со шифра од три елементи, т.е. Резултатот не е компресија, туку истегнување.

Алгоритмот LZSS, предложен во 1978 година, ги има најдобрите карактеристики. Има разлики во поддршката за лизгачки прозорец и излезните кодови на компресорот. Покрај прозорецот, алгоритмот генерира бинарно дрво слично на дрвото Хафман за да го забрза пребарувањето за совпаѓања: секоја подниза што го напушта тековниот прозорец се додава на дрвото како едно од децата. Овој алгоритам ви овозможува дополнително да ја зголемите големината на тековниот прозорец (пожелно е неговата големина да биде еднаква на моќност од два: 128, 256, итн. бајти). Секвенциските кодови исто така се формираат поинаку: воведен е дополнителен 1-битен префикс за да се разликуваат некодираните знаци од паровите „офсет, должина“.

Уште поголем степен на компресија се добива кога се користат алгоритми како LZW. Претходно опишаните алгоритми имаат фиксна големина на прозорецот, што го оневозможува внесувањето на фрази подолги од големината на прозорецот во речникот. Во алгоритмите LZW (и нивниот претходник LZ78), прозорецот за гледање има неограничена големина, а речникот акумулира фрази (а не збирка знаци, како порано). Речникот има неограничена должина, а енкодерот (декодерот) работи во режим на чекање фраза. Кога ќе се формира фраза што одговара на речникот, се издава код за совпаѓање (т.е. кодот на оваа фраза во речникот) и шифрата на знакот што следи по неа. Ако, како што се акумулираат симболите, се формира нова фраза, таа исто така се внесува во речникот, како пократката. Резултатот е рекурзивна процедура која обезбедува брзо кодирање и декодирање.

Дополнителна карактеристика за компресија е обезбедена со компресирано кодирање на повторувачки знаци. Ако во низа следат некои знаци по ред (на пример, во текстот тоа може да бидат знаци „простор“, во бројна низа - последователни нули, итн.), тогаш има смисла да се заменат со парот „карактер; должина“ или „знак, должина““. Во првиот случај, кодот го означува знакот дека низата ќе биде кодирана (обично 1 бит), потоа кодот на повторувачкиот знак и должината на низата. Во вториот случај (обезбеден за најчесто повторуваните знаци), префиксот едноставно означува знак за повторување.

Динамична компресија(Компресија на динамички опсег, DRC) - стеснување (или проширување во случај на експандер) на динамичкиот опсег на фонограмот. Динамички опсег, е разликата помеѓу најтивкиот и најгласниот звук. Понекогаш најтивкиот звук во саундтракот ќе биде малку погласен од нивото на бучава, а понекогаш и малку потивок од најгласниот. Хардверските уреди и програмите кои вршат динамична компресија се нарекуваат компресори, разликувајќи ги меѓу нив четири главни групи: самите компресори, ограничувачи, експандери и порти.

Аналоген компресор со цевки DBX 566

Компресија надолу и нагоре

Намалување на компресија(Компресија надолу) ја намалува јачината на звукот кога ќе почне да надминува одреден праг, оставајќи ги потивките звуци непроменети. Екстремна верзија на надолна компресија е ограничувач. Зголемете ја компресијатаНагорна компресија, од друга страна, ја зголемува јачината на звукот ако е под прагот без да влијае на погласните звуци. Во исто време, двата типа на компресија го стеснуваат динамичкиот опсег на аудио сигналот.

Намалување на компресија

Зголемете ја компресијата

Експандер и порта

Ако компресорот го намалува динамичкиот опсег, експандерот го зголемува. Кога нивото на сигналот се издига над нивото на прагот, експандерот дополнително го зголемува, а со тоа ја зголемува разликата помеѓу гласните и меките звуци. Уредите како овој често се користат при снимање на комплет за тапани за да се одделат звуците на еден тапан од друг.

Еден вид експандер што не се користи за засилување на гласни звуци, туку за ублажување на тивките звуци кои не надминуваат праг (на пример, шум во позадина) се нарекува Порта за бучава. Во таков уред, штом нивото на звукот стане помало од прагот, сигналот престанува да поминува. Обично портата се користи за да се потисне бучавата за време на паузите. На некои модели, можете да се погрижите звукот да не престане нагло кога ќе достигне праг, туку постепено да згаснува. Во овој случај, стапката на распаѓање е поставена од контролата Decay.

Портата, како и другите видови компресори, може да биде зависна од фреквенцијата(т.е. третира одредени фреквенциски опсези) и може да работи во режим страничен синџир(Види подолу).

Принцип на работа на компресорот

Сигналот што влегува во компресорот е поделен на две копии. Една копија се испраќа до засилувач, во кој степенот на засилување е контролиран од надворешен сигнал, а втората копија го генерира овој сигнал. Влегува во уред наречен страничен синџир, каде што се мери сигналот и, врз основа на овие податоци, се создава плик кој ја опишува промената на неговиот волумен.
Така се дизајнирани повеќето модерни компресори, ова е таканаречениот тип на повлекување напред. Кај постарите уреди (тип на повратни информации), нивото на сигналот се мери по засилувачот.

Постојат различни технологии за аналогно засилување со променливо засилување, секоја со свои предности и недостатоци: цевка, оптички со помош на фотоотпорници и транзистор. Кога работите со дигитално аудио (во уредувач на звукили DAW) може да користи сопственички математички алгоритми или да ја емулира работата на аналогните технологии.

Главните параметри на компресорите

Праг

Компресорот го намалува нивото на аудио сигналот ако неговата амплитуда надмине одредена праг (праг). Обично се одредува во децибели, со понизок праг (на пр. -60 dB) што значи дека ќе се обработи повеќе аудио отколку повисок праг (на пр. -5 dB).

Сооднос

Количината на намалување на нивото се одредува со параметарот на односот: соодносот 4:1 значи дека ако влезното ниво е 4 dB над прагот, излезното ниво ќе биде 1 dB над прагот.
На пример:
Праг = −10 dB
Влез = -6 dB (4 dB над прагот)
Излез = -9 dB (1 dB над прагот)

Важно е да се има на ум дека потиснувањето на нивото на сигналот продолжува некое време откако ќе падне под нивото на прагот, а овој пат се одредува според вредноста на параметарот ослободување.

Компресијата со максимален сооднос ∞:1 се нарекува ограничување. Ова значи дека секој сигнал над нивото на прагот е ослабен до нивото на прагот (освен за краток период по нагло зголемување на влезниот волумен). Видете „Ограничувач“ подолу за повеќе детали.

Примери на различни вредности на сооднос

Напад и ослободување

Компресорот обезбедува одредена контрола врз тоа колку брзо реагира на промените во динамиката на сигналот. Параметарот Attack го одредува времето што му е потребно на компресорот да го намали засилувањето на ниво определено со параметарот Ratio. Ослободувањето го одредува времето во кое компресорот, напротив, го зголемува засилувањето или се враќа во нормала ако нивото на влезниот сигнал падне под прагот.

Фази на напад и ослободување

Овие параметри го покажуваат времето (обично во милисекунди) што е потребно за да се промени засилувањето за одредена количина на децибели, обично 10 dB. На пример, во овој случај, ако Attack е поставен на 1 ms, ќе биде потребно 1 ms за да се намали засилувањето за 10 dB, а 2 ms за да се намали засилувањето за 20 dB.

На многу компресори, параметрите за напад и ослободување може да се прилагодат, но кај некои тие се претходно поставени и не можат да се прилагодат. Понекогаш тие се означени како „автоматски“ или „зависни од програмата“, т.е. се менува во зависност од влезниот сигнал.

Коленото

Друг параметар на компресорот: тврдо/меко колено. Тоа одредува дали почетокот на компресија ќе биде нагло (тврдо) или постепено (меко). Мекото колено ја намалува забележливоста на преминот од сув сигнал кон компримиран сигнал, особено при високи вредности на односот и нагло зголемување на јачината на звукот.

Компресија на тврдо колено и меко колено

Врв и RMS

Компресорот може да одговори на врвните (краткорочни максимални) вредности или на просечното ниво на влезниот сигнал. Употребата на врвни вредности може да доведе до остри флуктуации во степенот на компресија, па дури и до изобличување. Затоа, компресорите применуваат просечна функција (обично RMS) на влезниот сигнал кога го споредуваат со праг. Ова дава поудобна компресија, поблиску до човечката перцепција за гласност.

RMS е параметар кој ја рефлектира просечната јачина на звук на саундтракот. Од математичка гледна точка, RMS (Root Mean Square) е коренската средна квадратна вредност на амплитудата на одреден број примероци:

Стерео поврзување

Компресорот во режим на стерео поврзување го применува истото засилување на двата стерео канали. Ова ги избегнува стерео поместувањата што може да резултираат од индивидуална обработка на левиот и десниот канал. Ова поместување се случува ако, на пример, гласен елемент е поместен надвор од центарот.

Добивка за шминка

Бидејќи компресорот го намалува целокупното ниво на сигналот, тој обично додава опција за фиксна излезна добивка за да го постигне оптималното ниво.

Погледнете

Функцијата за гледање напред е дизајнирана да решава проблеми поврзани со превисоки и прениски вредности на напад и ослободување. Премногу долго време на напад не ни дозволува ефективно да ги пресретнеме минливите моменти, а времето на напад што е прекратко можеби не е удобно за слушателот. Кога ја користите функцијата за гледање напред, главниот сигнал е одложен во однос на контролниот сигнал, што ви овозможува однапред да започнете со компресија, дури и пред сигналот да ја достигне прагот.
Единствениот недостаток на овој метод е временското доцнење на сигналот, што во некои случаи е непожелно.

Користење на динамичка компресија

Компресијата се користи насекаде, не само во музичките саундтракови, туку и секаде каде што е неопходно да се зголеми вкупната јачина на звук без да се зголемуваат максималните нивоа, каде што се користи евтина опрема за репродукција на звук или ограничен канал за пренос (јавни адреси и системи за комуникација, радио аматер, итн.) .

За време на репродукцијата се применува компресија позадинска музика(во продавници, ресторани и сл.) каде што не се посакувани забележителни промени во волуменот.

Но, најважната област на примена на динамичка компресија е производство и емитување музика. Компресијата се користи за да му се даде на звукот „дебелина“ и „погон“, за подобро комбинирање на инструментите едни со други, а особено при обработка на вокали.

Вокалите во рок и поп музиката често се компресирани за да се издвојат од придружбата и да додадат јасност. Посебен тип на компресор подесен само на одредени фреквенции - де-ессер - се користи за потиснување на сибилантните фонеми.

Во инструменталните делови, компресија се користи и за ефекти кои не се директно поврзани со јачината на звукот, на пример, звуците на тапанот што брзо се распаѓаат може да бидат подолготрајни.

Електронската денс музика (EDM) често користи странично врзување (види подолу) - на пример, бас линијата може да биде управувана од тапан за удар или слично за да се спречи судир на басот и тапаните и да се создаде динамична пулсација.

Компресијата е широко користена во емитувањето (радио, телевизија, интернет емитување) за да се зголеми воочената гласност додека се намалува динамичкиот опсег на изворното аудио (обично ЦД). Повеќето земји имаат законски ограничувања за максималната моментална јачина што може да се емитува. Обично овие ограничувања се имплементирани од постојани хардверски компресори во воздушниот ланец. Дополнително, зголемувањето на воочената гласност го подобрува „квалитетот“ на звукот од перспектива на повеќето слушатели.

исто така види Војна за гласност.

Постојано зголемување на јачината на звукот на истата песна ремастерирана за ЦД од 1983 до 2000 година.

Странично врзување

Друг најчесто сретнуван компресорски прекинувач е „страничниот синџир“. Во овој режим, компресија на звукот се јавува без оглед на неговата сопствено ниво, и во зависност од нивото на сигналот што влегува во конекторот, кој обично се нарекува страничен синџир.

Постојат неколку намени за ова. На пример, вокалистот има усни и сите „и“ се издвојуваат од целокупната слика. Неговиот глас го пренесувате низ компресор и истиот звук го внесувате во конекторот на страничниот синџир, но поминат низ еквилајзер. Со еквилајзер, ги отсекувате сите фреквенции освен оние што ги користи вокалистот кога ја изговара буквата „s“. Обично околу 5 kHz, но може да се движи од 3 kHz до 8 kHz. Ако потоа го ставите компресорот во режим на страничен ланец, гласот ќе се компресира во моментите кога се изговара буквата „s“. Ова резултираше со уред познат како де-ессер. Овој начин на работа се нарекува „зависен од фреквенцијата“.

Друга употреба на оваа функција се нарекува „патка“. На пример, на радио станица, музиката поминува низ компресор, а зборовите на диџејот доаѓаат преку страничен синџир. Кога диџејот ќе започне да разговара, јачината на звукот на музиката автоматски се намалува. Овој ефект исто така може успешно да се користи во снимањето, на пример, за да се намали обемот на делови од тастатурата додека пеете.

Ограничување на ѕидот од тули

Компресорот и ограничувачот работат приближно на ист начин; можеме да кажеме дека ограничувачот е компресор со висок сооднос (од 10:1) и, обично, со ниско време на напад.

Постои концепт за ограничување на wallидот од тули - ограничување со многу висок сооднос (20: 1 и погоре) и многу брз напад. Идеално, не дозволува сигналот воопшто да го надмине нивото на прагот. Резултатот ќе биде непријатен за увото, но ова ќе спречи оштетување на опрема за репродукција на звук или вишок пропусниот опсегканал. Многу производители ги интегрираат ограничувачите во нивните уреди за оваа цел.

Клипер vs. Ограничувач, меко и тврдо сечење

Компресијата е една од најпознатите мит-теми во производството на звук. Тие велат дека Бетовен дури ги исплашил децата на соседот со неа :(

Во ред, всушност, користењето на компресија не е потешко од користењето на изобличување, главната работа е да се разбере принципот на неговото функционирање и да се има добра контрола. Ова е она што сега ќе го видиме заедно.

Што е аудио компресија

Првото нешто што треба да се разбере пред подготовката е компресија. работа со динамичкиот опсег на звук. И, пак, не е ништо повеќе од разликата помеѓу најгласните и најтевките нивоа на сигнал:

Значи, компресија е компресија на динамичкиот опсег. Да, Самокомпресија на динамички опсег, или со други зборови Намалување на нивото на гласни делови на сигналот и зголемување на обемот на тивки делови. Нема повеќе.

Можеби разумно се прашувате зошто таквата возбуда е поврзана тогаш? Зошто сите зборуваат за рецепти за точни поставки на компресорот, но никој не ги споделува? Зошто, и покрај огромниот број кул додатоци, дали многу студиа сè уште користат скапи, ретки модели на компресори? Зошто некои производители користат компресори во екстремни поставки, додека други воопшто не ги користат? И кој од нив е во право на крајот?

Проблеми решени со компресија

Одговорите на ваквите прашања лежат во авионот на разбирање на улогата на компресија во работењето со звук. И дозволува:

  1. Нагласете го нападотзвук, што го прави поизразен;
  2. „Поставување“ индивидуални делови на инструменти во мешавината, додавајќи им моќ и „тежина“;
  3. Направете групи инструменти или цела мешавина покохезивна, таков единствен монолит;
  4. Решавајте конфликти помеѓу алаткитекористење на страничен синџир;
  5. Поправете ги грешките на вокалистот или музичарите, израмнување на нивната динамика;
  6. Со одредена поставка делува како уметнички ефект.

Како што можете да видите, ова не е помалку значаен креативен процес отколку, да речеме, смислување мелодии или создавање интересни тембри. Покрај тоа, кој било од горенаведените проблеми може да се реши со користење на 4 главни параметри.

Основни параметри на компресорот

И покрај огромниот број софтверски и хардверски модели на компресори, целата „магија“ на компресија се јавува кога правилна поставкаглавни параметри: праг, однос, напад и ослободување. Да ги погледнеме подетално:

Праг или праг на одговор, dB

Овој параметар ви овозможува да ја поставите вредноста од која ќе работи компресорот (односно, компресирајте го аудио сигналот). Значи, ако го поставиме прагот на -12 dB, компресорот ќе работи само во оние делови од динамичкиот опсег што ја надминуваат оваа вредност. Ако целиот наш звук е потивок од -12 db, компресорот едноставно ќе го помине без да влијае на кој било начин.

Сооднос или однос на компресија

Параметарот на односот одредува колку ќе се компресира сигналот што го надминува прагот. Малку математика за да ја комплетираме сликата: да речеме дека поставивме компресор со праг од -12 dB, сооднос 2:1 и го нахранивме со јамка на барабанот во кој волуменот на барабанот за удар е -4 dB. Кој ќе биде резултатот од операцијата на компресорот во овој случај?

Во нашиот случај, нивото на удар го надминува прагот за 8dB. Оваа разлика според односот ќе биде компресирана до 4DB (8dB / 2). Во комбинација со необработениот дел од сигналот, ова ќе доведе до фактот дека по обработката со компресор, волуменот на барабанот за удар ќе биде -8db (праг -12dB + компримиран сигнал 4dB).

Напад, г-ѓа

Ова е време по кое компресорот ќе одговори на надминување на прагот на одговор. Тоа е, ако времето на напад е над 0 ms - компресорот започнува со компресијаНадминување на сигналот за прагот не веднаш, туку по одредено време.

Ослободување или обновување, ms

Спротивно на нападот - вредноста на овој параметар ви овозможува да наведете колку долго откако нивото на сигналот се враќа под прагот компресорот ќе престане да компресира.

Пред да продолжиме понатаму, силно препорачувам да земете добро познат примерок, да поставите кој било компресор на неговиот канал и да експериментирате со горенаведените параметри 5-10 минути за безбедно фиксирање на материјалот.

Сите другите параметри се опционални. Тие можат да се разликуваат помеѓу различни модели на компресори, што е делумно зошто продуцентите користат различни модели за специфични цели (на пример, еден компресор за вокал, друг за тапана група, трет за главниот канал). Јас нема детално да се осврнам на овие параметри, туку само ќе ги дадам генерални информацииЗа да разберете за што се работи:

  • Колено или свиткување (тврдо/меко колено). Овој параметар одредува колку брзо ќе се примени односот на компресија (сооднос): тешко по кривата или непречено. Забележувам дека во режимот меко колено компресорот не работи линеарно, туку почнува непречено (колку што е соодветно кога зборуваме за милисекунди) го компресира звукот веќе пред вредноста на прагот. За обработка на групи канали и целокупната мешавина, често се користи меко колено (бидејќи работи незабележано), а за да се нагласи нападот и другите карактеристики на поединечни инструменти, се користи тврдо колено;
  • Режим на одговор: Peak/RMS. Режимот Peak е оправдан кога треба строго да ги ограничите амплитудните рафали, како и на сигналите со сложена форма, чија динамика и читливост треба целосно да се пренесат. Режимот RMS е многу нежен на звукот, овозможувајќи ви да го задебелите додека одржувате напад;
  • Предвидување (Гледај напред). Ова е време во кое компресорот ќе знае што доаѓа до него. Еден вид прелиминарна анализа на дојдовни сигнали;
  • Шминка или добивка. Параметар што ви овозможува да го компензирате намалувањето на волуменот како резултат на компресија.

Прво и повеќето главен совет , што ги елиминира сите дополнителни прашања за компресија: ако а) го разбирате принципот на компресија, б) цврсто знаете како овој или оној параметар влијае на звукот и в) успеавте да пробате неколку во пракса различни моделиповеќе не ти треба никаков совет.

Јас сум апсолутно сериозен. Ако внимателно ја прочитавте оваа објава, експериментиравте со стандардниот компресор на вашиот DAW и еден или два приклучоци, но сепак не сте разбрале во кои случаи треба да поставите големи вредности за напад, каков сооднос да се користи и во кој режим да се обработи Изворен сигнал - Тогаш ќе продолжите да пребарувате на Интернет за готови рецепти, применувајќи ги непромислено каде било.

Рецепти за фино подесување на компресоротНекако е како рецепти за фино подесување на реверб или хор - нема смисла и нема никаква врска со креативноста. Затоа, упорно го повторувам единствениот правилен рецепт: наоружајте се со овој напис, добри слушалки за монитор, приклучок за визуелна контрола на брановата форма и поминете ја вечерта во друштво на неколку компресори.

Преземете акција!

, Медиа плеери

Записите, особено постарите што се снимени и произведени пред 1982 година, имаа многу помала веројатност да се мешаат за да се направи снимката погласна. Тие репродуцираат природна музика со природен динамичен опсег што е зачуван на плочата и се губи во повеќето стандардни дигитални или формати со висока дефиниција.

Има исклучоци од ова, се разбира - слушнете го неодамнешниот албум на Стивен Вилсон од MA Recordings или Reference Recordings и ќе слушнете колку добро може да биде дигиталниот звук. Но, ова е ретко; повеќето модерни звучни снимки се гласни и компресирани.

Компресијата на музиката во последно време наиде на многу критики, но јас сум подготвен да се обложам дека скоро сите ваши омилени снимки се компресирани. Некои од нив се помалку, некои се повеќе, но сепак компресирани. Компресирањето на динамичкиот опсег е жртвено јагне за музика со лош звук, но високо компресираната музика не е ништо ново: слушајте ги албумите на Motown од 60-тите. Истото може да се каже и за класичните дела на Лед Цепелин или за помладите албуми на Wilco и Radiohead. Компресијата со динамички опсег ја намалува природната врска помеѓу најгласните и најнежните звуци на снимање, така што шепотот може да биде гласен како крик. Прилично е тешко да се најде поп-музика од последните 50 години што не е компресирана.

Неодамна имав убав разговор со основачот и уредник на списанието Tape Op, Лери Крејн, за добрите, лошите и грдите аспекти на компресијата. Лери Крејн има работено со бендови и уметници како Стефан Маркус, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi и Richmond Fontaine. Го води и студиото за снимање Џекпот! во Портланд, Орегон, кој беше дом на The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him и многу, многу други.

Како пример за изненадувачки неприродно звук, но сепак одлични песни, го наведувам албумот на Spoon од 2014 година, They Want My Soul. Крејн се смее и вели дека ја слуша во автомобилот бидејќи таму звучи одлично. Што нè доведува до друг одговор на прашањето зошто музиката е компресирана: затоа што компресијата и дополнителната „јасност“ го олеснуваат слушањето на бучни места.

Лери Крејн на работа. Фотографија на Џејсон Квигли

Кога луѓето велат дека им се допаѓа звукот на аудио снимката, мислам дека им се допаѓа музиката, како звукот и музиката да се неразделни поими. Но, за себе, јас ги разликувам овие концепти. Од перспектива на аудиофил, звукот може да биде груб и суров, но тоа нема да биде важно за повеќето слушатели.

Многумина брзаат да ги обвинат мајсторските инженери за прекумерна употреба на компресија, но компресијата се применува директно за време на снимањето, за време на мешањето и дури потоа за време на мастерингот. Освен ако не сте биле лично присутни на секоја од овие фази, нема да можете да кажете како звучеле инструментите и вокалните делови на самиот почеток на процесот.

Крејн беше на тркалање: „Ако музичарот сака намерно да звучи лудо и искривено како плочите на Guided by Voices, тогаш нема ништо лошо во тоа - желбата секогаш го надминува квалитетот на звукот“. Гласот на изведувачот е речиси секогаш компримиран, а истото се случува и со басот, тапаните, гитарите и синтисајзерите. Компресијата ја одржува јачината на вокалот на вистинското нивониз песната или малку се издвојува од останатите звуци.

Правилно направената компресија може да направи тапаните да звучат поживо или намерно чудно. За да направите музиката да звучи одлично, треба да можете да ги користите потребните алатки. Ова е причината зошто потребни се години за да се открие како да се користи компресија без да се претера. Ако инженерот за мешање го компресира делот од гитарата премногу, мајсторскиот инженер повеќе нема да може целосно да ги врати фреквенциите што недостасуваат.

Ако музичарите сакаа да слушате музика што не поминала низ фазите на миксирање и мастеринг, тие би ја пуштиле на полиците на продавниците директно од студиото. Крејн вели дека луѓето кои создаваат, уредуваат, мешаат и совладуваат снимена музика не се таму за да им пречат на музичарите - тие им помагаат на уметниците од самиот почеток, повеќе од сто години.

Овие луѓе се дел од процесот на создавање што резултира со неверојатни уметнички дела. Крејн додава: „Не сакате верзија на „Темната страна на Месечината“ која не е мешана и мастерирана. Пинк Флојд ја објавија песната онака како што сакаа да ја слушнат.




Врв