Компресија во пракса. Динамична компресија Динамички опсег компримиран или стандарден

Оваа група на методи се заснова на фактот дека пренесените сигнали се подложени на нелинеарни амплитудни трансформации, а во предавателните и приемните делови нелинеарностите се меѓусебно инверзни. На пример, ако предавателот користи нелинеарна функција Öu , приемникот користи u 2 . Последователната примена на реципрочните функции ќе доведе до фактот дека целокупната трансформација останува линеарна.

Идејата за нелинеарни методи за компресија на податоци е дека предавателот може, со иста амплитуда на излезните сигнали, да пренесе поголем опсег на промени во пренесениот параметар (односно, поголем динамички опсег). Динамички опсег е односот на најголемата дозволена амплитуда на сигналот до најмалата, изразена во релативни единици или децибели:

; (2.17)
. (2.18)

Природната желба да се зголеми динамичкиот опсег со намалување на U min е ограничена од чувствителноста на опремата и зголемувањето на влијанието на пречките и внатрешниот шум.

Најчесто, компресија на динамички опсег се врши со користење на пар реципрочни логаритам и функции за потенцирање. Првата операција на промена на амплитудата се нарекува компресија(компресија), вториот - проширување(истегнување). Изборот на овие функции е поврзан со нивната најголема можност за компресија.

Во исто време, овие методи имаат и недостатоци. Првиот од нив е дека логаритамот на мал број е негативен и во граница:

односно чувствителноста е високо нелинеарна.

За да се намалат овие недостатоци, двете функции се модифицирани со пристрасност и приближување. На пример, за телефонски канали, приближната функција има форма (тип А,):

каде A=87.6. Добивката од компресија во овој случај е 24dB.

Компресирањето на податоците со нелинеарни процедури се спроведува со аналогни средства со големи грешки. Апликација дигитални медиумиможе значително да ја подобри точноста или перформансите на конверзијата. Во исто време, директното користење на средствата Компјутерски науки(т.е. директно пресметување на логаритми и експоненти) нема да го даде најдобриот резултат поради ниските перформанси и акумулираните грешки во пресметките.

Компресија на податоци со компресија поради ограничувања на точноста се користи во некритични случаи, на пример, за пренос на глас преку телефонски и радио канали.

Ефикасно кодирање

Ефикасните кодови беа предложени од К. Шенон, Фано и Хафман. Суштината на шифрите лежи во тоа што тие се нерамни, односно со нееднаков број цифри, а должината на шифрата е обратно пропорционална на веројатноста за нејзино појавување. Друга одлична карактеристика на ефикасните кодови е тоа што тие не бараат разграничувачи, т.е. специјални ликовиодвојување на соседните комбинации на кодови. Ова се постигнува со почитување на едноставно правило: пократките кодови не се почеток на подолгите. Во овој случај, континуираниот проток на битови е недвосмислено декодиран бидејќи декодерот прво детектира пократки обрасци. Ефикасните кодови одамна се чисто академски, но неодамна успешно се користат во формирањето на бази на податоци, како и во компресија на информации во современите модеми и софтверски архиви.

Поради нерамномерноста, се воведува просечна должина на кодот. Просечна должина - математичко очекување за должината на кодот:

згора на тоа, l cf се стреми кон H(x) одозгора (т.е. l cf > H(x)).

Исполнувањето на условот (2.23) станува посилно со зголемувањето на N.

Постојат два вида ефикасни кодови: Шенон-Фано и Хафман. Ајде да земеме пример за да ги добиеме. Да претпоставиме дека веројатностите на ликовите во низата ги имаат вредностите дадени во Табела 2.1.

Табела 2.1.

Веројатности за симболи

Н
пи 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Симболите се рангирани, односно се претставени во серија по опаѓачки редослед на веројатности. После тоа, според Шенон-Фано методот, периодично се повторува следната постапка: целата група настани се дели на две подгрупи со исти (или приближно исти) вкупни веројатности. Постапката продолжува додека еден елемент не остане во следната подгрупа, по што овој елемент се елиминира, а наведените дејства продолжуваат со останатите. Ова продолжува додека не остане само еден елемент во последните две подгрупи. Да го продолжиме разгледувањето на нашиот пример, кој е сумиран во Табела 2.2.

Табела 2.2.

Шенон-Фано кодирање

Н Пи
4 0.3 Јас
0.2 Јас II
6 0.15 Јас Јас
0.1 II
1 0.1 Јас Јас
9 0.05 II II
5 0.05 II Јас
7 0.03 II II Јас
8 0.02 II

Како што може да се види од Табела 2.2, првиот симбол со веројатност p 4 = 0.3 учествувал во две постапки за разделување во групи и двата пати паднал во групата со број I . Според тоа, тој е кодиран со двоцифрена шифра II. Вториот елемент во првата фаза од поделбата припаѓаше на групата I, во втората - на групата II. Затоа, неговиот код е 10. Кодовите на преостанатите знаци не бараат дополнителни коментари.

Обично неуниформните кодови се прикажуваат како стебла на кодови. Дрвото на кодови е график кој ги покажува дозволените комбинации на кодови. Насоките на рабовите на овој график се прелиминарно поставени, како што е прикажано на сл. 2.11 (изборот на насоките е произволен).

Според графиконот, тие се водат на следниов начин: направете рута за избраниот симбол; бројот на битови за него е еднаков на бројот на рабовите во трасата, а вредноста на секој бит е еднаква на насоката на соодветниот раб. Трасата се црта од почетната точка (на цртежот е означена со буквата А). На пример, маршрутата до темето 5 се состои од пет рабови, од кои сите освен последниот имаат насока 0; ја добиваме шифрата 00001.

За овој пример, ја пресметуваме ентропијата и просечната должина на зборот.

H(x) = -(0.3 log 0.3 + 0.2 log 0.2 + 2 0.1 log 0.1+ 2 0.05 log 0.05+

0,03 лог 0,03 + 0,02 лог 0,02) = 2,23 бита

лав = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Како што можете да видите, просечната должина на зборот е блиску до ентропијата.

Хафмановите кодови се изградени според различен алгоритам. Постапката за кодирање се состои од два чекори. Во првата фаза, секвенцијално се врши еднократна компресија на азбуката. Еднократна компресија - замена на последните два знака (со најмали веројатности) со еден, со вкупна веројатност. Компресијата се врши додека не останат два знака. Во исто време, се пополнува табела за кодирање, во која се ставаат добиените веројатности, а се прикажани и правците по кои минуваат новите симболи во следната фаза.

Во втората фаза се одвива вистинското кодирање, кое започнува од последната фаза: на првиот од двата знака му е доделена шифра 1, на вториот - 0. После тоа, тие одат во претходната фаза. Шифрите од следната фаза се доделуваат на знаците кои не учествувале во компресија во оваа фаза, а кодот на знакот добиен по лепењето двапати се доделува на последните два знака и се додава на кодот на горниот знак 1, долен - 0. Доколку знакот не е понатаму во лепењето учествува, неговиот код останува непроменет. Постапката продолжува до крај (односно до првата фаза).

Табелата 2.3 го прикажува кодирањето на Хафман. Како што може да се види од табелата, кодирањето беше спроведено во 7 фази. Лево се веројатностите на симболите, десната - средни кодови. Стрелките ги прикажуваат движењата на новоформираните симболи. Во секоја фаза, последните два знака се разликуваат само во најмалку значајниот бит, што одговара на техниката на кодирање. Пресметајте ја просечната должина на зборот:

лав = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + + 0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Ова е уште поблиску до ентропијата: кодот е уште поефикасен. На сл. 2.12 го прикажува дрвото на кодот Хафман.

Табела 2.3.

Хафман кодирање

Н пи код Јас II III IV В VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Двата кодови го задоволуваат барањето за недвосмислено декодирање: како што може да се види од табелите, пократките комбинации не се почеток на подолгите кодови.

Како што се зголемува бројот на симболи, ефикасноста на шифрите се зголемува, така што во некои случаи се кодираат поголеми блокови (на пример, ако ние зборувамеза текстовите, можете да шифрирате некои од најчестите слогови, зборови, па дури и фрази).

Ефектот од воведувањето на таквите кодови се одредува со нивно споредување со униформа шифра:

(2.24)

каде n е бројот на цифри од униформната шифра, која се заменува со ефективна.

Модификации на Хафманови кодови

Класичниот Хафман алгоритам се однесува на две премини, т.е. бара прво збир на статистички податоци за симболите и пораките, а потоа и процедурите опишани погоре. Ова е незгодно во пракса, бидејќи го зголемува времето за обработка на пораки и акумулација на речник. Почесто се користат методите со еден премин, во кои се комбинираат процедурите за акумулација и кодирање. Ваквите методи се нарекуваат и Хафманова адаптивна компресија [46].

Суштината на адаптивната компресија според Хафман е сведена на конструкцијата на почетното дрво на кодови и неговата последователна измена по доаѓањето на секој следен знак. Како и досега, дрвјата овде се бинарни, т.е. од секое теме на граф-стеблото доаѓаат најмногу два лака. Вообичаено е почетното теме да се нарекува родител, а следните две темиња поврзани со него - децата. Ајде да го воведеме концептот на тежината на темето - ова е бројот на знаци (зборови) што одговараат на дадено теме, добиен при поднесување на оригиналната низа. Очигледно, збирот на тежините на децата е еднаков на тежината на родителот.

По воведувањето на следниот симбол на влезната низа, дрвото на кодот се ревидира: тежините на темињата се пресметуваат повторно и, доколку е потребно, темињата се преуредуваат. Правилото за пермутација на темето е следново: тежините на долните темиња се најмали, а темињата лево од графикот имаат најмали тежини.

Во исто време, темињата се нумерирани. Нумерирањето започнува од долните (виси, т.е. без деца) темиња од лево кон десно, потоа се пренесува на највисоко нивоитн. до нумерирањето на последното, почетно теме. Во овој случај, се постигнува следниот резултат: колку е помала тежината на темето, толку е помал нејзиниот број.

Пермутацијата се врши главно за висечки темиња. При преуредување, треба да се земе предвид правилото формулирано погоре: темињата со голема тежина имаат и поголем број.

Откако ќе помине низ низата (исто така се нарекува контрола или тест), комбинациите на кодови се доделуваат на сите висечки темиња. Правилото за доделување код е слично на она погоре: бројот на битови на кодот е еднаков на бројот на темиња низ кои трасата минува од изворот до даденото висечко теме, а вредноста на одреден бит одговара на насоката од родител на „дете“ (да речеме, движењето налево од родителот одговара на вредноста 1, надесно - 0 ).

Добиените комбинации на кодови се внесуваат во меморијата на уредот за компресија заедно со нивните колеги и формираат речник. Употребата на алгоритмот е како што следува. Компресираната низа знаци е поделена на фрагменти според достапниот речник, по што секој од фрагментите се заменува со неговиот код од речникот. Фрагментите што не се наоѓаат во речникот формираат нови висечки темиња, добиваат тежина и се внесуваат и во речникот. Така, се формира адаптивен алгоритам за надополнување на речник.

За да се зголеми ефикасноста на методот, пожелно е да се зголеми големината на речникот; во овој случај, односот на компресија е зголемен. Во пракса, големината на речник е 4 - 16 KB меморија.


Да го илустрираме горенаведениот алгоритам со пример. На сл. 2.13 го прикажува оригиналниот дијаграм (исто така наречен Хафман дрво). Секое теме на дрвото е прикажано со правоаголник во кој преку дропка се внесуваат две цифри: првата го означува бројот на темето, втората - неговата тежина. Како што можете да видите, кореспонденцијата помеѓу тежините на темињата и нивните броеви е задоволена.

Сега да претпоставиме дека симболот што одговара на темето 1 се појавува по втор пат во тест низата. Тежината на темето е променета, како што е прикажано на сл. 2.14, како резултат на што е прекршено правилото за нумерирање на темето. Во следната фаза, ја менуваме локацијата на висечките темиња, за кои ги менуваме темињата 1 и 4 и ги пренумерираме сите темиња на дрвото. Резултирачкиот графикон е прикажан на сл. 2.15. Постапката потоа продолжува на ист начин.

Треба да се запомни дека секој висечки јазол во дрвото Хафман одговара на одреден лик или група од нив. Родителот се разликува од децата по тоа што групата на знаци што му одговараат е еден знак пократка од онаа на неговите деца, а овие деца се разликуваат последен лик. На пример, родителот ги совпаѓа ликовите „kar“; тогаш децата може да ги имаат секвенците „кара“ и „карп“.

Горенаведениот алгоритам не е академски и активно се користи во програмите за архивирање, вклучително и при компресирање на графички податоци (за нив ќе се дискутира подолу).

Лемпел-Жива алгоритми

Ова се најчесто користените алгоритми за компресија денес. Тие се користат во повеќето програми - архиви (на пример, PKZIP, ARJ, LHA). Суштината на алгоритмите лежи во фактот дека одреден сет на знаци се заменува за време на архивирањето со неговиот број во специјално формиран речник. На пример, фразата „Појдовен број за вашето писмо ...“, која често се наоѓа во деловната кореспонденција, може да ја заземе позицијата 121 во речникот; тогаш наместо да ја пренесувате или зачувувате наведената фраза (30 бајти), можете да ја зачувате фразата број (1,5 бајти во BCD или 1 бајт во бинарни).

Алгоритмите се именувани по авторите кои први ги предложиле во 1977 година. Од нив, првиот е LZ77. За архивирање се креира таканаречен прозорец со лизгачки пораки, кој се состои од два дела. Првиот дел, со поголем формат, служи за формирање речник и има големина од редот на неколку килобајти. Вториот, помал дел (обично до 100 бајти) ги прима тековните знаци на текстот што се гледа. Алгоритмот се обидува да најде збир на знаци во речникот што се совпаѓа со оние примени во приказот. Ако ова успее, се формира код кој се состои од три дела: поместувањето во речникот во однос на неговата почетна подниза, должината на оваа подниза и знакот што следи по оваа подниза. На пример, избраната подниза се состои од знаците "app" (вкупно 6 знаци), знакот што следи е "e". Потоа, ако поднизата ја има адресата (место во речникот) 45, тогаш записот во речникот изгледа како „45, 6. e“. После тоа, содржината на прозорецот се поместува за позиција, а пребарувањето продолжува. Така, се формира речник.

Предноста на алгоритмот е лесно формализиран алгоритам за составување речник. Дополнително, отпакувањето е можно без почетниот речник (пожелно е да се има тест низа во исто време) - речникот се формира за време на отпакувањето.

Недостатоците на алгоритмот се појавуваат кога се зголемува големината на речникот - се зголемува времето за пребарување. Дополнително, ако во тековниот прозорец се појави низа знаци што ја нема во речникот, секој знак се запишува со шифра од три елементи, т.е. Тоа не е компресија, туку проширување.

Алгоритмот LZSS, предложен во 1978 година, има најдобри перформанси. Има разлики во одржувањето на лизгачкиот прозорец и излезните шифри на компресорот. Покрај прозорецот, алгоритмот формира бинарно дрво слично на дрвото Хафман за да го забрза пребарувањето на совпаѓања: секоја подниза што го напушта тековниот прозорец се додава на дрвото како едно од децата. Овој алгоритам ви овозможува дополнително да ја зголемите големината на тековниот прозорец (пожелно е неговата вредност да биде еднаква на моќноста од два: 128, 256, итн. бајти). Секвенциските кодови исто така се формираат поинаку: воведен е дополнителен 1-битен префикс за да се разликуваат некодираните знаци од паровите „офсет, должина“.

Уште поголем степен на компресија се добива при користење на алгоритми како што е LZW. Алгоритмите опишани претходно имаат фиксна големина на прозорецот, што го оневозможува внесувањето на фрази подолги од големината на прозорецот во речникот. Во алгоритмите LZW (и нивниот претходник LZ78), приказот има неограничена големина, а речникот акумулира фрази (а не збирка знаци, како порано). Речникот има неограничена должина, а енкодерот (декодерот) работи во режимот на чекање фраза. Кога ќе се формира фраза што одговара на речникот, шифрата за совпаѓање (т.е. кодот за таа фраза во речникот) и кодот на знакот што следи се враќаат. Ако, како што се акумулираат знаците, се формира нова фраза, таа исто така се внесува во речникот, како и пократка. Резултатот е рекурзивна процедура која обезбедува брзо кодирање и декодирање.

Дополнителна способност за компресија е обезбедена со компресирано кодирање на повторени знаци. Ако во низата следат некои знаци по ред (на пример, во текстот ова може да бидат знаци „простор“, во нумеричка низа - последователни нули итн.), тогаш има смисла да ги замените со пар „карактери ; должина“ или „знак, должина“. Во првиот случај, кодот го означува знакот дека низата ќе биде кодирана (обично 1 бит), потоа кодот на повторениот знак и должината на низата. Во вториот случај (обезбеден за најчесто повторуваните знаци), префиксот едноставно го означува знакот на повторувања.

Динамична компресија(Компресија на динамички опсег, DRC) - стеснување (или проширување во случај на експандер) динамичкиот опсег на фонограм. Динамички опсег, е разликата помеѓу најтивкиот и најгласниот звук. Понекогаш најтивкиот звук во фонограмот ќе биде малку погласен од нивото на бучава, а понекогаш малку потивок од најгласниот. Хардверските уреди и програмите кои вршат динамична компресија се нарекуваат компресори, разликувајќи четири главни групи меѓу нив: самите компресори, ограничувачи, експандери и порти.

Аналоген компресор со цевки DBX 566

Компресија надолу и нагоре

надолна компресија(Компресија надолу) ја намалува јачината на звукот кога ќе надмине одреден праг, оставајќи ги потивките звуци непроменети. Екстремна верзија на намалување на компресија е ограничувач. До компресија(Компресија нагоре), напротив, ја зголемува јачината на звукот ако е под прагот, без да влијае на погласните звуци. Во исто време, двата типа на компресија го стеснуваат динамичкиот опсег на аудио сигналот.

надолна компресија

До компресија

Експандер и порта

Ако компресорот го намалува динамичкиот опсег, експандерот го зголемува. Кога нивото на сигналот ќе го надмине нивото на прагот, експандерот го зголемува уште повеќе, со што се зголемува разликата помеѓу гласните и меките звуци. Ваквите уреди често се користат при снимање на тапан поставен за да се одделат звуците на еден тапан од друг.

Типот на експандер што се користи не за засилување гласни, туку за исклучување на меки звуци што не надминуваат праг (на пример, шум во позадина) се нарекува портата за бучава. Во таков уред, штом нивото на звукот стане помало од прагот, сигналот престанува да поминува. Вообичаено, портата се користи за да се потисне бучавата во паузи. На некои модели, можете да се погрижите звукот да не запре нагло кога ќе се достигне прагот, туку постепено да се намалува. Во овој случај, стапката на распаѓање е поставена од контролата Decay.

Портата, како и другите видови компресори, може да биде зависна од фреквенцијата(т.е. третира одредени фреквенциски опсези) и може да работи во режим страничен синџир(Види подолу).

Принципот на работа на компресорот

Сигналот што влегува во компресорот е поделен на две копии. Една копија се испраќа до засилувач во кој засилувањето е контролирано од надворешен сигнал, втората копија го формира овој сигнал. Влегува во уред наречен страничен синџир, каде што се мери сигналот и врз основа на овие податоци се создава плик кој ја опишува промената на неговиот волумен.
Така се распоредени повеќето модерни компресори, ова е таканаречениот тип на feed-forward. Кај постарите уреди (тип на повратни информации), нивото на сигналот се мери по засилувачот.

Постојат различни аналогни технологии за контролирано засилување (засилување со променлива добивка), секоја со свои предности и недостатоци: цевка, оптички со помош на фотоотпорници и транзистори. Кога работите со дигитален звук (во уредувач на звук или DAW), може да се користат сопствени математички алгоритми или да се емулираат аналогни технологии.

Главните параметри на компресорите

Праг

Компресорот го намалува нивото на аудио сигналот доколку неговата амплитуда надмине одредена праг (праг). Обично се одредува во децибели, со понизок праг (на пр. -60 dB) што значи дека ќе се обработи повеќе звук отколку повисок праг (на пр. -5 dB).

Сооднос

Износот на намалување на нивото се одредува со параметарот на односот: соодносот 4:1 значи дека ако влезното ниво е 4 dB над прагот, излезното ниво ќе биде 1 dB над прагот.
На пример:
Праг = -10dB
Влезен сигнал = -6 dB (4 dB над прагот)
Излезен сигнал = -9 dB (1 dB над прагот)

Важно е да се има на ум дека потиснувањето на нивото на сигналот продолжува некое време откако ќе падне под нивото на прагот, а овој пат се одредува според вредноста на параметарот ослободување.

Компресијата со максимален сооднос ∞:1 се нарекува ограничување. Ова значи дека секој сигнал над нивото на прагот е атенуиран до нивото на прагот (освен за краток период по нагло зголемување на влезната јачина на звук). Видете „Ограничувач“ подолу за детали.

Примери на различни вредности на сооднос

Напад и ослободување

Компресорот обезбедува одредена контрола врз тоа колку брзо реагира на променливата динамика на сигналот. Параметарот Attack го одредува времето што му е потребно на компресорот да го намали засилувањето до нивото одредено со параметарот Ratio. Ослободувањето го одредува времето што му е потребно на компресорот или да го зголеми засилувањето или да се врати во нормала ако нивото на влезот падне под прагот.

Фази на напад и ослободување

Овие параметри го покажуваат времето (обично во милисекунди) што е потребно за засилувањето да се промени за одреден број децибели, обично 10 dB. На пример, во овој случај, ако Attack е поставен на 1ms, ќе бидат потребни 1ms за да се намали засилувањето за 10dB и 2ms за 20dB.

Во многу компресори, параметрите Attack и Release може да се прилагодат, но кај некои тие се претходно поставени и не се прилагодливи. Понекогаш тие се нарекуваат „автоматски“ или „зависни од програмата“, т.е. се менува во зависност од влезниот сигнал.

Коленото

Друга опција за компресор: тврдо/меко колено. Тоа одредува дали почетокот на примената на компресија ќе биде нагло (тврд) или постепен (мек). Мекото колено ја намалува видливоста на транзицијата на сигналот од суво кон компресирано, особено при високи соодноси и нагло се зголемува гласноста.

Компресија на тврдо колено и меко колено

Врв и RMS

Компресорот може да одговори на врвните (краткорочни максимални) вредности или на просечното ниво на влезниот сигнал. Употребата на врвни вредности може да доведе до големи флуктуации во степенот на компресија, па дури и до изобличување. Затоа, компресорите применуваат просечна функција (обично RMS) на влезниот сигнал кога го споредуваат со праг. Ова дава поудобна компресија што е поблиску до човечката перцепција за гласност.

RMS е параметар кој ја одразува просечната гласност на фонограмот. Од математичка гледна точка, RMS (Root Mean Square) е коренската средна квадратна вредност на амплитудата на одреден број примероци:

стерео поврзување

Компресорот во режим на стерео поврзување го применува истото засилување на двата стерео канали. Ова го избегнува поместувањето на стерео тавата што може да резултира од обработката на левиот и десниот канал поединечно. Таквото поместување се случува ако, на пример, кој било гласен елемент е поместен надвор од центарот.

шминка добивка

Бидејќи компресорот го намалува целокупното ниво на сигналот, вообичаено е да се додаде опција за фиксно засилување на излезот за да се добие оптималното ниво.

Гледајте напред

Функцијата за гледање напред е наменета да ги реши проблемите поврзани со преголеми и премали вредности на напад и ослободување. Премногу долго време на напад не дозволува ефективно пресретнување на транзиенти, а прекраткото време за напад можеби не е удобно за слушателот. Кога се користи функцијата за гледање напред, главниот сигнал е одложен во однос на контролниот сигнал, што овозможува компресија да започне однапред, дури и пред сигналот да ја достигне прагот.
Единствениот недостаток на овој метод е временското доцнење на сигналот, што во некои случаи е непожелно.

Користење на динамичка компресија

Компресијата се користи насекаде, не само во музичките фонограми, туку и секаде каде што е неопходно да се зголеми вкупната јачина на звук без зголемување на врвните нивоа, каде што се користи евтина опрема за репродукција на звук или ограничен канал за пренос (јавни адреси и системи за комуникација, радио аматерски итн. .) .

Применета компресија за време на репродукцијата позадинска музика(продавници, ресторани итн.) каде што се непожелни забележливи промени во волуменот.

Но, најважната примена на динамичната компресија е продукцијата и емитувањето музика. Компресијата се користи за да му се даде на звукот „дебелина“ и „погон“, за подобро усогласување на инструментите едни со други, а особено при обработка на вокали.

Вокалите во рок и поп музиката обично се компресирани за да се издвојат од придружбата и да додадат јасност. Посебен вид на компресор, прилагоден само на одредени фреквенции - де-ессер, се користи за потиснување на фонемите кои шушкаат.

Во инструменталните делови, компресија се користи и за ефекти кои не се директно поврзани со јачината на звукот, на пример, брзото избледување на звуците на тапанот може да стане подолг.

Електронската денс музика (EDM) често користи странично поврзување (види подолу) - на пример, бас линијата може да се вози со удар или слично за да се спречи конфликт бас/тапан и да се создаде динамична пулсација.

Компресијата е широко користена во емитувањето (радио, ТВ, интернет) за да се зголеми воочената гласност додека се намалува динамичкиот опсег на оригиналното аудио (обично ЦД). Повеќето земји имаат законски ограничувања за моменталниот максимален волумен што може да се емитува. Обично овие ограничувања се имплементирани од постојани хардверски компресори во колото на воздухот. Покрај тоа, зголемувањето на воочената гласност го подобрува „квалитетот“ на звукот од гледна точка на повеќето слушатели.

исто така види Војна за гласност.

Секвенцијално зголемување на јачината на истата песна, ремастерирана за ЦД од 1983 до 2000 година.

странично синџирирање

Друг вообичаен прекинувач на компресорот е "страничниот синџир". Во овој режим, звукот се компресира не во зависност од сопственото ниво, туку во зависност од нивото на сигналот што доаѓа до конекторот, што обично се нарекува страничен синџир.

Постојат неколку намени за ова. На пример, вокалистот лиснува и сите букви „s“ се издвојуваат од целокупната слика. Неговиот глас го поминувате низ компресорот, а истиот звук се внесува во приклучокот на страничниот ланец, но поминува низ еквилајзерот. На еквилајзерот ги отстранувате сите фреквенции освен оние што ги користи вокалистот кога ја изговара буквата „c“. Обично околу 5 kHz, но може да биде од 3 kHz до 8 kHz. Ако потоа го ставите компресорот во режим на страничен ланец, тогаш компресирањето на гласот ќе се случи во моментите кога ќе се изговара буквата „s“. Така е добиен апаратот познат како „де-ессер“ (де-ессер). Овој начин на работа се нарекува зависен од фреквенцијата.

Друга апликација на оваа функција се нарекува „патка“. На пример, на радио станица, музиката поминува низ компресорот, а зборовите на диџејот поминуваат низ страничниот синџир. Кога диџејот ќе започне да разговара, јачината на музиката автоматски ќе се намали. Овој ефект може успешно да се примени и при снимање, на пример, да се намали јачината на звукот на деловите од тастатурата додека се пее.

ограничување на ѕидот од тули

Компресорот и ограничувачот работат на ист начин, можеме да кажеме дека ограничувачот е компресор со висок сооднос (од 10:1) и обично ниско време на напад.

Постои концепт на ограничување на ѕид од тули - ограничување со многу висок сооднос (од 20:1 и погоре) и многу брз напад. Идеално, воопшто не дозволува сигналот да го надмине нивото на прагот. Резултатот ќе биде непријатен за увото, но ќе спречи оштетување на опремата за репродукција на звук или надминување пропусниот опсегканал. Многу производители интегрираат ограничувачи во нивните уреди токму за оваа намена.

Клипер vs. Ограничувач, меко и тврдо сечење

Компресијата е една од најмитските теми во производството на звук. Велат дека Бетовен дури и ги исплашил децата на соседот:(

Во ред, всушност, примената на компресија не е потешко од користењето на изобличување, главната работа е да разберете како функционира и да имате добра контрола. Што сме сега заедно и уверете се.

Што е аудио компресија

Првото нешто што треба да се разбере пред подготовката е дека компресија е работа со динамичкиот опсег на звук. И, пак, не е ништо повеќе од разликата помеѓу најгласното и најтивкото ниво на сигнал:

Па еве го компресија е компресија на динамичкиот опсег. Да, Самокомпресија на динамички опсег, или со други зборови намалете ја гласноста на гласните делови од сигналот и зголемете ја јачината на тивките. Нема повеќе.

Сосема разумно може да се запрашате која е причината за таквата возбуда? Зошто сите зборуваат за рецепти за правилно подесување на компресорот, но никој не ги споделува? Зошто, и покрај огромниот број на кул приклучоци, многу студиа сè уште користат скапи ретки модели на компресори? Зошто некои производители користат компресори при екстремни поставки, додека други воопшто не ги користат? И кој е во право на крајот?

Проблеми што ги решава компресијата

Одговорите на ваквите прашања лежат во рамнината на разбирање на улогата на компресија при работа со звук. И дозволува:

  1. Нагласете го нападотзвук, направете го поизразен;
  2. „Седиште“ поединечни делови од инструментите во мешавината, додавајќи им моќ и „тежина“;
  3. Направете групи инструменти или целата мешавина покохезивна, таков единствен монолит;
  4. Решавајте конфликти помеѓу алаткитекористење страничен синџир ;
  5. Поправете ги недостатоците на вокалистот или музичарите, израмнување на нивната динамика;
  6. Со одредена поставка делува како уметнички ефект.

Како што можете да видите, ова не е помалку значаен креативен процес отколку, да речеме, измислување мелодии или свирење интересни тембри. Во овој случај, која било од горенаведените задачи може да се реши со користење на 4 главни параметри.

Главните параметри на компресорот

И покрај огромниот број на софтверски и хардверски модели на компресори, сета „магија“ на компресија се случува со правилните поставки на главните параметри: праг, однос, напад и ослободување. Ајде да ги разгледаме подетално:

Праг или праг, dB

Овој параметар ви овозможува да ја поставите вредноста на која ќе работи компресорот (т.е. да го компресирате аудио сигналот). Значи, ако го поставиме прагот на -12 dB, компресорот ќе влезе само на оние места во динамичкиот опсег што ја надминуваат оваа вредност. Ако целиот наш звук е потивок од -12 db, компресорот едноставно ќе го помине низ себе без да влијае на кој било начин.

Сооднос или сооднос

Параметарот сооднос одредува колку сигналот ќе биде компресиран ако го надмине прагот. Малку математика за да ја комплетираме сликата: да речеме дека поставивме компресор со праг од -12 dB, сооднос 2:1 и го нахранивме со јамка на барабанот со јачина на удар од -4 dB. Каков ќе биде резултатот од работата на компресорот во овој случај?

Во нашиот случај, нивото на удар го надминува прагот за 8dB. Оваа разлика ќе биде компресирана на 4dB (8dB / 2) според односот. Заедно со необработениот дел од сигналот, ова ќе доведе до фактот дека по обработката од страна на компресорот, волуменот на ударот ќе биде -8db (праг -12dB + 4dB компримиран сигнал).

Напад, г-ѓа

Ова е време по кое компресорот ќе реагира на надминување на прагот. Тоа е, ако времето на напад е над 0ms − компресорот почнува да компресиранадминувањето на сигналот на прагот не е моментално, туку по одреденото време.

Ослободување или обновување, ms

Спротивно на нападот - вредноста на овој параметар ви овозможува да одредите колку долго откако нивото на сигналот се враќа под прагот компресорот ќе престане да компресира.

Пред да продолжиме понатаму, силно препорачувам да земете добро познат примерок, да прикачите кој било компресор на неговиот канал и да експериментирате со горенаведените параметри 5-10 минути за безбедно да го поправите материјалот.

Сите другите параметри се опционални. Тие можат да се разликуваат помеѓу различни модели на компресори, што е делумно зошто продуцентите користат различни модели за која било специфична намена (на пример, еден компресор за вокал, друг за тапана група, трет за главен канал). Јас нема да се задржам на овие параметри во детали, туку само ќе дадам генерални информациида се разбере за што се работи:

  • Колено или свиткување (тврдо/меко колено). Овој параметар одредува колку брзо ќе се примени односот (односот) на компресија: тврд на крива или мазен. Забележувам дека во режимот меко колено, компресорот не работи праволиниски, туку започнува непречено (колку што е соодветно кога зборуваме за милисекунди) за да го затегне звукот веќе пред вредноста на прагот. За обработка на групи канали и целокупната мешавина, почесто се користи меко колено (бидејќи работи незабележливо), а тврдото колено се користи за да се нагласи нападот и другите карактеристики на поединечни инструменти;
  • Режим на одговор: Peak/RMS. Режимот Peak е оправдан кога треба сериозно да ги ограничите изливите на амплитудата, како и на сигналите со сложена форма, чија динамика и читливост мора да бидат целосно пренесени. Режимот RMS е многу нежен за звукот, што ви овозможува да го кондензирате, додека го одржувате нападот;
  • Предмисленост (Гледај напред). Ова е време за кое компресорот ќе знае што да очекува. Еден вид прелиминарна анализа на дојдовните сигнали;
  • Шминка или добивка. Параметар кој ви овозможува да го компензирате намалувањето на волуменот како резултат на компресија.

Прво и повеќето главен совет , што ги отстранува сите дополнителни прашања за компресија: ако а) го разбирате принципот на компресија, б) цврсто знаете како овој или оној параметар влијае на звукот и в) успеавте да пробате неколку различни моделине ти треба никаков совет.

Јас сум апсолутно сериозен. Ако внимателно го прочитавте овој запис, експериментиравте со обичниот компресор на вашиот DAW и еден или два приклучоци, но не сте разбрале во кои случаи треба да поставите големи вредности за напад, кој сооднос да го користите и во кој режим да го обработите оригиналот сигнал, а потоа ќе пребарувате на Интернет за готови рецепти, непромислено применувајќи ги насекаде.

Рецепти за фино подесување на компресороттоа е нешто како рецепти за фино подесување на реверб или рефрен - нема никаква смисла и нема никаква врска со креативноста. Затоа, упорно го повторувам единствениот вистински рецепт: наоружајте се со овој напис, добри слушалки за монитор, додаток за визуелна контрола на брановата форма и поминете ја вечерта во друштво на неколку компресори.

Преземете акција!

, медиа плеери

Записите, особено постарите плочи кои биле снимени и направени пред 1982 година, имале многу помала веројатност да се мешаат за да се направи рекордот погласен. Тие репродуцираат природна музика со природен динамичен опсег што се задржува на плочата и се губи во повеќето стандардни или дигитални формати со висока дефиниција.

Секако, тука има исклучоци - слушнете го неодамна објавениот албум на Стивен Вилсон од MA Recordings или Reference Recordings и ќе слушнете колку добар дигитален звук може да биде. Но, ова е ретко, повеќето модерни звучни снимки се гласни и компресирани.

Компресијата на музиката во последно време наиде на многу критики, но јас сум подготвен да се обложам дека скоро сите ваши омилени снимки се компресирани. Некои од нив помалку, некои повеќе, но сепак компресирани. Компресирањето на динамичкиот опсег е жртвено јагне кое се обвинува за лошите музички звуци, но високо компресираната музика не е нова: слушајте ги албумите на Motown од 60-тите. Истото може да се каже и за класиците на Лед Цепелин или за помладите албуми на Вилко и Радиохед. Компресијата со динамички опсег го намалува природниот сооднос помеѓу најгласните и најтивките звуци на снимање, така што шепотот може да биде гласен како крик. Прилично е тешко да се најде поп-музика од последните 50 години што не е компресирана.

Неодамна имав убав разговор со основачот и уредник на списанието Tape Op, Лери Крејн, за добрите, лошите и „злобните“ аспекти на компресијата. Лери Крејн има работено со бендови и уметници како Стефан Маркус, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi и Richmond Fontaine. Го води и студиото за снимање Џекпот! во Портланд, Орегон, кој беше дом на The Breeders, The Decemberists, Eddie Veder, Pavement, R.E.M., She & Him и многу, многу други.

Како пример за изненадувачки набиени, но сепак одлични песни, ја наведувам „They Want My Soul“ на Spoon, објавена во 2014 година. Крејн се смее и вели дека ја слуша во автомобилот бидејќи таму звучи одлично. Што нè доведува до уште еден одговор за тоа зошто музиката е компресирана: затоа што компресијата и дополнителната „јасност“ го олеснуваат слушањето на бучни места.

Лери Крејн на работа. Фотографија на Џејсон Квигли

Кога луѓето велат дека им се допаѓа звукот на аудио снимката, сметам дека им се допаѓа музиката, како звукот и музиката да се неразделни поими. Но, за себе, јас ги разликувам овие концепти. Од гледна точка на љубителите на музиката, звукот можеби е груб и суров, но тоа нема да биде важно за повеќето слушатели.

Многумина брзаат да ги обвинат мајсторските инженери за злоупотреба на компресија, но компресијата се применува директно за време на снимањето, за време на мешањето и дури потоа за време на мастерингот. Освен ако не сте биле лично присутни на секоја од овие фази, нема да можете да кажете како звучеле инструментите и вокалите на самиот почеток на процесот.

Крејн гореше: „Ако музичарот сака намерно да го направи звукот луд и искривен како плочите на Guided by Voices, тогаш нема ништо лошо во тоа - желбата секогаш го надминува квалитетот на звукот“. Гласот на изведувачот е скоро секогаш компримиран, истото се случува и со басот, тапаните, гитарите и синтисајзерите. Со компресија, јачината на вокалот се одржува на ниво вистинско нивониз песната или малку се издвојува од останатите звуци.

Правилно направената компресија може да направи тапаните да звучат поживо или намерно чудно. За да направите музиката да звучи одлично, треба да можете да ги користите потребните алатки за ова. Затоа се потребни години за да се сфати како да се користи компресија и да не се претера. Ако инженерот за мешање го компресира делот од гитарата премногу, тогаш мајсторскиот инженер повеќе нема да може целосно да ги врати фреквенциите што недостасуваат.

Ако музичарите сакаа да слушате музика што не поминала низ фазите на миксирање и мастеринг, тогаш ќе ја пуштат на полиците на продавниците директно од студиото. Крејн вели дека луѓето кои создаваат, уредуваат, миксираат и мастерираат музички снимки не се таму за да им пречат на музичарите - тие им помагаат на изведувачите од самиот почеток, односно повеќе од сто години.

Овие луѓе се дел од креативниот процес кој резултира со неверојатни уметнички дела. Крејн додава: „Не сакате верзија на „Темната страна на Месечината“ која не е мешана и мастерирана. Пинк Флојд ја објавија песната онака како што сакаа да ја слушнат.




Врв