실제로 압축. 동적 압축 동적 범위 압축 또는 표준

이 방법 그룹은 전송된 신호가 비선형 진폭 변환을 겪고 전송 및 수신 부분에서 비선형성이 상호적이라는 사실을 기반으로 합니다. 예를 들어, 비선형 함수 Öu가 송신기에서 사용되면 u 2가 수신기에서 사용됩니다. 상호 함수를 일관되게 적용하면 전체 변환이 선형으로 유지됩니다.

비선형 데이터 압축 방법의 개념은 송신기가 출력 신호의 동일한 진폭으로 전송된 매개변수의 더 넓은 범위의 변화(즉, 더 큰 동적 범위)를 전송할 수 있다는 것입니다. 다이내믹 레인지- 이는 최대 허용 신호 진폭과 최소 신호 진폭의 비율로, 상대 단위 또는 데시벨로 표시됩니다.

; (2.17)
. (2.18)

U min을 줄여 동적 범위를 늘리려는 자연스러운 욕구는 장비의 감도와 간섭 및 자체 잡음의 영향 증가로 인해 제한됩니다.

대부분의 경우 동적 범위 압축은 로그와 강화의 상호 함수 쌍을 사용하여 수행됩니다. 진폭을 변경하는 첫 번째 작업을 압축(압축에 의해), 두 번째 - 확장(스트레칭). 이러한 특정 기능의 선택은 최고의 압축 기능과 관련이 있습니다.

동시에 이러한 방법에는 단점도 있습니다. 첫 번째는 작은 수의 로그가 음수이고 한계 내에 있다는 것입니다.

즉, 감도가 매우 비선형적입니다.

이러한 단점을 줄이기 위해 두 기능 모두 변위와 근사로 수정됩니다. 예를 들어 전화 채널의 경우 근사 함수의 형식은 다음과 같습니다(유형 A).

A=87.6입니다. 압축으로 인한 게인은 24dB입니다.

비선형 절차를 사용한 데이터 압축은 오류가 큰 아날로그 방식으로 구현됩니다. 애플리케이션 디지털 미디어변환의 정확성이나 성능을 크게 향상시킬 수 있습니다. 동시에 자금을 직접 사용 컴퓨터 기술(즉, 로그와 지수를 직접 계산하는 방식)은 성능이 낮고 계산 오류가 누적되어 최상의 결과를 얻을 수 없습니다.

정확도 제한으로 인해 압축을 통한 데이터 압축은 전화 및 무선 채널을 통해 음성을 전송하는 등 중요하지 않은 경우에 사용됩니다.

효율적인 코딩

K. Shannon, Fano 및 Huffman이 효율적인 코드를 제안했습니다. 코드의 본질은 코드가 고르지 않다는 것, 즉 비트 수가 동일하지 않으며 코드 길이가 발생 확률에 반비례한다는 것입니다. 효율적인 코드의 또 다른 큰 특징은 구분 기호가 필요하지 않다는 것입니다. 특수 문자, 인접한 코드 조합을 분리합니다. 이는 간단한 규칙을 따르면 달성됩니다. 즉, 짧은 코드가 긴 코드의 시작이 아닙니다. 이 경우 디코더가 더 짧은 코드워드를 먼저 감지하기 때문에 연속적인 비트 스트림이 고유하게 디코딩됩니다. 효율적인 코드는 오랫동안 순전히 학술적인 용도로 사용되었지만 최근에는 데이터베이스를 생성하고 최신 모뎀 및 소프트웨어 아카이버에서 정보를 압축하는 데 성공적으로 사용되었습니다.

불균일로 인해 평균 코드 길이가 도입되었습니다. 평균 길이 - 코드 길이에 대한 수학적 기대:

더욱이, l av는 위에서 H(x)로 향하는 경향이 있습니다(즉, l av > H(x)).

조건(2.23)의 충족은 N이 증가함에 따라 더욱 강해집니다.

효율적인 코드에는 Shannon-Fano와 Huffman의 두 가지 유형이 있습니다. 예제를 사용하여 이를 얻는 방법을 살펴보겠습니다. 시퀀스의 기호 확률이 표 2.1에 주어진 값을 갖는다고 가정해 보겠습니다.

표 2.1.

기호 확률

N
피 나는 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

기호는 순위가 매겨집니다. 즉, 확률이 내림차순으로 연속해서 표시됩니다. 그런 다음 Shannon-Fano 방법을 사용하여 다음 절차를 주기적으로 반복합니다. 전체 이벤트 그룹은 전체 확률이 동일한(또는 거의 동일한) 두 개의 하위 그룹으로 나뉩니다. 절차는 하나의 요소가 다음 하위 그룹에 남을 때까지 계속되며, 그 후에는 이 요소가 제거되고 지정된 작업은 나머지 요소와 함께 계속됩니다. 이는 마지막 두 하위 그룹에 요소가 하나만 남을 때까지 발생합니다. 표 2.2에 요약되어 있는 예제를 계속 진행해 보겠습니다.

표 2.2.

Shannon-Fano 코딩

N 파이
4 0.3
0.2 II
6 0.15
0.1 II
1 0.1
9 0.05 II II
5 0.05 II
7 0.03 II II
8 0.02 II

표 2.2에서 볼 수 있듯이 확률 p 4 = 0.3인 첫 번째 심볼은 그룹으로 나누는 두 가지 절차에 참여했으며 두 번 모두 그룹 번호 I에 포함되었습니다. 이에 따라 두 자리 코드 II로 인코딩됩니다. 분할의 첫 번째 단계에서 두 번째 요소는 그룹 I에 속했고 두 번째 요소는 그룹 II에 속했습니다. 따라서 해당 코드는 10입니다. 나머지 기호의 코드에는 추가 설명이 필요하지 않습니다.

일반적으로 균일하지 않은 코드는 코드 트리로 표시됩니다. 코드 트리는 허용되는 코드 조합을 나타내는 그래프입니다. 이 그래프의 가장자리 방향은 그림 2.11에 표시된 것처럼 미리 설정되어 있습니다(방향 선택은 임의적임).

그들은 다음과 같이 그래프를 탐색합니다. 선택한 기호에 대한 경로를 만듭니다. 이에 대한 비트 수는 경로의 가장자리 수와 동일하고 각 비트의 값은 해당 가장자리의 방향과 같습니다. 경로는 시작점(도면에서 문자 A로 표시됨)부터 작성됩니다. 예를 들어 정점 5에 대한 경로는 5개의 가장자리로 구성되며 마지막 가장자리를 제외한 모든 가장자리의 방향은 0입니다. 코드 00001을 얻습니다.

이 예의 엔트로피와 평균 단어 길이를 계산해 보겠습니다.

H(x) = -(0.3 로그 0.3 + 0.2 로그 0.2 + 2 0.1 로그 0.1+ 2 0.05 로그 0.05+

0.03 로그 0.03 + 0.02 로그 0.02) = 2.23비트

l 평균 = 0.3 2 + 0.2 2 + 0.15 3 + 0.1 3 + 0.1 4 + 0.05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

보시다시피 평균 단어 길이는 엔트로피에 가깝습니다.

허프만 코드는 다른 알고리즘을 사용하여 구성됩니다. 코딩 절차는 두 단계로 구성됩니다. 첫 번째 단계에서는 알파벳의 단일 압축이 순차적으로 수행됩니다. 일회성 압축 - 마지막 두 기호(확률이 가장 낮음)를 전체 확률로 하나로 대체합니다. 두 문자가 남을 때까지 압축이 수행됩니다. 동시에, 결과 확률이 입력되는 코딩 테이블이 채워지고 다음 단계에서 새로운 기호가 이동하는 경로가 표시됩니다.

두 번째 단계에서는 마지막 단계부터 시작되는 실제 인코딩이 발생합니다. 두 기호 중 첫 번째 기호에는 코드 1이 할당되고 두 번째 기호에는 0이 할당됩니다. 그 후 이전 단계로 이동합니다. 이번 단계에서 압축에 참여하지 않은 기호에는 다음 단계의 코드를 부여하고, 마지막 2개의 기호에는 접착 후 얻은 기호의 코드를 2번 부여하여 상위문자 1의 코드에 붙인 다음, 낮은 것 - 0. 문자가 더 이상 접착에 참여하지 않으면 해당 코드는 변경되지 않습니다. 절차는 끝까지(즉, 첫 번째 단계까지) 계속됩니다.

표 2.3은 허프만 코딩을 보여줍니다. 표에서 볼 수 있듯이 코딩은 7단계로 진행되었다. 왼쪽에는 기호 확률이 있고 오른쪽에는 중간 코드가 있습니다. 화살표는 새로 형성된 기호의 움직임을 보여줍니다. 각 단계에서 마지막 두 심볼은 인코딩 기술에 해당하는 최하위 비트에서만 다릅니다. 평균 단어 길이를 계산해 보겠습니다.

l 평균 = 0.3 2 + 0.2 2 + 0.15 3 ++ 2 0.1 3 + +0.05 4 + 0.05 5 + 0.03 6 + 0.02 6 = 2.7

이는 엔트로피에 훨씬 더 가깝습니다. 코드가 훨씬 더 효율적입니다. 그림에서. 그림 2.12는 허프만 코드 트리를 보여줍니다.

표 2.3.

허프만 코딩

N 피 나는 암호 II III IV V VI
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

두 코드 모두 명확한 디코딩 요구 사항을 충족합니다. 표에서 볼 수 있듯이 짧은 조합은 긴 코드의 시작이 아닙니다.

기호 수가 증가하면 코드 효율성이 증가하므로 어떤 경우에는 더 큰 블록이 인코딩됩니다(예: 우리 얘기 중이야텍스트의 경우 가장 자주 발생하는 음절, 단어, 심지어 문구까지 인코딩할 수 있습니다.

이러한 코드 도입의 효과는 이를 균일한 코드와 비교하여 결정됩니다.

(2.24)

여기서 n은 유효 코드로 대체되는 균일 코드의 비트 수입니다.

허프만 코드의 수정

고전적인 허프만 알고리즘은 2단계 알고리즘입니다. 먼저 기호와 메시지에 대한 통계를 수집한 다음 위에서 설명한 절차를 수행해야 합니다. 이는 메시지 처리 및 사전 축적에 소요되는 시간이 늘어나기 때문에 실제로는 불편하다. 축적 및 인코딩 절차가 결합된 원패스 방법이 더 자주 사용됩니다. Huffman [46]에 따르면 이러한 방법을 적응형 압축이라고도 합니다.

Huffman에 따르면 적응형 압축의 본질은 초기 코드 트리의 구성과 각 다음 기호 도착 후 순차적인 수정으로 귀결됩니다. 이전과 마찬가지로 여기의 트리는 바이너리입니다. 트리 그래프의 각 꼭지점에서는 최대 2개의 호가 나옵니다. 원래 꼭짓점을 부모라고 부르고, 이에 연결된 두 개의 후속 꼭짓점을 자식으로 부르는 것이 관례입니다. 정점 가중치의 개념을 소개하겠습니다. 이는 원본 시퀀스를 제공할 때 얻은 특정 정점에 해당하는 문자(단어) 수입니다. 분명히 자식 가중치의 합은 부모 가중치와 같습니다.

입력 시퀀스의 다음 기호를 도입한 후 코드 트리가 수정됩니다. 정점의 가중치가 다시 계산되고 필요한 경우 정점이 재배열됩니다. 정점 순열 규칙은 아래 정점의 가중치가 가장 작고, 그래프의 왼쪽에 위치한 정점의 가중치가 가장 작다는 규칙입니다.

동시에 정점에 번호가 매겨집니다. 번호 매기기는 아래쪽(자식 없음) 정점부터 왼쪽에서 오른쪽으로 시작하여 다음으로 이동합니다. 최상위 수준등. 마지막 원래 정점에 번호를 매기기 전에. 이 경우 다음과 같은 결과가 달성됩니다. 정점의 가중치가 작을수록 정점의 개수도 낮아집니다.

순열은 주로 정점을 매달기 위해 수행됩니다. 순열할 때 위에서 공식화한 규칙을 고려해야 합니다. 즉, 가중치가 더 큰 정점의 숫자가 더 높습니다.

시퀀스(제어 또는 테스트라고도 함)를 통과한 후 모든 매달린 정점에 코드 조합이 할당됩니다. 코드 할당 규칙은 위와 유사합니다. 코드의 비트 수는 경로가 소스에서 지정된 매달린 정점까지 통과하는 정점 수와 동일하며 특정 비트의 값은 방향에 해당합니다. 부모에서 "자식"으로(예를 들어 부모의 왼쪽으로 가는 것은 값 1에 해당하고 오른쪽으로 가는 것은 0 ).

결과 코드 조합은 해당 유사 항목과 함께 압축 장치의 메모리에 저장되어 사전을 형성합니다. 알고리즘의 사용은 다음과 같습니다. 압축된 문자 시퀀스는 기존 사전에 따라 조각으로 분할된 후 각 조각이 사전의 해당 코드로 대체됩니다. 사전에 없는 조각은 새로운 매달린 정점을 형성하고 가중치를 획득하며 사전에도 입력됩니다. 이러한 방식으로 사전을 보충하기 위한 적응형 알고리즘이 형성됩니다.

방법의 효율성을 높이려면 사전의 크기를 늘리는 것이 바람직합니다. 이 경우 압축 비율이 증가합니다. 실제로 사전의 크기는 4 - 16KB의 메모리입니다.


예제를 통해 주어진 알고리즘을 설명해 보겠습니다. 그림에서. 그림 2.13은 원래 다이어그램을 보여줍니다(허프만 트리라고도 함). 트리의 각 정점은 두 개의 숫자가 분수로 새겨져 있는 직사각형으로 표시됩니다. 첫 번째는 정점의 수를 의미하고 두 번째는 가중치를 의미합니다. 보시다시피, 정점의 가중치와 해당 개수 사이의 대응이 만족됩니다.

이제 정점 1에 해당하는 기호가 테스트 시퀀스에서 두 번째로 나타난다고 가정해 보겠습니다. 정점의 가중치는 그림과 같이 변경되었습니다. 2.14, 그 결과 정점 번호 매기기 규칙이 위반되었습니다. 다음 단계에서는 매달린 정점의 위치를 ​​변경합니다. 이를 위해 정점 1과 4를 바꾸고 트리의 모든 정점의 번호를 다시 매깁니다. 결과 그래프는 그림 1에 나와 있습니다. 2.15. 그런 다음 절차는 동일한 방식으로 계속됩니다.

허프만 트리의 각 매달린 정점은 특정 기호 또는 기호 그룹에 해당한다는 점을 기억해야 합니다. 부모는 그에 상응하는 기호 그룹이 자식 기호보다 하나 더 짧다는 점에서 자식과 다르며, 이 자식은 다릅니다. 마지막 문자. 예를 들어, "car" 기호는 상위 항목에 해당합니다. 그러면 아이들은 "kara"와 "karp"라는 시퀀스를 가질 수 있습니다.

주어진 알고리즘은 학문적이지 않으며 그래픽 데이터를 압축할 때를 포함하여 아카이버 프로그램에서 적극적으로 사용됩니다(아래에서 설명합니다).

Lempel–Ziv 알고리즘

이는 오늘날 가장 일반적으로 사용되는 압축 알고리즘입니다. 이는 대부분의 보관 프로그램(예: PKZIP, ARJ, LHA)에서 사용됩니다. 알고리즘의 핵심은 보관 중에 특정 기호 집합이 특별히 생성된 사전의 해당 번호로 대체된다는 것입니다. 예를 들어, 비즈니스 서신에서 흔히 볼 수 있는 "편지 발신 번호..."라는 문구는 사전에서 121위를 차지할 수 있습니다. 그러면 언급된 문구(30바이트)를 전송하거나 저장하는 대신 문구 번호(이진수 십진수 형식으로 1.5바이트 또는 이진수로 1바이트)를 저장할 수 있습니다.

알고리즘의 이름은 1977년에 처음 제안한 저자의 이름을 따서 명명되었습니다. 그 중 첫 번째는 LZ77입니다. 보관을 위해 두 부분으로 구성된 소위 메시지 슬라이딩 창이 생성됩니다. 더 큰 형식인 첫 번째 부분은 사전을 구성하는 역할을 하며 크기는 약 수 킬로바이트입니다. 두 번째 작은 부분(보통 최대 100바이트 크기)은 현재 보고 있는 텍스트의 문자를 수신합니다. 알고리즘은 보기 창에 수신된 문자 집합과 일치하는 문자 집합을 사전에서 찾으려고 합니다. 이것이 성공하면 초기 부분 문자열을 기준으로 한 사전의 오프셋, 이 부분 문자열의 길이, 이 부분 문자열 다음의 문자 등 세 부분으로 구성된 코드가 생성됩니다. 예를 들어 선택한 하위 문자열은 "app" 문자(총 6자)로 구성되고 다음 문자는 "e"입니다. 그런 다음 하위 문자열의 주소(사전 위치)가 45인 경우 사전의 항목은 "45, 6.e"처럼 보입니다. 그 후 창의 내용이 위치별로 이동되고 검색이 계속됩니다. 이것이 사전이 형성되는 방식입니다.

알고리즘의 장점은 사전 편찬을 위한 쉽게 형식화된 알고리즘입니다. 또한 원본 사전 없이 압축을 풀 수 있습니다(테스트 시퀀스를 갖는 것이 좋습니다). 압축을 풀 때 사전이 형성됩니다.

알고리즘의 단점은 사전의 크기가 커질수록 나타납니다. 검색 시간이 늘어납니다. 또한 사전에는 없는 문자열이 현재 창에 나타나면 각 문자는 3요소 코드로 기록됩니다. 결과는 압축이 아니라 늘어납니다.

1978년에 제안된 LZSS 알고리즘이 가장 좋은 특성을 가지고 있다. 슬라이딩 윈도우 지원과 압축기 출력 코드에 차이가 있습니다. 창 외에도 알고리즘은 일치 항목 검색 속도를 높이기 위해 허프만 트리와 유사한 이진 트리를 생성합니다. 현재 창을 떠나는 각 하위 문자열은 하위 항목 중 하나로 트리에 추가됩니다. 이 알고리즘을 사용하면 현재 창의 크기를 더 늘릴 수 있습니다(크기가 2의 거듭제곱인 128, 256 등 바이트인 것이 바람직함). 시퀀스 코드도 다르게 구성됩니다. "오프셋, 길이" 쌍과 코딩되지 않은 문자를 구별하기 위해 추가 1비트 접두사가 도입됩니다.

LZW와 같은 알고리즘을 사용하면 훨씬 더 높은 수준의 압축이 이루어집니다. 앞서 설명한 알고리즘은 창 크기가 고정되어 있어 창 크기보다 긴 문구를 사전에 입력하는 것이 불가능합니다. LZW 알고리즘(및 이전 LZ78)에서 보기 창의 크기는 무제한이며 사전은 구문을 축적합니다(이전과 같이 문자 모음이 아님). 사전은 길이에 제한이 없으며 인코더(디코더)는 구문 대기 모드로 작동합니다. 사전과 일치하는 구문이 생성되면 일치 코드(즉, 사전에 있는 이 구문의 코드)와 그 뒤에 오는 문자의 코드가 발급됩니다. 기호가 축적되면서 새로운 구문이 형성되면 이 구문도 짧은 구문과 마찬가지로 사전에 입력됩니다. 그 결과 빠른 인코딩 및 디코딩을 제공하는 재귀 프로시저가 탄생했습니다.

반복 문자의 압축 인코딩을 통해 추가 압축 기능이 제공됩니다. 시퀀스에서 일부 문자가 연속해서 나오는 경우(예를 들어 텍스트에서는 "공백" 문자일 수 있고 숫자 시퀀스에서는 연속 0 등이 될 수 있음) 이를 "문자;" 쌍으로 바꾸는 것이 합리적입니다. 길이” 또는 “부호, 길이” ". 첫 번째 경우, 코드는 시퀀스가 ​​인코딩될 부호(보통 1비트)를 나타내고, 그다음에는 반복 문자의 코드와 시퀀스 길이를 나타냅니다. 두 번째 경우(가장 자주 발생하는 반복 문자에 대해 제공됨) 접두사는 단순히 반복 기호를 나타냅니다.

동적 압축(동적 범위 압축, DRC) - 음반의 동적 범위를 좁히는 것(또는 확장기의 경우 확장하는 것)입니다. 다이내믹 레인지, 가장 조용한 소리와 가장 큰 소리의 차이입니다. 때로는 사운드트랙에서 가장 조용한 소리가 소음 수준보다 약간 더 클 수도 있고, 때로는 가장 큰 소리보다 조금 더 조용할 수도 있습니다. 동적 압축을 수행하는 하드웨어 장치 및 프로그램을 압축기라고 하며 압축기 자체, 리미터, 확장기 및 게이트의 네 가지 주요 그룹으로 구분됩니다.

튜브 아날로그 압축기 DBX 566

하향 및 상향 압축

하향 압축(하향 압축)은 소리가 특정 임계값을 초과하기 시작하면 소리의 볼륨을 줄여 더 조용한 소리를 변경하지 않고 그대로 유지합니다. 하향 압축의 극단적인 버전은 다음과 같습니다. 리미터. 부스트 압축반면에 상향 압축은 더 큰 소리에 영향을 주지 않고 임계값 미만인 경우 소리의 볼륨을 증가시킵니다. 동시에 두 압축 유형 모두 오디오 신호의 동적 범위를 좁힙니다.

하향 압축

부스트 압축

확장기와 게이트

압축기가 동적 범위를 줄이면 확장기는 이를 늘립니다. 신호 레벨이 임계값 레벨 이상으로 올라가면 확장기가 이를 더욱 증가시켜 큰 소리와 부드러운 소리의 차이를 증가시킵니다. 이와 같은 장치는 드럼 키트를 녹음할 때 한 드럼의 사운드를 다른 드럼 사운드와 분리하기 위해 자주 사용됩니다.

큰 소리를 증폭하는 것이 아니라 임계값을 초과하지 않는 조용한 소리(예: 배경 소음)를 감쇠하는 데 사용되는 일종의 확장기라고 합니다. 노이즈 게이트. 이러한 장치에서는 사운드 레벨이 임계값보다 낮아지자마자 신호 전달이 중지됩니다. 일반적으로 게이트는 일시 중지 중에 소음을 억제하는 데 사용됩니다. 일부 모델에서는 사운드가 임계값 레벨에 도달할 때 갑자기 멈추지 않고 점차적으로 사라지는 것을 확인할 수 있습니다. 이 경우 감쇄율은 Decay 컨트롤에 의해 설정됩니다.

게이트는 다른 유형의 압축기와 마찬가지로 주파수에 따라 다름(즉, 특정 치료를 주파수 대역) 모드에서 작동할 수 있습니다. 사이드체인(아래 참조).

압축기 작동 원리

컴프레서에 입력되는 신호는 두 개의 사본으로 분할됩니다. 하나의 복사본은 증폭 정도가 외부 신호에 의해 제어되는 증폭기로 전송되고 두 번째 복사본은 이 신호를 생성합니다. 이는 신호가 측정되는 사이드 체인이라는 장치로 들어가고 이 데이터를 기반으로 볼륨 변화를 설명하는 엔벨로프가 생성됩니다.
이것이 대부분의 최신 압축기가 설계되는 방식이며, 소위 피드포워드 유형입니다. 구형 장치(피드백 유형)에서는 신호 레벨이 증폭기 이후에 측정됩니다.

다양한 아날로그 가변 이득 증폭 기술이 있으며 각각 고유한 장점과 단점이 있습니다. 즉, 튜브, 포토레지스터를 사용하는 광학, 트랜지스터 등이 있습니다. 디지털 오디오로 작업할 때(사운드 편집기 또는 DAW에서) 자신만의 수학적 알고리즘을 사용하거나 아날로그 기술의 작동을 에뮬레이트할 수 있습니다.

압축기의 주요 매개변수

한계점

압축기는 진폭이 특정 임계값(임계값)을 초과하는 경우 오디오 신호의 레벨을 줄입니다. 일반적으로 데시벨 단위로 지정되며 임계값이 낮을수록(예: -60dB) 높은 임계값(예: -5dB)보다 더 많은 오디오가 처리된다는 의미입니다.

비율

레벨 감소량은 비율 매개변수에 의해 결정됩니다. 비율 4:1은 입력 레벨이 임계값보다 4dB 높으면 출력 레벨이 임계값보다 1dB 높다는 것을 의미합니다.
예를 들어:
임계값 = -10dB
입력 = −6dB(임계값보다 4dB 높음)
출력 = −9dB(임계값보다 1dB 높음)

신호 레벨 억제는 임계값 레벨 아래로 떨어진 후에도 일정 시간 동안 계속되며 이 시간은 매개변수 값에 의해 결정된다는 점을 명심하는 것이 중요합니다. 풀어 주다.

최대 비율이 무한대:1인 압축을 제한이라고 합니다. 이는 임계값 레벨을 초과하는 모든 신호가 임계값 레벨로 감쇠됨을 의미합니다(입력 볼륨이 갑자기 증가한 후 짧은 기간 제외). 자세한 내용은 아래의 "리미터"를 참조하세요.

다양한 비율 값의 예

공격과 해방

컴프레서는 신호 역학의 변화에 ​​얼마나 빨리 반응하는지에 대한 제어 기능을 제공합니다. Attack 매개변수는 압축기가 Ratio 매개변수에 의해 결정된 레벨로 게인을 줄이는 데 걸리는 시간을 결정합니다. 릴리스는 반대로 컴프레서가 게인을 증가시키거나 입력 신호 레벨이 임계값 아래로 떨어지는 경우 정상으로 돌아가는 시간을 결정합니다.

공격 및 릴리스 단계

이러한 매개변수는 게인을 특정 데시벨(보통 10dB)만큼 변경하는 데 걸리는 시간(보통 밀리초)을 나타냅니다. 예를 들어, 이 경우 Attack을 1ms로 설정하면 게인을 10dB 줄이는 데 1ms가 걸리고, 게인을 20dB 줄이는 데 2ms가 걸립니다.

많은 컴프레서에서는 Attack 및 Release 매개변수를 조정할 수 있지만 일부에서는 미리 설정되어 있어 조정할 수 없습니다. 때로는 "자동" 또는 "프로그램 종속"으로 지정되기도 합니다. 입력 신호에 따라 변경됩니다.

무릎

또 다른 압축기 매개변수: 딱딱한/부드러운 무릎. 압축 시작이 갑작스러울지(하드) 점진적일지(소프트) 여부를 결정합니다. Soft Knee는 특히 높은 Ratio 값과 급격한 볼륨 증가에서 Dry 신호에서 압축된 신호로의 전환을 눈에 띄게 줄여줍니다.

하드 니(Hard Knee) 및 소프트 니(Soft Knee) 압축

피크 및 RMS

압축기는 입력 신호의 피크(단기 최대) 값 또는 평균 레벨에 응답할 수 있습니다. 피크 값을 사용하면 압축 정도가 급격히 변동하고 심지어 왜곡될 수도 있습니다. 따라서 압축기는 임계값과 비교할 때 입력 신호에 평균 기능(일반적으로 RMS)을 적용합니다. 이는 인간의 음량 인식에 더 가까운 보다 편안한 압축을 제공합니다.

RMS는 사운드트랙의 평균 볼륨을 반영하는 매개변수입니다. 수학적 관점에서 RMS(Root Mean Square)는 특정 수의 샘플 진폭에 대한 제곱 평균 제곱근 값입니다.

스테레오 연결

스테레오 연결 모드의 압축기는 두 스테레오 채널에 동일한 게인을 적용합니다. 이렇게 하면 왼쪽 및 오른쪽 채널의 개별 처리로 인해 발생할 수 있는 스테레오 이동이 방지됩니다. 예를 들어 시끄러운 요소가 중앙에서 벗어나 패닝되는 경우 이러한 변화가 발생합니다.

메이크업 게인

압축기는 전체 신호 레벨을 감소시키기 때문에 일반적으로 최적의 레벨을 달성하기 위해 고정 출력 게인 옵션을 추가합니다.

미리보기

미리보기 기능은 너무 높거나 너무 낮은 어택 및 릴리스 값과 관련된 문제를 해결하도록 설계되었습니다. 어택 시간이 너무 길면 과도 현상을 효과적으로 차단할 수 없고 너무 짧은 어택 시간은 청취자에게 불편할 수 있습니다. 미리보기 기능을 사용하면 주 신호가 제어 신호에 비해 지연되므로 신호가 임계값에 도달하기 전에도 미리 압축을 시작할 수 있습니다.
이 방법의 유일한 단점은 신호의 시간 지연이며 어떤 경우에는 바람직하지 않습니다.

동적 압축 사용

압축은 음악 사운드 트랙뿐만 아니라 저렴한 사운드 재생 장비 또는 제한된 전송 채널이 사용되는 피크 레벨을 높이지 않고 전체 볼륨을 높이는 데 필요한 모든 곳(전관 방송 및 통신 시스템, 아마추어 라디오, 등) .

재생 중에 압축이 적용됩니다. 배경 음악(상점, 레스토랑 등) 눈에 띄는 볼륨 변화를 원하지 않는 곳.

그러나 동적 압축의 가장 중요한 적용 분야는 음악 제작과 방송입니다. 컴프레션은 사운드에 "두꺼움"과 "드라이브"를 부여하고, 악기를 서로 더 잘 결합하는 데, 특히 보컬을 처리할 때 사용됩니다.

록 및 팝 음악의 보컬은 반주에서 눈에 띄고 선명도를 추가하기 위해 압축되는 경우가 많습니다. 특정 주파수에만 맞춰진 특별한 유형의 압축기(디에서)는 치찰음 음소를 억제하는 데 사용됩니다.

악기 파트에서는 ​​볼륨과 직접적인 관련이 없는 효과에도 압축이 사용됩니다. 예를 들어 빠르게 감쇠되는 드럼 사운드를 더 오래 지속시킬 수 있습니다.

일렉트로닉 댄스 음악(EDM)은 종종 사이드 체인(아래 참조)을 사용합니다. 예를 들어 베이스 라인은 킥 드럼이나 이와 유사한 것으로 구동되어 베이스와 드럼이 충돌하는 것을 방지하고 역동적인 맥동을 생성할 수 있습니다.

압축은 방송(라디오, TV, 인터넷 방송)에서 소스 오디오(일반적으로 CD)의 동적 범위를 줄이면서 인지되는 음량을 늘리기 위해 널리 사용됩니다. 대부분의 국가에서는 방송할 수 있는 최대 순간 볼륨에 대한 법적 제한이 있습니다. 일반적으로 이러한 제한은 에어 체인의 영구 하드웨어 압축기에 의해 구현됩니다. 또한 인지된 음량의 증가는 대부분의 청취자의 관점에서 사운드의 "품질"을 향상시킵니다.

또한보십시오 음량 전쟁.

1983년부터 2000년까지 CD용으로 리마스터링된 동일한 곡의 볼륨을 지속적으로 늘렸습니다.

사이드체인

흔히 접하는 또 다른 압축기 스위치는 "사이드 체인"입니다. 이 모드에서는 사운드 압축이 발생합니다. 자신의 레벨, 커넥터로 들어가는 신호의 레벨에 따라 달라지는데, 이를 일반적으로 사이드 체인이라고 합니다.

이에 대한 몇 가지 용도가 있습니다. 예를 들어, 보컬리스트는 혀 소리를 내며 전체 그림에서 모든 "s"가 눈에 띕니다. 그의 목소리는 컴프레서를 통해 전달되고 동일한 사운드가 사이드 체인 커넥터에 공급되지만 이퀄라이저를 통과합니다. 이퀄라이저를 사용하면 보컬리스트가 문자 "s"를 발음할 때 사용하는 주파수를 제외한 모든 주파수를 차단할 수 있습니다. 일반적으로 약 5kHz이지만 범위는 3kHz ~ 8kHz일 수 있습니다. 그런 다음 컴프레서를 사이드 체인 모드로 설정하면 문자 "s"가 발음되는 순간에 음성이 압축됩니다. 이로 인해 디에서(de-esser)라는 장치가 탄생했습니다. 이러한 작업 방식을 "주파수 종속"이라고 합니다.

이 기능의 또 다른 용도는 "ducker"입니다. 예를 들어, 라디오 방송국에서 음악은 컴프레서를 거치고, DJ의 가사는 사이드체인을 통해 들어옵니다. DJ가 채팅을 시작하면 음악 볼륨이 자동으로 감소합니다. 이 효과는 노래하는 동안 건반 부분의 볼륨을 줄이는 등 녹음에도 성공적으로 사용할 수 있습니다.

벽돌 벽 제한

컴프레서와 리미터는 거의 같은 방식으로 작동합니다. 리미터는 비율이 높고(10:1부터) 일반적으로 어택 시간이 낮은 컴프레서라고 말할 수 있습니다.

매우 높은 비율(20:1 이상)과 매우 빠른 공격으로 제한하는 브릭 벽 제한 개념이 있습니다. 이상적으로는 신호가 임계값 레벨을 전혀 초과하는 것을 허용하지 않습니다. 결과는 귀에 불편할 수 있지만 이렇게 하면 사운드 재생 장비의 손상이나 과도한 손상을 방지할 수 있습니다. 대역폭채널. 많은 제조업체는 바로 이러한 목적을 위해 리미터를 장치에 통합합니다.

클리퍼 대 리미터, 소프트 및 하드 클리핑

컴프레션은 사운드 제작에 있어 가장 신화적인 주제 중 하나입니다. 그들은 베토벤이 심지어 그녀와 함께 이웃의 아이들을 겁주기까지 했다고 말합니다:(

사실 압축을 사용하는 것은 왜곡을 사용하는 것보다 어렵지 않습니다. 가장 중요한 것은 작동 원리를 이해하고 잘 제어하는 ​​것입니다. 이것이 지금 우리가 함께 볼 것입니다.

오디오 압축이란 무엇입니까?

준비하기 전에 가장 먼저 이해해야 할 것은 압축입니다. 동적 사운드 범위 작업. 그리고 가장 큰 신호 레벨과 가장 조용한 신호 레벨의 차이에 지나지 않습니다.

그래서, 압축은 동적 범위의 압축입니다.. 예, 단지다이내믹 레인지 압축, 즉 신호의 시끄러운 부분의 레벨을 낮추고 조용한 부분의 볼륨을 높입니다.. 더 이상은 없어.

그러면 그러한 과대광고가 왜 연결되어 있는지 상당히 합리적으로 궁금해하실 수 있습니다. 올바른 압축기 설정 방법에 대해 모두가 이야기하지만 아무도 공유하지 않는 이유는 무엇입니까? 수많은 멋진 플러그인에도 불구하고 많은 스튜디오에서 여전히 비싸고 희귀한 압축기 모델을 사용하는 이유는 무엇입니까? 일부 제작자는 극단적인 설정에서 컴프레서를 사용하는 반면 다른 제작자는 전혀 사용하지 않는 이유는 무엇입니까? 그리고 결국 그 중 어느 것이 옳은가?

압축으로 해결된 문제

이러한 질문에 대한 답은 사운드 작업에서 압축의 역할을 이해하는 차원에 있습니다. 그리고 다음을 허용합니다.

  1. 공격을 강조하라소리가 더 뚜렷해집니다.
  2. 악기의 개별 부분을 믹스에 "설정", 그들에게 힘과 "무게"를 추가합니다.
  3. 악기 그룹이나 전체 믹스를 더욱 응집력 있게 만드세요., 그러한 단일 단일체;
  4. 도구 간의 충돌 해결사이드체인 사용;
  5. 보컬리스트나 연주자의 실수를 바로잡아라, 역학을 평준화합니다.
  6. 특정 설정으로 예술적 효과로 작용하다.

보시다시피 이것은 멜로디를 생각해 내거나 흥미로운 음색을 만드는 것보다 덜 중요한 창의적인 과정입니다. 또한 위의 문제는 4가지 주요 매개변수를 사용하여 해결할 수 있습니다.

압축기의 기본 매개변수

수많은 소프트웨어 및 하드웨어 모델의 압축기에도 불구하고 압축의 모든 "마법"은 기본 매개변수(임계값, 비율, 어택 및 릴리스)가 올바르게 구성되었을 때 발생합니다. 더 자세히 살펴보겠습니다.

임계값 또는 응답 임계값, dB

이 매개변수를 사용하면 압축기가 작동하는 값(즉, 오디오 신호 압축)을 설정할 수 있습니다. 따라서 임계값을 -12dB로 설정하면 압축기는 이 값을 초과하는 동적 범위 부분에서만 작동합니다. 모든 사운드가 -12db보다 조용하면 컴프레서는 어떤 방식으로든 영향을 주지 않고 통과시킵니다.

비율 또는 압축 비율

비율 매개변수는 임계값을 초과하는 신호가 얼마나 압축되는지를 결정합니다. 그림을 완성하기 위한 약간의 수학: 임계값 -12dB, 비율 2:1로 컴프레서를 설정하고 킥 드럼의 볼륨이 -4dB인 드럼 루프를 공급한다고 가정해 보겠습니다. 이 경우 압축기 작동의 결과는 무엇입니까?

우리의 경우 킥 레벨이 임계값을 8dB 초과합니다. 이 비율에 따른 차이는 4dB(8dB/2)로 압축됩니다. 처리되지 않은 신호 부분과 결합하면 컴프레서로 처리한 후 킥 드럼의 볼륨이 -8db(임계값 -12dB + 압축 신호 4dB)가 됩니다.

공격, ms

이는 압축기가 응답 임계값 초과에 응답하는 시간입니다. 즉, Attack 시간이 0ms 이상이면 - 압축기가 압축을 시작합니다임계값 신호를 즉시 초과하는 것이 아니라 지정된 시간 후에 초과됩니다.

릴리스 또는 복구(밀리초)

어택의 반대 - 이 매개변수의 값을 사용하면 신호 레벨이 임계값 아래로 돌아온 후의 시간을 지정할 수 있습니다. 압축기가 압축을 중지합니다.

계속 진행하기 전에 잘 알려진 샘플을 채취하여 해당 채널에 압축기를 배치하고 위의 매개변수를 5~10분 동안 실험하여 재료를 단단히 고정할 것을 강력히 권장합니다.

모두 다른 매개변수는 선택사항입니다.. 컴프레서 모델마다 다를 수 있으며, 이것이 부분적으로 제작자가 특정 목적을 위해 서로 다른 모델을 사용하는 이유입니다(예: 보컬용 컴프레서, 드럼 그룹용 컴프레서, 마스터 채널용 컴프레서). 이 매개변수에 대해 자세히 설명하지는 않겠지만, 일반 정보이것이 무엇인지 이해하려면:

  • 무릎 또는 꼬임(하드/소프트 무릎). 이 매개변수는 압축 비율(비율)이 적용되는 속도(곡선을 따라 강하게 또는 부드럽게)를 결정합니다. Soft Knee 모드에서는 컴프레서가 선형적으로 작동하지 않지만 사운드를 부드럽게 압축하기 시작합니다(밀리초 단위로 이야기할 때 이것이 적절할 수 있음). 이미 임계값 이전. 채널 그룹과 전체 믹스를 처리하기 위해 소프트 니가 자주 사용되며(눈에 띄지 않게 작동하므로) 개별 악기의 어택과 기타 기능을 강조하기 위해 하드 니가 사용됩니다.
  • 응답 모드: 피크/RMS. 피크 모드는 진폭 버스트를 엄격하게 제한해야 할 때뿐 아니라 복잡한 모양의 신호, 역학 및 가독성을 완전히 전달해야 하는 경우에 적합합니다. RMS 모드는 사운드에 매우 부드럽기 때문에 어택을 유지하면서 사운드를 두껍게 만들 수 있습니다.
  • 예측(예측). 이것은 압축기가 앞으로 어떤 일이 일어날지 알게 되는 시간입니다. 들어오는 신호에 대한 일종의 예비 분석입니다.
  • 메이크업 또는 게인. 압축으로 인한 볼륨 감소를 보상할 수 있는 매개변수입니다.

먼저 그리고 최대 주요 조언 , 이는 압축에 대한 모든 추가 질문을 제거합니다. a) 압축의 원리를 이해하고 b) 이 매개변수 또는 해당 매개변수가 사운드에 어떤 영향을 미치는지 확실히 알고 c) 실제로 여러 가지를 시도한 경우 다른 모델더 이상 조언이 필요하지 않습니다.

나는 정말 진지하다. 이 게시물을 주의 깊게 읽고 DAW의 표준 컴프레서와 하나 또는 두 개의 플러그인을 실험했지만 어떤 경우에 큰 어택 값을 설정해야 하는지, 어떤 비율을 사용해야 하는지, 어떤 모드에서 처리해야 하는지 이해하지 못했다면 소스 신호 - 그러면 인터넷에서 기성품 레시피를 계속 검색하여 아무데나 무심코 적용하게 됩니다.

압축기 미세 조정 방법그것은 리버브나 코러스를 미세 조정하는 방법과 비슷합니다. 이는 말도 안 되고 창의성과는 아무런 관련이 없습니다. 따라서 나는 유일한 올바른 방법을 지속적으로 반복합니다. 이 기사, 좋은 모니터 헤드폰, 파형의 시각적 제어를 위한 플러그인으로 무장하고 두 개의 압축기 회사에서 저녁을 보냅니다.

행동을 취하다!

, 미디어 플레이어

레코드, 특히 1982년 이전에 녹음되고 제작된 오래된 레코드는 녹음을 더 크게 만들기 위해 믹싱될 가능성이 훨씬 적었습니다. 레코드에는 보존되고 대부분의 표준 디지털 또는 HD 형식에서는 손실되는 자연스러운 다이내믹 레인지로 자연스러운 음악을 재현합니다.

물론 여기에는 예외가 있습니다. MA Recordings 또는 Reference Recordings에서 Steven Wilson의 최근 앨범을 들어보면 디지털 오디오가 얼마나 좋은지 들을 수 있습니다. 그러나 이것은 드문 일이며 대부분의 현대 사운드 녹음은 크고 압축되어 있습니다.

음악 압축은 최근 많은 비판을 받고 있지만 여러분이 좋아하는 거의 모든 녹음이 압축되어 있다고 확신합니다. 그 중 일부는 더 적고 일부는 더 많지만 여전히 압축되어 있습니다. 다이내믹 레인지 압축은 좋지 않은 음악의 희생양이지만 고도로 압축된 음악은 새로운 것이 아닙니다. 60년대 Motown 앨범을 들어보세요. Led Zeppelin의 고전 작품이나 Wilco와 Radiohead의 젊은 앨범에 대해서도 마찬가지입니다. 다이내믹 레인지 압축은 녹음에서 가장 큰 소리와 가장 작은 소리 사이의 자연스러운 관계를 줄여 속삭임이 비명만큼 클 수 있습니다. 지난 50년 동안 압축되지 않은 팝음악을 찾는 것은 꽤 어렵다.

나는 최근에 Tape Op 잡지의 창립자이자 편집자인 Larry Crane과 압축의 좋은 점, 나쁜 점, 추악한 측면에 관해 즐거운 대화를 나누었습니다. Larry Crane은 Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi 및 Richmond Fontaine과 같은 밴드 및 아티스트와 함께 작업했습니다. 그는 또한 녹음 스튜디오 Jackpot을 운영하고 있습니다! The Breeders, The Decemists, Eddie Vedder, Pavement, R.E.M., She & Him 및 기타 많은 사람들의 본거지였던 오레곤주 포틀랜드에 있습니다.

놀랍도록 부자연스러우면서도 훌륭한 노래의 예로 Spoon의 2014년 앨범 They Want My Soul을 들겠습니다. 크레인은 웃으며 차에서 듣기에 아주 좋기 때문에 차에서 듣는다고 말했습니다. 이는 음악이 압축되는 이유에 대한 또 다른 대답을 제시합니다. 압축과 추가적인 "명확성"을 통해 시끄러운 장소에서도 더 쉽게 들을 수 있기 때문입니다.

래리 크레인이 직장에서. 사진 제공: Jason Quigley

사람들이 오디오 녹음의 사운드를 좋아한다고 말할 때, 마치 사운드와 음악이 분리될 수 없는 용어인 것처럼 음악을 좋아한다고 생각합니다. 하지만 나 자신은 이러한 개념을 차별화합니다. 오디오 애호가의 관점에서 볼 때 사운드는 거칠고 원시적일 수 있지만 대부분의 청취자에게는 문제가 되지 않습니다.

많은 사람들이 마스터링 엔지니어가 압축을 과도하게 사용한다고 비난하지만 압축은 녹음 중에, 믹싱 중에, 그리고 마스터링 중에만 직접 적용됩니다. 각 단계에 직접 참여하지 않는 한, 프로세스 초기에 악기와 보컬 파트의 소리가 어땠는지 말할 수 없을 것입니다.

Crane은 순조롭게 진행 중이었습니다. "음악가가 Guided by Voices 레코드처럼 의도적으로 이상하고 왜곡된 소리를 내고자 한다면 그것은 문제가 아닙니다. 욕망이 항상 음질보다 중요합니다." 연주자의 목소리는 거의 항상 압축되어 있으며 베이스, 드럼, 기타, 신디사이저에서도 같은 현상이 발생합니다. 압축은 보컬의 볼륨을 적절한 수준노래 전체에서 소리가 나거나 나머지 소리에 비해 조금 돋보입니다.

적절하게 압축을 수행하면 드럼 사운드가 더욱 생동감 넘치거나 의도적으로 이상하게 들릴 수 있습니다. 음악 사운드를 훌륭하게 만들려면 필요한 도구를 사용할 수 있어야 합니다. 이것이 바로 압축을 과도하게 사용하지 않고 사용하는 방법을 알아내는 데 수년이 걸리는 이유입니다. 믹스 엔지니어가 기타 파트를 너무 많이 압축하면 마스터링 엔지니어는 더 이상 누락된 주파수를 완전히 복원할 수 없습니다.

뮤지션들이 믹싱과 마스터링의 단계를 거치지 않은 음악을 들려주기를 원한다면, 스튜디오에서 바로 매장 진열대에 출시할 것입니다. Crane은 녹음된 음악을 만들고, 편집하고, 믹싱하고 마스터하는 사람들이 음악가들을 방해하기 위해 존재하는 것이 아니라고 말했습니다. 그들은 처음부터 100년 이상 동안 예술가들을 도와왔습니다.

이 사람들은 놀라운 예술 작품을 탄생시키는 창작 과정의 일부입니다. Crane은 "믹스와 마스터링이 이루어지지 않은 'Dark Side of the Moon' 버전은 원하지 않을 것입니다."라고 덧붙입니다. 핑크 플로이드는 자신들이 듣고 싶은 대로 노래를 발표했다.




맨 위