La compression en pratique. Compression dynamique Plage dynamique compressée ou standard

Ce groupe de méthodes est basé sur le fait que les signaux transmis subissent des transformations d'amplitude non linéaires et que dans les parties émission et réception, les non-linéarités sont réciproques. Par exemple, si la fonction non linéaire Öu est utilisée dans l'émetteur, u 2 est utilisée dans le récepteur. L'application cohérente des fonctions réciproques garantira que la transformation globale reste linéaire.

L'idée des méthodes de compression de données non linéaires est que l'émetteur peut, avec la même amplitude des signaux de sortie, transmettre une plus grande plage de modifications du paramètre transmis (c'est-à-dire une plus grande plage dynamique). Plage dynamique- c'est le rapport de la plus grande amplitude de signal admissible à la plus petite, exprimé en unités relatives ou décibels :

; (2.17)
. (2.18)

Le désir naturel d'augmenter la plage dynamique en diminuant U min est limité par la sensibilité de l'équipement et l'influence croissante des interférences et du bruit propre.

Le plus souvent, la compression de la plage dynamique est effectuée à l'aide d'une paire de fonctions réciproques de logarithme et de potentialisation. La première opération de changement d'amplitude s'appelle compression(par compression), le deuxième - expansion(élongation). Le choix de ces fonctions particulières est associé à leurs plus grandes capacités de compression.

Dans le même temps, ces méthodes présentent également des inconvénients. La première d'entre elles est que le logarithme d'un petit nombre est négatif et dans la limite :

c'est-à-dire que la sensibilité est très non linéaire.

Pour réduire ces défauts, les deux fonctions sont modifiées par déplacement et approximation. Par exemple, pour les canaux téléphoniques, la fonction approchée a la forme (type A) :

avec A=87,6. Le gain de compression est de 24 dB.

La compression des données utilisant des procédures non linéaires est mise en œuvre par des moyens analogiques avec de grandes erreurs. Application médias numériques peut améliorer considérablement la précision ou les performances de la conversion. Parallèlement, l'utilisation directe des fonds la technologie informatique(c'est-à-dire calculer directement les logarithmes et les exposants) ne donnera pas les meilleurs résultats en raison de faibles performances et de l'accumulation d'erreurs de calcul.

En raison de limitations de précision, la compression des données par compression est utilisée dans des cas non critiques, par exemple pour transmettre la parole sur des canaux téléphoniques et radio.

Codage efficace

Des codes efficaces ont été proposés par K. Shannon, Fano et Huffman. L'essence des codes est qu'ils sont inégaux, c'est-à-dire avec un nombre inégal de bits, et la longueur du code est inversement proportionnelle à la probabilité de son apparition. Une autre grande caractéristique des codes efficaces est qu’ils ne nécessitent pas de délimiteurs, c’est-à-dire caractères spéciaux, séparant les combinaisons de codes adjacentes. Ceci est réalisé en suivant une règle simple : des codes plus courts ne sont pas le début de codes plus longs. Dans ce cas, le flux continu de bits est décodé de manière unique car le décodeur détecte en premier les mots de code les plus courts. Les codes efficaces ont longtemps été purement académiques, mais ils ont récemment été utilisés avec succès dans la création de bases de données, ainsi que dans la compression d'informations dans des modems et des archiveurs de logiciels modernes.

En raison des irrégularités, la longueur moyenne du code est introduite. Longueur moyenne - espérance mathématique de la longueur du code :

de plus, l av tend vers H(x) d'en haut (c'est-à-dire l av > H(x)).

La réalisation de la condition (2.23) devient plus forte à mesure que N augmente.

Il existe deux types de codes efficaces : Shannon-Fano et Huffman. Voyons comment les obtenir à l'aide d'un exemple. Supposons que les probabilités des symboles de la séquence aient les valeurs données dans le tableau 2.1.

Tableau 2.1.

Probabilités des symboles

N
p je 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Les symboles sont classés, c'est-à-dire présentés dans une rangée par ordre décroissant de probabilités. Après cela, en utilisant la méthode de Shannon-Fano, la procédure suivante est périodiquement répétée : l'ensemble du groupe d'événements est divisé en deux sous-groupes avec les mêmes (ou approximativement les mêmes) probabilités totales. La procédure se poursuit jusqu'à ce qu'un élément reste dans le sous-groupe suivant, après quoi cet élément est éliminé et les actions spécifiées se poursuivent avec les actions restantes. Cela se produit jusqu'à ce qu'il ne reste qu'un seul élément dans les deux derniers sous-groupes. Continuons avec notre exemple, résumé dans le tableau 2.2.

Tableau 2.2.

Codage Shannon-Fano

N P je
4 0.3 je
0.2 je II
6 0.15 je je
0.1 II
1 0.1 je je
9 0.05 II II
5 0.05 II je
7 0.03 II II je
8 0.02 II

Comme le montre le tableau 2.2, le premier symbole avec une probabilité p 4 = 0,3 a participé à deux procédures de division en groupes et les deux fois se sont retrouvés dans le groupe numéro I. Conformément à cela, il est codé avec un code II à deux chiffres. Le deuxième élément au premier stade de la partition appartenait au groupe I, au deuxième au groupe II. Son code est donc 10. Les codes des symboles restants ne nécessitent pas de commentaires supplémentaires.

En règle générale, les codes non uniformes sont représentés sous forme d’arbres de codes. Un arbre de codes est un graphique indiquant les combinaisons de codes autorisées. Les directions des bords de ce graphique sont prédéfinies, comme le montre la Fig. 2.11 (le choix des directions est arbitraire).

Ils parcourent le graphique comme suit : créent un itinéraire pour le symbole sélectionné ; le nombre de bits correspondant est égal au nombre de tronçons de l'itinéraire et la valeur de chaque bit est égale à la direction du tronçon correspondant. L'itinéraire est tracé à partir du point de départ (sur le dessin il est marqué de la lettre A). Par exemple, la route vers le sommet 5 se compose de cinq arêtes, dont toutes sauf la dernière ont la direction 0 ; nous obtenons le code 00001.

Calculons l'entropie et la longueur moyenne des mots pour cet exemple.

H(x) = -(0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bits

l moyenne = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Comme vous pouvez le constater, la longueur moyenne des mots est proche de l’entropie.

Les codes de Huffman sont construits à l'aide d'un algorithme différent. La procédure de codage comprend deux étapes. Dans un premier temps, des compressions uniques de l'alphabet sont effectuées séquentiellement. Compression unique - remplacement des deux derniers symboles (avec les probabilités les plus faibles) par un, avec une probabilité totale. Les compressions sont effectuées jusqu'à ce qu'il reste deux caractères. Dans le même temps, une table de codage est remplie, dans laquelle les probabilités résultantes sont saisies et les itinéraires le long desquels les nouveaux symboles se déplacent à l'étape suivante sont représentés.

Lors de la deuxième étape, le codage proprement dit a lieu, qui commence à partir de la dernière étape : le premier des deux symboles se voit attribuer le code 1, le second - 0. Après cela, ils passent à l'étape précédente. Les codes de l'étape suivante sont attribués aux symboles qui n'ont pas participé à la compression à cette étape, et le code du symbole obtenu après collage est attribué deux fois aux deux derniers symboles et ajouté au code du caractère supérieur 1, le inférieur - 0. Si le caractère ne participe pas davantage au collage, son code reste inchangé. La procédure se poursuit jusqu'à la fin (c'est-à-dire jusqu'à la première étape).

Le tableau 2.3 montre le codage de Huffman. Comme le montre le tableau, le codage a été réalisé en 7 étapes. A gauche se trouvent les probabilités des symboles, à droite les codes intermédiaires. Les flèches montrent les mouvements des symboles nouvellement formés. A chaque étape, les deux derniers symboles ne diffèrent que par le bit de poids faible, ce qui correspond à la technique de codage. Calculons la longueur moyenne des mots :

l moyenne = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

C'est encore plus proche de l'entropie : le code est encore plus efficace. En figue. La figure 2.12 montre l'arbre des codes de Huffman.

Tableau 2.3.

Codage de Huffman

N p je code je II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Les deux codes satisfont à l’exigence d’un décodage sans ambiguïté : comme le montrent les tableaux, des combinaisons plus courtes ne sont pas le début de codes plus longs.

À mesure que le nombre de symboles augmente, l'efficacité des codes augmente, de sorte que dans certains cas, des blocs plus grands sont codés (par exemple, si nous parlons de sur les textes, vous pouvez encoder certaines des syllabes, mots et même phrases les plus fréquents).

L'effet de l'introduction de tels codes est déterminé en les comparant avec un code uniforme :

(2.24)

où n est le nombre de bits du code uniforme remplacé par le code effectif.

Modifications des codes de Huffman

L'algorithme de Huffman classique est un algorithme à deux passes, c'est-à-dire nécessite d'abord de collecter des statistiques sur les symboles et les messages, puis d'appliquer les procédures décrites ci-dessus. Ceci est peu pratique en pratique car cela augmente le temps nécessaire au traitement des messages et à l'accumulation d'un dictionnaire. Le plus souvent, des méthodes en un seul passage sont utilisées, dans lesquelles les procédures d'accumulation et de codage sont combinées. De telles méthodes sont également appelées compression adaptative selon Huffman [46].

L'essence de la compression adaptative selon Huffman se résume à la construction d'un arbre de code initial et à sa modification séquentielle après l'arrivée de chaque symbole suivant. Comme auparavant, les arbres ici sont binaires, c'est-à-dire Au plus deux arcs émanent de chaque sommet de l’arborescence. Il est d'usage d'appeler le sommet d'origine le parent, et les deux sommets suivants qui y sont connectés comme des enfants. Introduisons le concept de poids de sommet - il s'agit du nombre de caractères (mots) correspondant à un sommet donné, obtenu lors de l'alimentation de la séquence originale. Évidemment, la somme des poids des enfants est égale au poids du parent.

Après avoir introduit le symbole suivant de la séquence d'entrée, l'arbre de codes est révisé : les poids des sommets sont recalculés et, si nécessaire, les sommets sont réorganisés. La règle de permutation des sommets est la suivante : les poids des sommets inférieurs sont les plus petits, et les sommets situés à gauche du graphe ont le moins de poids.

En même temps, les sommets sont numérotés. La numérotation commence à partir des sommets inférieurs (suspendus, c'est-à-dire sans enfants) de gauche à droite, puis se déplace vers haut niveau etc. avant de numéroter le dernier sommet d’origine. Dans ce cas, le résultat suivant est obtenu : plus le poids d'un sommet est petit, plus son nombre est faible.

La permutation s'effectue principalement pour les sommets suspendus. Lors de la permutation, la règle formulée ci-dessus doit être prise en compte : les sommets de plus grand poids ont un nombre plus élevé.

Après avoir réussi la séquence (également appelée contrôle ou test), tous les sommets suspendus se voient attribuer des combinaisons de codes. La règle d'attribution des codes est similaire à celle ci-dessus : le nombre de bits du code est égal au nombre de sommets par lesquels passe l'itinéraire depuis la source jusqu'au sommet suspendu donné, et la valeur d'un bit particulier correspond à la direction. du parent à « l'enfant » (disons, aller à gauche du parent correspond à la valeur 1, à droite - 0 ).

Les combinaisons de codes résultantes sont stockées dans la mémoire du dispositif de compression avec leurs analogues et forment un dictionnaire. L'utilisation de l'algorithme est la suivante. La séquence de caractères compressée est divisée en fragments conformément au dictionnaire existant, après quoi chacun des fragments est remplacé par son code du dictionnaire. Les fragments introuvables dans le dictionnaire forment de nouveaux sommets suspendus, acquièrent du poids et sont également entrés dans le dictionnaire. De cette manière, un algorithme adaptatif de réapprovisionnement du dictionnaire est formé.

Pour augmenter l'efficacité de la méthode, il est souhaitable d'augmenter la taille du dictionnaire ; dans ce cas le taux de compression augmente. En pratique, la taille du dictionnaire est de 4 à 16 Ko de mémoire.


Illustrons l'algorithme donné avec un exemple. En figue. La figure 2.13 montre le diagramme original (il est également appelé arbre de Huffman). Chaque sommet de l'arbre est représenté par un rectangle dans lequel sont inscrits deux nombres à travers une fraction : le premier désigne le numéro du sommet, le second signifie son poids. Comme vous pouvez le constater, la correspondance entre les poids des sommets et leurs nombres est satisfaite.

Supposons maintenant que le symbole correspondant au sommet 1 apparaisse une seconde fois dans la séquence de test. Le poids du sommet a changé comme le montre la Fig. 2.14, à la suite de quoi la règle de numérotation des sommets est violée. A l'étape suivante, nous modifions l'emplacement des sommets suspendus, pour lesquels nous échangeons les sommets 1 et 4 et renumérotons tous les sommets de l'arbre. Le graphique résultant est présenté sur la Fig. 2.15. La procédure se poursuit ensuite de la même manière.

Il ne faut pas oublier que chaque sommet suspendu de l'arbre de Huffman correspond à un symbole ou un groupe de symboles spécifique. Le parent diffère des enfants en ce que le groupe de symboles qui lui correspond est un symbole plus court que celui de ses enfants, et ces enfants sont différents dernier personnage. Par exemple, les symboles « voiture » correspondent au parent ; alors les enfants pourront avoir les séquences « kara » et « karp ».

L'algorithme donné n'est pas académique et est activement utilisé dans les programmes d'archivage, y compris lors de la compression de données graphiques (ils seront discutés ci-dessous).

Algorithmes de Lempel – Ziv

Ce sont les algorithmes de compression les plus couramment utilisés aujourd’hui. Ils sont utilisés dans la plupart des programmes d'archivage (par exemple, PKZIP. ARJ, LHA). L'essence des algorithmes est qu'un certain ensemble de symboles est remplacé lors de l'archivage par son numéro dans un dictionnaire spécialement généré. Par exemple, l'expression « Le numéro d'envoi de votre lettre... », que l'on retrouve souvent dans la correspondance commerciale, peut occuper la position 121 dans le dictionnaire ; puis, au lieu de transmettre ou de stocker la phrase mentionnée (30 octets), vous pouvez stocker le numéro de phrase (1,5 octets sous forme décimale binaire ou 1 octet en binaire).

Les algorithmes portent le nom des auteurs qui les ont proposés pour la première fois en 1977. Parmi ceux-ci, le premier est le LZ77. Pour l'archivage, une fenêtre coulissante de messages est créée, composée de deux parties. La première partie, de format plus grand, sert à former un dictionnaire et a une taille d'environ plusieurs kilo-octets. La deuxième partie, plus petite (généralement jusqu'à 100 octets) reçoit les caractères actuels du texte affiché. L'algorithme essaie de trouver un ensemble de caractères dans le dictionnaire qui correspond à ceux reçus dans la fenêtre de visualisation. Si cela réussit, un code est généré composé de trois parties : le décalage dans le dictionnaire par rapport à sa sous-chaîne initiale, la longueur de cette sous-chaîne et le caractère qui suit cette sous-chaîne. Par exemple, la sous-chaîne sélectionnée est constituée des caractères « app » (6 caractères au total), le caractère suivant est « e ». Ensuite, si la sous-chaîne a une adresse (place dans le dictionnaire) 45, alors l'entrée dans le dictionnaire ressemble à « 45, 6. e ». Après cela, le contenu de la fenêtre est décalé par position et la recherche continue. C'est ainsi que se forme un dictionnaire.

L'avantage de l'algorithme est un algorithme facilement formalisé pour compiler un dictionnaire. De plus, il est possible de décompresser sans le dictionnaire original (il est conseillé d'avoir une séquence de test) - le dictionnaire est formé lors de la décompression.

Les inconvénients de l'algorithme apparaissent à mesure que la taille du dictionnaire augmente - le temps de recherche augmente. De plus, si une chaîne de caractères apparaît dans la fenêtre courante qui n'est pas dans le dictionnaire, chaque caractère est écrit avec un code à trois éléments, c'est-à-dire Le résultat n’est pas une compression, mais un étirement.

L'algorithme LZSS, proposé en 1978, présente les meilleures caractéristiques. Il présente des différences dans le support des fenêtres coulissantes et les codes de sortie du compresseur. En plus de la fenêtre, l'algorithme génère un arbre binaire similaire à un arbre de Huffman pour accélérer la recherche de correspondances : chaque sous-chaîne quittant la fenêtre actuelle est ajoutée à l'arbre comme l'un des enfants. Cet algorithme permet d'augmenter encore la taille de la fenêtre courante (il est souhaitable que sa taille soit égale à une puissance de deux : 128, 256, etc. octets). Les codes de séquence sont également formés différemment : un préfixe supplémentaire de 1 bit est introduit pour distinguer les caractères non codés des paires « décalage, longueur ».

Un degré de compression encore plus élevé est obtenu en utilisant des algorithmes comme LZW. Les algorithmes décrits précédemment ont une taille de fenêtre fixe, ce qui rend impossible la saisie de phrases plus longues que la taille de la fenêtre dans le dictionnaire. Dans les algorithmes LZW (et leur prédécesseur LZ78), la fenêtre de visualisation a une taille illimitée et le dictionnaire accumule des phrases (et non une collection de caractères, comme auparavant). Le dictionnaire a une longueur illimitée et l'encodeur (décodeur) fonctionne en mode d'attente de phrase. Lorsqu'une expression correspondant au dictionnaire est formée, un code de correspondance est émis (c'est-à-dire le code de cette expression dans le dictionnaire) et le code du caractère qui la suit. Si, à mesure que les symboles s'accumulent, une nouvelle phrase est formée, elle est également inscrite dans le dictionnaire, comme la plus courte. Le résultat est une procédure récursive qui permet un codage et un décodage rapides.

Une fonctionnalité de compression supplémentaire est fournie par le codage compressé des caractères répétitifs. Si dans une séquence certains caractères se succèdent (par exemple, dans le texte, il peut s'agir de caractères « espace », dans une séquence numérique - des zéros consécutifs, etc.), alors il est logique de les remplacer par la paire « caractère ; longueur » ou « signe, longueur » ". Dans le premier cas, le code indique le signe que la séquence sera codée (généralement 1 bit), puis le code du caractère répétitif et la longueur de la séquence. Dans le second cas (prévu pour les caractères répétitifs les plus fréquents), le préfixe indique simplement un signe de répétition.

Compression dynamique(Compression de plage dynamique, DRC) - rétrécissement (ou expansion dans le cas d'un expanseur) de la plage dynamique du phonogramme. Plage dynamique, est la différence entre le son le plus faible et le son le plus fort. Parfois, le son le plus faible d'une bande sonore sera un peu plus fort que le niveau de bruit, et parfois un peu plus faible que le son le plus fort. Les périphériques matériels et les programmes qui effectuent une compression dynamique sont appelés compresseurs, en distinguant quatre groupes principaux : les compresseurs eux-mêmes, les limiteurs, les expandeurs et les gates.

Compresseur analogique à lampes DBX 566

Compression vers le bas et vers le haut

Décompression(Compression vers le bas) réduit le volume d'un son lorsqu'il commence à dépasser un certain seuil, laissant inchangés les sons plus faibles. Une version extrême de la compression vers le bas est limiteur. Augmenter la compression La compression ascendante, en revanche, augmente le volume d'un son s'il est inférieur à un seuil sans affecter les sons plus forts. Dans le même temps, les deux types de compression réduisent la plage dynamique du signal audio.

Décompression

Augmenter la compression

Extenseur et portail

Si un compresseur réduit la plage dynamique, un expanseur l'augmente. Lorsque le niveau du signal dépasse le niveau seuil, l'expanseur l'augmente encore, augmentant ainsi la différence entre les sons forts et faibles. Des appareils comme celui-ci sont souvent utilisés lors de l’enregistrement d’un kit de batterie pour séparer les sons d’une batterie d’une autre.

Un type d'expandeur utilisé non pas pour amplifier les sons forts, mais pour atténuer les sons faibles qui ne dépassent pas un niveau seuil (par exemple, le bruit de fond) est appelé Porte anti-bruit. Dans un tel dispositif, dès que le niveau sonore devient inférieur au seuil, le signal cesse de passer. Généralement, une porte est utilisée pour supprimer le bruit pendant les pauses. Sur certains modèles, vous pouvez vous assurer que le son ne s'arrête pas brusquement lorsqu'il atteint un niveau seuil, mais s'éteint progressivement. Dans ce cas, le taux de décroissance est défini par la commande Decay.

Gate, comme les autres types de compresseurs, peut être dépendant de la fréquence(c'est-à-dire traiter certains Bandes de fréquence) et peut fonctionner en mode chaîne latérale(voir ci-dessous).

Principe de fonctionnement du compresseur

Le signal entrant dans le compresseur est divisé en deux copies. Une copie est envoyée à un amplificateur, dans lequel le degré d'amplification est contrôlé par un signal externe, et la deuxième copie génère ce signal. Il entre dans un appareil appelé side-chain, où le signal est mesuré et, sur la base de ces données, une enveloppe est créée qui décrit le changement de son volume.
C'est ainsi que sont conçus la plupart des compresseurs modernes, c'est ce qu'on appelle le type à action directe. Dans les appareils plus anciens (type feedback), le niveau du signal est mesuré après l'amplificateur.

Il existe différentes technologies d'amplification analogique à gain variable, chacune avec ses propres avantages et inconvénients : à tube, optique utilisant des photorésistances et à transistor. Lorsque vous travaillez avec de l'audio numérique (en monteur sonore ou DAW) peuvent utiliser des algorithmes mathématiques propriétaires ou émuler le fonctionnement de technologies analogiques.

Principaux paramètres des compresseurs

Seuil

Un compresseur réduit le niveau d'un signal audio si son amplitude dépasse une certaine valeur seuil (seuil). Il est généralement spécifié en décibels, avec un seuil inférieur (par exemple -60 dB) ce qui signifie que davantage d'audio sera traité qu'un seuil plus élevé (par exemple -5 dB).

rapport

L'ampleur de la réduction de niveau est déterminée par le paramètre ratio : un ratio 4:1 signifie que si le niveau d'entrée est de 4 dB au-dessus du seuil, le niveau de sortie sera de 1 dB au-dessus du seuil.
Par exemple:
Seuil = −10 dB
Entrée = −6 dB (4 dB au-dessus du seuil)
Sortie = −9 dB (1 dB au-dessus du seuil)

Il est important de garder à l'esprit que la suppression du niveau de signal continue pendant un certain temps après qu'il soit tombé en dessous du niveau seuil, et ce temps est déterminé par la valeur du paramètre libérer.

La compression avec un rapport maximum de ∞:1 est appelée limitation. Cela signifie que tout signal supérieur au niveau seuil est atténué jusqu'au niveau seuil (sauf pendant une courte période après une augmentation soudaine du volume d'entrée). Voir « Limiteur » ci-dessous pour plus de détails.

Exemples de différentes valeurs de ratio

Attaque et libération

Un compresseur permet de contrôler dans une certaine mesure la rapidité avec laquelle il répond aux changements dans la dynamique du signal. Le paramètre Attack détermine le temps nécessaire au compresseur pour réduire le gain à un niveau déterminé par le paramètre Ratio. Release détermine le temps pendant lequel le compresseur, au contraire, augmente le gain, ou revient à la normale si le niveau du signal d'entrée descend en dessous de la valeur seuil.

Phases d'attaque et de libération

Ces paramètres indiquent le temps (généralement en millisecondes) qu'il faudra pour modifier le gain d'une certaine quantité de décibels, généralement 10 dB. Par exemple, dans ce cas, si Attack est réglé sur 1 ms, il faudra 1 ms pour réduire le gain de 10 dB et 2 ms pour réduire le gain de 20 dB.

Sur de nombreux compresseurs, les paramètres Attack et Release peuvent être ajustés, mais sur certains, ils sont prédéfinis et ne peuvent pas être ajustés. Parfois, ils sont désignés comme « automatiques » ou « dépendants du programme », c'est-à-dire change en fonction du signal d’entrée.

Genou

Un autre paramètre du compresseur : genou dur/mou. Il détermine si le début de la compression sera brusque (dur) ou progressif (doux). Soft Knee réduit la visibilité de la transition du signal sec au signal compressé, en particulier à des valeurs de ratio élevées et à des augmentations soudaines de volume.

Compression du genou dur et du genou souple

Pic et RMS

Le compresseur peut répondre aux valeurs de crête (maximum à court terme) ou au niveau moyen du signal d'entrée. L'utilisation de valeurs maximales peut entraîner de fortes fluctuations du degré de compression, voire une distorsion. Par conséquent, les compresseurs appliquent une fonction moyenne (généralement RMS) au signal d’entrée lorsqu’il le compare à une valeur seuil. Cela donne une compression plus confortable, plus proche de la perception humaine du volume.

RMS est un paramètre qui reflète le volume moyen d'une bande sonore. D'un point de vue mathématique, RMS (Root Mean Square) est la valeur quadratique moyenne de l'amplitude d'un certain nombre d'échantillons :

Liaison stéréo

Un compresseur en mode de liaison stéréo applique le même gain aux deux canaux stéréo. Cela évite les décalages stéréo qui peuvent résulter du traitement individuel des canaux gauche et droit. Ce décalage se produit si, par exemple, un élément fort est décentré.

Gain de maquillage

Étant donné que le compresseur réduit le niveau global du signal, il ajoute généralement une option de gain de sortie fixe pour atteindre le niveau optimal.

Anticipation

La fonction d'anticipation est conçue pour résoudre les problèmes associés à des valeurs d'attaque et de relâchement trop élevées et trop faibles. Un temps d'attaque trop long ne permet pas d'intercepter efficacement les transitoires, et un temps d'attaque trop court peut ne pas être confortable pour l'auditeur. Lors de l'utilisation de la fonction d'anticipation, le signal principal est retardé par rapport au signal de contrôle, cela vous permet de démarrer la compression à l'avance, avant même que le signal n'atteigne la valeur seuil.
Le seul inconvénient de cette méthode est le retard du signal, qui dans certains cas est indésirable.

Utilisation de la compression dynamique

La compression est utilisée partout, non seulement dans les bandes sonores musicales, mais aussi partout où il est nécessaire d'augmenter le volume global sans augmenter les niveaux de crête, lorsqu'un équipement de reproduction sonore peu coûteux ou un canal de transmission limité est utilisé (systèmes de sonorisation et de communication, radio amateur, etc.) .

La compression est appliquée pendant la lecture musique de fond(dans les magasins, restaurants, etc.) où des changements de volume notables ne sont pas souhaités.

Mais le domaine d'application le plus important de la compression dynamique est la production et la diffusion musicale. La compression est utilisée pour donner au son « épaisseur » et « dynamisme », pour mieux combiner les instruments entre eux, et notamment lors du traitement du chant.

Les voix de la musique rock et pop sont souvent compressées pour les faire ressortir de l'accompagnement et ajouter de la clarté. Un type spécial de compresseur accordé uniquement sur certaines fréquences – un de-esser – est utilisé pour supprimer les phonèmes sifflants.

Dans les parties instrumentales, la compression est également utilisée pour des effets qui ne sont pas directement liés au volume, par exemple, les sons de batterie à déclin rapide peuvent être allongés.

La musique de danse électronique (EDM) utilise souvent le side-chaining (voir ci-dessous) - par exemple, la ligne de basse peut être entraînée par une grosse caisse ou similaire pour empêcher la basse et la batterie de s'affronter et créer une pulsation dynamique.

La compression est largement utilisée en radiodiffusion (radio, télévision, diffusion sur Internet) pour augmenter le volume perçu tout en réduisant la plage dynamique de la source audio (généralement un CD). La plupart des pays ont des restrictions légales sur le volume instantané maximum pouvant être diffusé. Généralement, ces limitations sont mises en œuvre par des compresseurs matériels permanents dans la chaîne pneumatique. De plus, l'augmentation du volume perçu améliore la « qualité » du son du point de vue de la plupart des auditeurs.

voir également Guerre du volume.

Augmentation constante du volume de la même chanson remasterisée pour CD de 1983 à 2000.

Chaînage latéral

Un autre commutateur de compresseur couramment rencontré est le « side chain ». Dans ce mode, la compression du son se produit quelle que soit sa propre niveau, et en fonction du niveau du signal entrant dans le connecteur, généralement appelé chaîne latérale.

Il existe plusieurs utilisations pour cela. Par exemple, le chanteur zozaie et tous les « s » ressortent de l’ensemble. Vous faites passer sa voix à travers un compresseur et vous introduisez le même son dans le connecteur de chaîne latérale, mais passé à travers un égaliseur. Avec un égaliseur, vous supprimez toutes les fréquences sauf celles utilisées par le chanteur lors de la prononciation de la lettre « s ». Généralement autour de 5 kHz, mais peut aller de 3 kHz à 8 kHz. Si vous mettez ensuite le compresseur en mode side chain, la voix sera compressée aux moments où la lettre « s » est prononcée. Cela a abouti à un appareil connu sous le nom de de-esser. Cette façon de travailler est dite « dépendante de la fréquence ».

Une autre utilisation de cette fonction est appelée « ducker ». Par exemple, dans une station de radio, la musique passe par un compresseur et les paroles du DJ passent par une chaîne latérale. Lorsque le DJ commence à discuter, le volume de la musique diminue automatiquement. Cet effet peut également être utilisé avec succès en enregistrement, par exemple pour réduire le volume des parties du clavier pendant le chant.

Limitation du mur de briques

Le compresseur et le limiteur fonctionnent à peu près de la même manière ; on peut dire que le limiteur est un compresseur avec un ratio élevé (à partir de 10:1) et, généralement, un temps d'attaque faible.

Il existe un concept de limitation par mur de briques - limitation avec un ratio très élevé (20:1 et plus) et une attaque très rapide. Idéalement, cela ne permet pas du tout au signal de dépasser le niveau seuil. Le résultat sera désagréable pour l'oreille, mais cela évitera d'endommager l'équipement de reproduction sonore ou de trop bande passante canal. De nombreux fabricants intègrent à cet effet des limiteurs dans leurs appareils.

Clipper contre Limiteur, clipping doux et dur

La compression est l’un des sujets les plus mythiques dans la production sonore. On dit que Beethoven a même effrayé les enfants du voisin avec elle :(

Bon, en fait, utiliser la compression n'est pas plus difficile que recourir à la distorsion, l'essentiel est de comprendre le principe de son fonctionnement et d'en avoir un bon contrôle. C'est ce que nous allons voir ensemble maintenant.

Qu'est-ce que la compression audio

La première chose à comprendre avant la préparation est la compression. travailler avec la gamme dynamique du son. Et, à son tour, ce n’est rien de plus que la différence entre les niveaux de signal les plus forts et les plus faibles :

Donc, la compression est la compression de la plage dynamique. Oui, Juste compression de plage dynamique, ou en d'autres termes diminuer le niveau des parties fortes du signal et augmenter le volume des parties faibles. Pas plus.

Vous pouvez raisonnablement vous demander pourquoi un tel battage médiatique est alors lié ? Pourquoi tout le monde parle de recettes pour régler correctement le compresseur, mais personne ne les partage ? Pourquoi, malgré le grand nombre de plugins sympas, de nombreux studios utilisent-ils encore des modèles de compresseurs rares et coûteux ? Pourquoi certains producteurs utilisent-ils des compresseurs à des réglages extrêmes, alors que d’autres ne les utilisent pas du tout ? Et lequel d’entre eux a finalement raison ?

Problèmes résolus par compression

Les réponses à ces questions résident dans la compréhension du rôle de la compression dans le travail avec le son. Et cela permet :

  1. Insister sur l'attaque le son, le rendant plus prononcé ;
  2. « Mise en place » de parties individuelles d'instruments dans le mixage, leur ajoutant de la puissance et du « poids » ;
  3. Rendre des groupes d'instruments ou un mix entier plus cohérents, un tel monolithe unique ;
  4. Résoudre les conflits entre les outils utiliser la chaîne latérale ;
  5. Corriger les erreurs du chanteur ou des musiciens, nivelant leur dynamique ;
  6. Avec un certain réglage agir comme un effet artistique.

Comme vous pouvez le constater, il ne s'agit pas d'un processus créatif moins important que, par exemple, de proposer des mélodies ou de créer des timbres intéressants. De plus, chacun des problèmes ci-dessus peut être résolu en utilisant 4 paramètres principaux.

Paramètres de base du compresseur

Malgré le grand nombre de modèles logiciels et matériels de compresseurs, toute la « magie » de la compression se produit lorsque réglage correct Paramètres principaux : seuil, ratio, attaque et relâchement. Regardons-les plus en détail :

Seuil ou seuil de réponse, dB

Ce paramètre vous permet de définir la valeur à partir de laquelle le compresseur fonctionnera (c'est-à-dire compresser le signal audio). Ainsi, si nous fixons le seuil à -12 dB, le compresseur ne fonctionnera que dans les parties de la plage dynamique qui dépassent cette valeur. Si tout notre son est inférieur à -12 dB, le compresseur le transmettra simplement sans l'affecter d'aucune façon.

Taux ou taux de compression

Le paramètre ratio détermine dans quelle mesure un signal dépassant le seuil sera compressé. Un peu de calcul pour compléter le tableau : disons que nous installons un compresseur avec un seuil de -12 dB, rapport 2:1 et que nous lui alimentons une boucle de batterie dans laquelle le volume de la grosse caisse est de -4 dB. Quel sera le résultat du fonctionnement du compresseur dans ce cas ?

Dans notre cas, le niveau du kick dépasse le seuil de 8 dB. Cette différence selon le ratio sera compressée à 4dB (8dB/2). Combiné avec la partie non traitée du signal, cela conduira au fait qu'après traitement par un compresseur, le volume de la grosse caisse sera de -8 dB (seuil -12 dB + signal compressé 4 dB).

Attaque, madame

C'est le temps après lequel le compresseur réagira au dépassement du seuil de réponse. Autrement dit, si le temps d'attaque est supérieur à 0 ms - le compresseur commence la compression le dépassement du signal de seuil n'est pas immédiat, mais après un temps spécifié.

Libération ou récupération, ms

Le contraire d'une attaque - la valeur de ce paramètre vous permet de spécifier combien de temps après que le niveau du signal repasse en dessous du seuil le compresseur cessera de comprimer.

Avant de continuer, je recommande fortement de prendre un échantillon bien connu, de placer n'importe quel compresseur sur son canal et d'expérimenter les paramètres ci-dessus pendant 5 à 10 minutes pour fixer solidement le matériau.

Tous les autres paramètres sont facultatifs. Ils peuvent différer selon les différents modèles de compresseurs, ce qui explique en partie pourquoi les producteurs utilisent différents modèles à des fins spécifiques (par exemple, un compresseur pour le chant, un autre pour un groupe de batterie, un troisième pour le canal principal). Je ne m'étendrai pas sur ces paramètres en détail, mais je donnerai seulement informations générales Pour comprendre de quoi il s’agit :

  • Genou ou pli (genou dur/souple). Ce paramètre détermine la rapidité avec laquelle le taux de compression (rapport) sera appliqué : fort le long d'une courbe ou en douceur. Je remarque qu'en mode Soft Knee, le compresseur ne fonctionne pas de manière linéaire, mais commence à compresser le son en douceur (dans la mesure où cela peut être approprié lorsqu'on parle de millisecondes). déjà avant la valeur seuil. Pour traiter des groupes de canaux et le mixage global, le soft knee est souvent utilisé (car il fonctionne inaperçu), et pour souligner l'attaque et d'autres caractéristiques des instruments individuels, le hard knee est utilisé ;
  • Mode de réponse : crête/RMS. Le mode Peak se justifie lorsqu'il faut limiter strictement les salves d'amplitude, ainsi que sur des signaux de forme complexe dont la dynamique et la lisibilité doivent être pleinement restituées. Le mode RMS est très doux sur le son, permettant de l'épaissir tout en conservant l'attaque ;
  • Prospective (anticipation). C'est le temps pendant lequel le compresseur saura ce qui lui arrive. Une sorte d'analyse préliminaire des signaux entrants ;
  • Maquillage ou gain. Un paramètre qui permet de compenser la diminution de volume suite à la compression.

D'abord et la plupart conseil principal , ce qui élimine toutes les autres questions sur la compression : si vous a) comprenez le principe de la compression, b) savez fermement comment tel ou tel paramètre affecte le son, et c) avez réussi à en essayer plusieurs en pratique différents modèlestu n'as plus besoin de conseils.

Je suis absolument sérieux. Si vous avez lu attentivement cet article, expérimenté le compresseur standard de votre DAW et un ou deux plug-ins, mais que vous n'avez toujours pas compris dans quels cas vous devez définir des valeurs d'attaque élevées, quel rapport utiliser et dans quel mode traiter le signal source - vous continuerez ensuite à rechercher sur Internet des recettes toutes faites, en les appliquant sans réfléchir n'importe où.

Recettes de réglage fin du compresseur c'est un peu comme des recettes pour peaufiner une réverbération ou un chorus : cela n'a aucun sens et n'a rien à voir avec la créativité. Par conséquent, je répète obstinément la seule recette correcte : armez-vous de cet article, de bons écouteurs de monitoring, d'un plug-in pour le contrôle visuel de la forme d'onde, et passez la soirée en compagnie de quelques compresseurs.

Passer à l'action!

, Lecteurs multimédias

Les disques, en particulier ceux plus anciens qui ont été enregistrés et produits avant 1982, étaient beaucoup moins susceptibles d'être mixés pour rendre l'enregistrement plus fort. Ils reproduisent une musique naturelle avec une plage dynamique naturelle qui est préservée sur le disque et perdue dans la plupart des formats numériques ou haute définition standard.

Il y a bien sûr des exceptions à cela : écoutez le récent album de Steven Wilson chez MA Recordings ou Reference Recordings et vous comprendrez à quel point l'audio numérique peut être de qualité. Mais cela est rare : la plupart des enregistrements sonores modernes sont forts et compressés.

La compression musicale a fait l'objet de nombreuses critiques ces derniers temps, mais je suis prêt à parier que presque tous vos enregistrements préférés sont compressés. Certains d'entre eux sont moins nombreux, d'autres plus, mais toujours compressés. La compression de plage dynamique est le bouc émissaire de la musique qui sonne mal, mais la musique hautement compressée n'est pas nouvelle : écoutez les albums Motown des années 60. On peut en dire autant des œuvres classiques de Led Zeppelin ou des albums plus jeunes de Wilco et Radiohead. La compression de la plage dynamique réduit la relation naturelle entre les sons les plus forts et les plus faibles d'un enregistrement, de sorte qu'un murmure peut être aussi fort qu'un cri. Il est assez difficile de trouver de la musique pop des 50 dernières années qui n'ait pas été compressée.

J'ai récemment eu une conversation agréable avec Larry Crane, fondateur et rédacteur en chef du magazine Tape Op, sur les bons, les mauvais et les mauvais aspects de la compression. Larry Crane a travaillé avec des groupes et des artistes tels que Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi et Richmond Fontaine. Il dirige également le studio d'enregistrement Jackpot ! à Portland, Oregon, qui abritait The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him et bien d'autres.

À titre d'exemple de chansons étonnamment peu naturelles mais néanmoins excellentes, je cite l'album de Spoon de 2014, They Want My Soul. Crane rit et dit qu'il l'écoute dans la voiture parce que ça sonne bien là-bas. Ce qui nous amène à une autre réponse à la question de savoir pourquoi la musique est compressée : parce que la compression et la « clarté » supplémentaire facilitent l’audition dans les endroits bruyants.

Larry Crane au travail. Photo de Jason Quigley

Quand les gens disent qu’ils aiment le son d’un enregistrement audio, je pense qu’ils aiment la musique, comme si son et musique étaient des termes indissociables. Mais pour ma part, je différencie ces concepts. Du point de vue d'un audiophile, le son peut être rugueux et brut, mais cela n'a pas d'importance pour la plupart des auditeurs.

Beaucoup n'hésitent pas à accuser les ingénieurs de mastering d'abuser de la compression, mais la compression est appliquée directement pendant l'enregistrement, pendant le mixage, et seulement ensuite pendant le mastering. À moins d’être personnellement présent à chacune de ces étapes, vous ne pourrez pas dire à quoi ressemblaient les instruments et les parties vocales au tout début du processus.

Crane était sur une lancée : « Si un musicien veut intentionnellement paraître fou et déformé comme les enregistrements de Guided by Voices, alors il n'y a rien de mal à cela : le désir l'emporte toujours sur la qualité sonore. » La voix de l'interprète est presque toujours compressée, et la même chose se produit avec la basse, la batterie, les guitares et les synthétiseurs. La compression maintient le volume des voix à le bon niveau tout au long de la chanson ou se démarque un peu du reste des sons.

Une compression correctement effectuée peut rendre le son de la batterie plus vivant ou intentionnellement étrange. Pour que la musique sonne bien, vous devez être capable d'utiliser les outils nécessaires. C’est pourquoi il faut des années pour comprendre comment utiliser la compression sans en faire trop. Si l’ingénieur mix compresse trop la partie guitare, l’ingénieur mastering ne pourra plus restituer entièrement les fréquences manquantes.

Si les musiciens voulaient que vous écoutiez de la musique qui n’a pas passé par les étapes de mixage et de mastering, ils la publieraient sur les étagères des magasins directement depuis le studio. Crane affirme que les gens qui créent, éditent, mixent et masterisent la musique enregistrée ne sont pas là pour gêner les musiciens : ils aident les artistes depuis le début, depuis plus de cent ans.

Ces personnes font partie du processus de création qui aboutit à des œuvres d’art étonnantes. Crane ajoute : "Vous ne voulez pas d'une version de 'Dark Side of the Moon' qui n'a pas été mixée et masterisée." Pink Floyd a sorti la chanson comme ils voulaient l'entendre.




Haut