Səsin rəqəmlər axınına çevrilməsi. Nitqin sintezi və tanınması. Müasir həllər. Kompüter audio avadanlığı. Audionun rəqəmlər axınına çevrilməsi Dinamik diapazon sıxılmış və ya standartdır

Seriyanın ikinci hissəsi şəkillərin dinamik diapazonunu optimallaşdırmaq funksiyalarına həsr edilmişdir. Bu cür həllərin nə üçün lazım olduğunu sizə xəbər verəcəyik, onların həyata keçirilməsi üçün müxtəlif variantları, eləcə də onların üstünlüklərini və mənfi cəhətlərini nəzərdən keçirəcəyik.

Sərhədsizliyi qucaqlayın

İdeal olaraq, kamera ətraf aləmin şəklini insanın qavradığı kimi çəkməlidir. Bununla belə, kameranın və insan gözünün "görmə" mexanizmlərinin əhəmiyyətli dərəcədə fərqli olması səbəbindən bu şərtin yerinə yetirilməsinə imkan verməyən bir sıra məhdudiyyətlər var.

Əvvəllər kinokamera istifadəçilərinin üzləşdiyi və indi rəqəmsal kamera sahiblərinin üzləşdiyi problemlərdən biri də xüsusi cihazlardan və/və ya xüsusi çəkiliş texnikalarından istifadə etmədən işıqlandırmada böyük fərqlərə malik səhnələri lazımi şəkildə çəkə bilməməkdir. İnsanın görmə sisteminin xüsusiyyətləri yüksək kontrastlı səhnələrin detallarını həm parlaq işıqlı, həm də qaranlıq yerlərdə eyni dərəcədə yaxşı qavramağa imkan verir. Təəssüf ki, kamera sensoru həmişə görüntünü bizim gördüyümüz kimi çəkə bilmir.

Şəkil çəkilmiş səhnədə parlaqlıq fərqi nə qədər çox olarsa, işıqlandırmalarda və/və ya kölgələrdə detalların itirilməsi ehtimalı bir o qədər yüksək olar. Nəticədə, sulu buludlu mavi səma əvəzinə, şəkil yalnız ağımtıl bir nöqtəyə çevrilir və kölgələrdə yerləşən obyektlər qeyri-müəyyən qaranlıq siluetlərə çevrilir və ya ətraf mühitlə tamamilə birləşir.

Klassik fotoqrafiyada anlayış fotoqrafiya eni(Ətraflı məlumat üçün yan panelə baxın). Nəzəri olaraq, rəqəmsal kameraların fotoqrafiya eni analoqdan rəqəmsal çeviricinin (ADC) bit dərinliyi ilə müəyyən edilir. Məsələn, 8 bitlik ADC-dən istifadə edərkən, kvantlaşdırma xətası nəzərə alınmaqla, fotoqrafiya eninin nəzəri cəhətdən əldə edilə bilən dəyəri 7 EV, 12 bitlik ADC üçün - 11 EV və s. Bununla belə, real cihazlarda şəkillərin dinamik diapazonu olduğu ortaya çıxır saat müxtəlif növ səs-küyün və digər amillərin təsiri ilə eyni nəzəri maksimum.

Parlaqlıq səviyyələrindəki böyük fərq ciddi bir fərqi göstərir
fotoşəkil çəkərkən problem. Bu vəziyyətdə kameranın imkanları
ən adekvat ötürülməsi üçün qeyri-kafi olduğu ortaya çıxdı
səhnənin işıqlı sahələri və nəticədə mavi bir sahə yerinə
göy (vuruşla işarələnmiş) ağ "yamaq" olur

İşığa həssas sensorun qeyd edə biləcəyi maksimum parlaqlıq dəyəri onun hüceyrələrinin doyma səviyyəsi ilə müəyyən edilir. Minimum dəyər matrisin termal səs-küyünün miqdarı, yük ötürülməsi səs-küyü və ADC xətası da daxil olmaqla bir neçə amildən asılıdır.

Onu da qeyd etmək lazımdır ki, eyni rəqəmsal kameranın fotoqrafiya eni parametrlərdə müəyyən edilmiş həssaslıq dəyərindən asılı olaraq dəyişə bilər. Maksimum dinamik diapazon, sözdə əsas həssaslığı təyin etməklə əldə edilə bilər (minimum mümkün ədədi dəyərə uyğundur). Bu parametrin dəyəri artdıqca, artan səs-küy səviyyəsinə görə dinamik diapazon azalır.

Sensorlarla təchiz olunmuş rəqəmsal kameraların müasir modellərinin foto genişliyi böyük ölçü və 14 və ya 16 bitlik ADC-lər 9 ilə 11 EV arasında dəyişir ki, bu da 35 mm rəngli mənfi filmlərin (orta hesabla 4-5 EV) oxşar xüsusiyyətləri ilə müqayisədə xeyli yüksəkdir. Beləliklə, hətta nisbətən ucuz rəqəmsal kameralar da ən tipik həvəskar çəkiliş səhnələrini adekvat şəkildə çatdırmaq üçün kifayət qədər foto eninə malikdir.

Ancaq fərqli bir problem var. Rəqəmsal təsvirlərin yazılması üçün mövcud standartlar tərəfindən qoyulan məhdudiyyətlərlə əlaqələndirilir. Hər rəng kanalı üçün 8 bit olan JPEG formatından istifadə etməklə (bu, indi kompüter sənayesində və rəqəmsal texnologiyada rəqəmsal təsvirlərin qeydə alınması üçün faktiki standarta çevrilmişdir) 8 EV-dən çox foto eninə malik olan şəkli saxlamaq hətta nəzəri cəhətdən mümkün deyil.

Fərz edək ki, kameranın ADC-si 12 və ya 14 bit dərinliyi olan, həm işıqlandırmalarda, həm də kölgələrdə nəzərə çarpan detalları ehtiva edən bir şəkil əldə etməyə imkan verir. Bununla belə, bu təsvirin fotoqrafik eni 8 EV-dən çox olarsa, o zaman heç bir əlavə hərəkət etmədən (yəni sadəcə “əlavə” bitləri atmaqla) standart 8 bitlik formata çevrilmə prosesində məlumatın bir hissəsi qeyd olunur. işığa həssas sensor itəcək.

Dinamik aralıq və fotoqrafiya eni

Sadə dillə desək, dinamik diapazon təsvirin maksimum parlaqlıq dəyərinin onun minimum dəyərinə nisbəti kimi müəyyən edilir. Klassik fotoqrafiyada ənənəvi olaraq fotoqrafiya genişliyi termini istifadə olunur ki, bu da mahiyyətcə eyni şeyi ifadə edir.

Dinamik diapazonun eni nisbət kimi ifadə edilə bilər (məsələn, 1000:1, 2500:1 və s.), lakin çox vaxt bu, loqarifmik miqyasda aparılır. Bu halda, maksimum parlaqlığın minimum dəyərinə nisbətinin onluq loqarifminin dəyəri hesablanır və nömrədən sonra baş hərf D (İngilis sıxlığından? - sıxlıq) və ya daha az tez-tez? - OD abbreviaturası (ingilis dilindən optik sıxlıq? - optik sıxlıq) yerləşdirilir. Məsələn, maksimum parlaqlıq dəyərinin cihazın minimum dəyərinə nisbəti 1000:1 olarsa, dinamik diapazon 3.0 D-ə bərabər olacaqdır:

Fotoqrafik eni ölçmək üçün ənənəvi olaraq qısaldılmış EV (ekspozisiya dəyərləri; peşəkarlar onları tez-tez "dayanacaqlar" və ya "addımlar" adlandırırlar) ekspozisiya vahidləri adlanır. Məhz bu vahidlərdə ekspozisiya kompensasiyası dəyəri adətən kamera parametrlərində təyin olunur. Fotoqrafik enlik dəyərinin 1 EV artırılması maksimum və minimum parlaqlıq səviyyələri arasındakı fərqin ikiqat artmasına bərabərdir. Beləliklə, EV şkalası da loqarifmikdir, lakin bu halda ədədi dəyərləri hesablamaq üçün əsas 2 loqarifmindən istifadə edilir.Məsələn, əgər cihaz maksimumdan minimuma parlaqlıq nisbəti 256:1 olan şəkilləri çəkə bilirsə, onda onun fotoqrafiya eni 8 EV olacaq:

Sıxılma ağlabatan bir kompromisdir

Ən çox təsirli yoldur Kameranın işığa həssas sensoru tərəfindən qeydə alınan təsvir məlumatının tam həcmini qorumaq üçün şəkilləri RAW formatında yazmaq mümkündür. Bununla belə, bütün kameralar belə bir funksiyaya malik deyil və hər bir həvəskar fotoqraf seçmənin zəhmətli işi ilə məşğul olmağa hazır deyil. fərdi parametrlərçəkilən hər bir fotoşəkil üçün.

Kamera daxilində 8 bitlik JPEG formatına çevrilmiş yüksək kontrastlı təsvirlərin detallarını itirmə ehtimalını azaltmaq üçün bir çox istehsalçının cihazları (yalnız yığcam olanlar deyil, həm də SLR olanlar) təqdim edilmişdir. xüsusi funksiyalar, istifadəçi müdaxiləsi olmadan yadda saxlanılan şəkillərin dinamik diapazonunu sıxmağa imkan verir. Ümumi kontrastı azaltmaqla və orijinal təsvirdəki məlumatın kiçik bir hissəsini itirməklə, bu cür həllər cihazın işığa həssas sensoru tərəfindən 8 bitlik JPEG formatında qeydə alınan işıqlandırma və kölgələrdə, hətta dinamik diapazonda belə, detalları qorumağa imkan verir. Orijinal görüntünün 8 EV-dən daha geniş olduğu ortaya çıxdı.

Bu sahənin inkişafında qabaqcıllardan biri HP şirkəti idi. 2003-cü ildə buraxılmış HP Photosmart 945 rəqəmsal kamerası dünyanın ilk HP Adaptiv İşıqlandırma texnologiyasına malikdir, o, fotoşəkillərin qaranlıq yerlərində aşağı işıq səviyyələrini avtomatik kompensasiya edir və beləliklə, həddindən artıq ifşa riski olmadan kölgə detallarını qoruyur (bu, yüksək foto çəkərkən çox vacibdir). kontrast səhnələri). HP Adaptiv İşıqlandırma alqoritmi ingilis alimi Edvin Lend tərəfindən insanın vizual qavrayışının RETINEX nəzəriyyəsində müəyyən edilmiş prinsiplərə əsaslanır.

HP Adaptiv İşıqlandırma menyusu

Adaptiv İşıqlandırma necə işləyir? Şəklin 12 bitlik şəklini aldıqdan sonra ondan köməkçi monoxrom təsvir çıxarılır ki, bu da əslində şüalanma xəritəsidir. Təsviri emal edərkən, bu kart kifayət qədər mürəkkəb rəqəmsal filtrin təsvirə təsir dərəcəsini tənzimləməyə imkan verən maska ​​kimi istifadə olunur. Beləliklə, xəritənin ən qaranlıq nöqtələrinə uyğun gələn ərazilərdə gələcək təsvirin təsvirinə təsir minimaldır və əksinə. Bu yanaşma, bu sahələri seçici şəkildə işıqlandırmaq və müvafiq olaraq, yaranan təsvirin ümumi kontrastını azaltmaqla kölgə detallarını aşkar etməyə imkan verir.

Qeyd etmək lazımdır ki, Adaptiv İşıqlandırma işə salındıqda, çəkilmiş şəkil bitmiş təsvir fayla yazılmazdan əvvəl yuxarıda təsvir edilən qaydada işlənir. Təsvir edilən bütün əməliyyatlar avtomatik həyata keçirilir və istifadəçi kamera menyusunda yalnız iki Adaptiv İşıqlandırma iş rejimindən (aşağı və ya yüksək ekspozisiya) birini seçə və ya bu funksiyanı söndürə bilər.

Ümumiyyətlə, müasir rəqəmsal kameraların bir çox spesifik funksiyaları (əvvəlki məqalədə müzakirə olunan üz tanıma sistemləri də daxil olmaqla) ilkin olaraq hərbi müştərilər üçün həyata keçirilən tədqiqat işinin bir növ əlavə məhsulu və ya çevrilmə məhsuludur. Şəkil dinamik diapazonunun optimallaşdırılması funksiyalarına gəldikdə, bu cür həllərin ən tanınmış təminatçılarından biri Apical-dır. Onun əməkdaşları tərəfindən yaradılmış alqoritmlər, xüsusən, bir sıra Olympus rəqəmsal kamera modellərində həyata keçirilən SAT (Kölgə Tənzimləmə Texnologiyası) funksiyasının işinin əsasını təşkil edir. Qısaca olaraq, SAT funksiyasının işini belə təsvir etmək olar: təsvirin orijinal şəklinə əsasən, ən qaranlıq sahələrə uyğun maska ​​yaradılır və sonra bu sahələr üçün ekspozisiya dəyəri avtomatik olaraq düzəldilir.

Sony həmçinin Apical-ın inkişaflarından istifadə etmək üçün lisenziya aldı. Cyber-shot seriyasındakı və alfa seriyasındakı DSLR kameralarındakı yığcam kameraların bir çox modeli Dinamik Aralığı Optimizer (DRO) adlanan funksiyanı həyata keçirir.

HP Photosmart R927 ilə çəkilmiş fotoşəkillər (yuxarı)
və aktivləşdirilmiş Adaptiv İşıqlandırma funksiyası

DRO aktivləşdirildikdə, təsvirin ilkin emalı zamanı (yəni hazır JPEG faylını qeyd etməzdən əvvəl) şəkil korreksiyası həyata keçirilir. Əsas versiyada DRO iki mərhələli parametrə malikdir (menyuda standart və ya inkişaf etmiş iş rejimini seçə bilərsiniz). Standart rejimi seçdiyiniz zaman, ekspozisiya səviyyələri fotoşəkilin təsvir analizi əsasında tənzimlənir və sonra ümumi balansı bərabərləşdirmək üçün şəkilə ton əyrisi tətbiq edilir. Qabaqcıl rejim həm kölgələrdə, həm də işıqlandırmalarda düzəliş etməyə imkan verən daha mürəkkəb alqoritmdən istifadə edir.

Sony tərtibatçıları daim DRO alqoritmini təkmilləşdirmək üzərində işləyirlər. Məsələn, a700 SLR kamerasında təkmil DRO rejimi aktivləşdirildikdə, beş düzəliş variantından birini seçmək mümkündür. Bundan əlavə, müxtəlif DRO parametrləri ilə eyni anda bir təsvirin üç versiyasını (bir növ bracketing) saxlamaq mümkündür.

Bir çox Nikon rəqəmsal kamera modellərində Apical alqoritmlərinə əsaslanan D-Lighting funksiyası var. Düzdür, yuxarıda təsvir edilən həllərdən fərqli olaraq, D-Lighting, şəklin digər sahələrini dəyişməz saxlamaqla, kölgələri daha yüngül etməyə imkan verən tonal əyri istifadə edərək əvvəllər saxlanmış şəkilləri emal etmək üçün bir filtr kimi həyata keçirilir. Lakin bu halda hazır 8 bitlik təsvirlər işləndiyindən (və daha yüksək bit dərinliyinə və müvafiq olaraq daha geniş dinamik diapazona malik olan orijinal çərçivə şəkli deyil) D-Lighting-in imkanları çox məhduddur. İstifadəçi təsviri qrafik redaktorda emal etməklə eyni nəticəni əldə edə bilər.

Böyüdülmüş fraqmentləri müqayisə edərkən aydın görünür ki, orijinal təsvirin qaranlıq sahələri (solda)
Adaptiv İşıqlandırma funksiyası işə salındıqda onlar yüngülləşdi

Digər prinsiplərə əsaslanan bir sıra həllər də var. Beləliklə, Panasonic-dən Lumix ailəsinin bir çox kameraları (xüsusən, DMC-FX35, DMC-TZ4, DMC-TZ5, DMC-FS20, DMC-FZ18 və s.) işığın tanınması funksiyasını (Intelligent Exposure) həyata keçirir. iA ağıllı avtomatik atəş idarəetmə sisteminin tərkib hissəsidir. Ağıllı Ekspozisiya funksiyası kadr təsvirinin avtomatik təhlilinə və kölgələrdə detalların itməsinin qarşısını almaq üçün təsvirin qaranlıq sahələrinin korreksiyasına, eləcə də (zəruri hallarda) yüksək kontrastlı səhnələrin dinamik diapazonunun sıxılmasına əsaslanır.

Bəzi hallarda, dinamik diapazonun optimallaşdırılması funksiyası yalnız orijinal görüntünün işlənməsi üçün müəyyən əməliyyatları deyil, həm də çəkiliş parametrlərinin düzəldilməsini əhatə edir. Məsələn, Fujifilm rəqəmsal kameralarının yeni modelləri (xüsusən, FinePix S100FS) dinamik diapazonu (Geniş Dynamic Range, WDR) genişləndirmək funksiyasını həyata keçirir, bu, tərtibatçıların fikrincə, fotoqrafiya enini bir və ya artırmağa imkan verir. iki addım (parametrlər terminologiyasında - 200 və 400%).

WDR aktivləşdirildikdə, kamera -1 və ya -2 EV (seçilmiş parametrdən asılı olaraq) ekspozisiya kompensasiyası ilə fotoşəkillər çəkir. Beləliklə, çərçivənin təsviri az ifşa olunur - bu, vurğulanan detallar haqqında maksimum məlumatı qorumaq üçün lazımdır. Sonra ortaya çıxan şəkil, ümumi balansı bərabərləşdirməyə və qara səviyyəsini tənzimləməyə imkan verən bir ton əyrisindən istifadə edərək işlənir. Sonra şəkil 8 bitlik formata çevrilir və JPEG faylı kimi qeyd olunur.

Dinamik diapazonun sıxılması daha çox təfərrüatı qoruyur
işıqlarda və kölgələrdə, lakin bu cür məruz qalmanın qaçılmaz nəticəsidir
ümumi kontrastın azalmasıdır. Aşağıdakı şəkildə
lakin buludların teksturası daha yaxşı inkişaf etmişdir
aşağı kontrasta görə fotoşəkilin bu versiyası
daha az təbii görünür

Dynamic Range Enlargement adlı oxşar funksiya Pentax-ın bir sıra kompakt və SLR kameralarında (Optio S12, K200D və s.) həyata keçirilir. İstehsalçının sözlərinə görə, Dynamic Range Enlargement funksiyasının istifadəsi işıqlandırma və kölgələrdə detalları itirmədən təsvirlərin fotoqrafik enini 1 EV artırmağa imkan verir.

Vurğulanan ton prioriteti (HTP) adlı oxşar funksiya bir sıra Canon DSLR modellərində (EOS 40D, EOS 450D və s.) həyata keçirilir. İstifadəçi təlimatına əsasən, HTP-nin aktivləşdirilməsi vurğulama təfərrüatını yaxşılaşdırır (xüsusilə, 0-18% boz diapazonda).

Nəticə

Gəlin ümumiləşdirək. Daxili dinamik diapazonun sıxılması yüksək dinamik diapazonlu mənbə şəklini minimal zərərlə 8 bitə çevirməyə imkan verir. JPEG faylı. Şəkilləri RAW formatında saxlamaq seçimi olmadan, Dinamik Aralığın Sıxılma rejimi fotoqraflara yüksək kontrastlı səhnələri çəkərkən kamera potensialından daha tam istifadə etməyə imkan verir.

Əlbəttə ki, dinamik diapazonun sıxılmasının möcüzəvi bir müalicə olmadığını, əksinə bir kompromis olduğunu xatırlamaq lazımdır. İşıqlandırmalarda və/və ya kölgələrdə təfərrüatların qorunması təsvirin qaranlıq yerlərində səs-küyün səviyyəsini artırmaq, kontrastını azaltmaq və hamar ton keçidlərini bir qədər qabalaşdırmaq bahasına başa gəlir.

Hər hansı bir avtomatik funksiya kimi, dinamik diapazonun sıxılma alqoritmi tamamilə hər hansı bir fotoşəkili yaxşılaşdırmağa imkan verən tam universal bir həll deyil. Buna görə də, onu yalnız həqiqətən zəruri hallarda aktivləşdirmək mantiqidir. Məsələn, yaxşı işlənmiş fon ilə silueti çəkmək üçün dinamik diapazonun sıxılma funksiyası söndürülməlidir - əks halda möhtəşəm səhnə ümidsiz şəkildə məhv olacaq.

Bu mövzunu nəzərdən keçirməyimizi yekunlaşdıraraq qeyd etmək lazımdır ki, dinamik diapazonun sıxılma funksiyalarından istifadə bizə kamera sensoru tərəfindən çəkilməyən nəticədə görüntüdəki detalları "çıxarmağa" imkan vermir. Yüksək kontrastlı səhnələri çəkərkən qənaətbəxş nəticələr əldə etmək üçün siz əlavə alətlərdən (məsələn, mənzərələrin fotoşəkli üçün gradient filtrləri) və ya xüsusi üsullardan (məsələn, ekspozisiya mötərizəsi ilə bir neçə kadr çəkmək və sonra Tone Xəritəçəkmə texnologiyasından istifadə edərək onları bir təsvirdə birləşdirmək) istifadə etməlisiniz. ).

Növbəti məqalədə partlayış funksiyasına diqqət yetiriləcək.

Ardı var

Gəlin bir sual üzərində düşünək - niyə səsi artırmalıyıq? Bizim şəraitdə eşidilməyən sakit səsləri eşitmək üçün (məsələn, yüksək səslə qulaq asa bilmirsinizsə, otaqda kənar səs-küy varsa və s.). Yüksək səsləri tək qoyaraq sakit səsləri gücləndirmək mümkündürmü? Belə çıxır ki, mümkündür. Bu texnika dinamik diapazonun sıxılması (DRC) adlanır. Bunu etmək üçün cari səs səviyyəsini daim dəyişdirməlisiniz - sakit səsləri gücləndirin, yüksək səsləri - yox. Həcm dəyişməsinin ən sadə qanunu xəttidir, yəni. Səs səviyyəsi çıxış_yüksəkliyi = k * giriş_yüksəkliyi qanununa uyğun olaraq dəyişir, burada k dinamik diapazonun sıxılma nisbətidir:

Şəkil 18. Dinamik diapazonun sıxılması.

k = 1 olduqda heç bir dəyişiklik edilmir (çıxışın həcmi giriş həcminə bərabərdir). k< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - həcm azalacaq və dinamik diapazon artacaq.

Həcm qrafiklərinə baxaq (k = 1/2: DD sıxılma ikiqatdır):

Şəkil 19. Ucalıq qrafikləri.

Orijinalda gördüyünüz kimi dialoq səviyyəsindən 30 dB aşağıda çox sakit səslər və dialoq səviyyəsindən 30 dB yüksək olan çox yüksək səslər var idi. Bu. dinamik diapazon 60 dB idi. Sıxılmadan sonra yüksək səslər yalnız 15dB yüksəkdir və sakit səslər dialoqdan 15dB aşağıdır (dinamik diapazon indi 30dB-dir). Beləliklə, yüksək səslər əhəmiyyətli dərəcədə sakitləşdi və sakit səslər əhəmiyyətli dərəcədə yüksəldi. Bu vəziyyətdə heç bir daşqın yoxdur!

İndi histoqramlara baxaq:

Şəkil 20. Sıxılma nümunəsi.

Aydın göründüyü kimi, +30dB-ə qədər gücləndirmə ilə histoqramın forması yaxşı saxlanılır, yəni yüksək səslər yaxşı ifadə olunur (sadə gücləndirmə ilə olduğu kimi onlar maksimuma çatmır və kəsilmir) . Bu, sakit səslər yaradır. Histoqram bunu zəif göstərir, lakin fərq qulaqda çox nəzərə çarpır. Bu metodun dezavantajı eyni həcm sıçrayışlarıdır. Bununla belə, onların meydana çıxma mexanizmi kəsmə zamanı baş verən yüksəklik atlamalarından fərqlənir və xarakterləri fərqlidir - onlar əsasən sakit səslər çox güclü gücləndirildikdə (və normal gücləndirmə ilə olduğu kimi yüksək səslər kəsildikdə deyil) görünür. Həddindən artıq sıxılma səviyyəsi səs şəklinin düzləşməsinə səbəb olur - bütün səslər eyni yüksəklik və ifadəsizliyə meyllidir.

Sakit səslərin həddən artıq gücləndirilməsi qeydə alınan səs-küyün eşidilməsinə səbəb ola bilər. Buna görə də, filtr bir az dəyişdirilmiş alqoritmdən istifadə edir ki, səs-küy səviyyəsi daha az yüksəlsin:

Şəkil 21. Səs-küy artırmadan səsin artırılması.

Bunlar. -50dB həcm səviyyəsində ötürmə funksiyası təsirlənir və səs-küy daha az gücləndiriləcək (sarı xətt). Belə bir əyilmə olmadıqda, səs-küy daha yüksək olacaq (boz xətt). Bu sadə modifikasiya hətta çox yüksək sıxılma səviyyələrində (şəkildə 1:5 sıxılma) səs-küyün miqdarını əhəmiyyətli dərəcədə azaldır. Filtrdəki “DRC” səviyyəsi sakit səslər üçün qazanc səviyyəsini təyin edir (-50dB-də), yəni. Şəkildə göstərilən 1/5 sıxılma səviyyəsi filtr parametrlərindəki +40dB səviyyəsinə uyğundur.

Tədqiqatçıların kompüterlər üçün nitq interfeysinin yaradılması problemini yenicə həll etməyə başladığı bir vaxtda onlar tez-tez audio məlumatı kompüterə daxil etməyə və onu kompüterdən çıxarmağa imkan verən öz avadanlıqlarını hazırlamalı olurdular. Bu gün bu cür cihazlar yalnız tarixi maraq doğura bilər, çünki müasir kompüterlər asanlıqla səs adapterləri, mikrofonlar, qulaqlıqlar və dinamiklər kimi audio giriş və çıxış cihazları ilə təchiz edilə bilər.

Bu cihazların daxili strukturunun təfərrüatlarını araşdırmayacağıq, lakin onların necə işlədiyi barədə danışacağıq və nitqin tanınması və sintez sistemləri ilə işləmək üçün audio kompüter cihazlarının seçilməsi üçün bəzi tövsiyələr verəcəyik.

Əvvəlki fəsildə dediyimiz kimi, səs hava vibrasiyasından başqa bir şey deyil, onların tezliyi insanların qəbul etdiyi tezliklər diapazonunda yerləşir. Səslənən tezlik diapazonunun dəqiq sərhədləri insandan insana dəyişə bilər, lakin səs vibrasiyalarının 16-20.000 Hz diapazonunda olduğuna inanılır.

Mikrofonun məqsədi səs titrəyişlərini elektrik vibrasiyalarına çevirməkdir, daha sonra gücləndirilə, müdaxiləni aradan qaldırmaq üçün süzgəcdən keçirilə və audio məlumatların kompüterə daxil edilməsi üçün rəqəmsallaşdırıla bilər.

İş prinsipinə əsasən, ən çox yayılmış mikrofonlar karbon, elektrodinamik, kondensator və elektretə bölünür. Bu mikrofonlardan bəziləri tələb olunur xarici mənbə cərəyan (məsələn, karbon və kondensator), digərləri, səs vibrasiyasının təsiri altında, müstəqil olaraq alternativ elektrik gərginliyi yarada bilirlər (bunlar elektrodinamik və elektret mikrofonlarıdır).

Siz həmçinin mikrofonları təyinatına görə ayıra bilərsiniz. Elə studiya mikrofonları var ki, onları əlində saxlamaq və ya stenddə quraşdırmaq olar, radio mikrofonları var ki, paltara yapışdırmaq olar və s.

Xüsusilə kompüterlər üçün nəzərdə tutulmuş mikrofonlar da var. Belə mikrofonlar adətən masanın səthində yerləşdirilən stenddə quraşdırılır. Kompüter mikrofonları Şəkildə göstərildiyi kimi qulaqlıqlarla birləşdirilə bilər. 2-1.

düyü. 2-1. Mikrofonlu qulaqcıqlar

Nitqin tanınması sistemləri üçün ən uyğun olan müxtəlif mikrofonlar arasından necə seçim etmək olar?

Prinsipcə, kompüterinizin audio adapterinə qoşulmaq şərti ilə hər hansı bir mikrofonla təcrübə edə bilərsiniz. Bununla birlikdə, nitqin tanınması sistemlərinin tərtibatçıları, iş zamanı dinamikin ağzından sabit bir məsafədə olacaq bir mikrofon almağı tövsiyə edirlər.

Mikrofonla ağız arasındakı məsafə dəyişməzsə, o zaman mikrofondan gələn elektrik siqnalının orta səviyyəsi də çox dəyişməyəcək. Bu, müasir nitqin tanınması sistemlərinin işinə müsbət təsir göstərəcək.

Problem nədir?

Bir insan həcmi çox geniş diapazonda dəyişən nitqi uğurla tanıya bilir. İnsan beyni sakit nitqi küçədən keçən avtomobillərin səs-küyü, kənar söhbətlər və musiqi kimi müdaxilələrdən süzə bilir.

Müasir nitqin tanınması sistemlərinə gəlincə, onların bu sahədəki qabiliyyətləri çox arzuolunandır. Mikrofon stolun üstündədirsə, o zaman başınızı çevirəndə və ya bədən mövqeyini dəyişdikdə ağzınızla mikrofon arasındakı məsafə dəyişəcək. Bu, mikrofonun çıxış səviyyəsini dəyişəcək, bu da öz növbəsində nitqin tanınmasının etibarlılığını azaldacaq.

Buna görə də, nitqin tanınması sistemləri ilə işləyərkən, Şəkil 1-də göstərildiyi kimi qulaqlıqlara qoşulmuş mikrofondan istifadə etsəniz, ən yaxşı nəticələr əldə ediləcəkdir. 2-1. Belə mikrofondan istifadə edərkən ağızla mikrofon arasındakı məsafə sabit olacaq.

Biz həmçinin diqqətinizi ona yönəldirik ki, nitqin tanınması sistemləri ilə bütün eksperimentlər ən yaxşı şəkildə gizlilik şəraitində sakit otaqda aparılır. Bu vəziyyətdə müdaxilənin təsiri minimal olacaqdır. Əlbəttə ki, güclü müdaxilə şəraitində işləyə bilən nitqin tanınması sistemini seçmək lazımdırsa, testlər fərqli şəkildə aparılmalıdır. Bununla belə, kitab müəlliflərinin bildiyi kimi, nitqin tanınması sistemlərinin səs-küy toxunulmazlığı hələ də çox, çox aşağıdır.

Mikrofon bizim üçün səs dalğalarını vibrasiyaya çevirir. elektrik cərəyanı. Bu dalğalanmaları osiloskopun ekranında görmək olar, lakin bu bahalı cihazı almaq üçün mağazaya tələsməyin. Səs adapteri ilə təchiz edilmiş adi kompüterdən, məsələn, Sound Blaster adapterindən istifadə edərək bütün osilloqrafik tədqiqatları həyata keçirə bilərik. Bunu necə edəcəyinizi daha sonra sizə xəbər verəcəyik.

Şəkildə. 2-2 oscilloqramı göstərdik səs siqnalı, uzun bir səsin tələffüzü nəticəsində yaranan a. Bu dalğa forması, kitabın bu fəslində daha sonra danışacağımız GoldWave proqramından, həmçinin Sound Blaster audio adapterindən və Şəkil 1-də göstərilənə bənzər mikrofondan istifadə etməklə əldə edilmişdir. 2-1.

düyü. 2-2. Audio siqnal oscillogram

GoldWave proqramı osilloqramı zaman oxu boyunca uzatmağa imkan verir ki, bu da ən kiçik detalları görməyə imkan verir. Şəkildə. 2-3 yuxarıda qeyd olunan a səsinin oscilloqramının uzanmış fraqmentini göstərdik.

düyü. 2-3. Səs siqnalının oscilloqramının fraqmenti

Nəzərə alın ki, mikrofondan gələn giriş siqnalının böyüklüyü vaxtaşırı dəyişir və həm müsbət, həm də mənfi qiymətlər alır.

Əgər giriş siqnalında yalnız bir tezlik mövcud olsaydı (yəni, səs “təmiz” olsaydı), mikrofondan alınan dalğa forması sinus dalğası olardı. Bununla belə, artıq dediyimiz kimi, insanın nitq səslərinin spektri tezliklər toplusundan ibarətdir ki, bunun nəticəsində nitq siqnalının oscilloqramının forması sinusoidaldan uzaqdır.

Zamanla miqyası davamlı dəyişən bir siqnal çağıracağıq analoq siqnal. Bu, mikrofondan gələn siqnaldır. Analoqdan fərqli olaraq, rəqəmsal siqnal zamanla diskret olaraq dəyişən ədədi dəyərlər toplusudur.

Kompüterin səs siqnalını emal etməsi üçün onu analoqdan rəqəmsal formaya çevirmək, yəni ədədi dəyərlər toplusu kimi təqdim etmək lazımdır. Bu proses analoq siqnalın rəqəmləşdirilməsi adlanır.

Audio (və hər hansı bir analoq) siqnalın rəqəmsallaşdırılması adlı xüsusi bir cihaz istifadə edərək həyata keçirilir analoqdan rəqəmə çevirici ADC (analoqdan rəqəmsal çeviriciyə, ADC). Bu cihaz səs adapterinin lövhəsində yerləşir və adi görünüşlü mikrosxemdir.

Analoqdan rəqəmsal çevirici necə işləyir?

O, dövri olaraq giriş siqnalının səviyyəsini ölçür və ölçmə nəticəsinin ədədi dəyərini verir. Bu proses Şəkildə göstərilmişdir. 2-4. Burada boz düzbucaqlılar müəyyən bir sabit vaxt intervalında ölçülən giriş siqnal dəyərlərini göstərir. Belə dəyərlər dəsti giriş analoq siqnalının rəqəmsal təsviridir.

düyü. 2-4. Siqnal amplitüdünün zamana qarşı ölçülməsi

Şəkildə. 2-5 analoqdan rəqəmsal çeviricinin mikrofona qoşulmasını göstərdik. Bu halda, x 1 girişinə analoq siqnal verilir və u 1 -u n çıxışlarından rəqəmsal siqnal çıxarılır.

düyü. 2-5. Analoqdan rəqəmə çevirici

Analoq-rəqəm çeviriciləri iki mühüm parametrlə xarakterizə olunur - çevrilmə tezliyi və giriş siqnalının kvantlaşdırma səviyyələrinin sayı. Bu parametrlərin düzgün seçilməsi analoq siqnalın adekvat rəqəmsal təsvirinə nail olmaq üçün vacibdir.

Rəqəmləşdirmə nəticəsində giriş analoq siqnalında dəyişikliklər haqqında məlumatın itirilməməsi üçün giriş analoq siqnalının amplitüdünü nə qədər tez-tez ölçmək lazımdır?

Cavabın sadə olduğu görünür - giriş siqnalını mümkün qədər tez-tez ölçmək lazımdır. Həqiqətən, analoqdan rəqəmsal çevirici bu cür ölçmələri nə qədər tez-tez edirsə, giriş analoq siqnalının amplitüdündəki ən kiçik dəyişiklikləri bir o qədər yaxşı izləyə biləcəkdir.

Bununla belə, həddindən artıq tez-tez ölçmələr rəqəmsal məlumat axınının əsassız artmasına və siqnalın işlənməsi zamanı kompüter resurslarının israfına səbəb ola bilər.

Xoşbəxtlikdən, düzgün çevirmə tezliyini (nümunə alma tezliyini) seçmək olduqca sadədir. Bunun üçün rəqəmsal siqnal emalı sahəsində mütəxəssislərə məlum olan Kotelnikovun teoreminə müraciət etmək kifayətdir. Teoremdə deyilir ki, çevrilmə tezliyi çevrilmiş siqnalın spektrinin maksimum tezliyindən iki dəfə çox olmalıdır. Buna görə də, tezliyi 16-20.000 Hz diapazonunda olan səs siqnalının keyfiyyətini itirmədən rəqəmsallaşdırmaq üçün 40.000 Hz-dən az olmayan bir çevirmə tezliyini seçməlisiniz.

Bununla belə, peşəkar audio avadanlığında çevrilmə tezliyinin göstərilən dəyərdən bir neçə dəfə yüksək seçildiyini unutmayın. Bu çox nail olmaq üçün edilir Yüksək keyfiyyət rəqəmsal səs. Bu keyfiyyət nitqin tanınması sistemləri üçün uyğun deyil, ona görə də diqqətinizi bu seçimə yönəltməyəcəyik.

İnsan nitqinin səsini rəqəmləşdirmək üçün hansı çevrilmə tezliyinə ehtiyac var?

İnsan nitqinin səsləri 300-4000 Hz tezlik diapazonunda olduğundan, minimum tələb olunan çevrilmə tezliyi 8000 Hz-dir. Bununla belə, çoxlu kompüter proqramları Nitqin tanınması adi audio adapterlər üçün 44.000 Hz standart çevrilmə tezliyindən istifadə edir. Bir tərəfdən belə çevrilmə tezliyi rəqəmsal məlumat axınının həddindən artıq artmasına səbəb olmur, digər tərəfdən isə nitqin kifayət qədər keyfiyyətlə rəqəmsallaşdırılmasını təmin edir.

Hələ məktəbdə bizə öyrədirdilər ki, hər hansı ölçmə zamanı səhvlər yaranır, onları tamamilə aradan qaldırmaq mümkün deyil. Bu cür səhvlər ölçmə vasitələrinin məhdud həlli, həmçinin ölçmə prosesinin özünün ölçülmüş dəyərə bəzi dəyişikliklər edə bilməsi səbəbindən yaranır.

Analoqdan rəqəmə çevirici giriş analoq siqnalını məhdud tutumlu ədədlər axını kimi təmsil edir. Adi audio adapterlər giriş siqnalının amplitudasını 216 = 65536 müxtəlif dəyər kimi təmsil edə bilən 16 bitlik ADC bloklarından ibarətdir. Yüksək səviyyəli audio avadanlığındakı ADC cihazları 20 bit ola bilər ki, bu da audio siqnalın amplitudasının daha yüksək dəqiqliyini təmin edir.

Adi səs adapterləri ilə təchiz edilmiş adi kompüterlər üçün müasir nitqin tanınması sistemləri və proqramları yaradılmışdır. Buna görə də, nitqin tanınması ilə təcrübələr aparmaq üçün peşəkar audio adapter almaq lazım deyil. Sound Blaster kimi bir adapter nitqin sonrakı tanınması üçün rəqəmsallaşdırmaq üçün olduqca uyğundur.

Faydalı siqnalla yanaşı, adətən mikrofona müxtəlif səslər daxil olur - küçədən səs-küy, külək səsi, kənar söhbətlər və s. Səs-küy nitqin tanınması sistemlərinin işinə mənfi təsir göstərir, ona görə də onunla mübarizə aparmaq lazımdır. Artıq yollardan birini qeyd etdik - bugünkü nitq tanıma sistemləri ən yaxşı şəkildə sakit otaqda, kompüterlə tək istifadə olunur.

Ancaq ideal şərait yaratmaq həmişə mümkün deyil, buna görə də müdaxilədən xilas olmaq üçün xüsusi üsullardan istifadə etmək lazımdır. Səs-küy səviyyəsini azaltmaq üçün mikrofonlar və faydalı məlumat daşımayan analoq siqnalın spektrindən tezlikləri çıxaran xüsusi filtrlər layihələndirilərkən xüsusi fəndlərdən istifadə olunur. Bundan əlavə, giriş siqnal səviyyələrinin dinamik diapazonunun sıxılması kimi bir texnika istifadə olunur.

Bütün bunlar haqqında sıra ilə danışaq.

Tezlik filtri analoq siqnalın tezlik spektrini çevirən cihazdır. Bu halda, çevrilmə prosesi zamanı müəyyən tezliklərin vibrasiyası buraxılır (və ya udulur).

Bu cihazı bir giriş və bir çıxış olan bir növ qara qutu kimi təsəvvür edə bilərsiniz. Bizim vəziyyətimizlə əlaqədar olaraq, tezlik filtrinin girişinə mikrofon, çıxışa isə analoqdan rəqəmsal çevirici qoşulacaq.

Müxtəlif tezlik filtrləri var:

· aşağı keçid filtrləri;

yüksək keçid filtrləri;

· ötürücü zolaqlı filtrlər;

· band-stop filtrləri.

Aşağı keçid filtrləri(aşağı keçid filtri) filtr parametrindən asılı olaraq dəyərləri müəyyən bir eşik tezliyindən aşağı olan bütün tezlikləri giriş siqnalının spektrindən çıxarın.

Səs siqnalları 16-20.000 Hz diapazonunda olduğundan, 16 Hz-dən aşağı olan bütün tezliklər səs keyfiyyətini aşağı salmadan kəsilə bilər. Nitqin tanınması üçün 300-4000 Hz tezlik diapazonu vacibdir, ona görə də 300 Hz-dən aşağı tezliklər kəsilə bilər. Bu halda, tezlik spektri 300 Hz-dən aşağı olan bütün müdaxilələr giriş siqnalından kəsiləcək və nitqin tanınması prosesinə mane olmayacaq.

Eynilə, yüksək keçid filtrləri(yüksək keçid filtri) müəyyən bir eşik tezlikdən yuxarı olan bütün tezlikləri giriş siqnalının spektrindən kəsir.

İnsanlar 20.000 Hz və daha yüksək tezlikli səsləri eşidə bilmirlər, buna görə də səs keyfiyyətində nəzərəçarpacaq dərəcədə pisləşmə olmadan spektrdən kəsilə bilər. Nitqin tanınmasına gəldikdə, burada 4000 Hz-dən yuxarı olan bütün tezlikləri kəsə bilərsiniz, bu da yüksək tezlikli müdaxilənin səviyyəsinin əhəmiyyətli dərəcədə azalmasına səbəb olacaqdır.

Bant keçid filtri(band-pass filter) aşağı və yüksək keçirici filtrin birləşməsi kimi düşünülə bilər. Belə bir filtr sözdə aşağıda göstərilən bütün tezlikləri gecikdirir aşağı keçid tezliyi, həm də yuxarıda yuxarı keçid tezliyi.

Beləliklə, keçid diapazonu filtri nitqin tanınması sistemi üçün əlverişlidir, bu da 300-4000 Hz diapazonunda tezliklərdən başqa bütün tezlikləri gecikdirir.

Band-stop filtrlərinə gəldikdə, onlar giriş siqnalının spektrindən müəyyən bir diapazonda yerləşən bütün tezlikləri kəsməyə imkan verir. Belə bir filtr, məsələn, siqnal spektrinin müəyyən bir fasiləsiz hissəsini tutan müdaxilənin qarşısını almaq üçün əlverişlidir.

Şəkildə. 2-6 keçid bandpass filtrinin əlaqəsini göstərdik.

düyü. 2-6. Rəqəmləşdirmədən əvvəl səs siqnalının filtrlənməsi

Qeyd etmək lazımdır ki, kompüterdə quraşdırılmış adi səs adapterlərinə rəqəmsallaşdırmadan əvvəl analoq siqnalın keçdiyi bir bant keçid filtri daxildir. Belə bir filtrin keçid diapazonu adətən səs siqnallarının diapazonuna, yəni 16-20.000 Hz-ə uyğundur (müxtəlif audio adapterlərdə yuxarı və aşağı tezliklərin dəyərləri kiçik məhdudiyyətlər daxilində dəyişə bilər).

İnsan nitqinin spektrinin ən informativ hissəsinə uyğun gələn 300-4000 Hz daha dar bant genişliyinə necə nail olmaq olar?

Əlbəttə ki, elektron avadanlıqların dizaynına meyliniz varsa, əməliyyat gücləndirici çipindən, rezistorlardan və kondansatörlərdən öz filtrinizi edə bilərsiniz. Nitqin tanınması sistemlərinin ilk yaradıcıları təxminən bunu etdilər.

Lakin sənaye sistemləri Nitqin tanınması sistemləri standart kompüter avadanlığında işlək olmalıdır, ona görə də burada xüsusi bandpass filtrinin hazırlanması marşrutu uyğun deyil.

Bunun əvəzinə, in müasir sistemlər nitq emal sözdə istifadə edir rəqəmsal tezlik filtrləri, proqram təminatında həyata keçirilir. Bu, sonra mümkün oldu CPU Kompüter kifayət qədər güclü hala gəldi.

Proqram təminatında tətbiq olunan rəqəmsal tezlik filtri giriş rəqəmsal siqnalını çıxış rəqəmsal siqnalına çevirir. Dönüşüm prosesi zamanı proqram analoqdan rəqəmsal çeviricidən gələn siqnal amplitudasının ədədi dəyərlərinin axınını xüsusi şəkildə emal edir. Transformasiyanın nəticəsi də rəqəmlər axını olacaq, lakin bu axın artıq süzülmüş siqnala uyğun olacaq.

Analoqdan rəqəmsal çevirici haqqında danışarkən biz kvantlaşdırma səviyyələrinin sayı kimi vacib bir xüsusiyyəti qeyd etdik. Səs adapterində 16 bitlik analoqdan rəqəmə çevirici quraşdırılıbsa, rəqəmsallaşdırmadan sonra audio siqnal səviyyələri 216 = 65536 müxtəlif qiymətlərlə təmsil oluna bilər.

Kvantlaşdırma səviyyəsi azdırsa, sözdə kvantlaşdırma səs-küyü. Bu səs-küyü azaltmaq üçün yüksək keyfiyyətli audio rəqəmsallaşdırma sistemləri mövcud kvantlaşdırma səviyyələrinin maksimum sayına malik analoqdan rəqəmə çeviricilərdən istifadə etməlidir.

Bununla belə, rəqəmsal səsyazma sistemlərində istifadə olunan səs siqnalının keyfiyyətinə kvantlaşdırma səs-küyünün təsirini azaltmaq üçün başqa bir texnika var. Bu texnikadan istifadə edərkən, rəqəmsallaşdırmadan əvvəl siqnal qeyri-xətti gücləndiricidən keçir, aşağı siqnal amplitudası olan siqnalları vurğulayır. Belə bir cihaz gücləndirir zəif siqnallar güclüdən güclüdür.

Bu, Şəkil 1-də göstərilən giriş siqnalının amplitudasına qarşı çıxış siqnalının amplitüdünün qrafiki ilə təsvir edilmişdir. 2-7.

düyü. 2-7. Rəqəmsallaşdırmadan əvvəl qeyri-xətti gücləndirmə

Rəqəmləşdirilmiş səsin yenidən analoqa çevrilməsi mərhələsində (bu addımı bu fəsildə daha sonra nəzərdən keçirəcəyik) analoq siqnal dinamiklərə verilməzdən əvvəl yenidən qeyri-xətti gücləndiricidən keçir. Bu dəfə yüksək amplitudalı siqnalları vurğulayan və rəqəmsallaşdırma zamanı istifadə edilənə tərs bir ötürmə xarakteristikasına (çıxış siqnalının amplitüdünün giriş siqnalının amplitüdündən asılılığı) malik olan fərqli gücləndirici istifadə olunur.

Bütün bunlar nitqin tanınması sistemlərinin yaradıcılarına necə kömək edə bilər?

Bir şəxs, məlum olduğu kimi, sakit bir pıçıltı və ya kifayət qədər yüksək səslə danışılan nitqi çox yaxşı tanıyır. Deyə bilərik ki, bir şəxs üçün uğurla tanınan nitqin səs səviyyəsinin dinamik diapazonu kifayət qədər genişdir.

Bugünkü kompüter sistemləri nitqin tanınması, təəssüf ki, bununla hələ öyünə bilməz. Bununla birlikdə, göstərilən dinamik diapazonu bir az genişləndirmək üçün rəqəmsallaşdırmadan əvvəl mikrofondan siqnalı ötürmə xarakteristikası Şəkil 1-də göstərilən qeyri-xətti gücləndiricidən keçirə bilərsiniz. 2-7. Bu, zəif siqnalları rəqəmləşdirərkən kvantlaşdırma səs-küy səviyyəsini azaldacaq.

Nitqin tanınması sistemlərinin tərtibatçıları yenə də ilk növbədə kommersiya məqsədli istehsal edilən səs adapterlərinə diqqət yetirməyə məcbur olurlar. Onlar yuxarıda təsvir edilən qeyri-xətti siqnal çevrilməsini təmin etmir.

Bununla belə, rəqəmsal siqnalı nitqin tanınması moduluna ötürməzdən əvvəl onu çevirən qeyri-xətti gücləndiricinin proqram təminatı ekvivalentini yaratmaq mümkündür. Baxmayaraq ki, belə bir proqram gücləndiricisi kvantlaşdırma səs-küyünü azalda bilməyəcək, ondan ən çox nitq məlumatını daşıyan siqnal səviyyələrini vurğulamaq üçün istifadə edilə bilər. Məsələn, siz zəif siqnalların amplitüdünü azalda bilərsiniz, beləliklə səs-küy siqnalını aradan qaldıra bilərsiniz.

Sıxılma, səs istehsalında ən çox əfsanəvi mövzulardan biridir. Deyirlər ki, Bethoven onunla qonşunun uşaqlarını belə qorxudur:(

Yaxşı, əslində sıxılmadan istifadə təhrifdən istifadə etməkdən daha çətin deyil, əsas odur ki, onun iş prinsipini başa düşək və yaxşı nəzarət. İndi birlikdə görəcəyimiz budur.

Audio sıxılma nədir

Hazırlıqdan əvvəl anlamaq lazım olan ilk şey sıxılmadır. dinamik səs diapazonu ilə işləmək. Və, öz növbəsində, ən yüksək və ən səssiz siqnal səviyyələri arasındakı fərqdən başqa bir şey deyil:

Belə ki, sıxılma dinamik diapazonun sıxılmasıdır. Bəli, Sadəcə dinamik diapazonun sıxılması və ya başqa sözlə siqnalın yüksək səsli hissələrinin səviyyəsinin aşağı salınması və səssiz hissələrin həcminin artırılması. Artıq yox.

Siz kifayət qədər əsaslı şəkildə təəccüblənə bilərsiniz ki, niyə belə bir şırınga bağlıdır? Niyə hamı düzgün kompressor parametrləri üçün reseptlər haqqında danışır, amma heç kim onları paylaşmır? Niyə, baxmayaraq ki çox sayda gözəl plaginlər, bir çox studiyalar hələ də bahalı, nadir kompressor modellərindən istifadə edirlər? Niyə bəzi istehsalçılar kompressorları həddindən artıq parametrlərdə istifadə edirlər, digərləri isə ümumiyyətlə istifadə etmirlər? Və onlardan hansı sonda haqlıdır?

Problemlər sıxılma yolu ilə həll edilir

Bu cür sualların cavabları səslə işləməkdə sıxılmanın rolunu anlamaq müstəvisindədir. Və imkan verir:

  1. Hücumu vurğulayın səs, onu daha aydın etmək;
  2. Alətlərin ayrı-ayrı hissələrini qarışığa “yerləşdirmək”, onlara güc və "çəki" əlavə etmək;
  3. Alət qruplarını və ya bütöv bir qarışığı daha uyğunlaşdırın, belə bir tək monolit;
  4. Alətlər arasındakı ziddiyyətləri həll edin yan zəncirdən istifadə etməklə ;
  5. Vokalçı və ya musiqiçilərin səhvlərini düzəldin, onların dinamikasının bərabərləşdirilməsi;
  6. Müəyyən bir parametr ilə bədii effekt kimi çıxış edir.

Gördüyünüz kimi, bu, məsələn, melodiyalar yaratmaqdan və ya maraqlı tembrlər yaratmaqdan daha əhəmiyyətli bir yaradıcılıq prosesidir. Üstəlik, yuxarıda göstərilən problemlərdən hər hansı birini 4 əsas parametrdən istifadə etməklə həll etmək olar.

Kompressorun əsas parametrləri

Kompressorların çox sayda proqram və aparat modellərinə baxmayaraq, sıxılmanın bütün "sehrləri" o zaman baş verir. düzgün parametr