فشرده سازی در عمل. فشرده سازی دینامیک محدوده دینامیکی فشرده یا استاندارد

این گروه از روش ها بر این واقعیت استوار است که سیگنال های ارسالی تحت تبدیل دامنه غیرخطی قرار می گیرند و در قسمت های ارسال کننده و گیرنده غیرخطی ها متقابل هستند. به عنوان مثال، اگر تابع غیر خطی Öu در فرستنده استفاده شود، در گیرنده از u 2 استفاده می شود. استفاده مداوم از توابع متقابل تضمین می کند که تبدیل کلی خطی باقی می ماند.

ایده روش‌های فشرده‌سازی غیرخطی داده این است که فرستنده می‌تواند با همان دامنه سیگنال‌های خروجی، دامنه بزرگ‌تری از تغییرات در پارامتر ارسالی (یعنی محدوده دینامیکی بزرگ‌تر) را منتقل کند. محدوده دینامیکی- این نسبت بزرگترین دامنه مجاز سیگنال به کوچکترین است که در واحدهای نسبی یا دسی بل بیان می شود:

; (2.17)
. (2.18)

تمایل طبیعی برای افزایش دامنه دینامیکی با کاهش U min به دلیل حساسیت تجهیزات و تأثیر فزاینده تداخل و خود نویز محدود می شود.

اغلب، فشرده سازی محدوده دینامیکی با استفاده از یک جفت تابع متقابل لگاریتم و تقویت انجام می شود. اولین عملیات تغییر دامنه نامیده می شود فشرده سازی(با فشرده سازی)، دوم - گسترش(کشش). انتخاب این توابع خاص با بزرگترین قابلیت فشرده سازی آنها مرتبط است.

در عین حال، این روش ها دارای معایبی نیز هستند. اولین مورد این است که لگاریتم یک عدد کوچک منفی و در حد است:

یعنی حساسیت بسیار غیر خطی است.

برای کاهش این کاستی ها، هر دو تابع با جابجایی و تقریب اصلاح می شوند. به عنوان مثال، برای کانال های تلفن، تابع تقریبی به شکل (نوع A) است:

با A=87.6. بهره حاصل از فشرده سازی 24 دسی بل است.

فشرده‌سازی داده‌ها با استفاده از روش‌های غیرخطی به روش آنالوگ با خطاهای بزرگ اجرا می‌شود. کاربرد رسانه دیجیتالمی تواند به طور قابل توجهی دقت یا عملکرد تبدیل را بهبود بخشد. در عین حال استفاده مستقیم از وجوه فناوری رایانه(یعنی محاسبه مستقیم لگاریتم ها و توان ها) به دلیل عملکرد پایین و انباشته شدن خطاهای محاسباتی بهترین نتیجه را نخواهد داد.

با توجه به محدودیت های دقت، فشرده سازی داده ها با فشرده سازی در موارد غیر بحرانی، به عنوان مثال، برای انتقال گفتار از طریق کانال های تلفن و رادیو استفاده می شود.

کدنویسی کارآمد

کدهای کارآمد توسط K. Shannon، Fano و Huffman ارائه شد. ماهیت کدها این است که آنها ناهموار هستند، یعنی دارای تعداد بیت های نامساوی هستند و طول کد با احتمال وقوع آن نسبت معکوس دارد. یکی دیگر از ویژگی های عالی کدهای کارآمد این است که به جداکننده نیاز ندارند، به عنوان مثال. شخصیت های خاص، جداسازی ترکیب کدهای مجاور. این با پیروی از یک قانون ساده به دست می آید: کدهای کوتاهتر آغاز کدهای طولانی تر نیستند. در این حالت، جریان پیوسته بیت‌ها به‌طور منحصربه‌فرد رمزگشایی می‌شود، زیرا رمزگشا ابتدا کلمات رمز کوتاه‌تر را تشخیص می‌دهد. کدهای کارآمد مدت‌هاست که کاملاً آکادمیک بوده‌اند، اما اخیراً با موفقیت در ایجاد پایگاه‌های اطلاعاتی و همچنین در فشرده‌سازی اطلاعات در مودم‌های مدرن و بایگانی‌های نرم‌افزاری مورد استفاده قرار گرفته‌اند.

به دلیل ناهمواری، میانگین طول کد معرفی شده است. طول متوسط ​​- انتظار ریاضی از طول کد:

علاوه بر این، l av از بالا به H(x) تمایل دارد (یعنی l av > H(x)).

تحقق شرط (2.23) با افزایش N قوی تر می شود.

دو نوع کد کارآمد وجود دارد: شانون-فانو و هافمن. بیایید نحوه به دست آوردن آنها را با استفاده از یک مثال بررسی کنیم. بیایید فرض کنیم که احتمالات نمادها در دنباله مقادیر داده شده در جدول 2.1 را دارند.

جدول 2.1.

احتمالات نماد

ن
p i 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

نمادها رتبه بندی می شوند، یعنی در یک ردیف به ترتیب احتمالات نزولی ارائه می شوند. پس از این، با استفاده از روش شانون-فانو، روش زیر به صورت دوره ای تکرار می شود: کل گروه رویدادها به دو زیر گروه با احتمالات کل یکسان (یا تقریباً یکسان) تقسیم می شود. این روند تا زمانی ادامه می یابد که یک عنصر در زیرگروه بعدی باقی بماند، پس از آن این عنصر حذف می شود و اقدامات مشخص شده با موارد باقی مانده ادامه می یابد. این اتفاق می افتد تا زمانی که تنها یک عنصر در دو زیر گروه آخر باقی بماند. بیایید به مثال خود ادامه دهیم که در جدول 2.2 خلاصه شده است.

جدول 2.2.

کد نویسی شانون-فانو

ن P i
4 0.3 من
0.2 من II
6 0.15 من من
0.1 II
1 0.1 من من
9 0.05 II II
5 0.05 II من
7 0.03 II II من
8 0.02 II

همانطور که از جدول 2.2 مشاهده می شود، نماد اول با احتمال p 4 = 0.3 در دو رویه برای تقسیم به گروه ها شرکت کرد و هر دو بار به گروه شماره I ختم شد. مطابق با این، با یک کد دو رقمی II کدگذاری شده است. عنصر دوم در مرحله اول پارتیشن به گروه I و در مرحله دوم به گروه II تعلق داشت. بنابراین کد آن 10 است. کدهای نمادهای باقیمانده نیاز به توضیحات اضافی ندارند.

به طور معمول، کدهای غیر یکنواخت به عنوان درخت کد نشان داده می شوند. درخت کد نموداری است که ترکیب کدهای مجاز را نشان می دهد. جهت لبه های این نمودار از پیش تنظیم شده است، همانطور که در شکل 2.11 نشان داده شده است (انتخاب جهت ها دلخواه است).

آنها نمودار را به صورت زیر هدایت می کنند: یک مسیر برای نماد انتخاب شده ایجاد کنید. تعداد بیت های آن برابر با تعداد یال های مسیر و مقدار هر بیت برابر با جهت یال مربوطه است. مسیر از نقطه شروع ترسیم شده است (در نقاشی با حرف A مشخص شده است). به عنوان مثال، مسیر رسیدن به رأس 5 از پنج یال تشکیل شده است که همه آنها به جز آخرین آنها جهت صفر دارند. کد 00001 را دریافت می کنیم.

بیایید آنتروپی و میانگین طول کلمه را برای این مثال محاسبه کنیم.

H(x) = -(0.3 log 0.3 + 0.2 log 0.2 + 2 0.1 log 0.1+ 2 0.05 log 0.05+

0.03 log 0.03 + 0.02 log 0.02) = 2.23 بیت

میانگین l = 0.3 2 + 0.2 2 + 0.15 3 + 0.1 3 + 0.1 4 + 0.05 5 + 0.05 4+

0.03 6 + 0.02 6 = 2.9 .

همانطور که می بینید، میانگین طول کلمه نزدیک به آنتروپی است.

کدهای هافمن با استفاده از الگوریتم متفاوتی ساخته می شوند. فرآیند کدگذاری شامل دو مرحله است. در مرحله اول، فشرده سازی تک حروف الفبا به ترتیب انجام می شود. فشرده سازی یک بار - جایگزینی دو نماد آخر (با کمترین احتمال) با یک، با احتمال کل. فشرده سازی تا زمانی که دو کاراکتر باقی بماند انجام می شود. در همان زمان، یک جدول کدگذاری پر می شود که در آن احتمالات حاصل وارد می شود و مسیرهایی که نمادهای جدید در مرحله بعدی حرکت می کنند به تصویر کشیده می شود.

در مرحله دوم، رمزگذاری واقعی اتفاق می‌افتد، که از آخرین مرحله شروع می‌شود: اولین علامت از دو نماد به کد 1 اختصاص داده می‌شود، دومی - 0. پس از این، آنها به مرحله قبل می‌روند. کدهای مرحله بعدی به نمادهایی که در این مرحله در فشرده سازی شرکت نکردند اختصاص داده می شود و کد نمادی که پس از چسباندن به دست می آید دو بار به دو علامت آخر اختصاص داده می شود و به کد کاراکتر بالایی 1 اضافه می شود. یک پایین - 0. اگر کاراکتر در چسباندن بیشتر نباشد، کد آن بدون تغییر باقی می‌ماند. این روش تا پایان (یعنی تا مرحله اول) ادامه دارد.

جدول 2.3 کدگذاری هافمن را نشان می دهد. همانطور که از جدول مشخص است، کدگذاری در 7 مرحله انجام شده است. در سمت چپ احتمالات نماد، در سمت راست کدهای میانی هستند. فلش ها حرکات نمادهای تازه شکل گرفته را نشان می دهد. در هر مرحله، دو نماد آخر فقط در کمترین بیت تفاوت دارند که مربوط به تکنیک رمزگذاری است. بیایید میانگین طول کلمه را محاسبه کنیم:

l میانگین = 0.3 2 + 0.2 2 + 0.15 3 ++ 2 0.1 3 + + 0.05 4 + 0.05 5 + 0.03 6 + 0.02 6 = 2.7

این حتی به آنتروپی نزدیک‌تر است: کد حتی کارآمدتر است. در شکل شکل 2.12 درخت کد هافمن را نشان می دهد.

جدول 2.3.

کد نویسی هافمن

ن p i کد من II III IV V VI VII
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

هر دو کد نیاز رمزگشایی بدون ابهام را برآورده می‌کنند: همانطور که از جداول مشاهده می‌شود، ترکیب‌های کوتاه‌تر آغاز کدهای طولانی‌تر نیستند.

با افزایش تعداد نمادها، کارایی کدها افزایش می یابد، بنابراین در برخی موارد بلوک های بزرگتر کدگذاری می شوند (به عنوان مثال، اگر ما در مورددر مورد متون، می توانید برخی از رایج ترین هجاها، کلمات و حتی عبارات را رمزگذاری کنید).

تأثیر معرفی چنین کدهایی با مقایسه آنها با یک کد یکنواخت مشخص می شود:

(2.24)

که در آن n تعداد بیت های کد یکنواخت است که با یک کد موثر جایگزین می شود.

تغییرات کدهای هافمن

الگوریتم کلاسیک هافمن یک الگوریتم دو پاس است، یعنی. ابتدا نیاز به جمع آوری آمار در مورد نمادها و پیام ها، و سپس روش های شرح داده شده در بالا دارد. این در عمل ناخوشایند است زیرا زمان پردازش پیام ها و جمع آوری یک فرهنگ لغت را افزایش می دهد. اغلب از روش های یک گذر استفاده می شود که در آن رویه های انباشت و رمزگذاری ترکیب می شوند. به گفته هافمن [46] چنین روش هایی فشرده سازی تطبیقی ​​نیز نامیده می شود.

ماهیت فشرده سازی تطبیقی ​​به گفته هافمن به ساخت یک درخت کد اولیه و اصلاح متوالی آن پس از رسیدن هر نماد بعدی برمی گردد. مانند قبل، درختان اینجا باینری هستند، یعنی. حداکثر دو کمان از هر رأس نمودار درختی خارج می شود. مرسوم است که راس اصلی را والد می نامند و دو رأس بعدی که در کودکی به آن متصل می شوند. بیایید مفهوم وزن راس را معرفی کنیم - این تعداد کاراکترها (کلمات) مربوط به یک راس مشخص است که هنگام تغذیه دنباله اصلی به دست می آید. بدیهی است که مجموع اوزان فرزندان با وزن والدین برابر است.

پس از معرفی نماد بعدی دنباله ورودی، درخت کد تجدید نظر می شود: وزن رئوس دوباره محاسبه می شود و در صورت لزوم، راس ها دوباره مرتب می شوند. قاعده جابجایی رئوس به این صورت است: وزن رئوس پایینی کوچکترین و رئوس واقع در سمت چپ نمودار کمترین وزن را دارند.

در همان زمان، رئوس شماره گذاری می شوند. شماره گذاری از رئوس پایین (آویز، یعنی بدون فرزند) از چپ به راست شروع می شود، سپس به سمت چپ حرکت می کند. سطح بالاو غیره. قبل از شماره گذاری آخرین راس اصلی. در این حالت، نتیجه زیر حاصل می شود: هر چه وزن یک راس کوچکتر باشد، تعداد آن کمتر است.

جایگشت عمدتاً برای رئوس آویزان انجام می شود. هنگام جابجایی، قانون فرموله شده در بالا باید در نظر گرفته شود: رئوس با وزن بیشتر تعداد بیشتری دارند.

پس از گذراندن دنباله (که به آن کنترل یا تست نیز گفته می شود)، به همه رئوس آویزان ترکیب کد اختصاص داده می شود. قانون تخصیص کدها مشابه موارد فوق است: تعداد بیت های کد برابر با تعداد رئوس هایی است که مسیر از منبع به راس معلق داده شده می گذرد و مقدار یک بیت خاص با جهت مطابقت دارد. از والدین به "فرزند" (مثلاً رفتن به سمت چپ والدین با مقدار 1 مطابقت دارد، به راست - 0).

ترکیب کدهای به دست آمده به همراه آنالوگ هایشان در حافظه دستگاه فشرده سازی ذخیره می شوند و یک فرهنگ لغت را تشکیل می دهند. استفاده از الگوریتم به شرح زیر است. دنباله فشرده کاراکترها مطابق با فرهنگ لغت موجود به قطعات تقسیم می شود، پس از آن هر یک از قطعات با کد خود از فرهنگ لغت جایگزین می شود. قطعاتی که در فرهنگ لغت یافت نمی شوند، رئوس آویزان جدید را تشکیل می دهند، وزن پیدا می کنند و همچنین وارد فرهنگ لغت می شوند. به این ترتیب یک الگوریتم تطبیقی ​​برای تکمیل فرهنگ لغت شکل می گیرد.

برای افزایش کارایی روش، مطلوب است که اندازه فرهنگ لغت را افزایش دهید. در این حالت نسبت تراکم افزایش می یابد. در عمل، حجم فرهنگ لغت 4 - 16 کیلوبایت حافظه است.


اجازه دهید الگوریتم داده شده را با یک مثال توضیح دهیم. در شکل شکل 2.13 نمودار اصلی را نشان می دهد (به آن درخت هافمن نیز می گویند). هر رأس درخت با یک مستطیل نشان داده می شود که در آن دو عدد از طریق یک کسری محاط شده است: اولی به معنای تعداد راس، دومی به معنای وزن آن است. همانطور که می بینید، مطابقت بین وزن رئوس و اعداد آنها برآورده می شود.

اکنون فرض می کنیم که نماد مربوط به راس 1 برای بار دوم در دنباله آزمون ظاهر می شود. همانطور که در شکل نشان داده شده است وزن راس تغییر کرده است. 2.14 که در نتیجه قانون شماره گذاری رئوس نقض می شود. در مرحله بعد محل رئوس آویزان را تغییر می دهیم که رئوس 1 و 4 را با هم عوض می کنیم و تمام رئوس درخت را شماره گذاری می کنیم. نمودار حاصل در شکل نشان داده شده است. 2.15. سپس این روش به همین ترتیب ادامه می یابد.

باید به خاطر داشت که هر رأس آویزان در درخت هافمن مربوط به نماد یا گروه خاصی از نمادها است. تفاوت والد با فرزندان این است که گروه نمادهای مربوط به او یک نماد کوتاهتر از فرزندانش است و این فرزندان متفاوت هستند. آخرین شخصیت. به عنوان مثال، نمادهای "ماشین" با والد مطابقت دارد. سپس کودکان ممکن است دنباله های "kara" و "karp" را داشته باشند.

الگوریتم داده شده آکادمیک نیست و به طور فعال در برنامه های بایگانی استفاده می شود، از جمله هنگام فشرده سازی داده های گرافیکی (آنها در زیر مورد بحث قرار خواهند گرفت).

الگوریتم های Lempel–Ziv

اینها رایج ترین الگوریتم های فشرده سازی امروزی هستند. آنها در اکثر برنامه های آرشیو استفاده می شوند (به عنوان مثال، PKZIP. ARJ، LHA). ماهیت الگوریتم ها این است که مجموعه خاصی از نمادها در حین بایگانی با شماره آن در یک فرهنگ لغت ایجاد شده مخصوص جایگزین می شود. به عنوان مثال، عبارت "شماره ارسالی نامه شما..." که اغلب در مکاتبات تجاری یافت می شود، ممکن است جایگاه 121 را در فرهنگ لغت اشغال کند. سپس به جای انتقال یا ذخیره عبارت ذکر شده (30 بایت) می توانید عبارت عدد (1.5 بایت به صورت اعشاری باینری یا 1 بایت به صورت باینری) را ذخیره کنید.

این الگوریتم ها به نام نویسندگانی که برای اولین بار آنها را در سال 1977 ارائه کردند، نامگذاری شده اند. از این میان اولین مورد LZ77 است. برای بایگانی یک پنجره به اصطلاح کشویی پیام ایجاد می شود که از دو قسمت تشکیل شده است. بخش اول، یک فرمت بزرگتر، برای تشکیل یک دیکشنری خدمت می کند و حجمی در حدود چندین کیلوبایت دارد. قسمت دوم و کوچکتر (معمولاً تا 100 بایت اندازه) کاراکترهای فعلی متن در حال مشاهده را دریافت می کند. الگوریتم سعی می کند مجموعه ای از کاراکترها را در فرهنگ لغت پیدا کند که با آنهایی که در پنجره مشاهده دریافت شده مطابقت داشته باشد. در صورت موفقیت آمیز بودن، کدی تولید می شود که از سه قسمت تشکیل شده است: افست در فرهنگ لغت نسبت به زیررشته اولیه، طول این زیررشته، و کاراکتر پس از این زیررشته. به عنوان مثال، رشته فرعی انتخاب شده از کاراکترهای "app" (در مجموع 6 کاراکتر) تشکیل شده است، کاراکتر بعدی "e" است. سپس، اگر رشته فرعی دارای یک آدرس (محل در فرهنگ لغت) 45 باشد، ورودی در فرهنگ لغت مانند "45, 6. e" به نظر می رسد. پس از این، محتویات پنجره بر اساس موقعیت جابجا می شوند و جستجو ادامه می یابد. به این ترتیب فرهنگ لغت تشکیل می شود.

مزیت الگوریتم این است که الگوریتمی است که به راحتی برای تدوین فرهنگ لغت رسمی می شود. علاوه بر این، می توان بدون دیکشنری اصلی را از حالت فشرده خارج کرد (توصیه می شود یک دنباله آزمایشی داشته باشید) - فرهنگ لغت در حین باز کردن زیپ تشکیل می شود.

معایب الگوریتم با افزایش اندازه فرهنگ لغت ظاهر می شود - زمان جستجو افزایش می یابد. علاوه بر این، اگر رشته ای از کاراکترها در پنجره فعلی ظاهر شود که در فرهنگ لغت وجود ندارد، هر کاراکتر با یک کد سه عنصری نوشته می شود. نتیجه فشرده سازی نیست، بلکه کشش است.

الگوریتم LZSS که در سال 1978 پیشنهاد شد، بهترین ویژگی ها را دارد. در پشتیبانی از پنجره کشویی و کدهای خروجی کمپرسور تفاوت هایی دارد. علاوه بر پنجره، الگوریتم یک درخت دودویی شبیه به درخت هافمن تولید می‌کند تا جستجوی منطبق‌ها را سرعت بخشد: هر زیررشته‌ای که از پنجره جاری خارج می‌شود به عنوان یکی از فرزندان به درخت اضافه می‌شود. این الگوریتم به شما امکان می دهد اندازه پنجره فعلی را بیشتر افزایش دهید (مطلوب است که اندازه آن برابر با توان دو باشد: 128، 256، و غیره بایت). کدهای دنباله نیز به طور متفاوتی شکل می گیرند: یک پیشوند 1 بیتی اضافی برای تشخیص کاراکترهای رمزگذاری نشده از جفت های "offset, length" معرفی شده است.

با استفاده از الگوریتم‌هایی مانند LZW، میزان فشرده‌سازی حتی بیشتر به دست می‌آید. الگوریتم‌هایی که قبلاً توضیح داده شد، اندازه پنجره ثابتی دارند، که باعث می‌شود عباراتی طولانی‌تر از اندازه پنجره در فرهنگ لغت وارد شوند. در الگوریتم های LZW (و LZ78 سلف آنها)، پنجره مشاهده دارای اندازه نامحدود است و فرهنگ لغت عبارات را جمع می کند (و نه مجموعه ای از کاراکترها، مانند قبل). فرهنگ لغت دارای طول نامحدود است و رمزگذار (رمزگشا) در حالت انتظار عبارت عمل می کند. هنگامی که عبارتی منطبق با فرهنگ لغت تشکیل می شود، یک کد مطابقت (یعنی کد این عبارت در فرهنگ لغت) و کد کاراکتر پس از آن صادر می شود. اگر با جمع شدن نمادها، عبارت جدیدی تشکیل شود، آن را نیز مانند کوتاهتر وارد فرهنگ لغت می کنیم. نتیجه یک رویه بازگشتی است که رمزگذاری و رمزگشایی سریع را فراهم می کند.

یک ویژگی فشرده سازی اضافی با رمزگذاری فشرده نویسه های تکراری ارائه می شود. اگر در یک دنباله برخی از کاراکترها در یک ردیف دنبال شوند (به عنوان مثال، در متن اینها می توانند کاراکترهای "فضا"، در یک دنباله اعداد - صفرهای متوالی و غیره باشند)، پس منطقی است که آنها را با جفت "شخصیت" جایگزین کنید. طول" یا "علامت، طول" ". در حالت اول، کد علامتی را نشان می دهد که دنباله کدگذاری می شود (معمولاً 1 بیت)، سپس کد کاراکتر تکرار شونده و طول دنباله را نشان می دهد. در حالت دوم (برای نویسه‌های تکرار شونده ارائه شده است)، پیشوند به سادگی نشان‌دهنده علامت تکرار است.

فشرده سازی دینامیک(فشرده سازی دامنه دینامیکی، DRC) - باریک شدن (یا در صورت گسترش دهنده) محدوده دینامیکی فونوگرام. محدوده دینامیکی، تفاوت بین آرام ترین و بلندترین صدا است. گاهی اوقات آرامترین صدا در یک موسیقی متن کمی بلندتر از سطح نویز و گاهی کمی آرامتر از بلندترین صدا خواهد بود. دستگاه‌ها و برنامه‌های سخت‌افزاری که فشرده‌سازی دینامیکی را انجام می‌دهند، کمپرسور نامیده می‌شوند که در میان آنها چهار گروه اصلی را متمایز می‌کند: خود کمپرسورها، محدودکننده‌ها، گسترش دهنده‌ها و دروازه‌ها.

کمپرسور آنالوگ تیوب DBX 566

فشرده سازی رو به پایین و بالا

فشرده سازی پایین(فشرده سازی رو به پایین) هنگامی که صدا شروع به فراتر رفتن از آستانه معینی می کند، حجم صدا را کاهش می دهد و صداهای آرام تر را بدون تغییر می گذارد. یک نسخه افراطی از فشرده سازی رو به پایین است محدود کننده. تقویت فشرده سازیاز سوی دیگر، فشرده‌سازی رو به بالا، اگر صدایی زیر آستانه باشد، بدون تأثیر بر صداهای بلندتر، حجم آن را افزایش می‌دهد. در همان زمان، هر دو نوع فشرده سازی، محدوده دینامیکی سیگنال صوتی را محدود می کند.

فشرده سازی پایین

تقویت فشرده سازی

گسترش دهنده و دروازه

اگر کمپرسور محدوده دینامیکی را کاهش دهد، یک بسط دهنده آن را افزایش می دهد. هنگامی که سطح سیگنال از سطح آستانه بالاتر می رود، گسترش دهنده آن را بیشتر افزایش می دهد و در نتیجه تفاوت بین صداهای بلند و نرم را افزایش می دهد. دستگاه هایی مانند این اغلب هنگام ضبط یک کیت درام برای جدا کردن صدای یک درام از دیگری استفاده می شود.

نوعی از گسترش دهنده که برای تقویت صداهای بلند استفاده نمی شود، بلکه برای کاهش صداهای آرامی که از سطح آستانه تجاوز نمی کنند (مثلاً نویز پس زمینه) استفاده می شود. دروازه نویز. در چنین دستگاهی، به محض اینکه سطح صدا از آستانه کمتر شود، سیگنال متوقف می شود. معمولاً یک دروازه برای سرکوب نویز در طول مکث استفاده می شود. در برخی از مدل ها، می توانید مطمئن شوید که صدا با رسیدن به سطح آستانه ناگهان قطع نمی شود، بلکه به تدریج خاموش می شود. در این حالت، نرخ پوسیدگی توسط کنترل Decay تنظیم می شود.

گیت مانند دیگر انواع کمپرسورها می تواند باشد وابسته به فرکانس(یعنی درمان معینی باندهای فرکانسی) و می تواند در حالت کار کند زنجیره جانبی(پایین را ببینید).

اصل کار کمپرسور

سیگنال ورودی به کمپرسور به دو نسخه تقسیم می شود. یک نسخه به یک تقویت کننده ارسال می شود که در آن درجه تقویت توسط یک سیگنال خارجی کنترل می شود و نسخه دوم این سیگنال را تولید می کند. این دستگاه وارد دستگاهی به نام زنجیره جانبی می شود، جایی که سیگنال اندازه گیری می شود و بر اساس این داده ها، پاکتی ایجاد می شود که تغییر در حجم آن را توصیف می کند.
اکثر کمپرسورهای مدرن اینگونه طراحی می شوند، این به اصطلاح نوع پیشخور است. در دستگاه های قدیمی (نوع فیدبک)، سطح سیگنال بعد از تقویت کننده اندازه گیری می شود.

فناوری‌های مختلفی برای تقویت با بهره متغیر آنالوگ وجود دارد که هر کدام مزایا و معایب خاص خود را دارند: لوله، نوری با استفاده از مقاومت نوری و ترانزیستور. هنگام کار با صدای دیجیتال (در ویرایشگر صدایا DAW) می تواند از الگوریتم های ریاضی اختصاصی استفاده کند یا عملکرد فناوری های آنالوگ را شبیه سازی کند.

پارامترهای اصلی کمپرسورها

آستانه

یک کمپرسور سطح سیگنال صوتی را در صورتی که دامنه آن از مقدار آستانه (آستانه) خاصی فراتر رود، کاهش می دهد. معمولاً بر حسب دسی بل مشخص می شود و آستانه کمتری دارد (مثلاً 60 دسی بل) به این معنی که صدای بیشتری نسبت به آستانه بالاتر (مثلاً 5 دسی بل) پردازش می شود.

نسبت

مقدار کاهش سطح توسط پارامتر نسبت تعیین می شود: نسبت 4:1 به این معنی است که اگر سطح ورودی 4 دسی بل بالاتر از آستانه باشد، سطح خروجی 1 دسی بل بالاتر از آستانه خواهد بود.
مثلا:
آستانه = -10 دسی بل
ورودی = -6 دسی بل (4 دسی بل بالاتر از آستانه)
خروجی = -9 دسی بل (1 دسی بل بالاتر از آستانه)

مهم است که به خاطر داشته باشید که سرکوب سطح سیگنال برای مدتی پس از پایین آمدن از سطح آستانه ادامه می یابد و این زمان توسط مقدار پارامتر تعیین می شود. رهایی.

فشرده سازی با نسبت حداکثر ∞:1 محدود کننده نامیده می شود. این بدان معنی است که هر سیگنال بالاتر از سطح آستانه به سطح آستانه تضعیف می شود (به جز برای مدت کوتاهی پس از افزایش ناگهانی حجم ورودی). برای جزئیات بیشتر به "Limiter" در زیر مراجعه کنید.

نمونه هایی از مقادیر مختلف نسبت

حمله و رها کردن

یک کمپرسور کنترلی روی سرعت واکنش به تغییرات دینامیک سیگنال فراهم می کند. پارامتر Attack مدت زمانی را که طول می کشد تا کمپرسور بهره را به سطحی که توسط پارامتر Ratio تعیین می شود کاهش دهد را مشخص می کند. Release زمانی را تعیین می کند که در طی آن کمپرسور، برعکس، بهره را افزایش می دهد یا اگر سطح سیگنال ورودی به زیر مقدار آستانه کاهش یابد، به حالت عادی باز می گردد.

مراحل حمله و رهاسازی

این پارامترها زمان (معمولاً بر حسب میلی ثانیه) را نشان می دهد که برای تغییر ضریب افزایش مقدار معینی دسی بل، معمولاً 10 دسی بل، نیاز است. به عنوان مثال، در این حالت، اگر Attack روی 1 میلی ثانیه تنظیم شود، برای کاهش 10 دسی بل، 1 میلی ثانیه و برای کاهش 20 دسی بل، 2 میلی ثانیه زمان نیاز است.

در بسیاری از کمپرسورها پارامترهای Attack و Release قابل تنظیم هستند، اما در برخی از کمپرسورها از قبل تنظیم شده و قابل تنظیم نیستند. گاهی اوقات آنها به عنوان "اتوماتیک" یا "وابسته به برنامه" تعیین می شوند. بسته به سیگنال ورودی تغییر می کند.

زانو

یکی دیگر از پارامترهای کمپرسور: زانو سخت/نرم. تعیین می کند که شروع فشرده سازی ناگهانی (سخت) یا تدریجی (نرم) باشد. زانوی نرم باعث کاهش قابل توجه انتقال از سیگنال خشک به سیگنال فشرده می شود، به خصوص در مقادیر نسبت بالا و افزایش ناگهانی صدا.

فشرده سازی زانو سخت و نرم زانو

اوج و RMS

کمپرسور می تواند به مقادیر پیک (حداکثر کوتاه مدت) یا به سطح متوسط ​​سیگنال ورودی پاسخ دهد. استفاده از مقادیر پیک می تواند منجر به نوسانات شدید در درجه فشرده سازی و حتی اعوجاج شود. بنابراین، کمپرسورها یک تابع متوسط ​​(معمولا RMS) را به سیگنال ورودی هنگام مقایسه آن با مقدار آستانه اعمال می کنند. این باعث می شود فشرده سازی راحت تر، نزدیک به درک انسان از بلندی صدا.

RMS پارامتری است که میانگین حجم یک موسیقی متن را نشان می دهد. از نقطه نظر ریاضی، RMS (ریشه میانگین مربع) مقدار ریشه میانگین مربع دامنه تعداد معینی از نمونه ها است:

پیوند استریو

یک کمپرسور در حالت پیوند استریو بهره یکسانی را برای هر دو کانال استریو اعمال می کند. این کار از جابجایی های استریو که ممکن است در نتیجه پردازش مجزای کانال های چپ و راست باشد، جلوگیری می کند. این تغییر زمانی اتفاق می‌افتد که مثلاً یک عنصر با صدای بلند خارج از مرکز حرکت داده شود.

افزایش آرایش

از آنجایی که کمپرسور سطح کلی سیگنال را کاهش می دهد، معمولاً یک گزینه افزایش خروجی ثابت برای دستیابی به سطح بهینه اضافه می کند.

به جلو نگاه کن

عملکرد نگاه به جلو برای حل مشکلات مرتبط با مقادیر بسیار زیاد و بسیار کم حمله و انتشار طراحی شده است. زمان حمله که خیلی طولانی است به ما اجازه نمی دهد که به طور موثر موارد گذرا را رهگیری کنیم و زمان حمله خیلی کوتاه ممکن است برای شنونده راحت نباشد. هنگام استفاده از عملکرد نگاه به جلو، سیگنال اصلی نسبت به سیگنال کنترل به تاخیر می افتد، این به شما امکان می دهد فشرده سازی را از قبل شروع کنید، حتی قبل از اینکه سیگنال به مقدار آستانه برسد.
تنها عیب این روش تاخیر زمانی سیگنال است که در برخی موارد نامطلوب است.

استفاده از فشرده سازی پویا

فشرده سازی در همه جا مورد استفاده قرار می گیرد، نه تنها در موسیقی متن های موسیقی، بلکه همچنین در هر جایی که لازم است صدای کلی را بدون افزایش سطوح پیک افزایش دهیم، در جایی که از تجهیزات ارزان قیمت بازتولید صدا یا یک کانال انتقال محدود استفاده می شود (سیستم های آدرس و ارتباط عمومی، رادیو آماتور، و غیره.) .

فشرده سازی در حین پخش اعمال می شود موسیقی پس زمینه(در مغازه ها، رستوران ها و غیره) که در آن تغییرات محسوس در حجم مورد نظر نیست.

اما مهمترین حوزه کاربرد فشرده سازی پویا تولید و پخش موسیقی است. فشرده سازی برای دادن "ضخامت" و "درایو" صدا، برای ترکیب بهتر سازها با یکدیگر و به ویژه هنگام پردازش آواز استفاده می شود.

آوازهای موسیقی راک و پاپ اغلب فشرده می‌شوند تا از همنوازی متمایز شوند و وضوح بیشتری به آن‌ها اضافه شود. نوع خاصی از کمپرسور که فقط روی فرکانس‌های خاصی تنظیم شده است - یک دی‌اسسر - برای سرکوب واج‌های sibilant استفاده می‌شود.

در قطعات ساز، فشرده‌سازی برای افکت‌هایی که مستقیماً به میزان صدا مربوط نمی‌شوند نیز استفاده می‌شود، به‌عنوان مثال، صداهای درام که به سرعت پوسیده می‌شوند می‌توانند ماندگاری بیشتری داشته باشند.

موسیقی رقص الکترونیک (EDM) اغلب از زنجیره جانبی استفاده می‌کند (به زیر مراجعه کنید) - برای مثال، خط بیس ممکن است توسط یک درام ضربه یا مشابه آن هدایت شود تا از برخورد باس و درام جلوگیری کند و یک ضربان پویا ایجاد کند.

فشرده سازی به طور گسترده در پخش (رادیو، تلویزیون، پخش اینترنتی) برای افزایش بلندی صدای درک شده و در عین حال کاهش دامنه دینامیکی صدای منبع (معمولاً CD) استفاده می شود. اکثر کشورها محدودیت های قانونی برای حداکثر حجم پخش لحظه ای دارند. به طور معمول این محدودیت ها توسط کمپرسورهای سخت افزاری دائمی در زنجیره هوا اعمال می شوند. علاوه بر این، افزایش بلندی درک شده، "کیفیت" صدا را از دیدگاه اکثر شنوندگان بهبود می بخشد.

همچنین ببینید جنگ بلندی صدا

افزایش مداوم حجم همان آهنگ ریمستر شده برای سی دی از سال 1983 تا 2000.

زنجیره جانبی

یکی دیگر از کلیدهای کمپرسور که معمولاً با آن مواجه می‌شویم «زنجیره جانبی» است. در این حالت فشرده سازی صدا بدون توجه به آن اتفاق می افتد سطح خودو بسته به سطح سیگنال ورودی به کانکتور که معمولاً به آن زنجیره جانبی می گویند.

چندین کاربرد برای این وجود دارد. به عنوان مثال، خواننده دارای یک لیپ است و تمام "s" ها از تصویر کلی متمایز هستند. صدای او را از یک کمپرسور عبور می دهید و همان صدا را به کانکتور زنجیره جانبی وارد می کنید، اما از یک اکولایزر عبور می کند. با یک اکولایزر، تمام فرکانس ها را به جز فرکانس هایی که خواننده هنگام تلفظ حرف "s" استفاده می کند، قطع می کنید. معمولاً حدود 5 کیلوهرتز است، اما می تواند بین 3 کیلوهرتز تا 8 کیلوهرتز باشد. اگر کمپرسور را در حالت زنجیره جانبی قرار دهید، صدا در آن لحظاتی که حرف "s" تلفظ می شود فشرده می شود. این منجر به تولید دستگاهی شد که به نام deesser شناخته می شود. این روش کار "وابسته به فرکانس" نامیده می شود.

یکی دیگر از کاربردهای این تابع "ducker" نام دارد. به عنوان مثال، در یک ایستگاه رادیویی، موسیقی از یک کمپرسور عبور می کند و کلمات دی جی از طریق یک زنجیره جانبی می آید. هنگامی که دی جی شروع به چت می کند، صدای موسیقی به طور خودکار کاهش می یابد. این افکت همچنین می تواند با موفقیت در ضبط استفاده شود، به عنوان مثال، برای کاهش صدای قطعات صفحه کلید در هنگام آواز خواندن.

محدودیت دیوار آجری

کمپرسور و لیمیتر تقریباً یکسان عمل می کنند؛ می توان گفت که لیمیتر کمپرسوری با نسبت بالا (از 10:1) و معمولاً زمان حمله کم است.

مفهوم محدود کردن دیوار آجری - محدود کننده با نسبت بسیار بالا (20:1 و بالاتر) و حمله بسیار سریع وجود دارد. در حالت ایده آل، به هیچ وجه اجازه نمی دهد سیگنال از سطح آستانه فراتر رود. نتیجه برای گوش ناخوشایند خواهد بود، اما از آسیب به تجهیزات بازتولید صدا یا بیش از حد جلوگیری می کند. پهنای باندکانال بسیاری از تولیدکنندگان محدود کننده ها را برای این منظور در دستگاه های خود ادغام می کنند.

کلیپر در مقابل محدود کننده، برش نرم و سخت

فشرده سازی یکی از اسطوره آمیزترین موضوعات در تولید صدا است. آنها می گویند که بتهوون حتی بچه های همسایه را با او ترساند:

خوب، در واقع، استفاده از فشرده سازی دشوارتر از استفاده از اعوجاج نیست، نکته اصلی درک اصل عملکرد آن و داشتن کنترل خوب است. این چیزی است که اکنون با هم خواهیم دید.

فشرده سازی صدا چیست؟

اولین چیزی که قبل از آماده سازی باید درک کنید فشرده سازی است. کار با محدوده دینامیکی صدا. و به نوبه خود چیزی بیش از تفاوت بین بلندترین و بی صداترین سطوح سیگنال نیست:

بنابراین، فشرده سازی فشرده سازی محدوده دینامیکی است. آره، فقطفشرده سازی محدوده دینامیکی یا به عبارت دیگر کاهش سطح صداهای بلند سیگنال و افزایش صدای بخش های ساکت. بیشتر نه.

ممکن است به طور منطقی تعجب کنید که چرا چنین تبلیغاتی مرتبط است؟ چرا همه در مورد دستور العمل های تنظیمات صحیح کمپرسور صحبت می کنند، اما هیچ کس آنها را به اشتراک نمی گذارد؟ چرا با وجود تعداد زیاد افزونه های جالب، بسیاری از استودیوها هنوز از مدل های گران قیمت و کمیاب کمپرسور استفاده می کنند؟ چرا برخی از تولیدکنندگان از کمپرسورها در تنظیمات شدید استفاده می کنند، در حالی که برخی دیگر اصلاً از آنها استفاده نمی کنند؟ و بالاخره کدام یک از آنها درست است؟

مشکلات با فشرده سازی حل شد

پاسخ به چنین سوالاتی در سطح درک نقش فشرده سازی در کار با صدا نهفته است. و اجازه می دهد:

  1. بر حمله تاکید کنیدصدا، آن را برجسته تر می کند.
  2. "تنظیم" بخش های جداگانه سازها در ترکیببا افزودن قدرت و وزن به آنها.
  3. گروه های ساز یا کل ترکیب را منسجم تر کنید، چنین یکپارچه واحد;
  4. تضاد بین ابزارها را حل کنیداستفاده از زنجیره جانبی؛
  5. اشتباهات خواننده یا نوازندگان را تصحیح کنیدتسطیح پویایی آنها.
  6. با یک تنظیم خاص به عنوان یک اثر هنری عمل کند.

همانطور که می بینید، این فرآیند خلاقانه کمتر از، مثلاً ساختن ملودی ها یا ایجاد صداهای جالب نیست. علاوه بر این، هر یک از مشکلات فوق را می توان با استفاده از 4 پارامتر اصلی حل کرد.

پارامترهای اصلی کمپرسور

علیرغم تعداد زیاد مدل های نرم افزاری و سخت افزاری کمپرسورها، تمام "جادوی" فشرده سازی زمانی اتفاق می افتد که تنظیم صحیحپارامترهای اصلی: آستانه، نسبت، حمله و انتشار. بیایید با جزئیات بیشتری به آنها نگاه کنیم:

آستانه یا آستانه پاسخ، دسی بل

این پارامتر به شما امکان می دهد مقداری را که کمپرسور از آن کار می کند (یعنی فشرده سازی سیگنال صوتی) را تنظیم کنید. بنابراین، اگر آستانه را روی 12- دسی بل قرار دهیم، کمپرسور فقط در قسمت هایی از محدوده دینامیکی کار می کند که از این مقدار بیشتر باشد. اگر همه صدای ما ساکت تر از -12db باشد، کمپرسور به سادگی آن را از خود عبور می دهد بدون اینکه به هیچ وجه روی آن تأثیر بگذارد.

نسبت یا نسبت تراکم

پارامتر نسبت تعیین می کند که سیگنالی که از آستانه فراتر رفته چقدر فشرده شود. کمی ریاضی برای تکمیل تصویر: فرض کنید یک کمپرسور با آستانه 12-dB با نسبت 2:1 راه اندازی کردیم و به آن یک حلقه درام دادیم که در آن حجم کیک درام -4 دسی بل است. نتیجه عملکرد کمپرسور در این صورت چه خواهد بود؟

در مورد ما، سطح درام ضربه ای 8 دسی بل از آستانه فراتر می رود. این تفاوت با توجه به نسبت به 4dB (8dB / 2) فشرده خواهد شد. در ترکیب با قسمت پردازش نشده سیگنال، این منجر به این واقعیت می شود که پس از پردازش توسط کمپرسور، حجم درام ضربه 8-db خواهد بود (آستانه -12dB + سیگنال فشرده 4dB).

حمله کن خانم

این زمانی است که پس از آن کمپرسور به فراتر از آستانه پاسخ پاسخ می دهد. یعنی اگر زمان حمله بالای 0 میلی ثانیه باشد - کمپرسور فشرده سازی را شروع می کندفراتر رفتن از سیگنال آستانه نه بلافاصله، بلکه پس از یک زمان مشخص.

انتشار یا بازیابی، ms

برعکس حمله - مقدار این پارامتر به شما امکان می دهد تعیین کنید که چه مدت پس از بازگشت سطح سیگنال به زیر آستانه کمپرسور فشرده سازی را متوقف می کند.

قبل از اینکه به جلو برویم، اکیداً توصیه می‌کنم یک نمونه شناخته شده بگیرید، هر کمپرسور را در کانال آن قرار دهید و پارامترهای بالا را به مدت 5-10 دقیقه آزمایش کنید تا مواد را به طور ایمن ثابت کنید.

همه سایر پارامترها اختیاری هستند. آنها می توانند بین مدل های مختلف کمپرسور متفاوت باشند، به همین دلیل است که تولیدکنندگان از مدل های مختلف برای اهداف خاص استفاده می کنند (به عنوان مثال، یک کمپرسور برای آواز، دیگری برای گروه درام، سومی برای کانال اصلی). من به جزئیات روی این پارامترها نمی پردازم، بلکه فقط ارائه خواهم داد اطلاعات کلیبرای درک اینکه این موضوع چیست:

  • زانو یا پیچ خوردگی (زانو سخت/نرم). این پارامتر تعیین می کند که نسبت تراکم (نسبت) با چه سرعتی اعمال شود: سخت در طول یک منحنی یا صاف. متذکر می شوم که در حالت نرم زانو، کمپرسور به صورت خطی کار نمی کند، اما شروع به فشرده سازی صدا می کند (تا جایی که ممکن است زمانی که در مورد میلی ثانیه صحبت می کنیم) صدا را فشرده کند. قبلاً قبل از مقدار آستانه. برای پردازش گروهی از کانال‌ها و ترکیب کلی، اغلب از زانوی نرم استفاده می‌شود (زیرا بدون توجه عمل می‌کند)، و برای تأکید بر حمله و سایر ویژگی‌های ابزارهای فردی، از زانوی سخت استفاده می‌شود.
  • حالت پاسخگویی: پیک/RMS. حالت اوج زمانی توجیه می شود که شما نیاز به محدود کردن شدید انفجارهای دامنه و همچنین سیگنال هایی با شکل پیچیده دارید که دینامیک و خوانایی آن باید به طور کامل منتقل شود. حالت RMS روی صدا بسیار ملایم است و به شما این امکان را می دهد که در عین حال حمله را ضخیم کنید.
  • آینده نگری (نگاه به آینده). این زمانی است که در طی آن کمپرسور متوجه خواهد شد که چه چیزی به سراغش می آید. نوعی تجزیه و تحلیل اولیه سیگنال های دریافتی؛
  • آرایش یا سود. پارامتری که به شما امکان می دهد کاهش حجم در نتیجه فشرده سازی را جبران کنید.

اول و اکثر توصیه اصلی ، که تمام سوالات بیشتر در مورد فشرده سازی را از بین می برد: اگر الف) اصل فشرده سازی را درک کنید، ب) کاملاً بدانید که این یا آن پارامتر چگونه بر صدا تأثیر می گذارد، و ج) موفق شده اید چندین مورد را در عمل امتحان کنید. مدل های مختلفشما دیگر نیازی به مشاوره ندارید.

من کاملا جدی هستم. اگر این پست را با دقت مطالعه کرده اید، با کمپرسور استاندارد DAW خود و یک یا دو افزونه آزمایش کرده اید، اما هنوز متوجه نشده اید که در چه مواردی باید مقادیر حمله بزرگ را تنظیم کنید، از چه نسبتی استفاده کنید و در چه حالتی باید پردازش را انجام دهید. سیگنال منبع - سپس شما به جستجوی اینترنت برای دستور العمل های آماده ادامه می دهید و آنها را بدون فکر در هر جایی اعمال می کنید.

دستور العمل های تنظیم دقیق کمپرسوراین به نوعی مانند دستور العمل هایی برای تنظیم دقیق یک ریورب یا کر است - هیچ معنایی ندارد و ربطی به خلاقیت ندارد. بنابراین، من دائماً تنها دستور درست را تکرار می کنم: خود را با این مقاله مسلح کنید، هدفون مانیتور خوب، یک پلاگین برای کنترل بصری شکل موج، و شب را در شرکت چند کمپرسور بگذرانید.

اقدام به!

, پخش کننده های رسانه ای

ضبط‌ها، به‌ویژه نمونه‌های قدیمی‌تر که قبل از سال 1982 ضبط و تولید شده بودند، برای بلندتر کردن صدای ضبط، بسیار کمتر میکس شدند. آنها موسیقی طبیعی را با محدوده دینامیکی طبیعی بازتولید می کنند که در ضبط حفظ می شود و در اکثر فرمت های دیجیتال استاندارد یا با کیفیت بالا گم می شود.

البته استثناهایی نیز در این مورد وجود دارد - به آلبوم اخیر استیون ویلسون از MA Recordings یا Reference Recordings گوش دهید و خواهید شنید که صدای دیجیتال چقدر می تواند خوب باشد. اما این نادر است؛ اکثر صداهای ضبط شده مدرن با صدای بلند و فشرده هستند.

فشرده سازی موسیقی اخیراً مورد انتقادهای زیادی قرار گرفته است، اما من حاضرم شرط ببندم که تقریباً تمام ضبط های مورد علاقه شما فشرده شده است. برخی از آنها کمتر، برخی بیشتر هستند، اما همچنان فشرده هستند. فشرده‌سازی محدوده دینامیکی یک قربانی برای موسیقی بدصدا است، اما موسیقی بسیار فشرده چیز جدیدی نیست: به آلبوم‌های موتاون از دهه 60 گوش دهید. همین را می توان در مورد آثار کلاسیک لد زپلین یا آلبوم های جوانتر Wilco و Radiohead نیز گفت. فشرده‌سازی دامنه دینامیکی رابطه طبیعی بین بلندترین و ملایم‌ترین صداها در ضبط را کاهش می‌دهد، بنابراین یک زمزمه می‌تواند به اندازه یک جیغ بلند باشد. پیدا کردن موسیقی پاپ از 50 سال گذشته که فشرده نشده باشد بسیار دشوار است.

اخیراً با لری کرین موسس و سردبیر مجله Tape Op در مورد جنبه های خوب، بد و زشت فشرده سازی گفتگوی خوبی داشتم. لری کرین با گروه‌های موسیقی و هنرمندانی مانند استفان مارکوس، کت پاور، اسلیتر-کینی، جنی لوئیس، ام وارد، The Go-Betweens، Jason Little، Eliot Smith، Quasi و Richmond Fontaine کار کرده است. او همچنین استودیوی ضبط Jackpot را اداره می کند! در پورتلند، اورگان، که خانه The Breeders، The Decemberists، Eddie Vedder، Pavement، R.E.M.، She & Him و بسیاری دیگر بود.

به‌عنوان نمونه‌ای از آهنگ‌های با صدای شگفت‌آور غیرطبیعی اما همچنان عالی، آلبوم Spoon در سال 2014 یعنی They Want My Soul را ذکر می‌کنم. کرین می‌خندد و می‌گوید که در ماشین به آن گوش می‌دهد، زیرا صدای آن عالی است. که ما را به پاسخ دیگری به این سؤال می رساند که چرا موسیقی فشرده می شود: زیرا فشرده سازی و "شفافیت" اضافی شنیدن آن را در مکان های پر سر و صدا آسان تر می کند.

لری کرین در محل کار عکس از جیسون کویگلی

وقتی مردم می گویند که صدای ضبط صدا را دوست دارند، فکر می کنم موسیقی را دوست دارند، گویی صدا و موسیقی اصطلاحات جدایی ناپذیری هستند. اما برای خودم این مفاهیم را متمایز می کنم. از منظر یک دوست دوست، صدا ممکن است خشن و خام باشد، اما برای اکثر شنوندگان مهم نیست.

بسیاری به سرعت مهندسان مسترینگ را به استفاده بیش از حد از فشرده سازی متهم می کنند، اما فشرده سازی مستقیماً در حین ضبط، در حین میکس و تنها پس از آن در طول مسترینگ اعمال می شود. تا زمانی که شخصاً در هر یک از این مراحل حضور نداشته باشید، نمی‌توانید بگویید که سازها و بخش‌های آوازی در همان ابتدای کار چه صدایی داشتند.

کرین در حال حرکت بود: «اگر یک نوازنده بخواهد عمداً مانند آلبوم‌های Guided by Voices دیوانه و تحریف شده به نظر برسد، هیچ ایرادی در آن وجود ندارد - میل همیشه بر کیفیت صدا برتری دارد.» صدای نوازنده تقریبا همیشه فشرده است و همین اتفاق در مورد بیس، درام، گیتار و سینت سایزر می افتد. فشرده سازی میزان صدای آواز را حفظ می کند سطح مناسبدر طول آهنگ یا کمی از بقیه صداها متمایز است.

فشرده سازی به درستی می تواند صدای درام را زنده تر یا عمداً عجیب تر کند. برای اینکه موسیقی عالی به نظر برسد، باید بتوانید از ابزارهای لازم استفاده کنید. به همین دلیل است که سالها طول می کشد تا بفهمیم چگونه از فشرده سازی بدون زیاده روی در آن استفاده کنیم. اگر مهندس میکس قسمت گیتار را بیش از حد فشرده کند، مهندس مسترینگ دیگر نمی تواند فرکانس های از دست رفته را به طور کامل بازیابی کند.

اگر نوازندگان از شما می خواستند به موسیقی گوش دهید که مراحل میکس و مسترینگ را طی نکرده است، آن را مستقیماً از استودیو در قفسه های فروشگاه منتشر می کنند. کرین می‌گوید افرادی که موسیقی ضبط شده را خلق، ویرایش، میکس و مسترینگ می‌کنند، برای ایجاد مانعی برای نوازندگان وجود ندارند - آنها از ابتدا، برای بیش از صد سال، به هنرمندان کمک کرده‌اند.

این افراد بخشی از فرآیند خلقت هستند که نتیجه آن آثار هنری شگفت انگیز است. کرین می افزاید: "شما نسخه ای از "سمت تاریک ماه" را که میکس و مسترینگ نشده باشد نمی خواهید. پینک فلوید این آهنگ را همانطور که می خواستند آن را بشنوند منتشر کرد.




بالا