اطلاعات زير مي تواند کمک بزرگ در درک بيشتر مسائل مربوط به ميکس و مسترينگ کند.
دستگاه شنوايي انسان
پردازش صوت محدودههاي گوناگوني را در بر ميگيرد كه همه به منظور ارائة صدا به شنوندگان انساني ابداع شدهاند. سه محدودة تكثير موسيقي با كيفيتي به خوبي اصل همانند آنچه در سيديهاي صوتي وجود دارد ،ارتباط صوتي از راه دور كه نام ديگر شبكة تلفني است و ،تركيب صحبت كه در آن كامپيوترها الگوهاي صوتي انسان را توليد كرده يا تشخيص ميدهند از ديگر قلمروهاي دانش پردازش صوت مهمترند. با وجود اين كه اهداف و مسائل اين كاربردها متفاوتند همگي در يك نقطة مشترك به هم ميرسند و آن گوش انسان است.
گوش انسان يك عضو به گونهاي فزاينده پيچيده است. قضيه وقتي پيچيدهتر ميشود كه اطلاعات ارسالي از دو گوش در يك شبكة پيچيدة گيج كننده كه همانا مغز انسان باشد با هم تركيب ميشوند. به ياد داشته باشيم كه بيان فوق يك گذر كلي بر قضيه است و تعداد زيادي از پديدهها و آثار دقيق مرتبط با گوش انسان هنوز به درستي درك نشدهاند.
شكل 1 قسمت اعظم ساختارها و پردازشهايي را كه گوش انسان را در بر دارند به تصوير ميكشد. گوش خارجي از دو بخش تشكيل شده است: نرمي پوست قابل مشاهده و غضروف متصل به كنار سر و كانال گوش كه لولهايست به قطر تقريبي 0.5 سانتيمتر و تا حدود 3 سانتيمتر در داخل سر فرو ميرود. اين ساختارها صداهاي محيط را به بخشهاي حساس گوش مياني و گوش داخلي كه در درون استخوانهاي جمجمه محافظت ميشود راهبري ميكنند. در انتهاي كانال گوش يك ورقة نازك از نسوج كه پردة صماخ يا طبل گوش ناميده ميشود كشيده شده است. امواج صدا با برخورد به پردة صماخ باعث لرزش آن ميشوند. گوش مياني مجموعهاي از استخوانهاي كوچك است كه لرزش مزبور را به حلزون گوش (گوش داخلي) انتقال ميدهند و در آنجا اين لرزشها تبديل به ضربههاي عصبي ميگردند. حلزون گوش يك لولة پر از مايع است كه به زحمت قطر آن به 2 ميليمتر و طول آن به 3 سانتيمتر ميرسد. اگر چه حلزون گوش در شكل شمارة 1 به صورت يك لولة مستقيم نشان داده شده اما در واقع به دور خودش همانند صدف حلزون پيچ خورده است و وجه تسمية آن كه ريشه در كلمهاي يوناني به معناي حلزون دارد نيز اين واقعيت است.
وقتي يك موج صوتي سعي دارد از هوا وارد مايع شود تنها كسر كوچكي از آن از بين دو محيط عبور ميكند و باقيماندة انرژي آن بازتابيده ميشود. دليل اين امر مقاومت مكانيكي پايين هوا (ناشي از پايين بودن ميزان فشار صوتي و سرعت بالاي ذرات هوا كه به نوبة خود از چگالي پايين و تراكمپذيري بالاي آنها نشأت ميگيرد) در برابر مقاومت مكانيكي بالاي مايع است. به عبارت سادهتر دليل اين امر مشابه دليل اين موضوع است كه براي ايجاد موج با دست در درون آب به تلاش بيشتري به نسبت انجام اين كار در هوا نيازمنديم. تفاوت موجود باعث بازتابش قسمت اعظم صوت در مرز هوا/مايع ميگردد.
گوش مياني يك شبكة تطبيق مقاومت است كه كسر انرژي صوتي وارد شده به مايع گوش داخلي را زياد ميكند. براي نمونه ماهي پردة صماخ يا گوش مياني ندارد چرا كه نيازي به شنيدن در هوا ندارد. تغيير شدت، بيشتر ناشي از تفاوت مساحت پردة صماخ (كه صدا را از هوا دريافت ميكند) و دريچه بيضوي (كه مطابق شكل 1صدا را به داخل مايع انتقال ميدهد) ميباشد. مساحت پردة صماخ حدوداً 60 ميليمتر مربع است حال آن كه دريچة بيضوي حدوداً 4 ميليمتر مربع مساحت دارد. از آنجا كه فشار برابر است با نسبت نيرو به مساحت، اين تفاوت مساحت فشار موج صدا را حدوداً 15 برابر افزايش ميدهد.
در داخل حلزون گوش پردة اصلي قرار دارد كه ساختاري را براي 12000 سلول حسي كه شكلدهندة عصب حلزوني است ايجاد ميكند. پردة اصلي در نزديكي دريچة بيضوي بسيار سفت است و در انتهاي ديگر انعطافپذيرتر است كه اين امر به اين عضو كمك ميكند تا به عنوان تحليلگر طيف فركانسي عمل كند. وقتي پردة اصلي در معرض يك سيگنال با فركانس بالا قرار ميگيرد در قسمت سفتتر طنين مياندازد كه سبب تحريك سلولهاي عصبي نزديك به دريچة بيضوي ميگردد. به همين ترتيب فركانسهاي پايين موجب تحريك انتهاي دورتر پردة اصلي ميشوند. اين امر موجب پاسخگويي رشتههاي خاص عصب حلزوني در برابر فركانسهاي خاص ميگردد. اين سازوكار اصل مكان ناميده ميشود و در سراسر مسير به سمت مغز حفظ ميشود.
طرح كدگذاري اطلاعات ديگري نيز در شنوايي انسان به كار ميرود كه اصل رگبار ناميده ميشود. سلولهاي عصبي اطلاعات را با توليد پالسهاي الكتريكي كوچكي كه پتانسيل كنش ناميده ميشوند انتقال ميدهد. يك سلول عصبي واقع بر پردة پاييني ميتواند اطلاعات صوتي را با توليد يك پتانسيل كنش در پاسخ هر سيكل لرزش كدگذاري كند. براي نمونه يك موج صداي 200 هرتزي ميتواند توسط يك نورون ايجاد كنندة 200 پتانسيل كنش در ثانيه نشان داده شود. در هر صورت اين روش تنها در فركانسهاي زير حدوداً 500 هرتز – بالاترين سرعت ممكن توليد پتانسيل كنش در نورونها – به كار ميآيد. گوش انسان براي غلبه بر اين مشكل به نورونها اجازه ميدهد كه براي انجام اين كار دستهجمعي عمل كنند. براي نمونه يك صداي 3000 هرتزي ميتواند توسط ده سلول عصبي كه هر كدام 300 ضربه در ثانيه علامت ميدهند نشان داده شود. اين پديده بازة كارايي اصل رگبار را تا 4 كيلوهرتز گسترش ميدهد كه بالاتر از بازة عملياتي اصل مكان ميباشد.
1
شكل شمارة 1- توضيحات مربوط به شكل: نمودار كاركردي گوش انسان. گوش خارجي امواج صوتي را از محيط ميگيرد و آنها را به سوي پردة صماخ (طبل گوش) كه ورقة نازكي از بافت است و هماهنگ با شكل موج هوا ميلرزد راهبري ميكند. استخوانهاي گوش مياني (استخوانهاي چكشي، سنداني و ركابي) اين لرزشها را به دريچة بيضوي كه پردهاي منعطف واقع در حلزون گوش پر از مايع است انتقال ميدهند. در داخل حلزون گوش پردة اصلي قرار دارد كه ايجاد كنندة ساختاري براي 12000 سلول عصبي شكلدهندة عصب حلزون گوش است. بسته به سفتي متغير پردة پاييني، هر سلول فقط به بازة كوچكي از فركانسهاي صدا پاسخ ميدهد كه اين پديده گوش را تبديل به يك تحليلگر طيف فركانسي مينمايد.
شكل شمارة 2 رابطة بين شدت صدا و بلندي مشاهده شده را نشان ميدهد. غالباً شدت صدا را با يك اندازة لگاريتمي كه دسيبل اس.پي.ال. (سطح توان صدا) ناميده ميشود نشان ميدهند. در اين معيار 0 دسيبل اس.پي.ال موج صدايي با قدرت ده به توان منفي شانزده وات بر سانتيمتر مربع است كه حدوداً ضعيفترين صداي قابل تشخيص توسط گوش انسان است. صحبت معمولي حدوداً 60 دسيبل اس.پي.ال است و صدايي با شدت 140 دسيبل اس.پي.اي براي گوش دردناك و زيانآور است.
2
شكل شمارة 2 – واحدهاي شدت صدا. شدت صدا به صورت توان بر واحد مساحت تعريف ميشود (مثلاُ وات بر سانتيمتر مربع) يا به صورت معمولتر با استفاده از يك اندازة لگاريتمي كه دسيبل اس.پي.ال خوانده ميشود. همچنان كه اين جدول نشان ميدهد قوة شنوايي انسان بيشتر به صداهاي بين 1كيلوهرتز تا 4 كيلوهرتز حساس است.
اختلاف بلندترين و ضعيفترين صداهايي كه انسان ميتواند بشنود 120 دسيبل است كه از لحاظ دامنه معادل بازهاي حدود يك ميليون است. شنونده تغيير بلندي صدا را وقتي صدا حدود 1 دسيبل (12% در دامنه) تغيير كند تشخيص ميدهد به عبارت ديگر تنها 120 سطح بلندي صدا از ملايمترين نجوا تا بلندترين تندر قابل تشخيص است. حساسيت گوش آنقدر جالب توجه است كه هنگام شنيدن به ضعيفترين صداها پردة صماخ به اندازهاي كمتر از قطر يك ملكول به لرزش درميآيد!
احساس بلندي صدا با توان صدا رابطة تواني با نماي 1/3 دارد. به عنوان نمونه اگر شما توان صدا را ده برابر كنيد شنوندگان آن صدا دو برابر شدن بلندي صدا را احساس و گزارش ميكنند.
اين مسأله يك مشكل بزرگ براي حذف صداهاي محيطي ناخواسته به وجود ميآورد. براي نمونه فرض كنيد كه شما 99% ديوار را با عايق صوتي پوشاندهايد و تنها 1% كه مربوط به درها، گوشهها، منافذ و… هستند باقي ماندهاند. با وجود آن كه توان صدا تا اندازة 1% مقدار اولية آن كاسته شده بلندي صدا تنها به اندازة 20% كاهش پيدا كردهاست. آهنگسازي و تنظيم
بازة شنيداري انسان بين 20 هرتز تا 20 كيلوهرتز در نظر گرفته ميشود، حال آن كه بيشتر صداهاي قابل حس در بازة 1 كيلوهرتز تا 4 كيلوهرتز قرار دارند. براي نمونه شنوندگان ميتوانند صدايي به ميزان صفر دسيبل را در فركانس 3 كيلوهرتز بشنوند حال آن كه براي شنيدن يك صداي 100 هرتزي حداقل مقدار آن بايد 40 دسيبل باشد. شنوندگان ميتوانند بگويند كه دو صدا متفاوتند اگر فركانس آنها بيش از حدود 0.3% در 3 كيلوهرتز متفاوت باشد. به عنوان نمونه كليدهاي كنار هم در پيانو به اندازة حدود 6% تفاوت فركانس دارند.
مهمترين مزيت داشتن دو گوش تشخيص جهت صداست. شنوندگان انساني ميتوانند تفاوت بين دو منبع صدا را كه فاصلهاي به كمي 3 درجه دارند (حدوداً برابر با عرض يك انسان در فاصلة ده متري) تشخيص دهند. اين اطلاعات جهتي به دو روش جداگانه به دست ميآيند. اولاً فركانسهاي حدوداً بالاي 1 كيلوهرتز به شدت زير ساية سر قرار ميگيرند. به بيان ديگر گوشي كه به منبع نزديكتر است سيگنال قوي تري را به نسبت گوشي كه در جهت مخالف دارد دريافت ميكند. روش ديگر تشخيص جهت آن است كه گوش دورتر به خاطر فاصلة بيشترش از منبع صدا را كمي ديرتر از گوش نزديكتر دريافت ميكند. به واسطة اندازة معمول سر (حدوداً 22 سانتيمتر) و سرعت صوت (حدود 340 متر در ثانيه) تفاوتگذاري زاويهاي سه درجه دقت زماني حدود 30 ميكروثانيه نياز دارد. چون اين فاصلة زماني نيازمند اصل رگبار است اين روش جهتيابي براي صداهاي داراي فركانس كمتر از حدود 1 كيلوهرتز به كار ميرود.
در حالي كه قوة شنوايي انسان ميتواند جهت صدا را تشخيص دهد در نشخيص فاصلة منبع صدا مشكل دارد. اين امر بدان علت است كه چيزهاي كمي در موج صدا وجود دارد كه اطلاعات اين گونه را در اختيار بگذارد. شنوايي انسان به صورت ضعيفي در مييابد كه منابع صداهاي با فركانس بالا نزديكند و صداهاي با فركانس پايين از فاصلة دورتري پخش ميشوند. اين به آن دليل است كه صداها در فاصلههاي دور از ميزان فركانسشان كاسته ميشود. پژواك روش ضعيف ديگري براي تشخيص فاصله است و با استفاده از آن مثلاً ميتوان ابعاد يك اتاق را حدس زد. براي نمونه صداهاي موجود در يك تالار بزرگ پژواكهايي با وقفة 100 ميلي ثانيه دارند، حال آن كه براي يك دفتر كار كوچك اين مقدار 10 ميلي ثانيه است. بعضي از موجودات با استفاده از دستگاه طبيعي تشخيص فاصلة صوتي مسألة فاصلهيابي را حل كردهاند. مثلاً خفاشها و دلفينها صداهايي مثل تيك و جيغ توليد ميكنند كه از سوي اشياء نزديك بازتابيده ميشوند. با اندازهگيري ميزان وقفة بازتاب اين صداها اين جانوران ميتوانند با دقت 1سانتيمتر اشياء را مكانيابي كنند. تجربيات نشان دادهاند كه بعضي انسانها به خصوص نابينايان تا حد كمي از روش مكانيابي با استفاده از پژواك استفاده ميكنند.
نگاره