روشهاي ديجيتالي ذخيرة صدا

در طراحي يك سيستم صوتي ديجيتال دو پرسش وجود دارند كه بايد پاسخ داده شوند: 1- چقدر لازم است صوت خوب به نظر برسد؟ 2- چه نرخ داده‌اي قابل تحمل است؟ جواب به اين پرسشها غالباً به يكي از اين سه انتخاب منجر مي‌شود: اول موسيقي با وفاداري بالا كه در آن كيفيت صدا مهم‌ترين چيز است و تقريباً هر نرخ داده‌اي قابل قبول است. دوم ارتباط تلفني كه نيازمند طبيعي به نظر رسيدن صحبت و يك نرخ دادة پايين براي كاهش هزينة سيستم است. سوم صحبت فشرده شده كه در آن كاهش نرخ داده بسيار مهم است و مقداري غير طبيعي به نظر رسيدن كيفيت صدا قابل تحمل است. اين مورد در بر دارندة ارتباطات نظامي، تلفنهاي سلولي و صحبت ذخيره شده به صورت ديجيتال براي پست الكترونيكي صوتي يا كاربردهاي چند رسانه‌اي است. آهنگسازي و تنظيم

شكل شمارة 3 بده بستانهاي موجود در انتخاب هر يك از اين سه روش را نشان مي‌دهد.

در حالي كه موسيقي نيازمند پهناي باند 20 كيلوهرتز است صحبتي كه طبيعي به نظر برسد فقط به پهناي باندي در حدود 3.2 كيلوهرتز نيازمند است. در اين حال هر چند پهناي باند به اندازة 16% مقدار اوليه محدود مي‌شود ولي فقط 20% اطلاعات اوليه از دست مي‌رود.

سيستمهاي ارتباط راه‌دور اغلب از نرخ نمونه‌برداري در حدود 8 كيلوهرتز استفاده مي‌كنند كه اجازة انتقال صحبت را با كيفيتي در حد طبيعي مي‌دهد ولي اگر از آن براي انتقال موسيقي استفاده شود تا ميزان بالايي از كيفيت آن از دست مي‌رود. شما احتمالاً با تفاوت اين دو ميزان آشنايي داريد: ايستگاههاي راديويي اف.ام با پهناي باندي در حدود 20 كيلوهرتز اقدام به پخش مي‌كنند حال آن كه ايستگاههاي اي.ام محدود به 3.2 كيلوهرتز هستند. صحبت و صداهاي معمول روي ايستگاههاي نوع دوم طبيعي به نظر مي‌رسد حال آن كه موسيقي اين گونه نيست.

5

شكل شمارة 3 – نرخ دادة صوتي در برابر كيفيت صدا. كيفيت صداي يك سيگنال صوتي ديجيتال به نرخ دادة آن كه برابر با حاصل‌ضرب نرخ نمونه‌برداري آن در تعداد بيتهاي آن در هر نمونه بستگي دارد كه به سه بخش تقسيم مي‌شود: موسيقي باوفاداري بالا (706كيلوبيت بر ثانيه)، صحبت با كيفيت تلفن (64كيلوبيت بر ثانيه) وصحبت فشرده شده (4 كيلوبيت بر ثانيه)

سيستمهايي كه فقط با صدا (و نه موسيقي) سر و كار دارند مي‌توانند مقدار دقت را از 16 بيت به 12 بيت بدون از دست رفتن دقتي قابل توجه كاهش دهند. اين ميزان مي‌تواند با انتخاب اندازة نامتساوي براي گام مقدارگزيني مي‌تواند به 8 بيت در هر نمونه نيز كاهش يابد. يك نرخ نمونه‌برداري 8 كيلوهرتز با دقت اي.دي.سي 8 بيت در هر نمونه به نرخ دادة 64كيلوبيت بر ثانيه مي‌انجامد. اين يك حد نهايي براي طبيعي به نظر رسيدن صحبت است. دقت كنيد كه صحبت نيازمند نرخ داده‌اي معادل 10% نرخ دادة موسيقي با وفاداري بالاست.

نرخ دادة 64 كيلو بيت بر ثانيه نمايانگر كاربرد نهايي نظرية نمونه‌برداري و مقدارگزيني براي سيگنالهاي صوتي است. روشهاي كاهش نرخ داده به اندازه‌اي بيشتر از اين مبتني بر فشرده‌سازي جريان داده با حذف تكرارهاي ذاتي سيگنال صحبت است. يكي از كاراترين روشهاي موجود ال.پي.سي است كه انواع و زيرگروههاي متعدد دارد. بر اساس كيفيت سيگنال صحبت مورد نياز اين روش مي‌تواند نرخ داده را تا اندازه‌اي بين 2 تا 6 كيلو بيت بر ثانيه كاهش دهد.
نگاره