Акустичні саги

Недоліки аналогових носіїв звуку разом із невблаганним ходом прогресу призвели людини до думки, що звук можна як інформації для записи на цифрові носії. Ця ж доля не минула сьогодні жодного об'єкта, що піддається кількісному та якісному опису в системі візуальних та звукових параметрів. Які ж загальні принципи перетворення аналогового звуку на послідовність цифр?

Аналоговий сигнал за допомогою АЦП (аналогово-цифрового перетворювача) розбивається на дрібні ділянки тривалістю кілька стотисячних часток секунди. На кожній з таких ділянок АЦП вимірюється амплітуда звуку. Величина, обернена до довжини цих ділянок, називається частотою дискретизації і вимірюється, як і частота звуку, в герцах. Очевидно, що вона вища (що частіше ми вимірюємо амплітуду), то повнішу інформацію про сигнал ми зможемо зберегти.

Занадто часті виміри, проте, вимагають багато місця зберігання отриманої інформації. З іншого боку, зменшення частоти дискретизації призводить до втрати інформації, що міститься у сигналі. Як вибрати оптимальну частоту дискретизації? Відповідь дає відома теорема Котельникова, згідно з якою звук із частотоюf не може бути оцифрований при частоті дискретизації нижче2f. Це означає, наприклад, що спроба оцифровування звуку частотою, скажімо, 1000 Гц при частоті дискретизації 1000 Гц приречена на невдачу. Результатом буде тиша або спотворений звук, що не має нічого спільного з початковим. Важливим наслідком цієї теореми є встановлення достатньої верхньої межі значення частоти дискретизації.

На цьому історія із дискретизацією не закінчується. Розбиваючи звуковий сигнал на певні ділянкидовжини та вимірюючи амплітуду коливань на цих ділянках, не варто забувати, що значення цієї амплітуди при записі на згадку про комп'ютер також може мати тільки строго певні дискретні значення. Це говорить про те, що кількість сходів між максимальним та мінімальним значеннями амплітуди обмежена. Від кількості цих сходинок залежить їх висота (різниця між сусідніми значеннями амплітуди) і, отже, що їх більше, то вища якість звуку.

Особливості зберігання інформації в пам'яті комп'ютера призвели до кількості можливих сходів 256, 65536, 16777216 та 4294967296 штук. Цим цифрам відповідають 8-, 16-, 24- та 32-бітний звуки (відповідні ступеня числа два, оскільки комп'ютер працює з двійковим кодом). Звісно, підвищення «бітності» звуку веде до збільшення кількості інформації. Однак 16-бітного звуку (65536 варіантів амплітуди звуку) зазвичай цілком достатньо для якісного запису більшості звукових сигналів.

Тепер ми легко зможемо підрахувати, скільки місця займе трихвилинний стереосигнал при записі на звичайному музичному компакт-диску. 180 секунд множимо на 44 100 Гц, потім на 2 байти (це відповідає 16 бітам), потім ще на 2 (кількість каналів, оскільки сигнал стереофонічний). Підсумкова цифра – 31 752 000 байт, або близько 30,3 Мбайт інформації. Досить багато, правда? Чи можна зменшити без помітної втрати якості? Можна, можливо. Але це тема зовсім іншої статті.