Алгоритм кодування мовлення CELP

Сутність лінійного передбачення з мультикодовим керуванням як алгоритму кодування мови, спочатку запропонований М.Р. Шредером та Б.С. Аталом. Характеристика чотирьох ідей алгоритму CELP. Процес розширення смуги пропускання, спотворення шумом.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru

3. Спотворення шумом

4. Модифікації та галузі застосування

Алгоритм кодування мовлення CELP

Лінійне передбачення з мульти кодовим управлінням (англ. Code Excited Linear Prediction, CELP) є алгоритм кодування мови, спочатку запропонований М. Р. Шредером і Б. С. Аталом в 1985 році. У той час алгоритм забезпечував значно кращу якість, ніж алгоритми з низьким бітрейтом, такі, як аудіокодеки RELP і LPC (наприклад, FS-1015). Поряд з варіантами, як, наприклад, ACELP, RCELP, LD-CELP і VSELP, на сьогодні це найбільш широко використовуваний алгоритм кодування мови. CELP нині використовується як загальний термін для класу алгоритмів, а чи не для певного кодека. Кодери мовних сигналів, що використовують алгоритм CELP, відносяться до класу гібридних і займають проміжне положення між кодерами форми, в яких зберігається форма коливання мовного сигналу в процесі дискретизації і квантування, і параметричними вокодерами, заснованими на процедурах оцінки і кодування невеликого числа параметрів мови. При цьому в кодерах CELP зберігаються переваги обох типів кодерів. Метод кодування CELP заснований на лінійній авто регресійній моделі процесу формування та сприйняттямови та входить до групи методів аналізу через синтез.

Алгоритм CELP базується на чотирьох основних ідеях:

використання моделі джерела-фільтра для відтворення мови на основі лінійного передбачення (ЛП);

Використання адаптивної та фіксованої кодових таблиць як базу для моделі лінійного передбачення;

Замкнений пошук у «перцептуально зваженому домені».

Застосування векторного квантування (VQ)

шум мультикодовий алгоритм

де є адаптивним (тактовим) внеском таблиці кодів та є фіксованим (стохастичним) вкладом таблиці кодів. Фіксована таблиця кодів - векторний словник квантування, який є (неявно чи явно) жорстко закодованим кодеком. Ця таблиця кодів може бути ACE алгебри або збереженої явно (наприклад. Speex). Записи адаптивної таблиці кодів складаються з відстрочених версій порушення. Це дозволяє ефективно кодувати періодичні сигнали, такі як людське мовлення.

Основний принцип, укладений в основі CELP, називають (Абсолютним) «Аналізом через синтез», що означає, що кодування (аналіз) виконано, перцепційно оптимізуючи декодований сигнал у замкнутому циклі. Теоретично, найкращий потік CELP було б проведено результаті комбінацій всіх можливих наборів двійкових знаків і вибором той, який виробляє декодований сигнал найкращого звучання. Це явно неможливо з двох причин: складність реалізації вище будь-яких нині доступних апаратних засобів, і критерій відбору «краще звучання» передбачає як слухача- людини.

Щоб здійснити кодування в реальному часі, використовуючи обмежені обчислювальні ресурси, пошук CELP розбитий на дрібні, керованіші, послідовніші пошуки, використовуючи проступерцептуальну функцію надбавки Як правило, кодування виконано у такому порядку:

Лінійні Коефіцієнти Пророцтва (ЛКП) обчислені та квантовані, зазвичай як LSP

Відбувається пошук за адаптивною (тактовою) таблицею кодів, та її сприяння/внесок/видаляється

Пошук за фіксованою (стохастичною) таблицею кодів

3. Спотворення шумом

Більшість (якщо не всі) сучасні звукові кодеки намагаються сформувати спотворення в кодуванні так, щоб воно проявилося головним чином тих частотних областях, де його не може вловити людське вухо. Наприклад, вухо більш терпимо до спотворення в частинах звукового діапазону, які голосніші і навпаки. Саме тому замість мінімізації квадратичної помилки CELP мінімізує помилки на зваженій області. Зважуючий результат по кривій W (z), як правило, випливає з фільтра ЛКП за допомогою розширення смуги пропускання:

4. Модифікації та галузі застосування

Згодом алгоритм CEMP зазнав модифікацій та змін, а також отримав широке коло застосування.

Інша варіація методу CELP називається CELP із малою затримкою (low-delay CELP). У даній модифікації кодова книга створюється не на основі заздалегідь заготовлених зразків, а на основі голосу самого, що говорить, що призводить до зменшення часу обробки сигналу і найчастіше до більш точного подання голосу. Метод LD-CELP був прийнятий як стандарт ITU-T і отримав назву G.728. Він працює на швидкості 16 000 біт/с.

Третя модифікація методу CELP стала можливою завдяки появі спеніатизованих мікропроцесорних чіпів - цифрових процесорів сигнсіюв (digital signal processor - DSP). Використання алгебраїчного методу CELP пов'язаної структури (conjugate structure algebraic CELP - CS-ACELP) дозволяєдосягти високої якості звуку при швидкості 8000 біт/с. Початковий алгоритм LD-CELP був дещо модифікований підвищення його ефективності і більш точного відтворення вихідного звуку. Кодова книга має більшу здатність до адаптації, ніж у методі CS-ACELP, оскільки вона використовує складніший математичний апарат для оцінки та кодування сигналу. Зважаючи на кращу адаптованість методу, легше відбувається перехід до інших мов. Використовуючи вихідний алгоритм CELP, кодова книга створювалася на основі звуків американського варіанту англійської мови, що обмежувало сферу використання даного методу. При використанні методу CS-CELP форми хвиль, що містяться в кодовій книзі, можуть бути пристосовані до різних варіантів людської мови і, відповідно, до різних мов. Такий метод був прийнятий організацією ITU-Т як стандарт і отримав назву G.729. Він має кілька базових варіацій.

Стандарт G.729a також є методом кодування CS-ACELP, однак його алгоритм дещо спрощений для підвищення ефективності. Хоча якість, що досягається при використанні цього методу, дуже висока, його надійність дещо нижча, ніж у початкового методу G.729. Двома іншими модифікаціями методу G.729 є стандарти G.729B та G.729AB. Вони також працюють зі швидкістю 8 Кбіт/с, проте містять вбудований алгоритм визначення голосової активності (Voice Activity Detection - VAD), який дозволяє додатково заощаджувати смугу пропускання.

До переваг гібридного методу стиснення слід віднести три основні фактори:

чудова якість звуку;

значна економія смуги пропускання;

адаптованість до особливостей мови абонента.

Недоліки гібридного стиску перераховані нижче.

ДляСтиснення потрібна спеціалізована апаратура (процесор DSP).

Метод потребує багато пам'яті.

Гібридний стиск збільшує затримку, що пов'язано з обробкою даних.