Кодування мовних сигналів, Посилення мобільного зв’язку

4.3. Кодування мовних сигналів

> Дивитись актуальні ціни на підсилювачі стільникового зв'язку репітери GSM

Кодер мовного сигналу є першим елементом цифрового ділянки передавального тракту, наступним після АЦП (рис. 4.2). Основним завданням кодера є гранично можливе стиснення сигналу мовлення, представленого в цифровій формі, тобто гранично можливе усунення надмірності мовного сигналу при збереженні прийнятної якості мови, що передається.

Компроміс між ступенем стиснення та збереження якості зазвичай знаходиться експериментально, а проблема отримання високого ступеня стиснення без надмірного зниження якості становить основну труднощі при розробці кодера.

У приймальному пристрої (рис. 4.2) перед ЦАП розміщений декодер мовного сигналу. Завданням декодера є відновлення цифрового сигналу мови, з властивою йому природною надмірністю, прийнятого кодованого сигналу. Поєднання кодера і декодера зазвичай називають кодеком (coder/decoder=codec).

Кодек мовного сигналу.

Система DTX управляється детектором активності мови VAD (Voice Activity Detection), який забезпечує виявлення та виділення інтервалів мови з шумомі шуму без мови, навіть у тих випадках, коли рівень шуму можна порівняти з рівнем мови.

До складу системи DTX входить пристрій формування комфортного шуму, який включається та прослуховується в паузах мови (коли передавач вимкнено).

Система переривчастої передачі мови також включає пристрій для екстраполяції фрагментів мови, втрачених через помилки в каналі.

Структурна схема процесу обробки мовного сигналу показано на рис. 4.3. Основним пристроєм у цій схемі є кодек мови.

Відповідно до стандарту GSM, кожен радіоканал використовується для організації восьми цифрових каналів з TDMA. Значить, якщо це будуть стандартні ІКМ-канали, потрібно швидкість передачі 8x64 = 512 кбіт/с. Таку швидкість передачі інформації користувача по одному радіоканалу забезпечити неможливо.

Вихід з цієї ситуації може бути знайдений, з одного боку, у збільшенні щільності інформації, що передається, а з іншого — у застосуванні більш складних способів кодування мовних сигналів, що вимагають меншого обсягу інформації.

Зниження необхідної швидкості цифрового потоку кожного каналу за рахунок використання складніших способів кодування повинно здійснюватися без значного погіршення якості. Найбільш низька швидкість передачі інформації (1.3) кбіт/с потрібна при використанні вокодерів, однак, якість передачі мови в цьому випадку досить низька, при декодуванні виходить «синтетичний» мовний сигнал. Висока якість передачі мови при незначному зниженні вимог до швидкості можна отримати при використанні різних модифікацій ІКМ, але складнішої апаратної реалізації.

Для того, щоб мати високу якість передачі мови при більш низьких вимогах до швидкості передачі інформації, GSM використовується спосіб кодування, що поєднує вокодери і диференціальну ІКМ, який отримав назву диференціального кодування. Вокодерне перетворення засноване на використанні особливостей мовних органів людини.

Звукові коливання, що випромінюються голосовими зв'язками, формуються далі у «фільтрах», що утворюються горлом, ротом і носом. Знаючи в кожний момент спектр частот і параметри таких фільтрів, можна відновити вихідний сигнал. Враховуючи інерційність голосових органів людини, можна вважати, що заневеликий проміжок часу (порядку 10. 30 мс) вони не змінюють свого стану, тобто залишаються постійними частоти та параметри фільтрів.

Отже, якщо брати відрізки мовного сигналу по 20 мс, частоту основного тону і параметри речетворуючого фільтра тракту, то по них легко можна відновити вихідний сигнал. Так, наприклад, при кодуванні з лінійним пророкуванням визначається і передається наступна інформація: - параметри моделі речеобразующего тракту; - характер збудження (голосний або дзвінкий приголосний звуки в порівнянні з глухими звуками); - період основного тону; - коефіцієнт посилення.

У фіксовані проміжки часу голосові органи людини не залишаються у фіксованому положенні, їх збудження носять більш комплексний характер, ніж переданий характер збудження та період основного тону. Це призводить до значного погіршення якості.

Диференціальна ІКМ враховує кореляцію дискретних звітів АІМ сигналу. При цьому кодуються не самі дискретні відліки, а різниця амплітуд надійшов і попереднього дискретних відліків. Оскільки діапазон зміни амплітуд різниці дискретних відліків менший від діапазону зміни амплітуд самих дискретних відліків, для їх кодування потрібно менше розрядів.

Таким чином, диференціальне кодування має на увазі розподіл мовного сигналу на відрізки в 20мс з попереднім їх кодуванням.

Кодек стандарту GSM

У стандарті GSMв системі кодування мовних сигналів використовується метод лінійного передбачення з збудженням регулярної послідовністю імпульсів та довготривалим передбаченням, тобто метод RPE-LTP.

Спрощена блок-схема кодека у стандарті GSM представлена на рис. 4.4.

Кодер

Кодер,представлений на рис. 4.4 складається з шести основних блоків Б.1. Б.6 [4.4]. Розглянемо послідовно призначення вказаних блоків. Б.1 - блок попередньої обробки здійснює такі функції: - передбачення вхідного цифрового сигналу sn(після АЦП) за допомогою цифрового фільтра, що підкреслює верхні частоти; 5-632 - розділення вхідного сигналу snна сегменти по 160 вибірок (20мс); - зважування кожного з сегментів вікном Хеммінга («косинус на п'єдесталі» - амплітуда сигналу плавно спадає від центру вікна до країв). Б.2 - фільтр-аналізатор STP: з виходу блоку Б.1 сигнал фільтрується гратчастим фільтром-аналізатором короткочасного лінійного передбачення і за його вихідним сигналом - залишку передбачення STPЬп- оцінюються параметри довготривалого передбачення LTP: коефіцієнт передбачення gі тимчасова затримка d Б.5. Б.З - блок оцінки параметрів фільтра STP: для кожного 20 мс сегмента оцінюються параметри фільтра-аналізатора STP - 8коефіцієнтів часткової кореляції kt (i = 1. 8), при порядку передбачення М = 8 (/ = 1. М) , Які передачі по каналу зв'язку перетворюються на логарифмічні відносини площ LARrh причому для функції логарифму використовується шматково-лінійна апроксимація. Б.4 - фільтр-аналізатор LTP: сигнал залишку передбачення Ьпфільтрується фільтром-аналізатором LTPдовгочасного лінійного передбачення, при цьому формується залишок передбачення LTP-v„. Б.5 — блок оцінки параметрів фільтра LTP: у блоці по залишку STP— Ьоцінюються параметри довготривалого передбачення gі d. і параметри gі dоцінюються для кожного підсегменту окремо, причому для оцінкивеличини тимчасової затримки dдля поточного підсегменту використовується ковзний підсегмент 40 вибірок, що переміщається в межах попередніх 128 вибірок сигналу залишку передбачення Ьп. Б.6 — блок оцінки параметрів сигналу збудження: вихідний сигнал фільтра-аналізатора LTP— залишок передбачення vn— фільтрується фільтром, що згладжує, і по ньому формуються параметри збудження, окремо для кожного з 40 вибіркових підсегментів. Сигнал збудження одного підсегменту складається з 13 імпульсів, що прямують через рівні проміжки часу (втричі більші, ніж інтервали дискретизації сигналу після АЦП - тобто вихідного сигналу), і мають різні амплітуди. Для формування сигналу збудження 40 імпульсів підсегменту згладженого залишку v„ обробляються наступним чином: - останній сороковий імпульс відкидається; - перші 39 імпульсів розбиваються на три послідовності:

■ у першій послідовності - імпульси 1, 4.. .37; ■ у другій - імпульси 2, 5, . 38; ■ у третій - імпульси 3, 6, . 39.

Як сигнал збудження вибирається та з послідовностей, енергія якої більша. Амплітуди імпульсів нормуються по відношенню до імпульсу з найбільшою амплітудою та нормовані амплітуди кодуються трьома бітами кожна при лінійній шкалі квантування. Абсолютне значення найбільшої амплітуди кодується шістьма бітами у логарифмічному масштабі. Положення початкового імпульсу 13-елементної послідовності кодується двома бітами, тобто визначається номер послідовності, обраної в якості сигналу збудження для даного підсегменту.

Таким чином, вихідна інформація кодера мовного сигналу для одного 20 мс сегмента мови включає: - параметри фільтра-аналізатора STP - 8 коефіцієнтів логарифмічноговідносини площ LARг, (/ = 1 ... 8) - один набір на весь сегмент; - параметри фільтра-аналізатора LTP-коефіцієнт довготривалого передбачення gі тимчасову затримку dдля кожного з 4-х підсегментів;- параметри сигналу збудження - номер послідовності п, максимальна амплітуда В, нормовані амплітуди bt(1. 13) імпульсів послідовності - для кожного із 4-х підсегментів.

Число біт, що відводяться на кодування параметрів, наведено в табл. 4.1.

Усього для одного 20-мілісекундного сегмента промови передається 260 біт інформації, тобто кодер промови здійснює стиснення інформації майже в 5 разів (1280/260 = 4,92, де 1280 = 160x8 - число біт у методі лінійного передбачення).

Декодер.

Розглянемо принцип декодування інформації, що надходить каналом зв'язку відповідно до схеми рис. 4.4.

1. Блок формування сигналу збудження 1.Б, використовуючи прийняті параметри сигналу збудження, відновлює 13-імпульсну послідовність сигналу збудження для кожного з підсегментів сигналу мови, включаючи амплітуди імпульсів та їх розташування в часі, тобто сигнал - як залишок довготривалого передбачення надходить на вхід 2.Б - фільтра-синтезатора LTP.

2. Сформований таким чином сигнал збудження фільтрується фільтром-синтезатором довготривалого прогнозу LTP, на виході якого виходить відновлений залишок короткочасного прогнозування Основи стільникового зв'язку стандарту GSM.