українськомовні мовні технології
Поділіться у соцмережах:
Мабуть, можна без перебільшення сказати, що останні років приблизно в багатьох науково-фантастичних фільмах і літературних творах люди майбутнього використовують для спілкування з різними "розумними" машинами звичайну людську мову. Це стало таким звичайним, що, наприклад, діалог Корбена Далласа зі своїм таксі (фільм "П'ятий елемент") сприймається нами як цілком природна річ. Справді, ну не вічно люди вдивлятимуться у свої монітори, щоб прочитати отримані листи, і тиснути на кнопки, щоб на них відповісти! Тим часом проходять роки, а спосіб спілкування з комп'ютерами залишається колишнім. Так, з'явилися додаткові клавіші на клавіатурі, миші з коліщатками і т. д., але ці зміни все ж таки, швидше, кількісні, ніж якісні. І лише в останні кілька років став помітний реальний прогрес у сфері комп'ютерних голосових технологій.
Однак у всіх цих приголомшливих досягнень є одне дуже суттєве "але" - як правило, вони відносяться тільки до англійської мови, яка, на превеликий жаль, все ще чужа і незрозуміла для більшості наших співвітчизників. Невже і на це "свято життя" нам залишається тільки дивитися збоку? На жаль! На сьогоднішній день на ринку немає жодного програмного продукту, здатного синтезувати чи розпізнавати українську мову. Втім, враховуючи відомі історичні та інші обставини, для багатьох українців прийнятною є українська мова, з якою, на щастя, не все так погано. У цій статті ми і постараємося уявити сучасний стан справ з українськомовними комп'ютерними мовними технологіями.
| Genie читає листа в Microsoft Outlook |
| PG>Якщо можна, то і приклад PG> якийсь додайте. |
Пе Же: Якщо можна, то і приклад якийсь додайте.
Однак просту функцію перетворення тексту в мову можна реалізувати і самому. У лістингу наведено фрагмент коду, який озвучує поточний документ Microsoft Word. Після інсталяції Microsoft Agent та модуля для синтезу української мови створіть у Word новий макрос і скопіюйте текст листингу всередину процедури (між рядками Sub та End Sub). При виклику макросу ви побачите джина, який прочитає текст.
| ' створюємо та ініціалізуємо Agent Control Set control = CreateObject("Agent.Control") control.Connected = True ' завантажуємо агента Genie control.Characters.Load "Genie", "Genie. acs" Set Genie = control.Characters("Genie") Genie.Language > 'вимовляємо Genie.Show Set Request = Genie.Speak(ActiveDocument.Content) While Request.Status <> 0 DoEvents Wend Genie.Hide |
| Макрос для озвучування документа Microsoft Word |
Цей же код можна використовувати в Microsoft Outlook для озвучення відкритого повідомлення - достатньо
| ActiveDocument.Content |
Компанія Dragon Systems ще до того, як увійшла до складу Lernout & Hauspie, випускала продукт для розпізнавання мови - Dragon Dictate. Фірма Voicelock спільно з White Computers розробила для нього модуль "Горинич", що дозволяє керувати додатками та диктувати тексти українською. Незважаючи на солідний вік, це рішення і сьогодні залишається практично єдиним. У Dragon Dictate застосовувалася застаріла за нинішніми мірками технологія, що вимагає від користувача роздільної вимови всіх слів. з обов'язковими паузами між ними. Після того, як Dragon Systems була придбана компанією Lernout & Hauspie, а також через повсюдний перехід до розпізнавання природного злитого мовлення продукт Dragon Dictate перетворився на Dragon NaturallySpeaking, який вже не підтримує українську мову.
Реальні спроби використати "Горинич" (або побудовані на тому ж ядрі програми "Комбат" та "Диктант") показали, що, на жаль, ця технологія недостатньо зручна. При роботі з мікрофоном, вбудованим у ноутбук або встановленим на столі, якість розпізнавання мови абсолютно неприйнятна, тому необхідно застосовувати головну гарнітуру. Було б чудово використовувати радіомікрофон, який дав би можливість, скажімо, диктувати тексти, походжаючи кімнатою. Однак користувач не помітить некоректно розпізнаних слів, внаслідок чого якість роботи ще погіршиться. Фактично, ця обставина змушує постійно дивитися на монітор, що, погодьтеся, не надто комфортно.
В цілому "Горинич" цілком підходить для управління комп'ютером (відкриття/закриття вікон, навігації по меню, переміщення по документу), але для того, щоб система розпізнавала текст, що диктується (хоча б з паузами між словами), необхідно досить-таки довго її навчати. Цей процес, правду кажучи, дуже стомливий і вимагає акуратності, особливо на початковому етапі, який може зайняти від кількох днів до кількох місяців — залежно від старань користувача та його дикції. Втішно лише те, що з часом алгоритм розпізнавання підлаштовується до голосу та особливостей вимови користувача та дозволяє вводити тексти швидше, ніж за допомогою клавіатури.
Крім перерахованих вище, існує ще кілька організацій, які займаютьсяукраїнськомовними мовними технологіями, проте не мають поки що готових продуктів.
Цікава робота ведеться у Мінську фірмою "Сакрамент". Ця компанія створює системи як для синтезу, так і для розпізнавання української мови. Наявні демонстраційні приклади дозволяють зробити висновок про серйозність розробки — мова, синтезована як чоловічим, так і жіночим голосом, дуже розбірлива і близька до природної. Програма підтримує специфікацію Microsoft SAPI 4, точність розпізнавання окремих слів і мовних команд становить 95-98%. У найближчому майбутньому з'явиться комерційна версія синтезатора мови. У планах компанії — розпізнавання злитої мови, підтримка української та білоукраїнської мови.
У 1997 р. Bell Laboratories, підрозділ компанії Lucent Technologies, оголосив про плани розробки синтезатора української мови. Проте до сьогодні, крім прикладів озвучених фраз, нічого так і не з'явилося. Судячи з прикладів, якість мови повинна бути дуже високою, але чи завершаться ці розробки, поки важко сказати.
З 1996 р. московська компанія "СТЕЛ - Комп'ютерні Системи" у співпраці з провідними спеціалістами філологічного факультету МДУ ім. М. В. Ломоносова, обчислювального центру РАН та низки інших організацій виконує проект зі створення прототипу "дикторонезалежної" системи розпізнавання української мови. Поки що, на жаль, реальних результатів у них немає.
Незважаючи на досить безрадісну картину сьогодні, надія на деякі зміни в найближчому майбутньому все ж таки є. Зважаючи на все, серйозних результатів можна очікувати саме від розробників із країн колишнього CCCP — інтерес користувачів до цього ПЗ є, фахівці, яким під силу його створити, здається, теж, і, що такожВажливо, що українська мова для багатьох все ще є рідною.