Яндекс» представив технологію синтезу мовлення та голосового введення

Технології Yandex SpeechKit охоплюють основні можливі сценарії мовної взаємодії людини з пристроєм: голосову активацію, розпізнавання промови довільної тематики та її переклад у текст, синтез промови, тобто озвучування тексту з можливістю вибору інтонації, а також голосове управління з виділенням смислових об'єктів.

Технології для розробників

За допомогою технології голосової активації будь-яка програма може створити власну голосову команду активації голосової взаємодії.

«Яндекс.Диктовка»

Для демонстрації мовних технологій у магазині «Яндекс.Store» доступний додаток «Яндекс.Диктовка». Для активації голосового введення, наприклад, слід скористатися командою "Яндекс, записуй". Потім потрібно продиктувати довільну мову, яку програма переведе в текст, а в деяких випадках розставить розділові знаки.

Технологія синтезу прочитає запис за допомогою команди «Прочитай все». Надиктований у демонстраційному додатку текст можна скопіювати в буфер і поділитися у програмі за допомогою голосових команд. Всі тексти автоматично зберігаються у нотатки, які доступні для завантаження на "Яндекс.Диск".

Всі мовні технології "Яндекса" доступні в бібліотеках Yandex SpeechKit Mobile SDK (для мобільних розробників на iOS, Android та Windows Phone) та Yandex SpeechKit Cloud (API для інших систем та пристроїв).