Розпізнавання мови на RPI2 за допомогою Google Speech API
Нещодавно мені прийшла ідея зробити деяке пристосування, здатне керуватися голосовими командами і виконувати певні дії. Для реалізації цієї витівки я придбав мікрокомп'ютер Raspberry PI 2 та зовнішню аудіокарту, а також використовував мікрофон від навушників.
З придбанням всіх необхідних компонентів я кинувся писати код, але зіткнувся з безліччю проблем, більшість із них було пов'язано з доступом до мікрофону, а також бібліотекою для python pyAudio.
Я вважаю, що вирішення проблем може бути окремою статтею. Зрештою я прийшов до використання бібліотеки системи спільно з утилітою ALSA (arecord, aplay).
Підключення всіх необхідних бібліотек
Відразу хочу додати, що в цій статті не йдеться про потокове розпізнавання.
Необхідні функції для запису та конвертації записаного файлу у різні формати:
А ось і сам запит на сервери Google.
Ключ для api необхідно отримати тут (ключ для сервера), і підключити до кабінету speech api тут
Потім структура коду
Світлодіоди підключені таким чином:

Таким чином ми зробили установку, яка дозволяє активувати різні пристрої за допомогою голосових команд.