Розпізнавання тексту за допомогою нейромереж Google Cloud Vision та 1С

У цій статті я розгляну можливості розпізнавання тексту (OCR) на чистому 1С за допомогою нейромереж сервісу Google Cloud Vision.

Реєстрація в консолі розробника та отримання ключа.

Спочатку потрібно зареєструватися в консолі розробника за посиланням console.cloud.google.com. Потрібно створити проект, увімкнути для нього Google Cloud Vision API. Далі в меню консолі необхідно перейти в Диспетчер облікових даних API і створити ключ API, який буде використовуватися для тестування. У документації є хороша інструкція англійською. Якщо все було зроблено правильно, то ваша консоль має виглядати як на малюнку нижче:

Формат json-запиту

Відповідно до інструкції сервісу потрібно надіслати json з полями requests (масив) image (об'єкт з полем content де міститься base64-закодоване зображення) та features (масив із зазначенням потрібного типу розпізнавання type, в даному випадку TEXT_DETECTION). Код, який це робить, можна переглянути у зовнішній обробці. У результаті виходить такий файл JSON:

Отримання відповіді Google

Надсилання даних здійснюється за допомогою об'єкта HTTPЗ'єднання за протоколом HTTPS (з установкою ЗахищенеЗ'єднанняOpenSSL) та методу НадіслатиДля Обробки. У нього передається HTTP Запит із сформованим json файлом для відправки, заданим через метод Встановити Тіло З Двійкових Даних. У json-відповіді Google нас цікавить перший елемент з ім'ям властивості description та його значення, в якому буде розпізнаний текст.

Спробуємо відправити на розпізнавання картинку з текстом:

І ось що надходить у відповідь, наведу фрагмент тексту:

Як видно, виходить дуже гарна якість розпізнавання.

А тепер спробуємо український текст:

І ось що виходить у відповіді від Google:

Робота з українською мовою

Відправимо для розпізнавання ту саму квитанцію і виходить дуже хороший результат:

Сама собою можливість використовувати найпотужніші нейромережі Google за допомогою нескладних запитів вражає.

Розпізнавання української мови теж працює дуже добре, таким чином може скласти конкуренцію ABBYY. І ціни на розпізнавання у Google Cloud набагато нижчі.

У доданій до статті зовнішній обробці можна переглянути код конструювання JSON запиту, надсилання його через HTTPЗ'єднання та отримання відповіді.

PS У вкладенні я додав і нову версію обробки, яка формує json запит для розпізнавання української мови.