Робота з рукописними математичними текстами
Діяльність описується завдання розпізнавання рукописних математичних текстів. Розглядаються два основні методи розпізнавання: динамічний та статичний. Наводиться короткий опис алгоритму розпізнавання рукописних математичних формул, у якому застосовується статичний метод. Для звичайного тексту використається динамічний. Описується метод відокремлення математичних формул від решти тексту та подальшого з'єднання результатів без порушення початкової структури всього тексту.
У цій роботі є описаним питанням handwritten matematical text recognition. Виникла динамічна і статечні методи зображення зображення. На примітці опис тексту handwritten matematical text recognition algorithm, which used the static method is proposed. Динамічний метод використовується як нематематичний текст recognize. We describe the method of separate of matematical formulas from the entire text and union of the results without losing the original structure.
Розпізнавання текстів у час є актуальним завданням, якщо ці тексти містять математичні формули. Щоб оцифрувати паперові документи, доводиться самі формули набирати вручну. Але з цим завданням людина не може впоратися з кількома причинами. По-перше, ручне введення математичних формул вимагає додаткових знань у галузі інформаційних технологій, а саме вміння друкувати математичні формули, що більшості людей дається з великими труднощами. в електронний документ.паперовий документ просто може містити дуже велику кількість формул, в результаті чого навіть для кращих фахівців знадобиться чимало часу.
Складність розв'язання задачі розпізнавання безпосередньо залежить від структури самих текстів та від способу їх створення (рукописні, друковані). Нині непогано вирішуються деякі завдання у цій галузі. Наприклад, розпізнавання звичайних друкованих текстів, які містять складних конструкцій (математичних формул, діаграм тощо.), виконується досить добре. Приклад цього вже здобув всесвітню популярність FineReader компанії ABBYY.
З більш складними текстами поки що виникають великі проблеми. Розпізнавання математичних текстів передбачає перетворення рукописних чи друкованих текстів, які у математичних науках. На даний час не
PROCEEDINGS OF CONFERENCE
“TECHNOLOGIES OF INFORMATISATION
IN PROFESSIONAL ACTIVITY”
ТОМ ІІ, ІЖЕВСЬК, ЛИСТОПАДА, 2011
VOL.II, IZHEVSK, NOVEMBER 2011
Сапаров А.Ю. Робота з рукописними математичними текстами
Очевидно, що людина записує формули на папері швидше, ніж набирає їх за допомогою клавіатури. Першочергове завдання полягає в тому, щоб збільшити швидкість набору математичних формул. Це підтверджує актуальність завдання розпізнавання математичних текстів.
1. Загальні відомості
Розпізнавання текстів може здійснюватися двома основними способами: динамічним та статичним.
Перший спосіб в основному використовується для введення тексту в електронних пристроях з додатковим обладнанням (наприклад планшетом, сенсорним екраном і т.д.). У цьому випадку не використовуються готові тексти на паперових носіях, ні звичайні графічні зображення в растрових форматах, що містять текст. Технологія розпізнавання не надто складна. Одночасно під час введення рукописного тексту відбувається збереження послідовності запису, тобто. послідовності точокна площині, якими проходило записуючий пристрій (наприклад стилус). За отриманими даними відбувається пошук найбільш відповідного шаблону, що зберігається в базі, і цим відбувається формування тексту в електронному вигляді. Для цього методу дуже важливо знати послідовність запису тексту, тому що вона є основним джерелом інформації, необхідної для розпізнавання. Так два записи одного й того ж слова, написані в різній послідовності, є нерозрізненими для погляду людини і навіть для комп'ютера, якщо зберегти їх у растровому форматі. Але розпізнаються вони зовсім по-різному.
Для обробки сканованих зображень цей метод не підходить, оскільки визначити послідовність запису у таких випадках неможливо, тому в цьому випадку використовується статичний метод розпізнавання. Цей метод використовується для готових текстів, зазвичай друкованих. Алгоритм розпізнавання повністю відрізняється від алгоритму, що використовується динамічному розпізнаванні. Оскільки послідовність запису невідома, використовується відразу все зображення тексту. Спочатку відбувається пошук окремих елементів у зображенні, які за геометричними характеристиками порівнюються з шаблонами, що зберігаються в базі. Потім розглядаються всі відповідні комбінації символів і вибирається одна найкраща. Порядок розпізнавання зави-
PROCEEDINGS OF CONFERENCE
“TECHNOLOGIES OF INFORMATISATION
IN PROFESSIONAL ACTIVITY”
ТОМ ІІ, ІЖЕВСЬК, ЛИСТОПАДА, 2011
VOL.II, IZHEVSK, NOVEMBER 2011
Сапаров А.Ю. Робота з рукописними математичними текстами
сит від самої мови тексту, що розпізнається.
2. Опис задачі
У сучасному світі у своїй професійній діяльності людині доводиться набирати на комп'ютерітексти різного ступеня складності. Суть цього завдання у тому, щоб полегшити людську працю при наборі текстів, містять математичні формули. Це може бути досягнуто двома основними способами. В обох випадках людина не повинна використовувати клавіатуру для введення формул. У першому випадку людина повинна мати можливість записувати формули за допомогою графічного пристрою введення (наприклад, за допомогою планшета, сенсорного екрана), а відповідне програмне забезпечення розпізнаватиме записаний рукописний текст. У разі введення тексту має здійснюватися з допомогою розпізнавання сканованого зображення, тобто. у разі, якщо текст вже існує у вигляді паперового документа. Вочевидь, що у першому випадку є можливість використання динамічних методів розпізнавання, тоді як у другому цієї можливості немає. Статичний метод може бути використаний в обох випадках, тому в основі цієї роботи лежатиме завдання створення алгоритму статичного розпізнавання математичних формул.
Отриманий текст має бути збережений у одному з форматів, призначених для представлення математичних текстів.
Повинна бути реалізована можливість відокремлення математичних формул від решти тексту для окремого розпізнавання. Методів поділу тексту можна використовувати кілька: від ручного (формули виділяє людина) до автоматичного. Об'єднання має бути автоматичним і воно повинно виконуватись без порушення структури вихідного зображення.
Для розпізнавання звичайного рукописного або друкованого тексту слід провести огляд існуючих систем і вибрати найбільш підходящі з них. Основна мета роботи полягає у розпізнаванні самих математичних формул, а не звичайних текстів, тому для розпізнавання звичайноготексту потрібно вико-
PROCEEDINGS OF CONFERENCE
“TECHNOLOGIES OF INFORMATISATION
IN PROFESSIONAL ACTIVITY”
ТОМ ІІ, ІЖЕВСЬК, ЛИСТОПАДА, 2011
VOL.II, IZHEVSK, NOVEMBER 2011
Сапаров А.Ю. Робота з рукописними математичними текстами
ти вже готові алгоритми.
3. Опис методу
При вирішенні поставленого завдання виникає одна проблема, а саме: нині немає систем, здатних досить добре розпізнавати рукописні тексти. У зв'язку з цим будемо розглядати лише рукописні тексти, котрим відома послідовність записи, тобто. будуть використані лише методи динамічного розпізнавання. Ще одне важливе обмеження це ручне виділення математичних формул.
Розглянемо короткий опис методу розв'язання цієї задачі. Розпізнавання відбувається у 3 основних етапи:
1) Поділ вихідного зображення на частини: математичні формули і типовий текст.
2) Розпізнавання кожної частини окремо.
3) Поєднання результатів.
З другого краю етапі відбувається саме розпізнавання текстів. Для звичайного тексту можна скористатися будь-якою існуючою системою. Вибрана система повинна за послідовністю запису розпізнавати рукописний текст та зберігати його у текстовому файлі. Після обробки масиву зі звичайним текстом напів-