Система конвертації даних формату PDF у текстовий формат

Сторінки роботи

формату

формат

текстовий

система

текстовий

зміст роботи

Система конвертації даних формату PDF у текстовий формат

  • Автор кваліфікаційної роботи
  • Керівник

Актуальність програмного продукту PDFtoTEXT 1.0

  • Програма не тільки витягує інформацію з PDF-файлу, але й конвертує її у формат текстового документа, перетворюючи кінцевий файл на справжній переносимий і редагований документ;
  • Програма, призначена для підрахунку кількості сторінок, а також іншої статистики по PDF, дуже зручна для отримання повного уявлення про інформаційний обсяг PDF;
  • Програма спрямована на досягнення максимальної відповідності вихідного та результуючого файлу;
  • Програма є безкоштовною, що дозволяє негайно її вивантажити та почати використовувати. Виходячи із проблеми різної платоспроможності потенційних користувачів, вона актуальна для користування учнями шкіл та студентами ВНЗ.

Аналоги, їх плюси та мінуси

  1. Solid Converter PDF 1.0
  2. Плюси:
  3. Вибір та конвертування лише малюнків із PDF файлу та їх збереження у вигляді графічних файлів;
  4. Перетворення вибраного діапазону сторінок.
  5. Мінуси:
  6. Програма умовно безкоштовна;
  7. Не передбачена коротка інформація про конвертований файл;
  8. Великий розмір файла-установника.

  1. PDF Transformer 1.0
  2. Плюси:
  3. Перетворення PDF-файлів будь-якого типу;
  4. 4 формати збереження;
  5. Програма коректно працює зPDF файлами 37 мовами;
  6. Мінуси:
  7. Висока ціна товару;
  8. Досить жорсткі системні вимоги;
  9. Низька швидкість отримання інформації для продукту такого класу (розробник – компанія ABBYY).

Напрям та завдання досліджень

  • Мета роботи полягає у розробці та створенні програмного продукту, що дозволяє витягувати текстову інформацію з PDF-файлів і зберігати її у файли текстового формату. Для досягнення цієї мети було вирішено такі завдання:
  • Дослідження структури файлів PDF;
  • Розробка алгоритму вилучення тексту (проектування та реалізація);
  • Створення інтерфейсу користувача.

Схеми, необхідні для вивчення PDF

Структура формату PDF

Структура файлу PDF

формату

система

Основні можливості програмного продукту

Інформація про PDF

формат

конвертації

Основні можливості програмного продукту

Попередження про помилку

Візуальне підтвердження про виконану роботу

система

конвертації

Приклади, що відображають результати роботи

Вихідний PDF-файл

даних

Приклади, що відображають результати роботи

Файл TXT після конвертації

даних

Результати оцінки програмного продукту сторонніми особами

Таблиця економічного обґрунтування дипломного проекту

текстовий

Система конвертації даних формату PDF у текстовий формат

  • Автор кваліфікаційної роботи
  • Керівник