Сканування архіву як оцифровуються архівні документи
Переклад в електронний вид історичних документів та формування баз даних на основі архівних описів – один із найскладніших видів оцифрування, що потребує особливого обладнання, технологій та уважного ставлення до оригіналів документів.
Як і в інших галузях державної та комерційної діяльності, оцифрування фондів у державних і муніципальних архівах служить вирішенню відразу кількох завдань: наведенню порядку у фондовому обліку, спрощенню пошуку документів, зниженню навантаження на співробітників і часу при відпрацюванні запитів користувачів, збереженні старих оригіналів, переходу до надання архівних послуг в електронному вигляді, зокрема платних послуг.
Роботи з переведення архівних фондів до електронного вигляду розпочалися ще на рубежі тисячоліть. За минулий час українськими архівами оцифровані сотні тисяч історичних документів та описів. Але це лише мала частина Архівного Фонду РФ.
Два підходи

Багато установ використовують оцифровку на вирішення разових, вузьких завдань. За аналогією з використанням безлічі програмних продуктів під кожну дрібну задачу, така оцифровка називається «клаптевою». Наприклад, у зв'язку з ювілеєм значущої для суб'єкта України особи очікується збільшення інтересу дослідників до архівних документів. Архів отримує фінансування, сканує ці фонди та переводить у формат бази даних 2–3 відповідні описи.
Цей шлях - несистемний підхід, що дозволяє відзвітувати про виконану роботу в короткий проміжок часу, але ніяк не відбивається на загальній ефективності роботи архіву, оскільки сумарний обсяг перекладених в електронний вид документів становить частки відсотка фондів установ. Багато архівів йдуть цим шляхом виключно через нестачуфінансування. Але більшість таки розуміє, що необхідні довгострокові, планові роботи.
Наприклад, у зв'язку з ювілеєм значущої для суб'єкта України особи очікується збільшення інтересу дослідників до архівних документів. Архів отримує фінансування, сканує ці фонди та переводить у формат бази даних 2–3 відповідні описи.

Пріоритет у ній надається перекладу в електронний вигляд всього науково-довідкового апарату. Цей шлях дозволяє перейти до повноцінного автоматизованого обліку фондів, зокрема створення єдиних інформаційних систем для регіональних архівів.
Крім того, з'являється можливість простого та зручного пошуку за фондами, що полегшує внутрішню діяльність та дозволяє перейти до надання архівних послуг в електронному вигляді.
Документи скануються в поточному режимі під час надходження запитів від користувачів. Для цього достатньо мати хоча б один професійний сканер. А ось для оцифрування великих за обсягом масивів, описів, а також особливо цінних документів, як і раніше, залучаються експерти з організацій, що спеціалізуються на скануванні та ретроконверсії.
Специфіка оцифрування архівних документів

Тепер розглянемо трохи докладніше деякі особливості сканування та індексування архівних документів та описів. На відміну, наприклад, від книг, що тиражуються, в архівах майже кожен документ унікальний. Величезна відповідальність лягає на оператора сканування, який має побачити особливий стан документа (старість, пошкодження, догляд тексту в корінець, особливу зшивку тощо) та оперативно налаштувати обладнання або передати документ на реставрацію.
Дуже високе значення набуває досвіду виконавця, якого залучають до робіт в установі. Якпоказала багаторічна практика, часте переналаштування обладнання, необхідність в режимі реального часу відстежувати якість оригіналів і електронних образів, що одержуються, не під силу новачкам в оцифровці. Якщо конкурс виграла така компанія, великі ризики значно збільшити термін проекту або отримати неякісний ресурс (тому потрібно обов'язково досконально перевіряти підготовлені електронні образи при здачі робіт).
Устаткування
Особливості документів пред'являють симетрично високі вимоги та обладнання. Для архівних документів можна використовувати виключно безконтактну скануючу техніку – планетарні сканери.
Причому сканер повинен мати найвищі характеристики роздільної здатності, кольору і контрастності, оскільки велика наявність неконтрастних, згасаючих текстів і зображень. Яке обладнання користується популярністю на ринку планетарних сканерів можна дізнатися з нашого огляду 2014 року.

Особлива структура, товщина, вага архівних документів іноді спричиняють необхідність розробки спеціальної техніки. Так, у більшості державних архівів серед затребуваних фондів генеалогічного спрямування є справи товщиною понад 30 см і вагою до 60 кг: наприклад, матеріали переписів населення (переписні книги), документи церковних парафій про народження та ін. Довгий час, незважаючи на затребуваність, ці фонди не сканувались через відсутність обладнання. Відповідні сканери з'явилися на ринку лише наприкінці 2013 р., але сьогодні вже завоювали популярність.
Індексування
Щоб вести облік та мати можливість шукати документи, їх треба проіндексувати – заповнити картки в АІС. Більшість архівних документів та описів виконані вручну або за допомогою друкарської машинки, тобто непіддаються якісному програмному розпізнаванню. Потрібна ручна ретроконверсія.
Знову з'являються додаткові вимоги до виконавця. По-перше, він повинен мати достатній штат, щоб виконати роботу вчасно. У найбільш масштабних на сьогодні проектах з оцифрування архівних фондів брало участь до 700 операторів індексування. Тримати такий постійний штат невигідно, тому великі та досвідчені компанії саме для великих регіональних архівних проектів часто-густо залучають місцеве населення. Вперше така технологія була застосована під час оцифрування метричних книг для проекту «Покоління Пермського краю». Через Центр зайнятості було тимчасово працевлаштовано кілька сотень людей. Причому працювали вони вдома через спеціальний додаток.

Головне питання – як досягти 100% якості? Адже у ПІБ, датах, номерах помилятися не можна. На допомогу приходять жорстка система контролю якості та технології. Наприклад, метод подвійного введення, коли інформація потрапляє до Бази даних лише після однакового внесення 2 операторами.
Але все одно залишається проблема мертвих мов та написання. При ретроконверсії таких документів на перший план виходить досвід керівників груп індексування, яким часто доводиться вирішувати складні нестандартні завдання.
А тепер про головне. Як уже зазначалося на початку статті, перспективною стратегією оцифрування архівних фондів є переведення в електронний вигляд повного НСА. Це найбільш складна робота. Методичними рекомендаціями Росархіву встановлено правила ведення баз даних з архівних описів. Тому описи необхідно індексувати за широким набором полів.
Описи, як і документи, можуть бути старими і написані однією з мертвих мов. Описи можуть мати дуже складну структуру та міститиперсональні дані. Відрізняється формат описів для звичайної та науково-технічної документації, а також об'єктів нефондового обліку. Сформовану базу даних треба заносити до програмного комплексу «Архівний фонд» тощо.