Технологічна модель побудови інформаційного порталу бібліотеки з використанням метаданих
Практичне використання Dublin Core у бібліотеці
Для легшого розуміння звичайним біблітекарем питань використання метаданих Dublin Core , гадаю, буде доречним провести ряд паралелей та допусків. Давайте подивимося на опис ресурсів Інтернету, як на традиційну бібліотечну роботу зі складання каталогу:
1. Опис із використанням Dublin Core ресурсів Інтернету є ні що інше як бібліографічний опис книги або аналітичної статті журналу (газети).
2. Зважаючи на те, що правила бібліографічного опису (ГОСТ-7. 1. 84) не мають даних про цифрові ресурси, будемо вважати, що правила Dublin Core і є наше зведення правил про опис цих ресурсів (до речі, з урахуванням останнього світового досвіду). Тобто Dublin Core - це ГОСТ-7. 1. 84” для Інтернету.
3. Традиційний каталог передбачає зберігання бібліографічної картки окремо від першоджерела (для паперового каталогу – картка в каталожній скриньці, для електронного – запис у бібліографічній БД). Ми дотримуватимемося всього того, що стосується електронного каталогу. Але додатково врахуємо, що користувач мережі Інтернет не знаходиться у стінах нашої бібліотеки, і не зможе отримати доступ до карткового каталогу. Тому створюючи опис Dublin Core для html-сторінок власного сервера ми поміщаємо цей опис до коду HTML безпосередньо в тіло документа, що публікується. Іншими словами: ми публікуємо в мережі Інтернет електронний документ і одночасно "вшиваємо" каталожну картку в тіло першоджерела.
Утиліта "Переглядач-конвертор метаданих Dublin Core"
Цього буде достатньо для того, щоб на сторінці сервера з'явився лінк DC. Metadata , і користувачі вашого сервера зможуть переглядати описові дані Dublin Core вашоїсторінки.
Наступна програма є продовженням попередньої, але з розширеними функціями (http://www.library.kr.ua/dc/lookatdc.html). Її призначення — можливість тестувати будь-які сторінки мережі Інтернет щодо наявності метаданих Dublin Core. Це пошукова форма, що має інтерфейс трьома мовами (українська, українська та англійська). Крім того, ви можете отримувати вторинну інформацію про сторінки навіть у тому випадку, якщо вони не мають метаданих Dublin Core . Програма просто згенерує максимальну кількість даних з інших, супутніх параметрів сторінки і відповідей сервера, а далі перекодує їх на льоту у формат Dublin Core.
Непрямо програма дозволяє судити взагалі про будь-яку присутність метеданих на сторінці, тому що використовує у своїй роботі стандартні html-метадані, призначені для розпізнавання сторінки традиційними пошуковими машинами Інтернет. Я провів невелике тестування веб ресурсів деяких бібліотек України та провідних бібліотек України щодо наявності хоч якихось метаданих. Результати виявилися плачевними. Можна стверджувати, що практично бібліотеки не приділяють цьому питанню належної уваги. Мені часто доводилося чути від бібліотекарів скарги на погано оформлені видання в контексті вихідних даних, про книги-перевертні або, наприклад, CD ROM, які оформлені з видавничої точки зору абсолютно безграмотно. Особливо важко доводиться із такими виданнями відділам обробки. Важко чи неможливо отримати вихідні дані та інші параметри при внесенні опису такого документа до бібліотечного каталогу. Однак давайте поглянемо під цим кутом на веб-сайти українських бібліотек. Створюючи чергову html-сторінку, бібліотека в даному випадку виступає видавцем цифрового документа в мережіІнтернет. І що ж виходить? Ця ж бібліотека "штампує" для мережі Інтернет документи без роду та імені. Чи це не приклад видавничої діяльності у новому середовищі організацією, яка знає, як професійно працювати з інформацією? Питання залишається відкритим.
Утиліта "Редактор-конвертор метаданих Dublin Core" (версія 1.1)
Як конвертор із формату метаданих Dublin Core у бібліографічний формат обміну даними UNIMARC (RUSMARC, UKRMARC) з подальшим збереженням даних у файлі ISO-2709.
Крім того, за допомогою цієї програми можна побудувати технологію створення та розвитку ІНФОРМАЦІЙНОГО ПОРТАЛУ бібліотеки в мережі Інтернет максимально наблизивши цю роботу до традиційних бібліотечних функцій — створення бібліотечного каталогу (вторинної інформації про ресурси). Таким чином, бібліотека фактично працюватиме у звичайному середовищі стосовно нових ресурсів, розташованих у мережі Інтернет. Використання РЕДАКТОРА-КОНВЕРТОРА можна представити на наступній блок-схемі:
Використання РЕДАКТОРА-КОНВЕРТОРА в якості конвертора Dublin Core - UNIMARC
001 http://www. nplu. Київ. ua/uk/main/conf. htm
035 ##$ahttp://www. nplu. Київ. ua/uk/main/conf. htm
200 1#$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ
УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСІ І УСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м. Миколаїв, 13-16 листопада 2001р.
210 ##$cНаціональна парламентська бібліотека України$d2001
230 ##$atext/html, text/html; charset=windows-1251, 36949 bytes
300 ##$aМісцевість: м. Миколаїв, Україна
300 ##$aКоординати годинні: 13-16 листопада 2001 року
330 ##$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальникавідділу
бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції
директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'
333 ##$aНаціональна парламентська бібліотека України, 2001
336 ##$atext/html, text/html; charset=windows-1251
336 ##$a36949 bytes
517 1#$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)
608 ##$aТекст$2Dublin Core
608 ##$aТекст-Праці$2Dublin Core
608 ##$aТекст-Тезіс$2Dublin Core
686 ##$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ
686 ##$aОУНБ України--Ресурси та послуги
686 ##$aОУНБ України--Проблеми інформатизації
702 #0$aНіколенко, Г.
702 #0$aКононенко, Л.
856 4#$uhttp: //www. nplu. kiev. ua/uk/main/conf. htm
Примечание: Пример №2 является результатом работы программы, использующей данные из примера №1. Для примеров использовалась реальная html- страница (http: //www. nplu. kiev. ua/uk/main/conf. htm) сервера Национальной парламетской библиотеки с материалами о всеукранской научно-практической конференции директоров библиотек, проходившей в г. Николаеве, в 2001 году . В реальности же таких метаданных в природе не существует и созданы для демострации работы программы.
Теоретические вопросы конверсии из Dublin Core в UNIMARC.
Основная проблема конверсии заключается в том, что формат Dublin Core является более простым форматом по сравнению с UNIMARC. Для формата UNIMARC — профессионального формата передачи данных, который учитывает правила библиографического описания, обязательна более строгая детализация отдельных элемениов описания. Для наглядности приведу таблицумапування (таблицю відповідностей між елементами двох форматів), які використовує програма.
Примітка: деякі деталі виключені для покращення читання.
Dublin Core
UNIMARC
Title ( Назва )
200 $a Основна назва 200 $e Відомості, що стосуються назви
517 $a Варіант назви
Creator (Творець, Автор)
700 $a Ім'я особи - первинна інтелектуальна відповідальність 701 $a Ім'я особи - альтернативна інтелектуальна відповідальність 710 $a Найменування організації - первинна інтелектуальна відповідальність 711 $a Найменування організації - альтернативна інтелектуальна відповідальність 200 $ f Перші відомості про відповідальність
Subject (Предмет. Ключові слова)
610 $a Неконтрольовані предметні терміни
606 Найменування теми як предмет
675 Універсальна десяткова класифікація (UDC/УДК) 676 Десятична класифікація Дьюї (DDC/ДДК)
680 Класифікація Бібліотеки Конгресу (LCC/КБК)
686 Індекси інших класифікацій
Description (Опис)
330 $a Резюме або реферат
Publisher (Видавець)
210 $c Ім'я видавця, розповсюджувача і т. д.
701 $a Ім'я особи - альтернативна інтелектуальна відповідальність
711 $a Назва організації — альтернативна інтелектуальна відповідальність 200 $g Подальші відомості про відповідальність
Date (Дата)
210 $d Дата видання, розповсюдження тощо.
Type (Тип)
608 Форма, жанр, фізичні характеристики документа як точка доступу
Формат (Формат)
230 $a Специфічна область матеріалу: характеристика електронного ресурсу
336 $a Тип комп'ютерного файлу
Identifier (Ідентифікатор)
001 (обов'язкове для UNIMARC) 010 (ISBN) 011 (ISSN) 020 (Номер документа у національній бібліографії)
035 Інші системні номери 856 $u (URL)
Source (Джерело)
324 Оригінальна версія примітки
Language (Мова)
101 Мова документа
Reletion (Ставлення)
300 Загальні примітки
Covarage (Охоплення. Покриття.)
300 Загальні примітки
Right s (Авторські права)
333 Примітки про особливості поширення та використання
Для UNIMARC (UKRMARC, RUSMARC) ряд полів є обов'язковим, без наявності яких запис не буде повноцінним. Наведу таблицю цих обов'язкових полів та відповідні їм поля формату Dublin Core:
UNIMARC
Dublin Core
001 - Ідентифікатор запису
Identificator (Ідентифікатор)
100 - Дані загальної обробки
Date (Дата), Language (Мова)
101 - Мова документа
Language (Мова)
200 - Назва та відомості про відповідальність
Про технологію побудови бібліотечного інформаційного порталу.
Зробимо імпорт запису про ресурс Інтернет із файлу ISO-2709 у бібліографічну БД “Ресурси Інтернет”. Тест проводився за допомогою системи ІРБІС версії 2002 року. Тепер запис на ресурс у БД може виглядати у кількох уявленнях – інформаційному вигляді, у вигляді бібліографічної картки тощо.
(Немає відомостей про копії)
ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСІ І НАСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м. Миколаїв, 13-16 листопада2001р. . -Б. м., 2001. -Б. ц.
Місцевість: м. Миколаїв, Україна. Координати годинні: 13-16 листопада 2001 року
ДІД. ТОЧКИ ДОСТУПУ:
Такий вигляд має запис у системі ІРБІС, у традиційному бібліотечному форматі.
Якщо бібліотека має свій модуль OPAC (модуль, що відображає внутрішній електронний каталог бібліотеки в мережі Інтернет), то не важко підключити до цього модуля нову БД, наприклад, “Ресурси Інтернет”, в якій будуть накопичуватися записи, отримані в результаті конверсії з формату Dublin Core . Онлайновий інтерфейс може змінюватись. Інтерфейс можна побудувати, наприклад, за видом каталогу Yahoo або чогось подібного. Тепер є можливість здійснювати пошук не тільки в традиційному для Інтернет порталу вигляді — за ключовими словами, але й за АВТОРОМ, ЗАГЛАВІЯМ, ВИДАВНИКОМ, ДАТОЮ, ПРЕДМЕТНОЮ РУБРИКОЮ, МОВИ ТЕКСТА, СПІВАВТОРАМ, ФОРМІ та ЖАНРУ, ФІЗИЧНИМ ХАРАКТЕМ. На цьому можна вважати закінченими підготовчі роботи щодо створення інформаційного порталу Інтернет, надалі необхідна робота бібліографів-каталогізаторів щодо наповнення БД описами ресурсів. Крім того, вся інформація стане доступною для користувачів електронного каталогу бібліотеки без використання мережі Інтернет.
Звичайно, можна і не конвертувати дані у формат UNIMARC, не заносити їх у бібліографічну БД, а зупинитися на проміжному етапі – зберігати дані у форматі Dublin Core та на їх основі будувати портал бібліотеки в Інтернеті. Однак, на мій погляд, це не зовсім логічно для бібліотеки. По-перше, знадобиться якесь додаткове середовище для зберігання даних. По-друге, необхідно створення механізму доступу, пошуку та вилучення даних з такої БД. І по-третє, цей масив даних буде відірваний від інших інформаційнихмасивів бібліотеки.
І останнє запитання. А чи варто бібліотеці створювати інформаційний портал? Ресурсів в Інтернеті так багато, а бібліотекарів у вашій бібліотеці так мало. Ресурси мігрують у мережі: з'являються, зникають, змінюють місце прописки… Як за всім цим наздогнати.
The Organization of Information. / Arlene G. Taylor-Englewood, Colorado: Libraries Unlimited, Inc., 1999.
Інформація архітектури для World Wide Web. / Louis Rosenfeld and Peter Morville, Cambridge: O'Reilly, 1998.
український комунікативний формат На допомогу розробникам програмного забезпечення/
ISO 2709 - 1981: Документація - Формат для обміну бібліографічної інформацією на магнітній стрічці.
Michael Day, 6. 2 Mapping Dublin Core до UNIMARC. In: Format conversion feasibility, ed. Rachel Heery. BIBLINK Project Deliverable D4. 1, 15 September 1997.
IFLA Universal Bibliographic Control та Міжнародні MARC Core Programme, UNIMARC: an introduction.
IFLA Universal Bibliographic Control та International MARC Core Programme. UNIMARC manual: bibliographic format. 2nd ed., with update 1. UBCIM publications, n. s., vol. 14. Mьnchen: K. G. Saur, 1996.