НОУ ІНТУІТ, Лекція, Мікроформати

Презентацію до цієї лекції Ви можете завантажити тут.

Для людей не важко зрозуміти сенс тексту, укладеного в HTML-документ, однак, комп'ютерам це зробити набагато складніше. Для розпізнавання сенсу тексту використовуються звані парсеры , які аналізують відповідним чином структурований документ за певними критеріями. Для того, щоб парсер могли аналізувати HTML-документ, в ньому розміщуються особливі блоки - мікроформати .

Мікроформати (англ. microformats; іноді скорочено F або uF) дозволяють наділяти інформацію змістом, зрозумілим для програм, що обробляють веб-сторінки. Мікроформати структурують інформацію згідно з певними угодами.

Принципи побудови мікроформатів

При використанні мікроформатів до існуючої HTML-розмітки додаються нові складові, наповнені особливим, наперед визначеним змістом. Наприклад, за допомогою атрибута class можна позначити зміст того чи іншого HTML-елемента на сторінці (цей атрибут визначений для всіх елементів). Таким чином, люди дійшли згоди про використання певних значень атрибутів (у тому числі class ) для розмітки певних фрагментів інформації. Надалі таку розмітку можна обробляти машинними засобами [1].

Для розмітки мікроформатами підходять будь-які елементи HTML, але особливе значення надається елементам, які не мають власного стандартного семантичного значення - div і span.

Розглянемо деякі поширені мікроформати.

hCard - організації та люди

мікроформати

hCalendar - події у формі календаря

hCalendar (скорочено від HTML iCalendar) – мікроформат для представлення семантичної інформації про події у форматі календаря.

Він дозволяєінструментам для парсингу (наприклад, іншим сайтам або розширенням Operator та Tails для Firefox) отримувати інформацію про подію та відображати її на сайтах, індексувати, шукати її або завантажити її в програму календаря чи щоденника та інше [3].

hAtom - стрічки новин

hAtom - стрічки новин (як аналог RSS та Atom) у звичайному HTML або XHTML;

XFN - Соціальні мережі

Необхідно повідомити браузерам та пошукачам, що сторінка підтримує XFN.

Для цього у тэзі веб-сторінки треба додати атрибут profile :

Для кожного гіперпосилання на сторінці потрібно додати атрибут rel. Значень атрибуту rel може бути кілька, у разі вони перераховуються через пробіл.