Організація зберігання та пошуку інформації в мережі Internet

На тему: "Організація зберігання та пошуку інформації в мережі Internet"

Інтернет як засіб інформації в Україні поки що не може конкурувати з традиційними ЗМІ, але має у цьому відношенні великі перспективи і зможе надалі виступати нарівні з іншими інформаційними ресурсами.

В даний час понад 500 млн. осіб більш менш регулярно користуються

Інтернетом, а за два роки їх кількість, на думку експертів, перевищить 1 млрд., інакше кажучи, понад 16% населення Землі. Зрозуміло, така колосальна аудиторія не могла залишитися незатребуваною – Інтернет давно перетворився на величезний інформаційний майданчик.

1. Зберігання даних у мережіInternet

1.1 Гіпертекстові документи, види файлів

Під гіпертекстовим документом розуміють документ, містить так звані посилання інший документ. Реалізовано це через протокол передачі гіпертексту HTTP (HyperText Transfer Protocol).

Інформація в документах Web може бути знайдена за ключовими словами. Це означає, що кожен браузер Web містить певні посилання, через які утворюються так звані гіперзв'язки, що дозволяють мільйонам користувачів Internet вести пошук інформації по всьому світу.

Великі та малі літери при записі тегів не відрізняються.У більшості випадків теги використовуються парами. Пара складається з тегів, що відкриває (start tag) і закриває (end tag). Синтаксис тега, що відкриває:

Прямі дужки, що використовуються в описі синтаксису, означають, що цей елемент може бути відсутнім. Ім'я тега, що закриває, відрізняється від імені відкриває лише тим, що перед ним ставиться похила риса:

Атрибути тега записуються внаступний формат:

Лапки при заданні значення аргументу не обов'язкові і можуть бути опущені. Для деяких атрибутів значення може не вказуватись. У теги, що закриває, атрибутів не буває.

Дія будь-якого парного тега починається з того місця, де зустрівся тег, що відкриває, і закінчується при зустрічі відповідного закриваючого тега. Часто пару, що складається з тега, що відкриває і закриває, називаютьконтейнером, а частина тексту, облямовану відкриваючим і закриває тегом, -елементом.

Послідовність символів, що становить текст, може складатися з пробілів, табуляцій, символів переходу на новий рядок, символів повернення каретки, букв, розділових знаків, цифр, і спеціальних символів (наприклад, +, #, $, @),за виняткомнаступних чотирьох символів, що мають у HTML спеціальний зміст: (більше), & (амперсенд) і " (подвійна лапка). Якщо необхідно включити до тексту якийсь із цих символів, то слід закодувати його особливою послідовністю символів.

До спеціальних символів можна віднести і нерозривну прогалину. Використання цього символу є одним із способів збільшити відстань між деякими словами в тексті. Звичайні прогалини використовувати для цих цілей не можна, оскільки група пробілів, що йдуть поспіль, інтерпретується браузером як один.

1.2 Графічні файли, їх види та особливості

В даний час використання повнокольорової якісної графіки реалістичних кольорів на комп'ютерах класу ПК виглядає цілком звичайним. Хоча нещодавно це було привілеєм видавничих систем, які зазвичай будувалися на платформах Macintosh або графічних станцій Silicon Graphics. Користувачі ПК задовольнялися в крайньому випадку графікою з кольором, глибиною максимум 8 біт/піксел (256 кольорів) придосить слабкої роздільної здатності 320Х200 або 16 кольорами при роздільній здатності 640Х480.

Більше того, в останні 5 років у зв'язку з блискавичним поширенням Internet і, зокрема, технологій World Wide Web, стала вставати проблема іншого роду – розробка форматів зображень досить компактних для передачі в мережі з мінімальними затримками та апаратно незалежних, оскільки до мережі підключені комп'ютери різних архітектур.

У зв'язку з цим хотілося б коротко розглянути кілька поширених графічних форматів та коротко охарактеризувати їх можливості. Всі ці відомості зведені в наведеній нижче таблиці:

ФорматМакс. глиб. кольориМакс. кількість кольорівМакс. розмір зображення, пікселМетоди стисненняКодування кількох зображень
BMP2416'777'21665535x65535RLE*-
GIF825665535x65535LZW+
JPEG2416'777'21665535x65535JPEG-
PCX2416'777'21665535x65535RLE-
PNG48281'474'976'710'6562147483647x 2147483647Deflation (LZ77)-
TIFF2416'777'216всього 4'294'967'295LZW, RLE та інші*+