Пошук інформації у каталогах

пошук інформації в інтернеті.doc

Державний освітній заклад

вищої професійної освіти міста Москви

МОСКІВСЬКИЙ ДЕРЖАВНИЙ ІНСТИТУТ

з дисципліни «Інформатика»

На тему: «Пошук інформації в інтернеті. Web каталоги. Web індекси».

Спеціальність 080200.62 "Менеджмент"

5. Алгоритм пошуку інформації

Необхідність і важливість проблеми інформаційного пошуку призвела до утворення в Інтернеті цілої галузі, завдання якої полягає саме в наданні допомоги користувачеві в його навігації в кіберпросторі. Складають цю галузь спеціальні пошукові служби чи послуги. Умовно їх можна поділити на каталоги (direstorіes) і пошукові машини (sеаrсh engіnes).

Web-каталоги. У них інформація з окремих тем зібрана в ієрархічно організованих каталогах, що постійно оновлюються. Типовими представниками цієї гілки є:

Look Smart (www.looksmart.com),

Сузір'я Internet (www.stars.ru) та віртуальні бібліотеки. Прикладом віртуальної бібліотеки є бібліотека, яку підтримує Консорціум W3.

Web-каталоги створюються людьми, які переглядають вузли Web, читають електронну пошту і телеконференції. Тут потрібна величезна частка праці кваліфікованих фахівців, які займаються класифікацією та аналізом даних, що надходять. Додатковою перевагою каталогів можна назвати спеціальні огляди, анотації тощо, які готуються аналітиками цих вузлів на різні теми і доступні користувачам. При використанні web-каталогів можездійснювати контекстний пошук за описами рубрик.

Web-індекс стали першим засобом систематизації вмісту документів, доступних через Internet. Створення Web-індексів передбачає створення і безперервне поповнення величезної бази даних по документах, що індексуються, що виконується виключно комп'ютерами (і в цьому принципова відмінність таких систем!). Повторюючись, нагадаємо, що збір інформації в індекси виконується автоматично програмами-роботами або "павуками", які переглядають сервери Internet, копіюють документи, аналізують слова, що зустрічаються в них, і виконують індексування. Яскравими представниками цієї гілки серверів є

Alta Vista (www.altavista.com),

Пошукові системи цього типу мають дуже великі бази даних і високу швидкість обробки запитів, але ступінь обробки матеріалу залишає бажати кращого. Як правило, у відповідь на введення ключових слів для пошуку вони видають посилання на сотні та тисячі документів, в яких дійсно зустрічаються вказані користувачем ключові слова, але за змістом переважна більшість цих документів має дуже віддалене відношення до теми, яка цікавить користувача. Ефективний пошук за допомогою web-індексів передбачає використання спеціальних мов керування запитами. Опис правил складання запитів є на кожній інформаційно-пошуковій системі у розділі Допомога (Help).

Пошук за допомогою пошукових систем

Найбільш відомі такі системи для пошуку інформації у міжнародних інформаційних ресурсах:

Alta Vista (http://www.altavista.com/);

Hot Bot (http://www.hotbot.com/)/.

Для пошуку інформації в українських інформаційних ресурсах:

Пошукові системи можуть бути 2-х типів: універсальні та спеціалізовані. Найбільшпопулярні сучасні пошукові системи поєднують у собі обидва типи. Пошукові системи зазвичай складаються з трьох компонентів:

  • пошуковий робот (агент, павук або кроулер), який переміщується по мережі та збирає інформацію;
  • база даних, що містить всю інформацію, що збирається роботом;
  • пошуковий механізм, який використовується як інтерфейс взаємодії з базою даних.

Єдиної раціональної схеми пошуку в Internet немає. Залежно від специфіки необхідної вам інформації, для її пошуку необхідно використовувати відповідні пошукові служби. В принципі, звичайно, можна завжди користуватись якоюсь однією пошуковою системою, наприклад Rambler, але чим грамотніше підібрані пошукові служби та складено запит на пошук інформації, тим якіснішими будуть результати пошуку.

3.1 Пошук за допомогою пошукових систем (web-індексів)

Правильне використання інформаційно-пошукової системи полягає у знанні мови запитів. Тільки застосовуючи на практиці цю мову, вам не доведеться розгрібати купу посилань, які ніяк не належать до того, що ви шукали, і пошук буде швидким та ефективним. Технологія пошуку за допомогою пошукової системи така:

Необхідно отримати з будь-якого джерела прецедент докладного та грамотного опису досліджуваного питання. Таким джерелом може стати як вузько спеціальний довідник, і електронна енциклопедія загального профілю. На основі вивченого матеріалу необхідно сформувати максимально широкий набір ключових слів у вигляді окремих термінів, словосполучень, професійної лексики та кліше, при необхідності – і кількома мовами. Заздалегідь варто потурбуватися про потенційну можливість уточнення пошукового запиту - рідкісні слова, можливо, назви та прізвища, тісно пов'язані зпроблемою.

Більшість пошукових машин мають три основні види пошуку:

* за будь-яким (одним) із слів,

* за всіма словами і

3. Наберіть ваш запит у рядку введення на головній сторінці обраної інформаційно-пошукової системи та натисніть (або клацніть на відповідній кнопці, наприклад, з назвою Знайти або Пошук (Search) тощо).

Якщо в результаті пошуку було виявлено занадто багато посилань, виконайте одну з таких дій:

* перейдіть з режиму пошуку "по одному з слів" в режим пошуку "за всіма словами",

* додайте до запиту ще одне ключове слово та повторіть пошук; на деяких вузлах є швидша функція "пошук серед знайденого",

* Перейдіть до режиму розширеного пошуку, що володіє додатковими типами запитів і можливостями сортування.

Якщо в результаті було виявлено занадто мало посилань, перейдіть з режиму пошуку "точно за фразою" в режим пошуку "за всіма словами", з нього - в режим пошуку "по одному зі слів" або використовуйте менше ключових слів.

6. Якщо результати пошуку за допомогою даної пошукової системи вас не задовольнили, вирушайте на інший пошуковий сервер

1.Що таке Web індекс?

Web індекс - засіб систематизації вмісту документа, доступного через Internet. Створення Web-індексів передбачає створення і безперервне поповнення величезної бази даних по документах, що індексуються, що виконується виключно комп'ютерами (і в цьому принципова відмінність таких систем!).

2. Що таке Web каталог?

3.Три компоненти пошукової системи.

-пошуковий робот (агент, павук або кроулер), який переміщається по мережі та збирає інформацію;

-база даних, що містить всю інформацію, що збирається роботом;

-пошуковий механізм, який використовується як інтерфейс взаємодії з базою даних.

4. Види пошукових машин?

Найбільш відомі такі системи для пошуку інформації у міжнародних інформаційних ресурсах:

Alta Vista (http://www.altavista.com/);

Hot Bot (http://www.hotbot.com/)/.

Для пошуку інформації в українських інформаційних ресурсах:

5. Яка головна відмінність між Wew каталогами та Web індексами?

Створення Web-індексів передбачає створення і безперервне поповнення величезної бази даних за документами, що індексуються, що виконується виключно комп'ютерами