Персональний інтернет-пошук, Світ ПК, Видавництво «Відкриті системи»

Система персонального, або користувача, інтернет-пошуку (Custom Search Engine) - це сервіс, що дозволяє створити і налаштувати спеціалізовану пошукову систему, яка враховує в результатах ваші особисті уподобання та тематичні інтереси, іншими словами - контекст пошуку. У найпростішому випадку такий пошук здійснюється за набором зазначених користувачем сайтів, більш складні варіанти мають на увазі тонке налаштування видачі результатів, автоматичне додавання тематичних сайтів до персонального індексу та організацію спільної роботи над пошуковою групою однодумців. Ціною невеликої втрати у широті охоплення персональний пошук дає можливість помітно покращити точність.

Система персонального, або користувача, інтернет-пошуку (Custom Search Engine) - це сервіс, що дозволяє створити і налаштувати спеціалізовану пошукову систему, яка враховує в результатах ваші особисті уподобання та тематичні інтереси, іншими словами - контекст пошуку. У найпростішому випадку такий пошук здійснюється за набором зазначених користувачем сайтів, більш складні варіанти мають на увазі тонке налаштування видачі результатів, автоматичне додавання тематичних сайтів до персонального індексу та організацію спільної роботи над пошуковою групою однодумців. Ціною невеликої втрати у широті охоплення персональний пошук дає можливість помітно покращити точність.

В даний час для використання рекомендуються проекти Google Custom Search Engine та Flexum. Інші загальнодоступні платформи персонального пошуку, наприклад Swiki та Mojeek, хоч і містять низку оригінальних функцій, серйозно поступаються лідерам та не відрізняються якісною роботою з українськомовними ресурсами.

Google Custom Search Engine

Проект GoogleCustom Search Engine - найбільша система персонального інтернет-пошуку. Її інтерфейс доступний кількома десятками мов. Передбачено й український варіант. Щоправда, переклад поки що неповний, особливо довідкової системи.

видавництво

Найцікавіший і найвідповідальніший етап роботи — налаштування пошуковика. У Google Custom Search Engine для цього слід використовувати інструменти пропонованої Панелі керування, а також пряме виправлення настроювальних XML-файлів системи. Панель керування розділена на окремі вкладки, де розміщені інструменти додавання нових сайтів в індекс, налаштування зовнішнього вигляду інтерфейсу пошуку та ін.

Пряме виправлення настроювальних файлів системи вимагає мінімальних знань мови XML, проте надає привабливі можливості повного контролю над поведінкою пошукача. Доступ до файлів можна отримати на вкладці "Додатково" спільної Панелі керування персонального пошуковика.

видавництво

У системі Google Custom Search Engine діють два настроювальні файли: «Контекст», із загальними параметрами пошуковика та описами тегів, а також «Аннотації», де міститься перелік включених до вашого індексу сайтів та індивідуальні налаштування кожного з них. Для редагування даних файлів спочатку потрібно завантажити їх на свій комп'ютер, а після внесення правок завантажити нові файли на сервер Google.

Нині список підтримуваних тегів дуже великий, проте результати їх застосування дуже цікаві. Наприклад, тег Boost дозволяє керувати позицією певного сайту на сторінці видачі результатів пошуку. За замовчуванням у персональному пошуку застосовуються стандартніалгоритми ранжирування Google, проте вони не завжди вигідні для тематичного пошуку, оскільки стараннями оптимізаторів розкручений сайт найзагальнішого змісту може оминати корисне, але непомітне спеціалізоване джерело. А тег BOOST таки дозволяє підняти дані з таких ресурсів на перші позиції в результатах пошуку.

Для цього спочатку у XML-файлі «Контекст» необхідно знайти розділ і за допомогою контейнера створити нову мітку з ім'ям, наприклад, «Кращі сайти». У її параметрах у вигляді чисельного значення встановлюється «вага» результатів із джерела, до якого буде застосована ця мітка. Діапазон допустимих значень - від -1 до максимального 1, що означає, що результати з певного сайту завжди будуть на першій позиції в пошуковій видачі. Оскільки допускається застосування дробових значень, цей інструмент має дуже велику гнучкість. Потім виконується редагування файлу «Анотацій». Тут потрібно додати створену нами мітку до тих сайтів, результати яких повинні потрапити на перші місця видачі. Для цього до опису потрібних сайтів додається тег з ім'ям нашої мітки («Кращі сайти») як параметр.

світ

Такі текстові настроювальні файли, звичайно, не дуже зручні для редагування вручну, проте дозволяють реалізувати кілька цікавих автоматизованих режимів роботи з Google Custom Search Engine. Справа в тому, що такі файли можна готувати в офлайновому режимі і потім вже завантажувати на сервер. Таким чином, наприклад, можна не набирати весь список сайтів в онлайновій формі, а заздалегідь підготувати та завантажити на сервер файл «Анотацій» із переліком потрібних сайтів та їх властивостями. Слід лише пам'ятати про обмеження на кількість позицій у такому файлі-списку, що існує в даний час, — не більше 5000 сайтів. Крім того,розробники Google реалізували унікальний режим "пов'язаного" пошуку. У цьому режимі настроювальні файли пошуку можуть зберігатися в будь-якому зовнішньому джерелі, наприклад на власному сайті, або взагалі генеруватися будь-якими зручними вам засобами і динамічно підвантажуватися на сервер Google при кожній відправці запиту за допомогою форми пошуку. У принципі, у такому режимі можлива генерація індивідуальних налаштувань для кожного користувача, що звертається до вашого пошуковика.

Форму пошуку Google Custom Search Engine можна встановити на своєму сайті або в блозі, просто скопіювавши пропонований системою код форми на свою сторінку.

Google Custom Search Engine пропонує кілька додаткових інструментів, які полегшують роботу з персональним пошуковою системою. Додаток до браузерів Firefox та Internet Explorer «Покажчик Google» дозволяє в ході серфінгу швидко додавати відкриті у браузері сторінки до свого персонального пошукового індексу. Також пропонується призначений для персонального порталу iGoogle віджет Google Custom Search Console, який надає можливість пошуку за допомогою свого персонального пошуковика, а також швидкий доступ до його налаштувань.

Flexum

український проект персонального пошуку Flexum став гідною відповіддю розробці, представленій Google, причому в деяких випадках він об'єктивно кращий. Flexum відрізняється від Google Custom Search Engine підходом до індексування сайтів персонального пошуку. Якщо Google використовує відомості, які вже знаходяться в головній базі пошуковика, то Flexum індексує вказані користувачем сайти «з нуля», причому власник персонального пошуковика отримує повний контроль над цим процесом.

Flexum пропонує два режими побудови персонального пошуку: «Простий» та"Експертний". У першому з них, як і належить, дозволяється зробити мінімум дій для додавання сайтів до списку для подальшого індексування - достатньо заповнити одну-єдину форму. «Експертний» режим підтверджує свій статус, пропонуючи досить серйозний набір інструментів, що заслуговує на докладний розгляд.

персональний

Для кожного сайту, що входить до бази, слід вказати ключові слова, призначені для групування посилань за тематичними рубриками. Крім того, доступне гнучке регулювання глибини індексування сайту. Ця опція відповідає за автоматичне індексування не лише вказаної стартової сторінки, а й усіх інших сторінок, на які вона посилається. Числове значення вказує, скільки таких переходів може зробити робот-індексатор. При значенні більшому ніж 2 кількість таких автоматично виявлених посилань може різко зрости, що необхідно враховувати при визначенні наступної настройки — квоти на кожен сайт. За промовчанням така квота дорівнює 20 Мбайт, однак це значення можна вручну змінювати в межах загальної квоти облікового запису.

Як і Google Custom Search, система Flexum дає можливість тонкого настроювання позицій видачі з певного сайту. Будь-якому сайту в індексі можна присвоїти рейтинг від одиниці до п'ятірки, для чого призначене спеціальне меню в налаштуваннях пошуку.

світ

Після включення сайту до списку він ставиться у чергу на індексування. Для безкоштовних облікових записів цей процес може тривати кілька днів. Після придбання комерційного облікового запису частоту оновлення індексу можна визначити самостійно.

Ще один спосіб поповнення власної бази - застосування напрацювань інших пошукових систем Flexum. Якщо ви зайдете до системи під своєю обліковоюзаписом та зверніться до будь-якого пошуку Flexum, то поряд з кожним знайденим посиланням побачите кнопку «Копіювання сайту у свій пошук». З її допомогою ви зможете швидко поповнити свою базу вже проіндексованим Flexum сайтом.

видавництво

Обидва розглянуті сервіси дозволяють побудувати хорошу персональну пошукову систему. В умілих руках вони можуть стати потужним засобом тематичного інтернет-пошуку. Відмінність їх можливостей залежить від обраної розробниками даних систем моделі індексування ресурсів. Однозначно визначити, який із запропонованих підходів краще, досить складно, оскільки кожен має свої переваги та недоліки. Важливо добре уявляти їх і вибирати систему персонального пошуку, з власних потреб.

Створення пошуковика засобами Flexum займає набагато більше часу, оскільки, по-перше, потрібно складати повний список сайтів, що індексуються, по-друге, системі знадобиться певний час на індексацію. Як тільки користувач починає працювати в Google Custom Search, йому відразу ж за умовчанням стає доступна вся величезна база індексу Google. Крім того, у скарбничці проекту Google є унікальні можливості автоматизації наповнення індексної бази та управління налаштуваннями пошуковика.

Ціною такого «швидкого старту» стала жорстка прив'язка до Google. Персональний пошуковик повністю залежатиме від якості роботи індексуючого робота Google. Якщо певний сайт не включений до бази або проіндексований поверхнево, то з цим нічого не вдієш.

Пропонована Flexum "чесна" індексація надає користувачеві повний і гнучкий контроль над цим процесом, що буде йому доречно тоді, коли він планує використовувати якийсь специфічний набір сайтів. Для роботи з невеликимиі «малопомітними» веб-проектами такий варіант буде, мабуть, кращим, ніж система від Google. Крім того, Flexum пропонує спеціальну пільгову програму для тематичних порталів, які вирішили збудувати свою систему пошуку на платформі Flexum.

Персональний пошук – чудовий інструмент, проте не варто переоцінювати його можливості. Як і в будь-яких коштів, він має недоліки. Якщо порівнювати персональні пошукові системи зі спеціалізованими «вертикальними» рішеннями, то неважко помітити, що для останніх, як правило, розробляють відповідні алгоритми індексації ресурсів, а найчастіше пропонують і спеціалізовані інтерфейси. Персональні ж пошукові системи використовують універсальні алгоритми та типові інтерфейси, що дещо обмежує їх можливості.

Google Custom Search Engine