Агент з передплати, Computerworld Україна, Видавництво «Відкриті системи»
Деяким службовцям часто доводиться контролювати появу у пресі, зокрема й у електронної, інформації з певної теме.
Integrum Techno пропонує послугу підписки на пошуковий запит
Це робиться, наприклад, з метою оцінки популярності компанії або для аналізу дій конкурентів. Характерною особливістю такої задачі є періодичне повторення однакових запитів до пошукових систем, такі дії можна легко автоматизувати. Саме для цього здебільшого і призначена технологія пошукових агентів. Агенти ефективно діють у системах пошуку інформації з публікацій преси.
Компанія Integrum Techno, основна діяльність якої пов'язана з поширенням преси за підпискою, але в електронному вигляді, не прогавила нагоди скористатися цією технологією. Для пошуку інформації про друковані видання застосовується пошукова система «Артефакт». Система спочатку була розроблена під DOS, зараз перенесена на NT. Загалом у «Артефакті» накопичено близько 40 Гбайт інформації. У систему міститься і безліч газет, які до Internet поки що не підключені; вони надсилають свою інформацію електронною поштою.
Для пошукових систем характерна дилема: швидкий пошук документів, але повільне додавання нової інформації або швидке додавання новин, але повільна видача результатів пошуку. Пошукові системи в Internet зазвичай оптимізовані для швидкої видачі посилань, але вони поповнюють інформацію рідко — раз на тиждень. Творці «Артефакту» намагалися досягти компромісу — прискорити завантаження документів, але при цьому швидко видавати відповіді користувачу. Нині за день завантажується кілька тисяч нових документів.
Слід зазначити, що «Артефакт» — це не єдина база, а кілька спеціалізованих баз,різняться за джерелами інформації. Поділ інформації виконується автоматично, ручні роботи перенесені на плечі постачальників. За допомогою спеціальної мови сценаріїв обробки потокової інформації дані, що надходять до «Артефакту», уніфікуються. Ці якості системи дають змогу ефективно використовувати технологію пошукових агентів.
Push-агенти функціонують наступним чином: у базі даних фіксуються запити користувачів, потім з деякою періодичністю система вибирає ці запити та надсилає їх до «Артефакту», отримані результати надсилаються передплатнику електронною поштою. При цьому обираються лише нові документи. Клієнту пересилається добірка документів із файлом змісту та всі тексти повідомлень, об'єднаних у Zip-файл. Для визначення агента треба зазначити періодичність запуску запиту та кількість документів у вибірці. Обмеження вибірки пов'язане з тим, що передплатнику передаються посилання на документи, а самі документи, за які потрібно платити. Передбачено два типи агентів: стандартний та бізнес-агент. Стандартний агент видає на день не більше десяти документів, а бізнес-агент — тричі на день не більше 50. Передбачається, що такий підхід є вигідним для клієнтів — менше часу витрачається на рутинні операції і питома вартість інформації зменшується.
Агенти зібрані в окремому модулі, який планує видачу запитів пошуковій машині Артефакт. У певний момент агент запускається, отримує результати та надсилає їх користувачу. Пошуковий сервер, зокрема, займається і білінгом. В принципі, програму-агента можна розташувати і на майданчику клієнта, оскільки вона вміє працювати з «Артефактом» віддалено через Internet. Та й сам "Артефакт" можна встановити на машини клієнтів, доповнивши його модулем пошукових агентів. У Integrum Technoє близько 50 клієнтів, які купили "Артефакт". Всі вони мають великий банк інформації - мають свої внутрішні бюлетені і, крім того, отримують інформацію від Integrum Techno. Деякі з них розглядають можливість купівлі та модуля агентів.
Поділіться матеріалом з колегами та друзями