Wolfram Alpha

Wolfram Alpha – це система, призначена для зберігання, обробки та видачі користувачам структурованих даних за запитами природною англійською мовою. Wolfram Alpha не є пошуковою системою. Це пов'язано з тим, що вона призначена для автоматичної обробки неструктурованих текстів. Для її роботи необхідно попередньо вручну ввести фактографічну інформацію до бази даних, а також розробити та реалізувати алгоритми її обробки. Ці процедури виконуються вручну спільнотою розробників та експертів системи Wolfram Alpha.

З аналізу опису системи система Wolfram Alpha випливає, що отримання відповідей система Wolfram Alpha повинна:

- вміти правильно розібрати запит користувача природною мовою;

- мати відповідну структуровану фактографічну інформацію;

- Мати алгоритми обробки фактографічної інформації, що забезпечують формування відповіді на запит користувача.

Таким чином, система Wolfram Alpha автоматично здатна обробляти лише заздалегідь структуровану фактографічну інформацію, що зберігається в СУДБ. Для синтезу відповідей можуть використовуватись детерміновані алгоритми вибірки додаткової інформації та проведення розрахунків за фактографічними даними. За даними формальних ознак система Wolfram Alpha може бути віднесена до відомого класу систем Business Intelligence. Системи цього класу є вузько спеціалізованими, що обумовлює незначний спектр питань, на які можна отримати відповіді Wolfram Alpha. Дане обмеження є системним, оскільки закладено концепцію її функціонування.

Таким чином, система Wolfram Alpha принципово не дозволяє користувачам шукативідповіді на будь-які питання, що їх цікавлять. Для цього призначені запитально-відповідні пошукові системи. На відміну від системи Wolfram Alpha питання-відповідні пошукові системи автоматично виявляють фактографічну інформацію в текстах, що обробляються, і проводять її індексацію без участі людини. За рахунок цього досягається значне підвищення повноти пошуку. Для узагальнення, проведення логічного висновку та синтезу відповідей запитально-відповідні пошукові системи також використовують правила обробки фактографічної інформації. Однак, на відміну від системи Wolfram Alpha, правила логічної обробки при цьому являють собою не окремі алгоритми, спрямовані на вирішення заздалегідь визначених порівняно простих завдань, а логічні правила, які можуть автоматично застосовуватися в послідовності, що динамічно формується, що визначає порядок обробки первинної фактографічної інформації і формування відповіді питання користувача. Для перевірки даних положень проведемо порівняльне тестування систем Wolfram Alpha та AskNet.ru.

Методика порівняльного тестування систем Wolfram Alpha та AskNet.ru

Результати порівняльного тестування систем Wolfram Alpha та AskNet.ru

Узагальнені результати порівняльного тестування систем Wolfram Alpha та AskNet.ru представлені у таблиці.

Порівнювані показникиСистема
AskNet.ruWolfram Alph a
Кількість правильних відповідей на першій сторінці видачі

З них у першій позиції

9Кількість неправильних відповідей02

Кількість невіднайдених відповідей

не розібрала пошуковий запит (не знала що шукати)

запитала уточнення пошукового запиту

3Можливість отримання правильної відповіді на першій сторінці видачі системи0,890,13

Детальна інформація щодо тестових випадків наведена в додатку. Усього поведено тестових випадків – 71.

При аналізі видачі запитально-відповідної пошукової системи AskNet.ru проводився облік наявності та номера позиції правильної відповіді. Середнє значення позиції правильної відповіді на сторінці, якщо відповідь знайдено, становить 1,63. Це означає, що в середньому правильна відповідь знаходилася у видачі запитально-відповідної пошукової системи AskNet.ru на першому або на другому місці.

Система Wolfram Alpha в 57 випадках не могла визначити зміст запиту користувача і видавала повідомлення "Wolfram Alpha не є незважаючи на те, що ви з вами". У трьох тестових випадках система Wolfram Alpha вивела діалог уточнення змістового змісту, введеного користувачем запиту.

Результати порівняльного тестування систем Wolfram Alpha та AskNet.ru підтвердили правильність викладених вище теоретичних оцінок.

Таким чином, при існуючій концепції функціонування, система Wolfram Alpha орієнтована на порівняно вузькі прикладні області застосування, що визначаються фактографічними даними, що вручаються, і алгоритмами їх обробки.

На відміну від даного підходу, питання-відповідальні та семантичні пошукові системи орієнтовані на автоматичне виявлення структурованої текстової інформації та її обробку. Це зумовлює їх значно ширшу прикладну спрямованість.