Застосування байєсовського підходу у вимірах аналітичних даних як фактор формування процесів

даних

Рубрика: Економіка та управління

Бібліографічний опис:

Байєсовськая методологія відрізняється від інших підходів тим, що ще до отримання даних дослідник визначає рівень своєї довіри до можливих моделей і згодом представляє її у вигляді певних ймовірностей. Після того, як дослідником отримано дані, з використанням теореми Байєса він знаходить ще одну множину ймовірностей, які є переглянутими ступенями довіри до можливих моделей з урахуванням отриманої дослідником нової інформації.

Ключові слова: метод, аналіз, прогнозування, оцінки, економіка, економічні процеси

The Bayesian методологія differs from other approaches in to, even before receiving the data, the researcher determines the level of his trust in possible models and subsequently presents it in the form of certain probabilities. Після того, як дослідник був оприлюднений з даними, використовуючи Bayes theorem he finds інший вибір probabilities, які є поставлені кроки confidence в можливих моделях, враховуючи нову інформацію received by the researcher.

Keywords: метод, analysis, forecasting, estimation, economics, economic processes

Байєсівські методи розроблені внаслідок численних спроб вчених визначити проблеми статистичного аналізу поведінки різних процесів та знайти їх рішення за допомогою застосування основи байєсівської методології – теореми Байєса. Використання даної теореми має низку передумов, основна з яких - наявність певних співвідношень між ймовірностями явищ, що мають різний.характер та специфікації будь-якого явища на потрібному рівні [1].

Байєсовськая методологія відрізняється від інших підходів тим, що ще до отримання даних дослідник визначає рівень своєї довіри до можливих моделей і згодом представляє її у вигляді певних ймовірностей. Після того, як дослідником отримано дані, з використанням теореми Байєса він знаходить ще одну множину ймовірностей, які є переглянутими ступенями довіри до можливих моделей з урахуванням отриманої дослідником нової інформації.

Однією з ключових переваг байєсовського підходу є використання будь-якої початкової (апріорної) інформації щодо параметрів моделі. Така інформація виражається у вигляді апріорної ймовірності чи функції густини ймовірності. Потім початкові ймовірності «переглядаються» за допомогою вибіркових даних, які знаходять своє відображення у вигляді апостеріорного розподілу оцінок параметрів або змінних моделей.

Необхідно виділити такі особливості байєсовського підходу:

‒ абсолютно всі параметри та величини прийнято вважати випадковими, а саме точне значення параметрів невідоме досліднику, з чого випливає те, що параметри є випадковими з погляду незнання дослідника;

‒ методи Байєса використовуються навіть за нульового обсягу вибірки. У цьому випадку значення апріорного та апостеріорного розподілів рівні;

‒ для оцінки невідомих змінних використовують апостеріорні розподіли, тобто знайти рішення задачі з оцінювання певної величини, означає визначити апостеріорний розподіл цієї величини;

‒ основним інструментом підходу є формула (теорема) Байєса, а також такі правила, як sum-rule (якщо A1, …, Ak – взаємовиключні події, то одна з нихвідбувається завжди) і product - rule (будь-яку спільну щільність завжди можна розбити на множники).

Поряд з переліченими вище перевагами байєсівської методології необхідно виділити її недоліки. Починаючи з 1930 року. байесівська парадигма досить часто піддавалася різкій критиці і практично не знаходила застосування з таких причин:

‒ У байєсівських методах передбачається, що апріорний розподіл відомий до початку спостережень і не пропонується конструктивних способів його вибору;

‒ Ухвалення рішення при використанні байєсівських методів у нетривіальних випадках потребує колосальних обчислювальних витрат, пов'язаних з чисельним інтегруванням у багатовимірних просторах;

‒ Фішером було показано оптимальність методу максимальної правдоподібності, а отже — безглуздість спроб придумати щось найкраще.

На сьогоднішній момент (починаючи з 1990 р.) вчені спостерігають відродження методології Байєса, методи якої виявилися корисними для пошуку рішень численних і серйозних питань і проблем у сфері машинного навчання та статистики.

Теорема Байєса: формула, застосування

Формула (теорема) Байєса є однією з фундаментальних теорем теорії ймовірностей і дозволяє встановити ймовірність певної події А, якщо має місце виникнення іншої взаємозалежної з ним статистичної події В. Інакше застосування теореми Байєса дає можливість досліднику найбільш точно перерахувати ймовірність, враховуючи як інформацію, отриману ним раніше, і нові дані пізніших спостережень. Байєсівська теорема може бути отримана з фундаментальних аксіом теорії ймовірностей, а саме з умовної ймовірності. Формулі Байєса притаманні певні особливості, головна з яких полягає втому, що для використання теореми на практиці необхідна значна кількість обчислень та розрахунків, внаслідок цього оцінки байєсівської парадигми знайшли активне застосування лише в період після революції, що сталася у сфері мережевих та комп'ютерних технологій.

Перед формулюванням байєсівської теореми ймовірності, які у ній, піддавалися численним ймовірнісним інтерпретаціям. В одній з них встановлювався факт, що виведення формули залежить безпосередньо від використання особливого підходу до статистичного аналізу. При застосуванні байєсівської інтерпретації ймовірності теорема Байєса показує, як ступінь особистої довіри здатна значно змінюватися після певної кількості подій. У цьому полягають основні висновки Байєса, які стали фундаментальними для статистики Баєса. Проте теорема знайшла своє застосування у байесівському аналізі, а й активно використовується у великій кількості інших розрахунків.

Сутність байесівської парадигми полягає в тому, що при знаходженні дослідником нової інформації вона дає основу для вимірювання ймовірностей, які зумовлені пов'язаними події. Формула Байєса має такий вигляд [1]:

,

де - ймовірності гіпотез до досвіду (апріорні ймовірності);

- Умовні ймовірності виникнення події А при виборі i-ї гіпотези; - Умовна ймовірність i-ї гіпотези після виникнення події А (апостеріорна або післядосвідчена ймовірність).

За допомогою цієї теореми вдається змінити значення ймовірності на основі пізніших отриманих відомостей. Інтерпретація байєсовського підходу має такий вигляд: нехай до початку реорганізації певного об'єкта є n гіпотез H1, H2, …, Hn про можливі його стани. На основі статистичних даних за минулі рокиможна приписати їм апріорні ймовірності P(H1), P(H2), …, P(Hn). Потім проводиться експеримент (реалізується проект), в результаті якого може наступити або не наступити подія А. Досвідченим шляхом визначаються умовні ймовірності виникнення події А при виборі i-ї гіпотези як частоти спостереження події А. За умови настання події А робиться переоцінка віри у справедливість кожної гіпотези за допомогою заміни ймовірностей на ймовірність.

Необхідно зазначити, що у разі відсутності статистичних даних про апріорні ймовірності спостережень або гіпотез про виникнення події А байєсовську методологію застосувати неможливо, оскільки подібна «формалізація» втрачає фізичний зміст [6].

Байєсівська стратегія оцінки достовірності висновків в експертних системах

Байєсівська стратегія оцінки висновків знаходить дедалі частіше застосування в науці, економіці та промисловості. Для детального вивчення байєсівської стратегії необхідно розглянути приклад оцінки достовірності гіпотези на її основі, а також обґрунтувати використання теореми Байєса для експертних систем.

Для початку необхідно навести більш розширений варіант формули Байєса з урахуванням деякої події Е, пов'язаної з подіями H1, H2. Hn. Імовірності події E відомі за умови, що з подій H1, H2. Hn настало: P(E/H1), P(E/H2). P(E/Hn). Припустимо, відомо, що подія E сталося. У цьому випадку ймовірність того, що якась з подій Hi (i=1. n) настала, визначається за такою формулою [2]:

Події H1, H2. Hn - гіпотези, а подія E називається свідченням. Імовірності гіпотез P(Hi) без урахування свідоцтва (тобто без урахування того, сталася подія E чи ні) називаються допитовими (апріорними), а ймовірності P(Hi/E) — післядосвідченими(Апостеріорними). Величина P(EHi) - спільна ймовірність подій E і Hi, тобто ймовірність того, що відбудуться обидві події разом. Розмір P(E) — повна (безумовна) можливість події E.

В експертних системах (комп'ютерні системи, які здатні частково замінити спеціаліста-експерта у вирішенні конкретної проблемної ситуації) теорема Байєса може використовуватися для оцінки ймовірностей висновків продукційних правил на основі даних щодо достовірності їх посилок. Висновки (висновки) у разі відповідають гіпотезам у теоремі Байєса, а посилки — свідченням. Зазвичай посилка правила експертних системах містить кілька умов. Імовірності P(Hi) та P(E/Hi) визначаються на основі статистичних даних з використанням основних формул, що застосовуються в теорії ймовірностей (формули множення ймовірностей, формули складання ймовірностей).

Як наочний приклад розглянемо експертну систему, яка допомагає оцінити умови праці робітників у певній організації. У наступній таблиці представлені дані про 5 тис. робітників (у 315 виявлено захворювання, що виникло у зв'язку з їхньою професійною діяльністю):

Приклад оцінки достовірності гіпотези

Умова

Значення

Кількість ситуацій виявлення проф. захворювань

У робітників, уяких немає проф. захворювання