Методи Бокса-Дженкінса (ARIMA)

Вступ

Методи прогнозування, засновані на згладжуванні, експоненційному згладжуванні та ковзному середньому

"Наївні" моделі прогнозування
Середні та ковзні середні
Методи Хольта та Брауна

Регресійні методи прогнозування

Декомпозиція часових рядів

Методи Бокса-Дженкінса (ARIMA)

Донедавна (середини 80-х років минулого століття) існувало кілька загальновизнаних методів прогнозування часових рядів:

Економетричні
Регресійні
Методи Бокса-Дженкінса (ARIMA, ARMA)

Ці статті відродили інтерес до нейромереж у науковому співтоваристві і останні дуже швидко стали широко використовуватися при дослідженнях у різних галузях науки від експериментальної фізики та хімії до економіки.

До речі, деякі співробітники компанії "Нейропроект" почали займатися нейронними мережами саме тоді, використовуючи їх для обробки результатів фізичних експериментів.

Почасти через відносну складність та недетермінованість нейронних мереж та генетичних алгоритмів, ці технології не відразу вийшли за рамки суто наукового застосування. Проте з часом рівень довіри до нових технологій підвищувався і з боку бізнесу. З початку 90-х років почали регулярно з'являтися повідомлення про встановлення нейромережевих систем у різних компаніях, банках, корпоративних інститутах. Причому сфера використання нових технологій була дуже багатогранною – оцінка ризиків, контроль технологічних процесів, управління роботами та багато іншого.

Одним із найуспішніших додатків нейронних мереж було прогнозування часових рядів. Причому наймасовішим було

Прогнозування на фінансовихринках
Прогнозування продажів

В даний час можна з упевненістю сказати, що використання нейронних мереж при прогнозуванні дає відчутну перевагу порівняно з простими статистичними методами.

Методи прогнозування, засновані на згладжуванні, експоненційному згладжуванні та ковзному середньому

"Наївні" моделі прогнозування

При створенні "наївних" моделей передбачається, що деякий останній період прогнозованого часового ряду найкраще описує майбутнє цього прогнозованого ряду, тому в цих моделях прогноз, як правило, є дуже простою функцією від значень прогнозованої змінної в минулому.

Найпростішою моделлю є

що відповідає припущенню, що "завтра буде як сьогодні".

Поза всяким сумнівом, від такої примітивної моделі не варто чекати великої точності. Вона не лише не враховує механізми, що визначають прогнозовані дані (цей серйозний недолік взагалі властивий багатьом статистичним методам прогнозування), а й не захищена від випадкових флуктуацій, вона не враховує сезонних коливань та трендів. Втім, можна будувати "наївні" моделі дещо по-іншому

такими способами ми намагаємось пристосувати модель до можливих трендів.

це спроба врахувати сезонні коливання

Середні та ковзні середні

Найпростішою моделлю, що базується на простому усередненні є

і на відміну від найпростішої "наївної" моделі, якою відповідав принцип "завтра буде як сьогодні", цій моделі відповідає принцип "завтра буде як було в середньому останнім часом". Така модель, звичайно, більш стійка до флуктуацій, оскільки в ній згладжуються випадкові викиди щодо середнього. Незважаючи на це,цей метод ідеологічно настільки ж примітивний як і "наївні" моделі і йому властиві майже ті самі недоліки.

У наведеній вище формулі передбачалося, що ряд усереднюється досить тривалим інтервалом часу. Однак, як правило, значення тимчасового ряду з недалекого минулого краще описують прогноз, ніж старіші значення цього ряду. Тоді можна використовувати для прогнозування ковзне середнє

Сенс його полягає в тому, що модель бачить тільки найближче минуле (на T відліків за часом у глибину) і ґрунтуючись лише на цих даних будує прогноз.

При прогнозуванні часто використовується метод експоненціальних середніх, який постійно адаптується до даних за рахунок нових значень. Формула, що описує цю модель, записується як

де Y(t+1) – прогноз на наступний період часу

Y(t) – реальне значення на момент часу t

^Y(t) - минулий прогноз на момент часу t

a – постійне згладжування (0 1, експоненційна модель прагне найпростішої "наївної" моделі. При a->0, прогнозована величина стає рівною попередньому прогнозу.

Якщо проводиться прогнозування з використанням моделі експонентного згладжування, зазвичай на деякому тестовому наборі будуються прогнози при a=[0.01, 0.02, . 0.98, 0.99] і відстежується, при якому точність прогнозування вище. Це значення a потім використовується під час прогнозування надалі.

Разом з цим хотілося б відзначити, що описані алгоритми цілком успішно можна використовувати як супутні та допоміжні для передобробки даних у задачах прогнозування. Наприклад, для прогнозування продажів у більшості випадків необхідно проводити декомпозицію часових рядів (тобто виділяти окремо тренд, сезоннута нерегулярну складові). Одним із методів виділення трендових складових є використання експоненційного згладжування.