Модель прогнозування часових рядів щодо вибірки максимальної подоби пояснення та приклад,
Ще одна копія хабора
Головне меню
Навігація за записами
Модель прогнозування часових рядів щодо вибірки максимальної подоби: пояснення та приклад
Передмова
Файли з реалізованим прикладом можна завантажити у архіві.
1. Пояснення моделі прогнозування щодо вибірки максимальної подоби
1.1. Основна ідея та її ілюстрація на вибірках часового ряду
Повний формальний опис моделі прогнозування можна знайти у другому розділі моєї дисертації. Однак якщо говорити просто, то в основу моделі покладена ідея про розвиток історії по спіралі: етапи повторюються, але з властивостями, що змінюються.
Якщо прикласти вказану ідею до часових рядів, можна сказати так: у фактичних значеннях часового ряду, якщо їх досить багато, напевно є відрізок, який дуже схожий на те, що відбувається напередодні прогнозу.
На рис. 1 представлена частина тимчасового ряду Z(t), якого без спеціальних обчислень помітні схожі відрізки. Назвемо відрізок часового ряду, що має початок у позначці часу tі довжину (число відліків) M, вибіркою часового ряду (time series pattern) і позначимо Z M t.

Мал. 1. Тимчасовий ряд Z(t) та деякі його вибірки
Будь-яка модель прогнозування виходить із деякого припущення. У моделі з вибірці максимальної подоби передбачається, що й історія повторюється, то кожної вибірки, попередньої прогнозу, є подібна вибірка, що у фактичних значеннях цього ж часового ряду. Формально це називається гіпотеза подібності (див. дисертацію).
Співвідношення вибірок та їх назву можна побачити на рис. 2.

Мал. 2. Вибірки часового ряду Z(t)
У момент часу T, який називаєтьсямоментом прогнозу, потрібно визначити Pзначень часового ряду в майбутньому, тобто обчислити вибіркуПрогноз. При цьому значенняВибірки нової історіїє доступними. Далі, виходячи з припущення про те, що для кожної вибірки є подібна, потрібно знайтиВибірку максимальної подібностідляВибірки нової історіїі припустити, що історія повториться, тобто основою для прогнозних значень станеБазова вибірка.
Далі необхідно відповісти на три запитання.
1.2. Як визначити подобу вибірок?
У своїй дисертації я пропоную найпростіший варіант визначення подібності - обчислення значення лінійної кореляції. Беремо одну вибірку довжини M, беремо іншу вибірку довжини M, вважаємо значення кореляції, яке відображатиме подібність двох вибірок.
ШукатиВибірку максимальної подібностінайпростішеметодом переборусеред усіх можливих вибірок. Для тимчасових рядів до 100 000 значень такого сорту перебір займає кілька секунд під час реалізації на персональному комп'ютері середньої потужності.
Запропонований підхід визначення подібності не є єдиним можливим. Низка студентів-послідовників пропонували у своїх роботах інші методи визначення подібності двох вибірок. Ви можете застосувати тут вашу фантазію!
1.3. Як «перенести» зміну властивостей?
У зв'язку з тим, що в основу визначення подоби закладено лінійну кореляцію, то найпростішим варіантом «перенесення» властивостей вибірок єлінійна залежність
(1)
Якщо рівняння (1) відображає залежність двох фактичних вибірок за допомогою коефіцієнтів α1 та α0, то на підставі припущення про подібність Прогноз та Базова вибірка співвідносяться наступним чином:
(2)
Коефіцієнти α1і α0 в обох рівняннях однакові, однак для рівняння (1) вони невідомі і їх потрібно визначити, а для рівняння (2) вони є відомими. Індексmspрозшифровується якmost similar pattern.
Назва моделі англійською звучить як extrapolation (або forecast) model on the most similar pattern, скорочено EMMSP.
1.4. Чи завжди припущення про подобу?
Це потрібно перевіряти для кожної нової задачі. Будь-яка модель часового ряду є інструментом поводження з цим рядом, і, як всякий інструмент, модель потрібно використовувати належним чином. Грубо кажучи, цвяхи треба забивати молотком і копати землю лопатою, а не навпаки.
Розроблена модель показала відмінні результати в завданнях короткострокового прогнозування тимчасових рядів у галузі електроенергетики, де потрібно прогнозувати ціни та обсяги енергоспоживання. Модель показала результати, порівняні з результатами інших моделей прогнозування, на фінансових тимчасових рядах, рівні цукру крові та ін. Чисельні значення помилок можна знайти в четвертому розділі дисертації та наборі звітів про прогнозування показників оптового ринку електроенергії та потужності.
Найважливіша властивість запропонованої моделі - її простота та наочність.
2. Приклад реалізації моделі прогнозування щодо вибірки максимальної подоби в MATLAB
Приклад моделі прогнозування реалізовано у MATLAB.
2.1. Вихідні дані, постановка завдання прогнозування та параметри моделі
Завантаження вихідних даних:
Постановка завдання прогнозування:
Параметри моделі прогнозування EMMSP:
ЗміннаStepє кроком перебору фактичних значень щодоВибірки максимальної подоби.
2.2. Алгоритммоделі прогнозування щодо вибірки максимальної подоби
2.2.1. Визначити вибірку нової історії
2.2.2. Визначити значення подоби
Крок переборуStep= 24 взятий з міркування, що часовий ряд має яскраво виражену добову періодичність.
2.2.3. Визначити максимум подоби
Практика показує, що максимумів подібності може бути кілька. Найзручніше взяти перший.
2.2.4. Визначити вибірку максимальної подоби
2.2.5. Визначити базову вибірку
2.2.6 Пошук коефіцієнтів α1 та α0
Після знаходження значень коефіцієнтів α1 і α0 можна зробити перевірку, з якою помилкоюВибірка нової історіїподібнаВибірці максимальної подібності, тобто яка помилка рівняння (1). У цьому прикладі перевірку для простоти опущено.
2.2.7. Прогнозування
У реалізованому прикладі кількість прогнозних відліків може бути змінено за допомогою зміни параметра P.
2.2.8. Оцінка помилки прогнозування
За підсумками виконання програми у командному рядку MATLAB має з'явитися повідомлення: