Нестабільність та схрещення квантилів

Загальні принципи

Початок роботи

Посібник користувача Envision

Прогнозування попиту

Оптимізація запасів

Довідник з Envision

Зразки сценаріїв Envision

Інтеграція

Оптимізація ціноутворення

Старі версії

Квантильні прогнози безцінні для оптимізації товарних запасів, проте невеликий відсоток квантильних числових значень, що видаються системою Lokad, може поводитися досить дивно. На цій сторінці ми розповімо, як з'являються подібні несподівані результати і що можна зробити.

Вибір моделі з бібліотеки

Наша технологія прогнозування є бібліотекою моделей прогнозування, які відбираються виходячи з того, наскільки точні вони видають прогнози. Загальній архітектурі програми прогнозування присвячена окрема сторінка. Процес підбору найбільш точних моделей (1) називаєтьсявибором. Вибір ґрунтується на результатах ретроспективного тестування, процесу, при якому кожна модель перевіряється на безлічі наборів даних.

Така система має великі переваги:

Прогнози виходять набагато точніше, ніж при використанні лише однієї моделі.
Для складання прогнозу не потрібно занадто багато даних про природу попиту.
Перепідгонка та інші системні помилки не можуть значно змінити результати прогнозування.

Проте цей процес іноді дає суперечливі результати.

Нестабільність квантилів

При виборі моделей прогнозування найбільш точні з них дають, як правило, дуже схожі результати. Таким чином, найточніша модель для 1-го дня може стати найточнішою моделлю 2-го дня. Тим не менш, зміни в прогнозованих показниках, якправило, незначні з практичного погляду.

І все ж, іноді найточніша і друга за точністю моделі дають дуже різні показники. Наприклад, модель А може дуже добре відображати сезонні зміни, але не помічати моду, тоді як модель добре відображає вплив моди, але не сезонні зміни. У таких випадках моделі А і В можуть бути приблизно однаково точні «загалом», але при цьому давати дуже різні прогнози у певні моменти часу.

Насправді такі ситуації трапляються рідко, та їх можна простежити на будь-якому відповідному наборі даних. Будь-який набір даних, що складається з понад 100 записів, зазвичай містить подібні випадки як мінімум для однієї одиниці товару; причому ймовірність подібних ситуацій вища, якщо фактичні дані про попит містять помилки або якщо їх мало.

Те, що ми зараз описали, насправді є прихованим процесом, що відбувається у Lokad. Найчастіше ви навіть нічого не помітите. Тим не менш, таку ситуацію можна спостерігати, якщо ви запустите Lokad з використанням двох злегка відмінних наборів даних. Наприклад, уявимо, що ви створили прогнози в понеділок з використанням набору А, який включає всі ваші продажі до неділі. Потім, з якоїсь причини, наприклад, ви забули включити якісь нові елементи, в середу ви створюєте новий прогноз, з набору даних, які включає в себе всі продажі до вівторка. Для вас ці набори дуже схожі, тому що вони відрізняються всього на 2 дні, і ви чекатимете однакові прогнози. Проте ви побачите відмінності, часом значні. Це дуже показовий приклад квантильної нестабільності: під час процесу вибору дані за 2 дні могли призвести до вибору іншої математичної моделі, результати якої дуже схожі. Загальнаточність буде трохи вищою, але зокрема прогнози можуть бути різними, що ви можете сприйняти як аномалії.

Перехрещення квантилів

Так само, при збільшенні ймовірності обслуговування кількість точок відновлення замовлення має також збільшуватися; це підтверджується експериментами, проведеними Lokad. Тим не менш, у ситуації, подібній вище, при створенні двох прогнозів у Lokad на підставі подібних наборів даних з трохи іншою ймовірністю обслуговування (скажімо, не 97%, а 98%), підвищення ймовірності обслуговування для групи предметів може призвести до зменшення точки відновлення замовлення, яке можна побачити при порівнянні прогнозів. З погляду користувача такий прогноз, зрозуміло, здається невірним.

Проблема, яку ми тут спостерігаємо, насправді давно відома у статистиці під назвою«перехрещення квантилів».

Перехрещення квантилів в Lokad, знову ж таки, відбувається через особливості процесу вибору моделі. Усі квантильні моделі прогнозування працюють за одним принципом: збільшення тау-фактора (ймовірності обслуговування) веде до збільшення значення квантилі (кількість точок відновлення замовлення). Тим не менш, якщо вибирається модель з трохи більш високою загальною точністю, порівняно з первісною, але яка дає сильно відрізняються показники, в деяких значеннях квантили відбуваєтьсязбій, і ми можемо спостерігати перехрещення квантилів. Ви повинні пам'ятати, що загальна точність прогнозів у таких випадках не знижується - вибирається найкраща модель для обраної ймовірності обслуговування.

На практиці ця ситуація виникає дуже рідко, але її можна спостерігати практично в будь-якому відповідному наборі даних. Слід зазначити, що висока ймовірність обслуговування також підвищує частотуперехрещення квантилів, тому що значення прогнозів стають менш стабільними. Спрогнозувати останній 1% попиту (при ймовірності обслуговування 99%) набагато складніше, ніж оцінити останні 10% (при ймовірності обслуговування 90%). Тут спостерігається сильний ефект важеля, тому набір математичних моделей, що використовуються для створення прогнозів при ймовірності обслуговування в 98% зазвичай відрізняється від тих, які використовуються для 96 або 97%.

Квантильний колапс

Квантильний колапс є дуже сильним перехрещенням квантилів. Якщо можливість обслуговування постійно підвищувати до крайніх значень, то в якийсь момент не просто окремі, а більшість квантильних прогнозів почнуть зменшуватися. Таким чином, при підвищенні ймовірності обслуговування може вийти так, що рекомендовані обсяги товарних запасів будуть нижче встановлених раніше. Ми називаємо появу таких дивних показників квантильним колапсом.

Квантильний колапс з'являється через відомий недолік нашої технології прогнозування. Простими словами, якщо встановлювати крайні значення ймовірності обслуговування, наприклад 99% або навіть 97% при ости даних, додаток для прогнозування не зможе виділяти найбільш ефективні моделі прогнозування. При дуже високих значеннях ймовірності обслуговування всі моделі прогнозування навмисно сильно переоцінюють попит. В результаті вибираються моделі з "середніми" показниками ефективності, що призводить до можливості колапсу, оскільки спрогнозовані обсяги товару знижуються, а ймовірність обслуговування підвищується.

Боротися з квантильними колапсами, звичайно, дуже цікаво з теоретичної точки зору, але на практиці це трапляється лише коли ймовірність обслуговування значно перевищуєрозумний рівень товарних запасів. Складання якісніших прогнозів — основна місія Lokad, проте ми намагаємося працювати над сценаріями, які справді мають значення для бізнесу; тому ми не посилено боротимемося з квантильними колапсами.

Як упоратися з такими парадоксальними свідченнями

Випадки нестабільності та перехрещення квантилів говорять про вроджену недосконалість статистичних технологій прогнозування. Тим не менш, важливо розуміти, що непродумане виправлення подібних відхилень може значно погіршити ситуацію.

Можна вирішити проблему, встановивши заборону змінення прогнозованого значення більш, ніж X%. Також можна зробити так, щоб прогнозоване значення збільшувалося строго відповідно до збільшення ймовірності обслуговування.

У будь-якому випадку, ми вибиратимемо одне значення замість іншого, не маючи для цього жодного статистичного підґрунтя: при обробці одного або двох прогнозів, підсумкове значення можездаватисябільш правильним, але не бути таким насправді, а значить компанія не зможе виграти від нього.

Технологія прогнозування Lokad постійно доопрацьовується. Ми створюємо найякісніші ринкові прогнози та працюємо над проблемними випадками, описаними вище.

(1) Тут ми значно спростили процес вибору. Насправді, при прогнозуванні використовується складна комбінація найбільш виграшних моделей. Проте, для простоти можна сказати, що вибирається лише одна «виграшна» модель.