Проблеми сезонного коригування даних
Розгляд основних проблем, що виникають під час використання процедур сезонного коригування даних. Аналіз проблеми "виляючого хвоста", змін динамічних властивостей часових рядів та його впливу на тестові процедури. Передиференціювання рядів.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче
Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.
Розміщено наhttp://www.allbest.ru/
українськаакадеміянародногогосподарстваідержавноїслужбиприПрезидентіукраїнськійФедерації,м.Москва
Проблемисезонноїкоригуванняданих
У статті розглядаються основні проблеми, що виникають під час використання процедур сезонного коригування даних: проблема «виляючого хвоста» та зміна динамічних властивостей часових рядів та його вплив на тестові процедури.
Ключовіслова:динамічні властивості часових рядів, проблема «виляючого хвоста», сезонне згладжування
Сезонне коригування даних є одним із складових процедури розкладання часового ряду на компоненти. Опишемо коротко суть проблеми. Нехай - деякий ряд часу, де t=1. T (місяці чи квартали) з усуненими календарними ефектами та ефектами робочого дня. Тоді завдання декомпозиції полягає у знаходженні наступного уявлення:
де – трендово-циклічна компонента, – сезонна компонента та – нерегулярна компонента (помилка). Розкладання виду (1) називаєтьсяадитивним, виду (2) -мультиплікативним. Мультиплікативне розкладання зводиться в адитивний спосіблогарифмування. У такій постановці завдання сезонно скоригованим називається ряд для адитивного випадку та ряд – для мультиплікативного.
Важливим для розуміння моментом є те, що з математичної точки зору розв'язання задачі розкладання часового ряду на компоненти не єдине. Тобто, використовуючи різні підходи до виділення компонентів ряду, ми отримаємо різні компоненти. Особливо сильні ці відмінності будуть у актуальному хвості ряду (тобто в точках, найбільш близьких до поточного часу).
У цій статті ми зупинимося на таких проблемах процедур сезонного згладжування, як проблема «виляючого хвоста» та проблема зміни динамічних властивостей ряду внаслідок сезонного коригування.
Проблема «виляючого хвоста»
Проблема «виляючого хвоста» є однією з основних і найчастіше обговорюваних у літературі. Вона пов'язана з тим, що при додаванні нових спостережень остання оцінка компонентів ряду (наприклад, трендової) може істотно змінюватися порівняно з оцінкою, отриманою без цієї точки.
Що може спричинити такі відмінності? Як зазначають Бессонов і Петроневич(Бессонов,Петроневич,2013), при різкій зміні значень показників, що спостерігається в умовах економічної нестабільності, не ясно, до якої з компонента ряду слід віднести ці зміни. Наприклад, якщо вони віднесені до сезонної компоненти, тоді як відбувається зміна трендових характеристик, виникає компенсація в сезонно згладженій компоненті ряду. І цей ефект поширюватиметься згасаючою хвилею на наступні спостереження. Автори зазначають, що проблему можна вирішити за рахунок включення викидів до процедури сезонного згладжування.
Ще одним джерелом спотворень тренду на околиці кризи може бути різкезміна структури сезонності. Обидві зазначені причини можуть призвести до виникнення так званих фіктивних (неправдивих) фор-і афтершоків. Безсонов і Петроневич розглянули ці ефекти на штучно змодельованих рядах і дійшли таких висновків. По-перше, проблема «виляючого хвоста» актуальна наприкінці існуючих рядів - при аналізі історичних даних (далеко від поточних криз) вона усувається. По-друге, зміщення поворотних точок (моменту, коли відбулася зміна) по відношенню до істинних досягає півроку. Це означає, що при оперативному моніторингу економіки ми можемо дуже помилятися щодо її поточного стану. На прикладі реальних даних було показано, що в процедурі X12-ARIMA ефект виляння хвостом менше, ніж у X11 та TRAMO/SEATS. Крім того, X12-ARIMA перевершує TRAMO/SEATS у тому сенсі, що помилкові спотворення згасають набагато швидше при використанні X12-ARIMA.
Наші емпіричні спостереження (досвід сезонного коригування даних) показують, що наявність у даних структурного зсуву типу «стрибок» (тобто зміна рівня тренду – LS) призводить до серйозних проблем при виділенні трендових компонентів ряду. Для вивчення цього ефекту ми змоделювали ряди (рис.1), що містять зсув такого виду в другій половині ряду. Розмір зсуву дорівнював або одному стандартному відхилення значень ряду (понад 1500 рядів), або п'яти стандартним відхиленням (також більше 1500 рядів).
Рисунок 1 Змодельований ряд, зміна довжини хвоста після викиду типу LS (5у)
Очікувалося, що малі зміни будуть ідентифіковані як структурне зрушення з більш низькою ефективністю (рідше) і замість цього будуть віднесені до тренду. Великі зрушення повинні визначатися досить точно. Також чим ближче злам тренду до актуальногокінці ряду, тим більше має бути спотворена сезонно згладжена компонента у його околиці.
Результат процедури згладжування змодельованого часового ряду вважається "вірним", якщо процедура Х12-ARIMA виявила викид типу LS там, де він був заданий. Це досить жорстка вимога, оскільки часто викид моделюється типом TC (одноразовий викид) або сукупністю TC+AO (АТ - адитивний викид - різка зміна в моментtі подальше плавне повернення до початкового рівня), що також може бути прийнятним у деяких ситуаціях. Пораховані за таким критерієм ефективності виявлення викиду (величиною 1у і 5у) залежно від його віддаленості від кінця ряду наведені на малюнку2.
Очікувалося, що це значення зростатиме в міру видалення викиду з кінця ряду. Однак цей ефект спостерігається досить незначно, а для найдовших рядів взагалі відзначається зниження ефективності при наближенні до кінця інтервалу. Можливо, останнє пов'язані з тим, що у практиці викид моделюється сукупністю різних типів викидів, які дозволяють враховувати наступну динаміку.
Рисунок 2 Залежність ефективності виявлення викиду типу LS на штучних часових рядах залежно від віддаленості викиду актуального кінця ряду. Ряди з викидом величиною 1у – зліва, 5у – праворуч
Як видно змалюнку2, ефективність виявлення зміни рівня в точках, ближчих до моменту структурного зсуву, вище у разі великих змін (тобто для зсувів розміру 5у). Але в міру наближення до кінця ряду ефективність виявлення такого зсуву практично не залежить від його розміру. Проте ефективність виявлення структурного зсуву варіюється від 59 до 93% і знижується до кінця вибірки. З данихрозрахунків можна дійти невтішного висновку у тому, що процедура X12-ARIMA який завжди ефективно виявляє структурний зсув типу зміни рівня, що може бути однією з причин «виляння хвостом».
Вплив сезонного коригування на статистичні властивості часових рядів
Ще однією проблемою, яка може виникати під час сезонного коригування рядів, є проблема зміни типу тренду (детермінований/стохастичний) часового ряду. Дослідженню таких ефектів присвячено чимало робіт. Зупинимося тих, які є, з погляду, основними.
Сімс(Sims,1974)і Уолліс(Wallis,1974)показали, що в класичній моделі регресії (без запізнюваних значень пояснюваної змінної ) з невипадковими регресорами та гауссовськими помилками оцінка найменших квадратів, отримана за згладженими (у даному випадку досліджувався фільтр Х11) даними, залишається незміщеною. Результат узагальнюється на випадок випадкових регресорів та ненормальних помилок. У цьому випадку оцінка найменших квадратів буде заможною та асимптотично нормальною, так що можна використовувати асимптотичні-статистику та статистику Вальда. Отже, у разі проблем через коригування даних немає.
При сезонної коригування даних часто відбувається передиференціювання рядів, тобто. взяття різниць у ситуації, коли це потрібно. І це, своєю чергою, призводить до того, що у даних з'являється незворотна МА-компонента. Так, Белл(Bell,2012)показує, що двосторонній симетричний X-11 фільтр при оцінюванні передбачуваної сезонної компоненти застосовує шестиразове диференціювання вихідного ряду (що не завжди потрібно, виходячи з динамічних властивостей ряду ). Крім того, процедура призводить не лише до видаленняможливої детермінованої сезонності, але також і до подвійного видалення всіх можливих одиничних коренів на кожній із сезонних частот. Але, оскільки тимчасові ряди, що спостерігаються, не завжди містять і один повний набір сезонних одиничних коренів, очевидним чином з'являється (принаймні приблизно) незворотна MA компонента, що має один або більше коренів на сезонних частотах.
Дель Барріо Кастро та Осборн(DelBarrioCastro,Osborn,2004)показують, що процедури сезонного коригування (фільтрації) призводять до консервативного розміру критерію в тестах на одиничні корені. При цьому в роботі показано, що в ADF-тесті включення великої кількості запізнювань у специфікацію зменшує зміщення тестових статистик через автокореляції, хоча X-11 фільтр і є незворотним. Потужність, звичайно, зменшується при використанні фільтрованих даних. Автори також аналізували тести Філліпса-Перона (PP), Брайтунга (VRT) та M-тести Стоку. Для того, щоб розподіл тестів Філліпса-Перона не був зміщеним, необхідно вибирати велике значення ширини вікна для оцінювання довгострокової дисперсії, щоб охопити MA процес високого порядку.
Тест Брайтунга не залежить від параметрів, що заважають, і інваріантний до сезонної корекції. M-тести Стоку також мають таку властивість, якщо довгострокова дисперсія задовільно оцінюється рівною одиниці.
Дель Барріо Кастро і Осборн також показали на змодельованих даних, що найменше вплив сезонної корекції піддається VRT-тест, розмір і потужність якого практично однакові для фільтрованих і нефільтрованих даних. Тести PP та M для фільтрованих даних мають меншу потужність, як і ADF тести, якщо брати велику кількість лагів, та більш високий розмір, якщо братимала кількість лагів.
Вплив сезонного коригування на випробування на коінтеграцію близько співвідноситься з впливом на випробування на одиничний корінь. Еріксон, Хендрі та Трен [3] показали для симетричного двостороннього фільтра (типу Х-11), що він не впливає на коінтеграційні співвідношення на нульовій частоті. Іншими словами, якщо ми очистимо дані від усіх коренів, крім одиничного, то коефіцієнти коентегрирующей регресії за цими даними будуть асимптотично еквівалентні коефіцієнтам, отриманим в коинтегрирующей регресії за фільтрованими даними. Крім того, тести на коінтеграцію будуть інваріантними до фільтрації (виконуватиметься не тільки спроможність, але також збігатимуться асимптотичні розподіли). Але, як і у випадку з тестуванням наявності одиничного кореня, результати виконуються лише асимптотично, але на кінцевих вибірках можуть бути суттєві усунення оцінок та статистик.
1. Найбільш відомою проблемою, що виникає при сезонному коригуванні даних, є проблема «виляючого хвоста». Як показують дослідження, вона найактуальніше стоїть у періоди економічної нестабільності. Основною причиною її виникнення можна вважати неможливість правильної ідентифікації змінилася компоненти ряду і, як наслідок, змішання компонентів ряду між собою. Все це сильно ускладнює поточний моніторинг даних і спричиняє некоректні висновки про економічну ситуацію, що склалася. Дати якісь конкретні рекомендації тут досить складно - компоненти ряду дуже волатильні на інтервалі до півроку, а ефективність процедур сезонного коригування (ми розглядали Х12-ARIMA) в ідентифікації зміни рівня ряду поблизу структурного зсуву не дуже висока навіть при структурних зсувах досить великого розміру ( близько 60%).
2. Процедурисезонного коригування можуть призвести до зміни динамічних властивостей часових рядів, які, у свою чергу, можуть негативно вплинути на властивості тестів та оцінки моделей. Як показав огляд літератури, асимптотично багато процедур не чутливі до наслідків сезонного коригування даних (наприклад, процедури оцінювання коінтеграційних співвідношень). Але це не правильно для кінцевих вибірок, з якими ми маємо справу на практиці. Також треба бути уважним при використанні тестів на одиничні корені для згладжених даних: для деяких процедур спостерігається досить серйозне падіння їх потужності та спотворення розміру критерію, причому вони можуть не усуватись навіть асимптотично.
3. Наші розрахунки показують, що на кінцевих вибірках (5-10 років у річному вимірі) ADF і DF-GLS тести мають не дуже високу потужність стосовно згладжених рядів.
1. Безсонов, В.А., Петроневич, А.В. (2013). Сезонне коригування як джерело помилкових сигналів. Економічний журнал Вищої школи економіки, 17 (4), 586-616.
3. Bell, W.R. (2012). Unit Root Properties of Seasonal Adjustment and Related Filters. Journal of Official Statistics, 28 (3), 441-461.
4. Ghysels, E., Perron, P. (1996). Діяльність linear filters на dynamic time series with structural change. Journal of Econometrics, 70 (1), 69-97. doi: 10.1016/0304-4076(94)01684-4.