Нелінійні моделі регресії

Якщо між економічними явищами існують нелінійні співвідношення, вони виражаються з допомогою відповідних нелінійних функцій.

Розрізняють два класи нелінійних регресій:

1. Регресії, нелінійні щодо включених в аналіз пояснюючих змінних, але лінійні за параметрами, що оцінюються.

- Поліноми різних ступенів - , , ;

2. Регресії, нелінійні за параметрами, що оцінюються.

1. Регресії нелінійні за включеними змінними зводяться до лінійного виду за допомогою методів лінеаризації простою заміною змінних, а подальша оцінка параметрів проводиться за допомогою методу найменших квадратів. Розглянемо деякі функції.

Поліном другого ступеня наводиться лінійному виду з допомогою заміни: . В результаті приходимо до двофакторного рівняння, оцінка параметрів якого за допомогою МНК призводить до системи наступних нормальних рівнянь:

А після зворотної заміни змінних отримаємо

Поліном другого ступеня зазвичай застосовується у випадках, коли для певного інтервалу значень фактора змінюється характер зв'язку ознак, що розглядаються: прямий зв'язок змінюється на зворотний або зворотний на пряму.

Аналогічно для полінома третього порядку отримаємо трифакторну модель.

Для полінома ступеня m отримаємо множинну регресію з m пояснювальними змінними

Серед нелінійної поліноміальної моделі найчастіше використовується поліном другого ступеня, рідше – третього.

Для рівносторонньої гіперболи заміна призводить до рівняння парної лінійної регресії, з метою оцінки параметрів якого використовується МНК. Система лінійних рівнянь при застосуванні МНК виглядатиме так:

Така модель може бути використана дляхарактеристики зв'язку питомих витрат сировини, матеріалів, палива від обсягу продукції, часу обігу товарів від величини товарообігу, відсотка приросту заробітної плати від рівня безробіття (наприклад, крива А.В. Філліпса), витрат на непродовольчі товари від доходів або загальної суми витрат ( наприклад, криві Е. Енгеля) та в інших випадках.

Аналогічним чином призводять до лінійного виду залежності та інші.

2. Регресії, нелінійними за оцінюваними параметрами, діляться на два типи: нелінійні моделі внутрішньо-лінійні (наводяться до лінійного вигляду за допомогою відповідних перетворень, наприклад, логарифмуванням) і нелінійні моделі внутрішньо-нелінійні (до лінійного вигляду не наводяться). До внутрішньо лінійних моделей відносяться, наприклад, статечна функція -, показова -, експоненційна -, логістична -, зворотна -. Серед нелінійних моделей найчастіше використовується статечна функція, яка наводиться до лінійного вигляду логарифмуванням:

де. Тобто. МНК ми застосовуємо для перетворених даних:

а потім потенціювання знаходимо шукане рівняння.

Широке використання статечної функції пов'язане з тим, що параметр у ній має чітке економічне тлумачення – він є коефіцієнтом еластичності. (Коефіцієнт еластичності показує, на скільки відсотків зміниться в середньому результат, якщо фактор зміниться на 1%.) Формула для розрахунку коефіцієнта еластичності має вигляд:

Так як для інших функцій коефіцієнт еластичності не є постійною величиною, а залежить від відповідного значення фактора, зазвичай розраховується середній коефіцієнт еластичності:.

Нарешті, слід зазначити залежність логістичного типу: . Графіком функції є так звана "крива"насичення", яка має дві горизонтальні асимптоти і точку перегину, а також точку перетину з віссю ординат:

Рівняння наводиться до лінійного вигляду замінами змінних.

До внутрішньо нелінійних моделей можна, наприклад, віднести такі моделі: , , .

У разі, коли функція не піддається безпосередньої лінійної лінеаризації, можна розкласти їх у функціональний ряд і потім оцінити регресію з членами цього ряду.

При лінеаризації функції чи розкладанні їх у ряд виникають інші проблеми: спотворення відхилень і порушення їх первісних властивостей, статистична залежність членів низки між собою.

Наприклад, якщо оцінюється формула отримана шляхом лінеаризації або розкладання в ряд, то незалежні змінні пов'язані між собою функціонально.

Тому у часто актуальна безпосередня оцінка нелінійної формули регресії. І тому використовується нелінійний МНК, ідея якого полягає в мінімізації суми квадратів відхилень розрахункових значень від емпіричних, тобто. потрібно оцінити параметри вектора функції, так щоб помилки по сукупності були мінімальні:.

Для вирішення цього завдання існують два шляхи:

1) безпосередня мінімізація функції F за допомогою методів нелінійної оптимізації, що дозволяють знаходити екстремум опуклих ліній (метод якнайшвидшого спуску).

2) розв'язання системи нелінійних рівнянь, що виходить із необхідної умови екстремуму функції - рівність нулю приватних похідних за кожним із параметрів:

Цю систему можна вирішити ітераційними методами. Однак у загальному випадку рішення такої системи не є більш простим способом знаходження вектора.

Існують методи оцінювання нелінійної регресії, що поєднують безпосереднюоптимізацію, що використовує знаходження градієнта, з розкладанням у ряд Тейлора для подальшої оцінки лінійної регресії (метод Марквардта).

При побудові нелінійної регресії гостріше, ніж у лінійному випадку, стоїть проблема правильної оцінки форми залежності між змінними.

Неточності при виборі форми функції істотно позначаються на якості окремих параметрів рівняння і, відповідно, на адекватності всієї моделі в целом.

Будь-яке рівняння нелінійної регресії, як і лінійної залежності, доповнюється показником кореляції, який у цьому випадку називається індексом кореляції:

Тут – загальна дисперсія результативної ознаки y, – залишкова дисперсія, яка визначається за рівнянням нелінійної регресії. Слід звернути увагу, щорізниці у відповідних сумахіберуться над перетворених, а вихідних значеннях результативного ознаки. Інакше висловлюючись, при обчисленні цих сум слід використовувати не перетворені (лінеаризовані) залежності, саме вихідні нелінійні рівняння регресії. Інакше можна записати так:

Величина R знаходиться в межах , і чим ближче вона до одиниці, тим тісніше зв'язок ознак, тим більше надійно знайдене рівняння регресії. При цьому індекс кореляції збігається з лінійним коефіцієнтом кореляції у разі коли перетворення змінних з метою лінеаризації рівняння регресії не проводиться з величинами результативної ознаки. Така ситуація з напівлогарифмічною і поліноміальною регресією, а також з рівносторонньою гіперболою. Визначивши лінійний коефіцієнт кореляції для лінеаризованих рівнянь, наприклад, у пакеті Excel за допомогою функції ЛІНІЙН, можна використовувати його для нелінійної залежності.

Інакше справау разі коли перетворення проводиться також з величиною y, наприклад, взяття зворотної величини або логарифмування. Тоді значення R, обчислене тією ж функцією Лінейн, буде відноситися до лінеаризованого рівняння регресії, а не до вихідного нелінійного рівняння, і величини різниць під сумами будуть ставитися до перетворених величин, а не до вихідних, що не те саме. При цьому, як було зазначено вище, для розрахунку R слід скористатися виразом, обчисленим за вихідним нелінійним рівнянням.

Оскільки в розрахунку індексу кореляції використовується співвідношення факторної та загальної СКО, то R 2 має той самий сенс, що і коефіцієнт детермінації. У спеціальних дослідженнях величину R2 для нелінійних зв'язків називають індексом детермінації.

Оцінка суттєвості індексу кореляції проводиться як і, як і оцінка надійності коефіцієнта кореляції.

Індекс детермінації використовується для перевірки суттєвості в цілому рівняння нелінійної регресії за F-критерієм Фішера:

де n-число спостережень, m-число параметрів за змінних х. В усіх розглянутих нами випадках, крім поліноміальної регресії, m=1, для поліномів кількість параметрів дорівнює m, тобто. ступеня полінома. Розмір m характеризує число ступенів свободи для факторної СКО, а (n-m-1) - число ступенів свободи для залишкової СКО.

Індекс детермінації R2 можна порівнювати з коефіцієнтом детермінації r2 для обґрунтування можливості застосування лінійної функції. Чим більша кривизна лінії регресії, тим більша різниця між R 2 і r 2 . Близькість цих показників означає, що ускладнювати форму рівняння регресії годі було і можна використовувати лінійну функцію. Фактично, якщо величина (R 2 -r 2 ) вбирається у 0,1, то лінійна залежність вважається виправданою. ІнакшеУ разі проводиться оцінка суттєвості відмінності показників детермінації, обчислених за тими самими даними, через t-критерій Стьюдента:.

Тут у знаменнику знаходиться помилка різниці (R 2 -r 2 ), яка визначається за формулою:

Якщо , то різницю між показниками кореляції істотні і заміна нелінійної регресії лінійної недоцільна.

На закінчення наведемо формули розрахунку коефіцієнтів еластичності для найпоширеніших рівнянь регресії: