Оцінка суттєвості параметрів рівняння множинної регресії та кореляції - Моделювання на

Множинна регресія – рівняння зв'язку з декількома незалежними змінними: де – залежна змінна (результативна ознака); - незалежні змінні (чинники). Для побудови рівняння множинної регресії найчастіше використовуються такі функції:

Можна використовувати інші функції, що приводяться до лінійного вигляду. Для оцінки параметрів рівняння множинної регресії застосовують метод найменших квадратів (МНК). Для лінійних рівнянь та нелінійних рівнянь, що наводяться до лінійних, будується наступна система нормальних рівнянь, вирішення якої дозволяє отримати оцінки параметрів регресії:

регресії

Для її вирішення може бути застосований метод визначників:

регресії

- Визначник системи; - Приватні визначники; які утворюються шляхом заміни відповідного стовпця матриці визначника системи даними лівої частини системи. Інший вид рівняння множинної регресії - рівняння регресії у стандартизованому масштабі:

- Стандартизовані коефіцієнти регресії. До рівняння множинної регресії в стандартизованому масштабі застосуємо МНК.

Стандартизовані коефіцієнти регресії (-коефіцієнти) визначаються з наступної системи рівнянь:

Зв'язок коефіцієнтів множинної регресії зі стандартизованими коефіцієнтами описується співвідношенням

Параметр визначається як

Середні коефіцієнти еластичності для лінійної регресії розраховуються за формулою

Для розрахунку окремих коефіцієнтів еластичності застосовується наступна формула:

Тісноту спільного впливу факторів на результат оцінює індекс множинної кореляції:

Значення індексу множинної кореляції лежить умежах від 0 до 1 і має бути більшим або дорівнює максимальному парному індексу кореляції: Індекс множинної кореляції для рівняння в стандартизованому масштабі можна записати у вигляді

При лінійній залежності коефіцієнт множинної кореляції можна визначити через матрицю парних коефіцієнтів кореляції:

суттєвості

- Визначник матриці парних коефіцієнтів кореляції;

- Визначник матриці міжфакторної кореляції. Приватні коефіцієнти (або індекси) кореляції, що вимірюють вплив на y фактора при незмінному рівні інших факторів, можна визначити за формулою:

або за рекурентною формулою:

Приватні коефіцієнти кореляції змінюються не більше -1 до 1. Якість побудованої моделі загалом оцінює коефіцієнт (індекс) детермінації. Коефіцієнт множинної детермінації розраховується як квадрат індексу множинної кореляції:

Коригований індекс множинної детермінації містить поправку на число ступенів свободи та розраховується за формулою:

де n-число спостережень; m – число факторів. Значення рівняння множинної регресії в цілому оцінюється за допомогою F-критерію Фішера:

Приватний F-критерій оцінює статистичну значущість присутності кожного з рівнянь. Загалом для фактора приватний F-критерій визначиться як

Оцінка значимості коефіцієнтів чистої регресії за допомогою t-критерію Стьюдента зводиться до обчислення значення

де - середня квадратична помилка коефіцієнта регресії При побудові рівняння множинної регресії може виникнути проблема мультиколінеарності факторів, їх тісної лінійної зв'язаності. Вважається, що дві змінні явно колінеарні, тобто знаходяться між собою в лінійній залежності, якщо за величиною парних коефіцієнтівкореляції виявляється лише явна колінеарність факторів. Найбільші труднощі використання апарата множинної регресії виникають за наявності мультиколлинеарности чинників. Чим сильніша мультиколлінеарність факторів, тим менш надійна оцінка розподілу суми поясненої варіації за окремими факторами за допомогою методу найменших квадратів.

Для оцінки мультиколлінеарності факторів може використовуватись визначник матриці парних коефіцієнтів кореляції між факторами. Якби фактори не корелювали між собою, то матриця парних коефіцієнтів кореляції між факторами була б одиничною матрицею, оскільки всі недіагональні елементи дорівнювали б нулю. Так, для включає три пояснюють змінні рівняння

матриця коефіцієнтів кореляції між факторами мала б визначник, що дорівнює 1:

оскільки і . Якщо ж, навпаки, між факторами існує повна лінійна залежність і всі коефіцієнти кореляції дорівнюють 1, то визначник такої матриці дорівнює 0:

Чим ближче до 0 визначник матриці міжфакторної кореляції, тим сильніша мультиколлінеарність факторів і ненадійніше результати множинної регресії. І навпаки, чим ближче до 1 визначник матриці міжфакторної кореляції, тим менша мультиколлінеарність факторів. Перевірка мультиколлінеарності факторів може бути проведена методом випробування гіпотези про незалежність змінних

Доведено, що величина

має наближений розподіл

ступенями свободи. Якщо фактичне значення перевищує табличний (критичне), то гіпотеза відхиляється. Це означає, що недіагональні ненульові коефіцієнти кореляції вказують на колінеарність факторів. Мультиколлінеарність вважається доведеною. Для застосування МНК потрібно, щоб дисперсія залишків булагомоскедастичну. Це означає, що з кожного значення чинника залишки мають однакову дисперсію. Якщо цієї умови не дотримується, то має місце гетероскедастичність. У разі порушення гомоскедастичності ми маємо нерівності

  • 3) поділ сукупності зі спостережень на дві групи (відповідно з малими та з великими значеннями фактора) та визначення за кожною з груп рівнянь регресії;
  • 4) визначення залишкової суми квадратів для першої та другої груп та знаходження їх відношення:

При виконанні нульової гіпотези про гомоскедастичність відношення R задовольнятиме F-критерію зі ступенями свободи для кожної залишкової суми квадратів. Чим більша величина R перевищує табличне значення F-критерію, тим більше порушена передумова про рівність дисперсій залишкових величин.

Рівняння множинної регресії можуть включати як незалежні змінні якісні ознаки (наприклад, професія, стать, освіта, кліматичні умови, окремі регіони тощо).