Лабораторна робота 4 тема регресійний аналіз
Рівняння лінійної парної регресії виглядає так:
З допомогою цього рівняння змінна Y виражається через константу a0 і кут нахилу прямий (чи кутовий коефіцієнт) а1, помножений значення змінної X. Константу a0 також називають вільним членом, а кутовий коефіцієнт - коефіцієнтом регресії. Параметри рівняння можна визначити за допомогою методу найменших квадратів (МНК)
Метод найменших квадратів
(У довідкових системах англомовних програм - Least Squares Мethod, LS) є одним з основних методів визначення параметрів регресійних рівнянь, що дає найкращі лінійні незміщені оцінки. Саме він використовується у MS Excel. Лінійні - відноситься до характеру взаємозв'язку змінних. Незміщені означає, що очікувані значення коефіцієнтів регресії мають бути дійсними коефіцієнтами. Тобто точки, побудовані за вихідними даними, повинні лежати якомога ближче до точок лінії регресії. Сутність даного методу полягає у знаходженні параметрів моделі, при яких сума квадратів відхилень емпіричних (фактичних) значень результуючого ознаки від теоретичних, отриманих за вибраним рівнянням регресії, тобто:
,
де




Мал. 1 Поняття відхилення

У регресійному аналізі передбачається, що математичне очікування випадкової величини дорівнює нулю і її дисперсія однакова для всіх спостережуваних значень Y. Звідси випливає, що розсіювання даних біля лінії регресії має бути однаково привсіх значеннях параметра X. У разі показаному на рис. 2 дані розподіляються вздовж лінії регресії нерівномірно, тому метод найменших квадратів у разі неприменим.

Рис.2. Нерівномірний розподіл вихідних точок вздовж лінії регресії
Провівши необхідні перетворення, отримаємо систему двох рівнянь із двома невідомими а0 та а1, які знайдемо вирішивши систему.


Напрямок зв'язку між змінними визначається виходячи з знаків (негативний чи позитивний) коефіцієнта регресії (коефіцієнта а1).
Якщо знак при коефіцієнті регресії - позитивний, зв'язок залежної змінної з незалежною буде позитивним. У нашому випадку знак коефіцієнта регресії позитивний, отже, зв'язок також є позитивним.
Якщо знак при коефіцієнті регресії - негативний, зв'язок залежної змінної з незалежною є негативним (зворотним).
Для аналізу загальної якості рівняння регресії використовують зазвичай множинний коефіцієнт детермінаціїR2, званий також квадратом коефіцієнта множинної кореляції R. R 2 (міра визначеності) завжди знаходиться в межах інтервалу [0; 1].
Якщо значення R 2 близько до одиниці, це означає, що побудована модель пояснює майже всю мінливість відповідних змінних. І навпаки, значення R-квадрату, близьке до нуля, означає погану якість збудованої моделі.
Коефіцієнт детермінації R 2 показує, на скільки відсотків (


де



Мал. 3 Графічна інтерпретація коефіцієнтадетермінації для випадку лінійної регресії
Відповідно, величина показує, скільки відсотків варіації параметра Y обумовлені факторами, не включеними в регресійну модель. При високому (

