Побудова регресійної прямої за згрупованими даними

При великій кількості спостережень зазвичай проводять угруповання даних за однією або декількома змінними. Для дослідження залежностей бажано використовувати рівні ширини інтервали угруповань. Нерівні інтервали можуть призвести до спотворення регресії та хибних висновків. При великому обсязі сукупності, що вивчається, найбільш доцільно утворювати 9 - 10 інтервалів, рівномірно заповнених частотами. При невеликих обсягах сукупності немає сенсу проводити угруповання даних. Оцінки, обчислені за згрупованим матеріалом, відрізняються від оцінок, обчислених за несгрупованим матеріалом. Причина цього – у переході при розрахунках до середин інтервалів та умовно прийнятого рівномірного розподілу частот за шириною цих інтервалів. При великому обсязі даних вважається, що неточності в результатах за рахунок угрупування скупчуються спрощенням процедури обчислення.

Тема 3. Модель множинної лінійної регресії

1. Визначення параметрів моделі парної лінійної регресії методом найменших квадратів

2. Оцінка тісноти зв'язку між змінними

3. Оцінка якості рівняння регресії

4. Причини способу менших квадратів

Лінійна множинна регресія

Насправді кожне явище визначається дією не однієї причини, а кількох, а точніше цілим комплексом причин. Складне поєднання причин призводить до різних результатів. Наприклад, діючи в тому самому напрямку, вони посилюють дію, діючи в протилежному напрямку - послаблюють один одного. Виникає питання про вимірювання впливу комплексу причин на явище, що вивчається. Завдання вивчення залежності однієї залежної змінної від кількох пояснюючих зміннихx1,x2, …,xmв умовах конкретного часу вирішується за допомогою множинного або багатофакторного регресійного аналізу. Розглянемо лінійне співвідношення між змінноюyі пояснювальними зміннимиx1,x2, …,xm.

Коефіцієнтиbk, k= 0, 1, 2, …, m називаються параметрами регресії. Постійна регресії виконує в рівнянні регресії функцію вирівнювання. Вона визначає точку перетину гіперповерхні регресії з віссюy. Значенняb1,b2, …,bmє оцінками коефіцієнтів регресії. Коефіцієнт регресіїbkвимірює усереднений приватний вплив зміни змінноїxk,k= 1, 2, …,m, у припущенні, що інші пояснюють змінні(x>1,x2, …,xk-1,xk,xk+1, …,x>m)залишаються без зміни постійному рівні. Тому з погляду статистичної методології немає різниці між множинною та приватною регресією. З цієї причини в літературі параметриbk,k= 1, 2, …,mназиваються як коефіцієнтами множинної, так і приватної регресії . Але висновок про те, що для визначення коефіцієнтів регресії достатньо визначити декілька простих лінійних регресійyнаxk, k = 1, 2, …, m є помилковим. Для достовірних оцінок необхідні методи оцінювання, що враховують багатосторонні зв'язки спільно залежних змінних.Найчастіше використовують двокроковий метод найменших квадратів, який є узагальненням методу найменших квадратів.

Розглянемо спочатку лінійну множинну регресію з двома пояснювальними змінними:

Метод найменших квадратів призводить до умови:

, звідки

регресійної

Вирішити отриману систему нормальних рівнянь щодо невідомих параметрів можна за формулами Крамера.

прямої

згрупованими

Коефіцієнти множинної чи приватної регресії можна подати через дисперсії та коваріації:

згрупованими

регресійної

де

даними

даними

Побудуємо лінійну множинну регресію загальної суми податків і платежів на загальну суму надходжень з податку на додану вартість та податку на прибуток (дохід).

y(загальна сума податків і платежів до консолідованого бюджету РФ), млрд. руб.

x1(загальна сума надходжень до консолідованого бюджету України з податку на прибуток), млрд. руб.

x2(загальна сума надходжень до консолідованого бюджету України з ПДВ), млрд. руб.