Тема «Побудова лінійної парної кореляції»

Компетенції: Студенти набувають компетенції:

- у виборі рівняння регресії для емпіричних даних та її оцінки (адекватність побудованої моделі);

- в оцінці зв'язку з різних позицій: наявність зв'язку, його напрям, сила і тіснота;

- у проведенні аналізу на основі отриманих результатів та виконанні висновків.

Мета роботи: Набути навички у побудові лінійного рівняння регресії для емпіричних даних, у знаходженні параметрів рівняння на основі цих даних; у розрахунку коефіцієнта тісноти зв'язку досліджуваних ознак з використанням інструментарію Microsoft Excel та проведення аналізу на основі отриманих результатів.

Для вивчення взаємодії ознак використовують дослідження за типами зв'язків між різними явищами та їх ознаками. Розрізняють два типи зв'язків (рис. 8.1)

Мал. 8.1 Типи зв'язків між статистичними ознаками

Так кореляційний зв'язок є окремим випадком статистичної.

Визначення: Кореляційним зв'язком називається такий зв'язок між явищами та їх ознаками, коли різним значенням змінної відповідають різні середні значення іншої змінної, причому одному середньому значенню може відповідати безліч значень іншої змінної.

Для вивчення кореляційних зв'язків використовують рівняння регресії, яке є математичним виразом зв'язку ознак: умовної середньої величини результативної ознаки зі зміною факторної ознаки (факторна ознака- ознака, що впливає на інші ознаки, результативна ознака- ознака, що відчуває на собі вплив факторного).

Рівняння регресії, виражене функцією (лінійною чи нелінійною) та описуєзалежність умовної середньої результативної ознаки від однієї факторного - рівняння парної регресії, а описує залежність результативного від кількох факторних ознак - рівняння множинної регресії, тобто. регресійна модель заснована на аналітичному поданні зв'язку факторної та результативної ознак.

Найпростішим рівнянням парної кореляції (регресії) є лінійне рівняння: - середнє значення результативної ознаки,b- варіація результативної ознаки на одиницю факторної,a- теоретичне значення результативної ознаки при значенні факторного, рівне 0 (x=0), що у практиці немає ніякого економічного сенсу.

Для обчислення параметрівaтаbвирішується система рівнянь:

(8.1)

Для розрахунку параметрів рівняння можна застосовувати методи лінійної алгебри (метод Крамера або метод Гауса), опускаючи перетворення, отримуємо формулу для розрахунку:

тоді (8.2)

При лінійному кореляційному зв'язку застосовують показник тісноти зв'язку між ознаками, що вивчаються - коефіцієнт кореляції:

(8.3)

Коефіцієнт детермінації ( ) показує, яка частина результативної ознаки обумовлена ​​змінами факторної:

. Розмір коефіцієнта кореляції коливається не більше: .

Таблиця характеру зв'язку в залежності від коефіцієнта кореляції:

ВеличинаХарактер зв'язку
До 0,3Практично відсутня
0,3-0,5Помітна
0,5-0,7Помірна
0,7-0,9Сильна
0,9-0,999Дуже сильна

Приклад рішення та оформлення типового завдання:

Є дані по підприємству провіці (тривалості експлуатації) типового обладнання та витратах на його ремонт. Розрахувати параметри лінійного рівняння парної кореляції, коефіцієнти тісноти зв'язку, найменший вік устаткування, у якому обчислюються амортизаційні відрахування. Зробити висновки щодо результатів роботи.

Номер верстатаВік верстата, роківВитрати ремонт, тис. крб.
1,5
3,4
3,6
3,7
3,3
2,5
6,6
103,7

Рисунок 8.2 Залежність витрат на ремонт від віку обладнання

На основі графічного зображення можна припустити, що аналітична залежність між ознаками, що характеризують обладнання існує у вигляді лінійної функції.

За підсумками розрахунків, виконаних у таблиці 8.3 рівняння лінійної парної кореляції має вид: .

Оцінка отриманого рівняння може бути виконана декількома способами, так для лінійного рівняння регресії існує два основних прийоми: або перевірка рівності емпіричного коефіцієнта детермінації та лінійного коефіцієнта кореляції, або розрахунок показників і порівняння їх з табличним значенням. З обчислень слід, що мінімальне значення факторного ознаки, у якому можливі зміни результативного дорівнює 29 днів, а 65,699 % змін витрат зумовлено змінами віку устаткування, 34,301 % змін витрат зумовлено неврахованими чинниками, рівність коефіцієнта кореляції значенню 0,811 свідчить про дуже сильний зв'язок між досліджуваними ознаками .

1. Які види зв'язків між ознаками у статистиці знаєте?

2. Які види рівнянь регресії знаєте?

3. Що називаєтьсякореляційним зв'язком?

4. Дайте поняття жорстко детермінованого зв'язку у статистиці.

5. Дайте поняття стохастично детермінованого зв'язку у статистиці.

6. Яка ознака у статистиці є факторною?

7. Яка ознака у статистиці є результативною?

8. Яка ознака в лабораторній роботі факторна, а яка результативна?

9. Запишіть систему рівнянь, щоб визначити параметри рівняння парної лінійної кореляції.

10. Які формули використовували для розрахунку коефіцієнтів у рівнянні регресії у лабораторній роботі?

11. Чи можна будувати рівняння парної кореляції для згрупованих даних?

12. Що показує коефіцієнт кореляції?

13. Що показує коефіцієнт детермінації?

14. Який економічний зміст параметрів рівняння лінійної парної кореляції?

15. Зробіть висновки щодо лабораторної роботи.

Номер верстатаВік верстата, років,xiВитрати ремонт, тис. крб.,yi
1,5-3-1,9305,7903,7251,943
-2-1,4302,8602,0452,439
3,4-2-0,0300,0600,0012,439
3,6-10,170-0,1700,0292,934
3,70,2700,2700,0733,926
0,5701,7100,3254,917
3,3-0,130-0,1300,0173,926
2,5-0,9300,0000,8653,430
6,63,17012,68010,0495,413
3,7-10,270-0,2700,0732,934
34,322,817,20134,3
7 роківb=0,495650,810549
3,43 тис. руб.a=-0,0395765,699%
0,079825 року = 29 днів

Лабораторна робота №9