Кореляційний аналіз для рангових шкал
С.В. Усатиков, кандидат фіз-мат наук, доцент; С.П. Грушевський, кандидат фіз-мат наук, доцент; М.М. Кириченко, кандидат соціологічних наук
Продовжуємо досліджувати об'єкти, що мають дві і більше ознаки, і вже з'ясували, що гіпотезу про їхню незалежність можна сміливо відкинути. Як же тепер пророкувати значення однієї ознаки за значенням іншої? Наскільки взагалі сильна ця залежність?
Для вивчення здібностей людини до розумової чи фізичної діяльності нерідко вдаються до спеціально організованих проб та тестів. Результатом такого тесту є число, яке називається тестовим балом. При заміні тесту іншим подібним тестові бали випробуваного змінюються, але об'єкт вимірювання той самий, що й раніше. Отже, цих чисел мають сенс лише поняття “більше” чи “менше”. Для тестових балів, як й у шкільних оцінок, допустимі лише порівняння. Операції на кшталт складання чи віднімання цих шкал немає сенсу, оскільки немає одиниці виміру. Наприклад, не можна сказати, що одержав оцінку 4 знає предмет на 1 бал краще, ніж 3. Ясно тільки, що 4 знає цей предмет краще, ніж тречник.
Першим вирішення подібних проблем запропонував психолог Ч.Спірмен у 1900 році, який обговорював, наприклад, зв'язок між здібностями до музики та математики.
Нехай проведено n випробувань із змінами двох ознак та отримано n пар чисел (Xi, Yi), де 1Ј iЈ n. Упорядкуємо ці пари за зростанням чисел Xi та їх порядковий номер j (1ЈjЈn) назвемо рангом чисел Xi. Якщо кілька чисел збігаються за величиною, то кожному з них присвоюється ранг, що дорівнює середньому арифметичному їх номерів. Порядок чисел Yi також, звісно, зміниться. Якщо окремо впорядкуватичисла yi за зростанням, їх порядковий номер r теж стає рангом чисел Yi. Але оскільки ці числа мають сенс тільки в парі між собою, ранги r чисел Yi переміщуються і виходить пар n чисел рангів (j, rj), де 1Ј jЈ n.
Якщо ознаки взаємопов'язані, то зростання j впливає порядок, у якому слідують ранги rj : наприклад, вони частіше зростають, ніж спадають, чи навпаки. Ще два випадки однозначної залежності ознак: зі зростанням j ранги rj або тільки зростають, або лише зменшуються. У цьому випадку число
зване коефіцієнтом рангової кореляції Спірмена, одно чи 1 чи -1. В інших випадках величина r може коливатися від +1 до -1 й у разі незалежності ознак (тобто. повного “хаосу” серед рангів rj) r =0. Якщо число r негативне, говорять про негативної кореляції, тобто. при зростанні однієї ознаки другий в основному зменшується. Якщо число r позитивне, то свідчать про позитивну кореляцію, тобто. при зростанні однієї ознаки другий переважно теж зростає. Розмір ж Ѕ r Ѕ Ј 1 показує у частках міру залежності ознак. Якщо r Ѕ близька до 1, говорять про сильну кореляцію, тобто. залежність ознак майже однозначна та випадкові відхилення рідкісні. Якщо ?r? близька до 0, то говорять про слабку кореляцію, тобто. у разі зростання однієї ознаки зростання чи зменшення іншого майже зовсім хаотичні і непередбачувані.
Наприкінці повернемося до питання значимості обчисленого коефіцієнта r , тобто. до перевірки гіпотези щодо незалежності ознак. У разі це можна зробити простіше. Зокрема, число
підпорядковується t-закону Стьюдента з n = n -2 ступенями свободи. Тому якщо, наприклад, рівень значущості a = 0,2 (або 20%), то свідомо t 3 при вірній нульовій гіпотезі. Отже, якщо t>3, то гіпотезу пронезалежності можна відкинути і вважати величину r значимою.
При інших рівнях значущості a та числі ступенів свободи n необхідно брати критичне значення t із таблиці розподілу Стьюдента у статистичних довідниках чи підручниках.