Умови та обмеження застосування критерію хі-квадрат Пірсона
1. Порівнювані показники повинні бути виміряні вномінальній шкалі(наприклад, стать пацієнта - чоловіча або жіноча) або впорядковій(наприклад, ступінь артеріальної гіпертензії, що приймає значення від 0 до 3).
2. Даний метод дозволяє проводити аналіз не тільки чотирипольних таблиць, коли і фактор, і результат є бінарними змінними, тобто мають лише два можливі значення (наприклад, чоловіча або жіноча стать, наявність або відсутність певного захворювання в анамнезі.). Критерій хі-квадрат Пірсона може застосовуватися і у разі аналізу багатопольних таблиць, коли фактор та (або) результат приймають три і більше значень.
3. Порівнювані групи повинні бути незалежними, тобто критерій хі-квадрат не повинен застосовуватися при порівнянні спостережень "до-"після." У цих випадках проводиться тест Мак-Немара (5) (при порівнянні двох пов'язаних сукупностей) або розраховуєтьсяQ-критерій Кохрена(у разі порівняння трьох і більше груп).
4. При аналізі чотирипільних таблицьочікувані значенняу кожному із осередків повинні бути не менше 10. У тому випадку, якщо хоча б в одному осередку очікуване явище набуває значення від 5 до 9, критерій хі-квадрат повинен розраховуватисяз поправкою Йейтса. Якщо хоча б в одному осередку очікуване явище менше 5, то для аналізу повинен використовуватисяточний критерій Фішера.
5. У разі аналізу багатопільних таблиць очікувана кількість спостережень не повинна набувати значення менше 5 більш ніж у 20% осередків.
Як розрахувати критерій хі-квадрат Пірсона?
Для розрахунку критерію хі-квадрату необхідно:
1.Розраховуємо очікувану кількість спостереженьдля кожної з осередків таблиці сполученості (за умови справедливості нульової гіпотези про відсутність взаємозв'язку)шляхом перемноження сум рядів і стовпців із наступним розподілом отриманого твору на загальну кількість спостережень. Загальний вигляд таблиці очікуваних значень представлений нижче:
| Вихід є (1) | Виходу немає (0) | Усього | |
| Чинник ризику є (1) | (A+B)*(A+C) / (A+B+C+D) | (A+B)*(B+D)/ (A+B+C+D) | A + B |
| Чинник ризику відсутній (0) | (C+D)*(A+C)/ (A+B+C+D) | (C+D)*(B+D)/ (A+B+C+D) | C+D |
| Усього | A + C | B + D | A+B+C+D |
2.Знаходимо значення критерію χ 2за такою формулою:
деi– номер рядка (від 1 до r),j– номер стовпця (від 1 до с),Oij– фактична кількість спостережень у осередку ij,Eij– очікувана кількість спостережень у осередку ij.
У тому випадку, якщо кількість очікуваного явища менше 10 хоча б в одному осередку, при аналізі чотирипільних таблиць повинен розраховуватися критерій хі-квадрат з поправкою Йейтса. Ця поправка дозволяє зменшити ймовірність помилки першого типу, тобто виявлення відмінностей там, де їх немає. Поправка Йейтса полягає у відніманні 0,5 з абсолютного значення різниці між фактичним та очікуваною кількістю спостережень у кожному осередку, що веде до зменшення величини критерію хі-квадрат.
Формула для розрахунку критерію 2 з поправкою Йейтса наступна:
3.Визначаємо число ступенів свободиза формулою:f = (r – 1) × (c – 1). Відповідно, для чотирипольної таблиці, в якій 2 ряди (r = 2) і 2 стовпці (c = 2), число ступенів свободи становить f2x2 = (2 - 1) * (2 - 1) = 1.
4.Порівнюємо значення критерію 2 з критичним значеннямпри числі ступенів свободи f (по таблиці).
Даний алгоритм застосуємо як длячотирипольних, так багатопольних таблиць.
Як інтерпретувати значення критерію хі-квадрат Пірсона?
У тому випадку, якщо отримане значення критерію χ 2 більше критичного, робимо висновок про наявність статистичного взаємозв'язку між фактором ризику, що вивчається, і результатом при відповідному рівні значущості.
Приклад розрахунку критерію хі-квадрат Пірсона
Визначимо статистичну значущість впливу фактора куріння на частоту випадків артеріальної гіпертонії за розглянутою вище таблицею:
| Артеріальна гіпертонія є (1) | Артеріальної гіпертонії немає (0) | Усього |
| Курці (1) | ||
| Некурці (0) | ||
| Усього |
1. Розраховуємо очікувані значення для кожного осередку:
| Артеріальна гіпертонія є (1) | Артеріальної гіпертонії немає (0) | Усього |
| Курці (1) | (70 * 72) / 150 = 33.6 | (70 * 78) / 150 = 36.4 |
| Некурці (0) | (80 * 72) / 150 = 38.4 | (80 * 78) / 150 = 41.6 |
| Усього |
2. Знаходимо значення критерію хі-квадрат Пірсона:
χ 2 = (40-33.6) 2 / 33.6 + (30-36.4) 2 / 36.4 + (32-38.4) 2 / 38.4 + (48-41.6) 2 / 41.6 = 4.396.
3. Число ступенів свободи f = (2-1) * (2-1) = 1. Знаходимо по таблиці критичне значення критерію хі-квадрат Пірсона, яке при рівні значущості p = 0.05 та числі ступенів свободи 1 становить 3.841.
4. Порівнюємо отримане значення критерію хі-квадрат із критичним: 4.396 > 3.841, отже залежність частоти випадків артеріальної гіпертонії від наявності куріння – статистично значуща. Рівень значущості даного взаємозв'язку відповідає p2 при p=0.05.χ 2 при p=0.01