Умови та обмеження застосування критерію хі-квадрат Пірсона

1. Порівнювані показники повинні бути виміряні вномінальній шкалі(наприклад, стать пацієнта - чоловіча або жіноча) або впорядковій(наприклад, ступінь артеріальної гіпертензії, що приймає значення від 0 до 3).

2. Даний метод дозволяє проводити аналіз не тільки чотирипольних таблиць, коли і фактор, і результат є бінарними змінними, тобто мають лише два можливі значення (наприклад, чоловіча або жіноча стать, наявність або відсутність певного захворювання в анамнезі.). Критерій хі-квадрат Пірсона може застосовуватися і у разі аналізу багатопольних таблиць, коли фактор та (або) результат приймають три і більше значень.

3. Порівнювані групи повинні бути незалежними, тобто критерій хі-квадрат не повинен застосовуватися при порівнянні спостережень "до-"після." У цих випадках проводиться тест Мак-Немара (5) (при порівнянні двох пов'язаних сукупностей) або розраховуєтьсяQ-критерій Кохрена(у разі порівняння трьох і більше груп).

4. При аналізі чотирипільних таблицьочікувані значенняу кожному із осередків повинні бути не менше 10. У тому випадку, якщо хоча б в одному осередку очікуване явище набуває значення від 5 до 9, критерій хі-квадрат повинен розраховуватисяз поправкою Йейтса. Якщо хоча б в одному осередку очікуване явище менше 5, то для аналізу повинен використовуватисяточний критерій Фішера.

5. У разі аналізу багатопільних таблиць очікувана кількість спостережень не повинна набувати значення менше 5 більш ніж у 20% осередків.

Як розрахувати критерій хі-квадрат Пірсона?

Для розрахунку критерію хі-квадрату необхідно:

1.Розраховуємо очікувану кількість спостереженьдля кожної з осередків таблиці сполученості (за умови справедливості нульової гіпотези про відсутність взаємозв'язку)шляхом перемноження сум рядів і стовпців із наступним розподілом отриманого твору на загальну кількість спостережень. Загальний вигляд таблиці очікуваних значень представлений нижче:

Вихід є (1)Виходу немає (0)Усього
Чинник ризику є (1)(A+B)*(A+C) / (A+B+C+D)(A+B)*(B+D)/ (A+B+C+D)A + B
Чинник ризику відсутній (0)(C+D)*(A+C)/ (A+B+C+D)(C+D)*(B+D)/ (A+B+C+D)C+D
УсьогоA + CB + DA+B+C+D

2.Знаходимо значення критерію χ 2за такою формулою:

деi– номер рядка (від 1 до r),j– номер стовпця (від 1 до с),Oij– фактична кількість спостережень у осередку ij,Eij– очікувана кількість спостережень у осередку ij.

У тому випадку, якщо кількість очікуваного явища менше 10 хоча б в одному осередку, при аналізі чотирипільних таблиць повинен розраховуватися критерій хі-квадрат з поправкою Йейтса. Ця поправка дозволяє зменшити ймовірність помилки першого типу, тобто виявлення відмінностей там, де їх немає. Поправка Йейтса полягає у відніманні 0,5 з абсолютного значення різниці між фактичним та очікуваною кількістю спостережень у кожному осередку, що веде до зменшення величини критерію хі-квадрат.

Формула для розрахунку критерію 2 з поправкою Йейтса наступна:

3.Визначаємо число ступенів свободиза формулою:f = (r – 1) × (c – 1). Відповідно, для чотирипольної таблиці, в якій 2 ряди (r = 2) і 2 стовпці (c = 2), число ступенів свободи становить f2x2 = (2 - 1) * (2 - 1) = 1.

4.Порівнюємо значення критерію 2 з критичним значеннямпри числі ступенів свободи f (по таблиці).

Даний алгоритм застосуємо як длячотирипольних, так багатопольних таблиць.

Як інтерпретувати значення критерію хі-квадрат Пірсона?

У тому випадку, якщо отримане значення критерію χ 2 більше критичного, робимо висновок про наявність статистичного взаємозв'язку між фактором ризику, що вивчається, і результатом при відповідному рівні значущості.

Приклад розрахунку критерію хі-квадрат Пірсона

Визначимо статистичну значущість впливу фактора куріння на частоту випадків артеріальної гіпертонії за розглянутою вище таблицею:

Артеріальна гіпертонія є (1)Артеріальної гіпертонії немає (0)Усього
Курці (1)
Некурці (0)
Усього

1. Розраховуємо очікувані значення для кожного осередку:

Артеріальна гіпертонія є (1)Артеріальної гіпертонії немає (0)Усього
Курці (1)(70 * 72) / 150 = 33.6(70 * 78) / 150 = 36.4
Некурці (0)(80 * 72) / 150 = 38.4(80 * 78) / 150 = 41.6
Усього

2. Знаходимо значення критерію хі-квадрат Пірсона:

χ 2 = (40-33.6) 2 / 33.6 + (30-36.4) 2 / 36.4 + (32-38.4) 2 / 38.4 + (48-41.6) 2 / 41.6 = 4.396.

3. Число ступенів свободи f = (2-1) * (2-1) = 1. Знаходимо по таблиці критичне значення критерію хі-квадрат Пірсона, яке при рівні значущості p = 0.05 та числі ступенів свободи 1 становить 3.841.

4. Порівнюємо отримане значення критерію хі-квадрат із критичним: 4.396 > 3.841, отже залежність частоти випадків артеріальної гіпертонії від наявності куріння – статистично значуща. Рівень значущості даного взаємозв'язку відповідає p2 при p=0.05.χ 2 при p=0.013.8416.6355.9919.217.81511.3459.48813.27711.0715.08612.59216.81214.06718.47515.50720.0916.91921.66618.30723.20919.67524.72521.02626.21722.36227.68823.68529.14124.99630.57826.29627.58733.40928.86934.80530.14436.19131.4137.566