Непараметричні критерії

Раніше було викладено метод оцінки різниці між середніми значеннями вибірок, витягнутих із двох незалежних генеральних сукупностей. Якщо обсяги вибірок малі чи генеральні сукупності є нормально розподіленими, виникають дві альтернативи: 1) можна застосувати непараметричну процедуру, яка залежить від припущення про нормальному розподілі генеральних сукупностей; 2) можна виконати попередню нормалізацію даних, а потім застосувати t-критерій, що використовує об'єднану дисперсію. [1]

У даному дописі розглядається критерій Вілкоксона, що дозволяє оцінити різницю між медіанами двох генеральних сукупностей. Цей критерій є дуже популярною непараметричною процедурою. За своєю потужністю критерій Вілкоксона мало відрізняється від t-критеріїв, що використовують роздільну або сумарну дисперсію. У той самий час його використання немає необхідності припускати, що генеральні сукупності розподілені нормально. Крім того, критерій Вілкоксона можна застосовувати навіть тоді, коли досліднику доступні лише рангові показники. Ця ситуація часто зустрічається в маркетингових дослідженнях, коли відсутність числових даних не дозволяє застосовувати t-критерії.

Завантажити нотатку у форматі Word або pdf, приклади у форматі Excel2013

Щоб застосувати критерій Уилкоксона, необхідно замінити спостереження, які у двох вибірках, мають обсяги n1 і n2, їх об'єднаними рангами (якщо вихідні дані є рангами спочатку). Кількість спостережень обох вибірках дорівнює n1 + n2. Найменший ранг дорівнює найменшому з n1 і n2 спостережень, другий ранг дорівнює найменшому з спостережень, що залишилися і так далі, поки ми не досягнемо найбільшогорангу. Якщо кілька значень взаємопов'язані, необхідно замінити кожне з них середніми рангами, обчисленими так, ніби ці величини не залежать один від одного.

Для зручності вважатимемо, що коли обсяги вибірок не однакові, число n1 менше від числа n2. Статистика рангового критерію Вілкоксона T1 дорівнює сумі перших n1 рангів. (Якщо обсяги вибірок рівні, як ця статистика можна взяти суму рангів у будь-якій групі.) Нагадаємо, що сума перших n послідовних натуральних чисел дорівнює n(n + 1)/2. Отже, сума статистик T1 і T2 (обчислених за рештою n2 спостережень), повинна дорівнювати n(n + 1)/2.

Сума статистик Вілкоксона:

Перевірка гіпотези здійснюється за допомогою одностороннього або двостороннього критерію, залежно від того, яка гіпотеза перевіряється: про рівність двох медіан або про те, що одна медіана більша за іншу (рис. 1)

Мал. 1. Нульова та альтернативна гіпотези для одностороннього або двостороннього критерію

Тут М1 - медіана першої генеральної сукупності, а М2 - медіана другої генеральної сукупності. Якщо обсяги обох вибірок не перевищують число 10, визначення критичних значень статистики одностороннього чи двостороннього критерію Т1 застосовуються табличні значення (рис. 2). На жаль, до Excel не включені відповідні функції.

Мал. 2. Нижні та верхні критичні значення статистики Т1 у ранговому критерії Вілкоксону

Для двостороннього критерію при заданому рівні значимості α нульова гіпотеза відхиляється, якщо статистика критерію більша від верхнього критичного значення або менша від нижнього критичного значення (рис. 3, панель А). Для одностороннього критерію альтернативна гіпотеза Н1 якого полягає в тому, що М1 М2, вирішальне правилоформулюється так: нульова гіпотеза відхиляється, якщо статистика Т1 більша за верхнє критичного значення або дорівнює йому (рис. 3, панель В).

Мал. 3. Області прийняття та відхилення гіпотези в ранговому критерії Вілкоксону

При більших обсягах вибірок статистика Т1 є приблизно нормально розподіленою, причому її математичне очікування μТ1 задається формулою:

а стандартне відхилення σТ1 обчислюється як:

Таким чином, стандартизована Z-статистика критерію має такий вигляд (критерій Вілкоксону для великих вибірок):

де статистика критерію Z має наближений нормальний розподіл.

Цю статистику застосовують, коли обсяг вибірки виходить за межі, передбачені таблицею (рис. 2). При заданому рівні значимості нульову гіпотезу відхиляють, коли обчислена статистика Z потрапляє в критичну область.

Повернемося до раніше розглянутого сценарію, в якому потрібно було визначити, чи рівні середні тижневі обсяги продажів BLK-коли, виставленої на спеціалізованих стелажах та на звичайних полицях. Якщо ми не маємо підстав вважати, що вибірки вилучені з нормально розподілених генеральних сукупностей, можна застосувати ранговий критерій Вілкоксона. Оскільки нам невідомо, яка з медіан виявиться більшою, нульову та альтернативну гіпотези слід сформулювати наступним чином: Н0: М1 = М2, Н1: М1 ≠ М2. Для того щоб застосувати ранговий критерій Вілкоксона, необхідно обчислити ранги для вибірок, що складаються з n1 = 10 магазинів зі звичайними полицями та з n2 = 10 магазинів зі спеціалізованими стелажами (рис. 4).

Мал. 4. Обчислення об'єднаних рангів обсягу продажу BLK-коли

На наступному етапі обчислюється статистика T1, що дорівнюєсумі рангів, обчислених за меншою вибіркою. Якщо обсяги вибірок рівні між собою, ранги можна обчислювати за будь-якою з вибірок, оскільки остаточний результат це вплинути неспроможна. Припустимо, що з обчислення рангів використовується вибірка магазинів із звичайними полицями: T1 =СУМ(B3:B13) = 72. Для перевірки ранжування обчислюється статистика Т2 = СУММ(D3:D13) = 138. Використовуючи формулу (1), обчислимо суму перших n = 20 рангів. Вона має бути рівною Т1 + Т2:

Перейдемо до перевірки гіпотези, яка полягає в тому, що між медіанами продажу істотної різниці немає. Для цього за таблицею (рис. 2) визначимо нижнє та верхнє критичні значення статистики критерію Т1. При рівні значимості, що дорівнює 0,05, критичні значення дорівнюють 78 і 132 (рис. 5). Отже, вирішальне правило виглядає так: нульова гіпотеза Н0 відхиляється, якщо Т1 ≤ 78 або Т2 ≥ 132, інакше гіпотеза Н0 не відхиляється.

Мал. 5. Нижнє та верхнє критичні значення для критерію Вілкоксона при n1 = 10, n2 = 10 та α = 0,05 (фрагмент таблиці з малюнка 2)

[1] Використовуються матеріали книги Левін та ін. Статистика для менеджерів. - М.: Вільямс, 2004. - с. 739-743