Однофакторний аналіз у системі statistica 6

Якщо відомо, що наявні групи результатів упорядковані за зростанням (зменшенням) впливу фактора, то в таких випадках можна використовувати статистику Джонкхієра, більш чутливу (сильнішу) проти альтернатив про впорядкований вплив фактора.

Так як у системі Statistica статистика Джонкхієра не реалізована, скористаємося критерієм перевірки двох вибірок, у нашому завданні (з трьома рівнями фактора) можна виділити три пари вибірок. Для порівняння двох способів обробки (два рівні фактора) скористаємося статистикою Манна Уітні, реалізованої в даній системі.

У критерії Манна Уітні сформулюємо нульову гіпотезу вихідні дві вибірки однорідні, відповідно гіпотеза стверджує, що вибірки не однорідні, тобто вплив фактора значущий.

Цей критерій перевіряється в модулі:

StatisticsNonparametricsComparing Two Independent Samples (Groups) (рис. 1).

Мал. 1. Тест Манна-Уітні

За допомогою клавіші Varia bl e s вибираємо Dependent variable " відгуки ( Power ) і Indep . ( grouping ) variable " рівні фактор . Далі вибираємо групи факторів (технології), які будуть аналізуватись (Group 1 та Group 2).

Після цих дій, натиснувши кнопку Mann - Whitney U test або M-W U Test можна отримати результат тестування. Результати тесту Манна – Уітні для всіх можливих пар вибірок представлені на рис. 2.

Мал. 2. Результати тесту Манна - Уітні

У наведених таблицях прийнято такі позначення:

Rank Sum T i | сума рангів вибірки Т i;

Rank Sum Tj сума рангів вибірки Тj;

U Статистика Манна - Вітні для малих вибірок;

Z | нормальна апроксимація статистики Манна - Уітні длявеликих вибірок;

p - level ? ймовірність прийняття гіпотези Н 0 ;

Z adjusted | скоригована нормальна апроксимація статистики Манна - Уітні;

p - level ? скоригована ймовірність прийняття гіпотези Н 0 ;

Valid N | обсяг вибірки;

2*1 sided exact p тут ймовірність p дорівнює 1 мінус кумулятивна одностороння ймовірність відповідної статистики Манна Вітні.

Для двох технологій (рівнів факторів) Т0-Т1 статистика U досить велика і нульову гіпотезу можна прийняти з ймовірністю р = 0,004072. При 5% рівні значущості гіпотезу Н 0 слід визнати хибною і прийняти гіпотезу Н 1 впливу фактора значне.
Порівнюючи технології Т0 і Т2, ми переконалися, що зміна відгуків є незначною і дві вибірки можна визнати однорідними.
Що ж до двох нових технологій Т1 і Т2, то нульову гіпотезу можна з ймовірністю р = 0,045155, що менше рівня значимості. На підставі цього нульову гіпотезу відкидаємо на користь альтернативного впливу фактора значне.

Як і у випадку тесту Краскела - Уолліса в закладці Categorized Histogram By Group можна переглянути та оцінити види розподілу окремих вибірок.

ОДНОФАКТОРНИЙ ДИСПЕРСІЙНИЙ АНАЛІЗ

Оскільки попередній однофакторний ранговий аналіз підтвердив гіпотезу про значний вплив фактора, спробуємо оцінити цей вплив кількісно в рамках дисперсійного аналізу.

Перевіряємо нульову гіпотезу вплив фактора на розподіл даних не істотно. Дисперсійний аналіз проведемо в модулі:

StatisticsBasic StatisticsBreakdown&One-way ANOVA (рис. 3).

Мал. 3. Модуль дисперсійного аналізу даних

В закладці Variables вибираються Dependent variable та Groupingvariables. У закладці Code s for grouping variables вибираються групи чинників, у прикладі змінна Technology розбивається на групи Т0, Т1 і Т2.

Мал. 4. Налаштування таблиці результатів дисперсійного аналізу

Вибір всіх груп здійснюємо натисканням на кнопку All. У вікні налаштування результуючих таблиць вибираємо групуючі змінні Grouping Variables, ставимо галочки в позиції Summary table of means і в позиції Analysis of variance, аналогічно галочкою відзначаємо ті статистичні дані, які хочемо докладніше проаналізувати (див. рис. 4). Після натискання кнопки OK отримаємо таблицю (рис. 5).

Рис.5. Результати дисперсійного аналізу

Пояснимо прийняті у таблиці позначення:

SS (Sum of Squares) Effect - сума квадратів факторів (друга оцінка дисперсії (18.7)) помножена на k - 1;

df Effect - число ступенів свободи фактора;

MS (Mean Square) Effect - середній квадрат фактора;

SS Error сума квадратів (оцінка дисперсії (18.3)) помножена на N k ;

df Error ? число ступенів свободи дорівнює N k ;

MS Error оцінка дисперсії (18.3);

значення значення статистики Фішера;

p Імовірність прийняття гіпотези Н 0 .

Статистика Фішера незначно відрізняється від одиниці з ймовірністю, що значно менше за рівень значущості. Отже, нульову гіпотезу слід відкинути на користь альтернативної гіпотези вплив фактора суттєво.

Оскільки поряд з дисперсійним аналізом у системі Statistica ми подбали про отримання оцінок ефектів обробки Summary table of means рис. 6, проаналізуємо отримані результати.

Мал. 6. Вплив технології (рівня фактора) на продуктивність (відгуки)

Отримані результати (середні)свідчать про суттєву відмінність точкових характеристик для різних груп. Зазначимо, що поряд із середніми значеннями ми можемо проаналізувати такі групові параметри як дисперсія, медіана, нижній та верхній квартілі, мінімальне та максимальне значення.

Поряд із точковими оцінками в результуючій таблиці наведено 95% довірчі інтервали для кожного параметра (групового середнього).

Фактично дослідження у межах однофакторного аналізу вважатимуться закінченими, але аналізуючи останні дані (див. рис. 6) виникає питання. Які технології вважатимуться значно різними? Для відповіді на це запитання повернемося у вікно Statistics by Groups (Breakdown) → OK → Sheffe test.

Результат порівняння середніх за методом Шеффе різних пар рівнів наведено на рис. 7.

Мал. 7. Тест Шеффа

В результаті перевірки гіпотези про незначну відмінність середніх, тільки для пари Т1 Т0 ймовірність нульової гіпотези дорівнює 0.001514 набагато менше рівня значимості. Тому нульова гіпотеза відхиляється, вплив фактора значний.