Параметричні критерії - Студопедія

Методи порівняльної статистики

Найбільш часто зустрічається і досить складною математико-статистичною задачею є порівняння даних, отриманих у процесі спостережень чи експериментів у вибіркових сукупностях. Дослідник намагається описати результати спостереження кількісними методами і «на виході» отримує числовий масив тих чи інших доступних вимірів – варіаційний ряд.

Однак, як правило, змістова інформація, що міститься в результатах вимірювань, має набагато більшу цінність при порівнянні її з аналогічною інформацією, але отриманою деяким іншим чином. Наприклад, це може бути ситуація порівняння досвідчених даних (коли ми якось вплинули на об'єкт, що вивчається або явище) з контрольною групою, в якій ніякого впливу на об'єкт спостереження не було. Можливе порівняння двох варіантів дослідів. Можливе порівняння двох серій спостережень, розділених у просторі та часі тощо.

Припустимо, що вдається помітити будь-які чисельні відмінності в характеристиках порівнюваних рядів. Насамперед виникає питання: яка ймовірність, що ці відмінності невипадкові і систематично повторюватимуться надалі при відтворенні умов експерименту чи спостереження, тобто. виявлені відмінності є статистично значущими.

Вибір відповідного методу порівняння вибіркових сукупностей визначається декількома факторами: характером порівнюваних ознак (якісні або кількісні), числом груп, залежністю або незалежністю вибірок, а також видом розподілу ознаки.

Вибірки єнезалежними, якщо набір об'єктів дослідження в кожну з груп здійснювався незалежно від того, які об'єкти дослідження включені до іншоїгрупу. Так, зокрема, відбувається при рандомізації, коли розподіл об'єктів відбувається випадковим чином. Прикладом порівняння незалежних вибірок може бути зіставлення даних аналізу крові групи пацієнтів з аналогічними показниками групи здорових.

Групи єзалежними (пов'язаними) у динамічних дослідженнях, коли вивчаються одні й самі об'єкти у різні моменти часу. Наприклад, показники аналізу крові в тих самих пацієнтів до і після лікування.

Від виду розподілу та типу досліджуваної ознаки залежить вибір відповідного математико-статистичного критерію. Критерії поділяються на два типи –параметричні та непараметричні.

Параметричні критерії – критерії, що ґрунтуються на оцінці параметрів розподілу, до яких відносяться середнє арифметичне, середньоквадратичне відхилення, дисперсія. Вони застосовні лише тому випадку, якщо чисельні дані підпорядковуються нормальному розподілу. Якщо розподіл відрізняється від нормального, слід користуватися так званими непараметричними критеріями.

Непараметричні критерії не ґрунтуються на оцінці параметрів розподілу і взагалі не вимагають, щоб дані підкорялися якомусь певному типу розподілу. Непараметричні критерії дають грубіші оцінки, ніж параметричні, але є більш універсальними. А параметричні методи точніші, але у разі, якщо правильно визначено розподіл сукупності.

Перед тим як перейти до розгляду статистичних критеріїв, введемо поняття нульової та альтернативної гіпотез, які нам будуть потрібні надалі.

Нульова гіпотеза неспроможнабути відкинута, якщо її ймовірність виявиться вище когось наперед заданого рівня α, досить близького до 0, тобто. .Ця величина носить назву рівень значимості нульової гіпотези.

Альтернативна гіпотеза може бути прийнята лише в тому випадку, якщо її ймовірність досягне когось наперед заданого рівня або перевершить його, тобто. . Ця величина – рівень довірчої ймовірності. Він відповідає «рівням безпомилкових прогнозів», тобто. ймовірностям 0.95, 0.99 та 0.999 (область практично достовірних подій ). Відповідно, α окреслює область практично неможливих подій із порогами ймовірностей 0.05, 0,01 та 0.001.

Оскільки і – альтернативні гіпотези, їх сумарна ймовірність дорівнює одиниці. Отже, зростання ймовірності однієї з гіпотез автоматично призводить до зниження ймовірності іншої. Наприклад, якщо , це означає, що буде виконуватися умова . І в цьому випадку нульова гіпотеза може бути відкинута як подія практично неможлива, а альтернативна має бути прийнята як подія практично достовірна. Якщо ж, то. І в цій ситуації нульова гіпотеза не може бути знехтувана, а альтернативна не може бути прийнята.

Наприклад, у процесі дослідження ставиться завдання довести наявність статистично значущих відмінностей між результатами спостережень у дослідній та контрольній групах. Це означає, що дані, отримані при застосуванні того чи іншого статистичного критерію, повинні дозволити відкинути нульову гіпотезу про відсутність зазначених відмінностей.

Параметричні критерії

Висновок про випадковість чи невипадковість відмінностей між вибірковими сукупностями під час використання параметричних критеріїв складає підставі порівняння параметрів розподілів, тобто. зведених числових показників. Кожен із параметрів компактно, як одного однини, відбиває деякі характерні властивостірозподілу цієї випадкової величини. Вони є кількісними заходами цих властивостей. Насправді, зазвичай, розглядають лише два параметри – середнє значення, що є «заходом становища математичного центру» отриманого варіаційного ряду, і дисперсію, але найчастіше корінь із неї – стандартне відхилення, є мірою варіації. Для цих параметрів розроблено два найбільш популярні параметричні критерії: критерій Стьюдента та критерій Фішера.

Критерій Стьюдента (t-критерій) - критерій, заснований на порівнянні середніх значень вибірок. Критерій Стьюдента є найвідомішим. З одного боку, аналіз середніх значень порівняно простий для обчислень. З іншого боку, середні величини найбільш наочні та зрозумілі.

Для того, щоб визначити, чи нормальний досліджуваний розподіл, використовуються критерії Шапіро-Вилка і Колмогорова-Смирнова.

Чи не знайшли те, що шукали? Скористайтеся пошуком: