Ймовірності помилок (рівень значущості та потужність критерію
Імовірність помилки першого роду під час перевіркистатистичних гіпотезназиваютьрівнем значимості і зазвичай позначають грецькою літерою (звідси назва -errors).
Імовірність помилки другого роду немає якогось особливого загальноприйнятого назви, на письмі позначається грецькою літерою (звідси -errors). Однак з цією величиною тісно пов'язана інша, що має велике статистичне значення - потужність критерію. Вона обчислюється за формулою. Таким чином, чим вища потужність, тим менша ймовірність зробити помилку другого роду.
Обидві ці властивості зазвичай обчислюються з допомогою так званої функції потужності критерію. Зокрема, ймовірність помилки першого роду є функція потужності, обчислена за нульової гіпотези. Для критеріїв, заснованих на вибірці фіксованого обсягу, ймовірність помилки другого роду є одиниця мінус функція потужності, обчислена у припущенні, що розподіл спостережень відповідає альтернативній гіпотезі. Для послідовних критеріїв це також правильно, якщо критерій зупиняється з ймовірністю одиниця (при цьому розподілі з альтернативи).
У статистичних тестах зазвичай доводиться йти на компроміс між прийнятним рівнемпомилок першого та другого роду. Найчастіше для ухвалення рішення використовується граничне значення, яке може змінюватися з метою зробити тест суворішим або, навпаки, м'якшим. Цим граничним значенням є рівень значущості, яким задаються під час перевірки статистичних гіпотез. Наприклад, у разі металодетектора підвищення чутливості приладу призведе до збільшення ризикупомилки першого роду(хибна тривога), а зниження чутливості - до збільшення ризикупомилкидругого роду (перепустка забороненого предмета).
Приклади використання
Масова медична діагностика (скринінг)
У медичній практиці є суттєва різниця міжскринінгомтатестуванням:
- Скрінінгвключає відноснодешевітести, які проводяться для великої групи людей за відсутності будь-яких клінічних ознак хвороби (наприклад,мазок Папаніколау).
- Тестуваннямає на увазі набагато більшдорогі, найчастіше інвазивні, процедури, які проводяться тільки для тих, у кого виявляються клінічні ознаки захворювання, і які, в основному, застосовуються для підтвердження передбачуваного діагнозу.
Наприклад, у більшості штатів у США обов'язково проходження новонародженими процедурискринінгунаоксифенілкетонуріютагіпотиреоз, крім іншихвроджених аномалій. Незважаючи на високий рівень помилок першого роду, ці процедури скринінгу вважаються доцільними, оскільки вони істотно збільшують ймовірність виявлення цих розладів на ранній стадії.[4]
Прості аналізи крові, що використовуються для скринінгу потенційних донорів на ВІЛ і гепатит мають суттєвий рівень помилок першого роду. ; проте в арсеналі лікарів є набагато точніші (і, відповідно, дорогі) тести для перевірки, чи дійсно людина інфікована будь-яким із цих вірусів.
Можливо, найбільш широкі дискусії викликають помилки першого роду в процедурах скринінгу на рак грудей (мамографія ). У рівеньпомилок першого родуу маммограмах сягає 15%, це найвищий показник у світі.[5]Найнижчий рівеньспостерігається в Нідерландах, 1%.[6]
Медичне тестування
Помилки другого родує суттєвою проблемою у медичному тестуванні. Вони дають пацієнтові і лікарю помилкове переконання, що захворювання відсутнє, тоді як насправді воно є. Це часто призводить до недоречного чи неадекватного лікування. Типовим прикладом є довіра результатам кардіотестування при виявленні коронарного атеросклерозу, хоча відомо, що кардіотестування виявляє ті труднощі кровотоку в коронарній артерії, які викликані стенозом.
Помилки другого родувикликають серйозні та важкі для розуміння проблеми, особливо коли потрібна умова є широкопоширеною. Якщо тест із 10%-ным рівнемпомилок другого родувикористовується обстеження групи, де ймовірність «істинно-позитивних» випадків становить 70%, багато негативні результати тесту виявляться хибними.Помилки першого родутакож можуть викликати серйозні та важкі для розуміння проблеми. Це відбувається, коли потрібна умова є рідкісною. Якщо рівеньпомилок першого родуу тесту становить один випадок на десять тисяч, але в тестованій групі зразків (або людей) ймовірність «істинно-позитивних» випадків становить у середньому один випадок на мільйон, більшість позитивних результатів цього тесту будуть хибними.
Статистичний критерій — суворе математичне правило, яким приймається чи відкидається та чи інша статистична гіпотеза з відомим рівнем значимості. Побудова критерію є вибір відповідної функції від результатів спостережень (ряду емпірично отриманих значень ознаки), яка служить виявлення міри розбіжності між емпіричними значеннями ігіпотетичними.
Види критеріїв
- Критерії значимості. Перевірка на значущість передбачає перевіркугіпотезипро чисельні значення відомогозакону розподілу: -нульова гіпотеза. або - конкуруюча гіпотеза.
- Критерії згоди. Перевірка на згоду передбачає перевірку припущення про те, що досліджуванавипадкова величинапідпорядковується передбачуваномузакону. Критерії згоди можна також сприймати як критерії значимості. Критеріями згоди є:
- Критерій Пірсона
- Критерій Колмогорова
- Критерій Андерсона-Дарлінга
- Критерій Крамера - Мізеса - Смирнова
- Критерій згоди Купера
- Z-тест
- Критерій Жака-Бера(англ.)
- Критерій Шапіро-Вілка(англ.)
- Графік нормальності(англ.) - не стільки критерій, скільки графічна ілюстрація: точки спеціально побудованого графіка повинні лежати майже на одній прямій.
- Критерії перевірки на однорідність. і тому закону). Використовуються уфакторному аналізідля визначення наявності залежностей.
Цей поділ умовно, і найчастіше той самий критерій може бути використаний у різних якостях.
Непараметричні критерії
Група статистичних критеріїв, які не включають до розрахунку параметри <імовірнісного розподілу і засновані на оперуванні частотами або рангами.
- Q-критерійРозенбаума
- U-критерій Манна-Уітні
- Критерій Вілкоксона
- Критерій Пірсона
- Критерій Колмогорова-Смирнова
Параметричні критерії
Група статистичних критеріїв, які включають до уваги параметриімовірнісного розподілуознаки (середні та дисперсії).
- t-критерій Стьюдента
- Критерій Фішера
- Критерій відносини правдоподібності
- Критерій Романовського
квиток №_5_