Ймовірності помилок (рівень значущості та потужність критерію

Імовірність помилки першого роду під час перевіркистатистичних гіпотезназиваютьрівнем значимості і зазвичай позначають грецькою літерою (звідси назва -errors).

Імовірність помилки другого роду немає якогось особливого загальноприйнятого назви, на письмі позначається грецькою літерою (звідси -errors). Однак з цією величиною тісно пов'язана інша, що має велике статистичне значення - потужність критерію. Вона обчислюється за формулою. Таким чином, чим вища потужність, тим менша ймовірність зробити помилку другого роду.

Обидві ці властивості зазвичай обчислюються з допомогою так званої функції потужності критерію. Зокрема, ймовірність помилки першого роду є функція потужності, обчислена за нульової гіпотези. Для критеріїв, заснованих на вибірці фіксованого обсягу, ймовірність помилки другого роду є одиниця мінус функція потужності, обчислена у припущенні, що розподіл спостережень відповідає альтернативній гіпотезі. Для послідовних критеріїв це також правильно, якщо критерій зупиняється з ймовірністю одиниця (при цьому розподілі з альтернативи).

У статистичних тестах зазвичай доводиться йти на компроміс між прийнятним рівнемпомилок першого та другого роду. Найчастіше для ухвалення рішення використовується граничне значення, яке може змінюватися з метою зробити тест суворішим або, навпаки, м'якшим. Цим граничним значенням є рівень значущості, яким задаються під час перевірки статистичних гіпотез. Наприклад, у разі металодетектора підвищення чутливості приладу призведе до збільшення ризикупомилки першого роду(хибна тривога), а зниження чутливості - до збільшення ризикупомилкидругого роду (перепустка забороненого предмета).

Приклади використання

Масова медична діагностика (скринінг)

У медичній практиці є суттєва різниця міжскринінгомтатестуванням:

  • Скрінінгвключає відноснодешевітести, які проводяться для великої групи людей за відсутності будь-яких клінічних ознак хвороби (наприклад,мазок Папаніколау).
  • Тестуваннямає на увазі набагато більшдорогі, найчастіше інвазивні, процедури, які проводяться тільки для тих, у кого виявляються клінічні ознаки захворювання, і які, в основному, застосовуються для підтвердження передбачуваного діагнозу.

Наприклад, у більшості штатів у США обов'язково проходження новонародженими процедурискринінгунаоксифенілкетонуріютагіпотиреоз, крім іншихвроджених аномалій. Незважаючи на високий рівень помилок першого роду, ці процедури скринінгу вважаються доцільними, оскільки вони істотно збільшують ймовірність виявлення цих розладів на ранній стадії.[4]

Прості аналізи крові, що використовуються для скринінгу потенційних донорів на ВІЛ і гепатит мають суттєвий рівень помилок першого роду. ; проте в арсеналі лікарів є набагато точніші (і, відповідно, дорогі) тести для перевірки, чи дійсно людина інфікована будь-яким із цих вірусів.

Можливо, найбільш широкі дискусії викликають помилки першого роду в процедурах скринінгу на рак грудей (мамографія ). У рівеньпомилок першого родуу маммограмах сягає 15%, це найвищий показник у світі.[5]Найнижчий рівеньспостерігається в Нідерландах, 1%.[6]

Медичне тестування

Помилки другого родує суттєвою проблемою у медичному тестуванні. Вони дають пацієнтові і лікарю помилкове переконання, що захворювання відсутнє, тоді як насправді воно є. Це часто призводить до недоречного чи неадекватного лікування. Типовим прикладом є довіра результатам кардіотестування при виявленні коронарного атеросклерозу, хоча відомо, що кардіотестування виявляє ті труднощі кровотоку в коронарній артерії, які викликані стенозом.

Помилки другого родувикликають серйозні та важкі для розуміння проблеми, особливо коли потрібна умова є широкопоширеною. Якщо тест із 10%-ным рівнемпомилок другого родувикористовується обстеження групи, де ймовірність «істинно-позитивних» випадків становить 70%, багато негативні результати тесту виявляться хибними.Помилки першого родутакож можуть викликати серйозні та важкі для розуміння проблеми. Це відбувається, коли потрібна умова є рідкісною. Якщо рівеньпомилок першого родуу тесту становить один випадок на десять тисяч, але в тестованій групі зразків (або людей) ймовірність «істинно-позитивних» випадків становить у середньому один випадок на мільйон, більшість позитивних результатів цього тесту будуть хибними.

Статистичний критерій — суворе математичне правило, яким приймається чи відкидається та чи інша статистична гіпотеза з відомим рівнем значимості. Побудова критерію є вибір відповідної функції від результатів спостережень (ряду емпірично отриманих значень ознаки), яка служить виявлення міри розбіжності між емпіричними значеннями ігіпотетичними.

Види критеріїв

  • Критерії значимості. Перевірка на значущість передбачає перевіркугіпотезипро чисельні значення відомогозакону розподілу: -нульова гіпотеза. або - конкуруюча гіпотеза.
  • Критерії згоди. Перевірка на згоду передбачає перевірку припущення про те, що досліджуванавипадкова величинапідпорядковується передбачуваномузакону. Критерії згоди можна також сприймати як критерії значимості. Критеріями згоди є:
  1. Критерій Пірсона
  2. Критерій Колмогорова
  3. Критерій Андерсона-Дарлінга
  4. Критерій Крамера - Мізеса - Смирнова
  5. Критерій згоди Купера
  6. Z-тест
  7. Критерій Жака-Бера(англ.)
  8. Критерій Шапіро-Вілка(англ.)
  9. Графік нормальності(англ.) - не стільки критерій, скільки графічна ілюстрація: точки спеціально побудованого графіка повинні лежати майже на одній прямій.
  • Критерії перевірки на однорідність. і тому закону). Використовуються уфакторному аналізідля визначення наявності залежностей.

Цей поділ умовно, і найчастіше той самий критерій може бути використаний у різних якостях.

Непараметричні критерії

Група статистичних критеріїв, які не включають до розрахунку параметри <імовірнісного розподілу і засновані на оперуванні частотами або рангами.

  • Q-критерійРозенбаума
  • U-критерій Манна-Уітні
  • Критерій Вілкоксона
  • Критерій Пірсона
  • Критерій Колмогорова-Смирнова

Параметричні критерії

Група статистичних критеріїв, які включають до уваги параметриімовірнісного розподілуознаки (середні та дисперсії).

  • t-критерій Стьюдента
  • Критерій Фішера
  • Критерій відносини правдоподібності
  • Критерій Романовського

квиток №_5_