Критерій Бартлетта

Матеріал із MachineLearning.

Критерій Бартлетта– статистичний критерій, що дозволяє перевіряти рівність дисперсій кількох (двох і більше) вибірок. Нульова гіпотеза передбачає, що аналізовані вибірки отримані з генеральних сукупностей, які мають однакові дисперсії.

Критерій Бартлетта є параметричним і ґрунтується на додатковому припущенні про нормальність вибірок даних. Тому перед застосуванням критерію Бартлетт рекомендується виконати перевірку нормальності. Критерій Бартлетта дуже чутливий до порушення цього припущення.

  • обсяги вибірок можуть бути різними(це його перевага перед критерієм Кокрену),
  • критерій Бартлетта виявляє відхилення, як у найбільшу, так і в найменшу сторону;

  • складність обчислень(Критерій Кокрена вимагає менше обчислювальних витрат. Особливо це актуально у разі обчислень «вручну»),
  • обсяг кожної вибірки має бути більше трьох,
  • критерій дуже чутливий до порушення припущення про норму закону розподілу вихідних даних.

Зміст

Приклади завдань – застосування критерію Бартлетту

Приклад 1.Критерій Бартлетта може бути використаний як допоміжний - наприклад, при перевірці іншого статистичного тесту, що використовує рівність дисперсій. Наведемо приклад застосування критерію Бартлетта в аналітичній хімії як допоміжний критерій. (Див. Застосування дисперсійного аналізу в аналітичній хімії.) При проведенні міжлабораторних експериментів виникає тип завдань, коли один зразок аналізується в кількох лабораторіях, а потім отримані результати обробляються та узагальнюються. Таким чином, євибірок у випадку різного розміру. Необхідно порівняти середні значення одержаних вибірок. Для цього спочатку потрібно переконатися, що дисперсії однорідні за допомогою критерію Бартлетта. Якщо дисперсії неоднорідні, порівняння середніх проводити не можна.

Приклад 2.(Див. Портал Природних Наук.) Вимірюється розмір деякого виробу. Усього проводиться серій експериментів, що складаються з ( ) вимірів. При цьому серії вимірювань можуть бути віднесені до різних експериментаторів, можуть застосовуватись різні методики вимірювання. У разі виконання припущення нормальності розподілу необхідно порівняти вибірки на однорідність дисперсій.

Приклад 3.(Див. Обробка однотипних вибірок експериментальних даних.) За результатами спостереження за пропускною спроможністю каналу в різні дні випробувань сформовані впорядковані вибірки. При заданому рівні важливості потрібно перевірити однорідність вибірок.

  • Для розрахунків при перевірці однорідності дисперсій найбільш складним виявляється випадок, коли вибіркові дисперсії отримані з вибірок неоднакового обсягу або за результатами попередньої обробки даних були виключені значення, визнані як промахи. Тоді рекомендується використовувати критерій Бартлетта.
  • У зв'язку з обчислювальною складністю даного критерію іноді практично намагаються відмовитися від нього, якщо є така можливість.

Опис критерію

Є вибірок обсягом ( ) кожна. Дисперсії вибірок та вибіркові оцінки дисперсій позначимо через та відповідно.

Додаткові припущення

  • Вибірки є нормальними. Критерій Бартлетта дуже чутливий до відхилень від нормальності розподілу досліджуваних випадкових величин. Якщо немає впевненості у нормальностірозподілу, ним не рекомендується користуватися. А за однакового обсягу всіх вибірок замість критерію Бартлетта краще застосовувати критерій Кокрену.

Нульова гіпотеза

Критерій Бартлетта перевіряєгіпотезупро те, що дисперсії всіх вибірок однакові.

Альтернативнагіпотеза: існує, принаймні, дві вибірки і ( ) з дисперсіями, що не збігаються.

Статистика критерію Бартлетта

Статистика критерію Бартлетта обчислюється відповідно до співвідношення:

де - сумарна оцінка дисперсій.

При 3 (i=1. k) " alt= "n_i > 3 (i=1. k) " /> і справедливості нульової гіпотези статистика критерію Бартлетта має розподіл хі-квадрат з (k-1) ступенями свободи.

Критерій (при рівні значимості)

Якщо \chi_^2" alt= " T > \chi_^2" />, то з достовірністю нульова гіпотезавідкидаєтьсяна користь альтернативи . Тут - квантиль розподілу хі-квадрат з (k-1) ступенями свободи.

Примітка

При відхиленні від нормальності рекомендується замість статистики користуватись її модифікацією:

Статистика має -розподіл з і ступенями свободи. Тому нульову гіпотезу слід відхилити, якщо F_(f_1, f_2)" alt= "T^* > F_(f_1, f_2)" />.