Статистична сукупність

4. Статистична сукупність. Гістограма

При великому числі спостережень уявлення даних у вигляді статистичного ряду буває скрутним, а при вирішенні низки завдань і недоцільним. У таких випадках проводиться підрахунок результатів спостереження за групами і складають таблицю, в якій вказуються групи та частоти, отримані в результаті спостереження в кожній групі. Сукупність груп, на які розбиваються результати спостережень та частоти, отримані в кожній групі, становлять статистичну сукупність, яка представлена нижче.

Графічне уявлення статистичної сукупності зветься гістограми. Гістограма будується в такий спосіб. По осі абсцис відкладаються інтервали, відповідні групам сукупності, і кожної з них будується прямокутник, площа якого дорівнює частоті цієї групи. З побудови випливає, що площа суми всіх прямокутників дорівнює одиниці. Очевидно, якщо плавно з'єднати точки гістограми, то ця крива буде першим наближенням до щільності розподілу випадкової величини Х.

Якщо число дослідів збільшувати і вибирати дрібніші групи (на малюнку маленькі інтервали) у статистичній сукупності, то отримана гістограма все більше наближається до щільності розподілу випадкової величини Х. Статистичну сукупність можна використовувати і для побудови наближеної функції розподілу F * (x), вибравши як значення випадкової величини граничні значення груп.

Pi*

5. Метод найбільшої правдоподібності для знаходження оцінок параметрів густини розподілу

Метод найбільшої правдоподібності ґрунтується на поданні вибірки обсягу n як n-вимірної випадкової величини (Х1, Х2, . Хn), дерозглядаються як незалежні випадкові величини з однаковою густиною розподілу f(x). Щільність розподілу такої n-вимірної випадкової величини називається функцією правдоподібності L(x1, x2, . xn), яка з незалежності випадкових величин дорівнює добутку щільностей розподілу випадкових величин Х1, Х2, . Хn:

Звідси випливає, що функцію у=у(x1, x2, . xn) вибіркових значень x1, x2, . xn, звану статистикою, можна як випадкову величину, розподіл якої однозначно визначається функцією правдоподібності.

Розглянемо спосіб пошуку оцінок властивостей за досвідченими даними, який використовує функцію правдоподібності.

Нехай f(x;а) – густина розподілу випадкової величини Х (генеральної сукупності), що залежить від параметра а. Функція правдоподібності також буде залежати від параметра і мати вигляд

Сутність методу найбільшої правдоподібності полягає в тому, щоб знайти таке значення параметра а, при якому функція правдоподібності L(x1, x2, xn, а) була б максимальною. Для цього необхідно вирішити рівняння

і знайти значення а, у якому функція L(x1, x2, . xn, а) досягає максимуму. З метою спрощення обчислення зазвичай максимізують натуральний логарифм функції правдоподібності, користуючись тим, що

Якщо невідомі кілька параметрів а1, а2, . , аm, то функція правдоподібності залежить від m змінних L = L(x1, x2, . xn; а1, а2, . , аm) і розв'язуються m рівнянь

приклад. Нехай на вхід приймального пристрою надходить сума двох сигналів: Y(t) = X + Z(t), де Х – невідомий сигнал, що не залежить від часу, а Z(t) – випадкова перешкода. У часи часу t1, t2, . tn проводяться вимірювання величини Y(t). З досвідчених даних (вибірки) y1 = y(t1), y2 = y(t2), . , yn=y(tn) потрібноВизначити наближене значення сигналу Х.

Рішення. Нехай Z(t1), Z(t2), . , Z(tn) – незалежні випадкові величини розподілені за нормальним законом із математичним очікуванням mZ= 0 і дисперсією D(Z) = s 2 . Тоді випадкові величини також незалежні, нормально розподілені з невідомим математичним очікуванням і з тією ж дисперсією s 2 . Щільність розподілу випадкових величин Y(t1), Y(t2), . , Y(tn) має, таким чином, вигляд

Запишемо функцію правдоподібності для n-вимірної випадкової величини (Y1, Y2, . , Yn):

щось із рівняння

Маємо

Неважко показати, що функція правдоподібності L = L(y1, y2, . yn; а) при цьому досягає свого максимуму. Таким чином ми показали, що оцінка математичного очікування невідомого сигналу Х за методом найбільшої правдоподібності у припущенні нормального розподілу адитивної перешкоди є середнім арифметичним виміром y1, y2, . yn:

Метод найбільшої правдоподібності має важливу властивість: він завжди призводить до заможних, хоча іноді і до зміщених, і ефективних оцінок.

Насправді використання методу найбільшої правдоподібності часто призводить до необхідності вирішувати досить складні системи рівнянь.

6. Метод найменших квадратів

математична статистика метод розподіл вибірка

Застосуємо метод найбільшої правдоподібності обробки експериментальних даних. Припустимо, що між фізичною величиною t (наприклад, часом) і вимірюваною (сигналом) існує функціональна залежність: y = j (t).

Вигляд цієї залежності потрібно визначити з досвіду. Припустимо, що в результаті досвіду ми отримали ряд експериментальних точок і побудували графік залежності від t. Експериментальні точки завжди мають помилки виміру. Виникає питання, як поекспериментальним даним найкращим чином відтворити залежність від t? Якщо провести інтерполяційну криву, тобто криву, що точно проходить через експериментальні точки, то це через помилки вимірювання буде не найкращим рішенням. Якщо відома тенденція цієї залежності, тобто вид кривої, то завдання спрощується. Тоді виникає завдання згладжування - побудова кривої в такий спосіб, щоб ухилення (у певному сенсі) від експериментальних точок кривої було мінімальним.

Дуже часто буває так, що знаючи вид кривої, з досвіду потрібно встановити тільки деякі параметри залежності. Наприклад, відомо, що залежність є лінійна y = at + b, а невідомі величини і b слід визначити з експериментальних даних y1= y(t1), y2= y(t2), . , Yn = y (tn). У випадку функція у = j (t, a, b, . ) може містити багато параметрів (а,b, . ). Потрібно вибрати ці параметри так, щоб крива у = j (t, a, b, .) в якомусь сенсі найкраще відображала залежність, отриману досвідченим шляхом. Для цього розглянемо таку модель.

Є спостереження (експериментальні дані) y1, y2, . ,yn точних величин j (t1, a, b, .) j (t2, a, b, . ), . j (tn, a, b, .). Тоді величина Di = yi - j (ti, a, b, .) є помилкою спостереження. Щодо помилок будемо вважати, що Di – незалежні випадкові величини з математичним очікуванням рівним нулю (центровані) та однаковою дисперсією s 2 підпорядковані нормальному закону розподілу. Функція правдоподібності в цьому випадку матиме вигляд

і досягає свого максимального значення шляхом вибору параметрів а, b. лише тоді, коли функція

досягне мінімального значення. Якщо виміри нерівноцінні, що еквівалентно наявності різних дисперсій si 2 помилок Di, то, виходячи зфункції правдоподібності, необхідно мінімізувати функцію

Розмір тут грає роль вагових множників. Цей спосіб пошуку властивостей зветься методу найменших квадратів.

Для знаходження мінімального значення останньої функції необхідно вирішити систему рівнянь

кількість рівнянь якої дорівнює кількості параметрів а, b, . . Як приклад розглянемо згадану лінійну залежність при рівноцінних вимірах:

у = at + b (j (ti; a, b) = at + b).

У цьому випадку нам необхідно мінімізувати функцію

Беручи приватні похідні від цієї функції а і b і прирівнюючи їх нулю, отримуємо систему двох рівнянь з двома невідомими

Вирішуючи цю систему щодо а і b, після простих перетворень отримаємо наступну лінійну залежність