Математична статистика - Математика

1. Предмет та методи математичної статистики

2. Основні поняття математичної статистики

2.1 Основні поняття вибіркового методу

2.2 Вибірковий розподіл

2.3 Емпірична функція розподілу, гістограма

Математична статистика — наука про математичні методи систематизації та використання статистичних даних для наукових та практичних висновків. У багатьох своїх розділах математична статистика спирається на теорію ймовірностей, що дозволяє оцінити надійність і точність висновків, які робляться на підставі обмеженого статистичного матеріалу (напр., оцінити необхідний обсяг вибірки для отримання результатів необхідної точності під час вибіркового обстеження).

Теоретично ймовірностей розглядаються випадкові величини із заданим розподілом чи випадкові експерименти, властивості яких цілком відомі. Предмет теорії ймовірностей - властивості та взаємозв'язку цих величин (розподілів).

Але найчастіше експеримент є чорний ящик, видає лише деякі результати, якими потрібно зробити висновок про властивості самого експерименту. Спостерігач має набір числових (або їх можна зробити числовими) результатів, отриманих повторенням того самого випадкового експерименту в однакових умовах.

При цьому виникають, наприклад, такі питання: Якщо ми спостерігаємо одну випадкову величину — як за набором її значень у кількох дослідах зробити якомога точніший висновок про її розподіл?

Прикладом такої серії експериментів може бути соціологічне опитування, набір економічних показників чи, нарешті, послідовність гербів і решок при тисячоразовому підкиданні монети.

Всі наведені вище фактори зумовлюють актуальність і значимістьтематики роботи на етапі, спрямованої на глибоке і всебічне вивчення основних понять математичної статистики.

У зв'язку з цим метою даної є систематизація, накопичення і закріплення знань про поняття математичної статистики.

1. Предмет та методи математичної статистики

Математична статистика - наука про математичні методи аналізу даних, отриманих під час проведення масових спостережень (вимірювань, дослідів). Залежно від математичної природи конкретних результатів спостережень статистика математична ділиться на статистику чисел, багатовимірний статистичний аналіз, аналіз функцій (процесів) та часових рядів, статистику об'єктів нечислової природи. Істотна частина математичної статистики заснована на ймовірнісних моделях. Виділяють загальні завдання опису даних, оцінювання та перевірки гіпотез. Розглядають і більш часткові завдання, пов'язані з проведенням вибіркових обстежень, відновленням залежностей, побудовою та використанням класифікацій (типологій) та ін.

Для опису даних будують таблиці, діаграми, інші наочні уявлення, наприклад, кореляційні поля. Вірогідні моделі зазвичай не застосовуються. Деякі методи опису даних спираються на просунуту теорію та можливості сучасних комп'ютерів. До них відносяться, зокрема, кластер-аналіз, націлений на виділення груп об'єктів, схожих один на одного, та багатовимірне шкалювання, що дозволяє наочно уявити об'єкти на площині, найменшою мірою спотворивши відстані між ними.

Методи оцінювання та перевірки гіпотез спираються на імовірнісні моделі породження даних. Ці моделі поділяються на параметричні та непараметричні. У параметричних моделях передбачається, що об'єкти, що вивчаються, описуютьсяфункціями розподілу, які залежать від невеликого числа (1-4) числових параметрів. У непараметричних моделях функції розподілу передбачаються довільними безперервними. У статистиці математичної оцінюють параметри та характеристики розподілу (математичне очікування, медіану, дисперсію, квантилі та ін.), щільності та функції розподілу, залежності між змінними (на основі лінійних та непараметричних коефіцієнтів кореляції, а також параметричних або непараметричних оцінок функцій, що виражають залежності) та ін. Використовують точкові та інтервальні (що дають межі для справжніх значень) оцінки.

У математичній статистиці є загальна теорія перевірки гіпотез і багато методів, присвячених перевірці конкретних гіпотез. Розглядають гіпотези про значення параметрів та характеристик, про перевірку однорідності (тобто про збіг характеристик або функцій розподілу у двох вибірках), про згоду емпіричної функції розподілу із заданою функцією розподілу або з параметричним сімейством таких функцій, про симетрію розподілу та ін.

Велике значення має розділ математичної статистики, пов'язаний із проведенням вибіркових обстежень, із властивостями різних схем організації вибірок та побудовою адекватних методів оцінювання та перевірки гіпотез.

Завдання відновлення залежностей активно вивчаються понад 200 років, з розробки К. Гауссом в 1794 р. методу найменших квадратів. В даний час найбільш актуальні методи пошуку інформативного підмножини змінних та непараметричні методи.

Розробка методів апроксимації даних та скорочення розмірності опису було розпочато понад 100 років тому, коли К. Пірсон створив метод головних компонентів. Пізніше було розроблено факторний анализ[1] ічисленні нелінійні узагальнення.

Різні способи побудови (кластер-анализ), аналізу та використання (дискримінантний аналіз) класифікацій (типологій) називають також способами розпізнавання образів (з учителем і без), автоматичної класифікації та ін.

Математичні методи у статистиці засновані або на використанні сум (на основі Центральної Граничної Теореми теорії ймовірностей) або показників відмінності (відстаней, метрик), як у статистиці об'єктів нечислової природи. Строго обґрунтовані зазвичай лише асимптотичні результати. В даний час комп'ютери відіграють велику роль у математичній статистиці. Вони використовуються як для розрахунків, так і для імітаційного моделювання (зокрема, у методах розмноження вибірок та щодо придатності асимптотичних результатів).

2. Основні поняття математичної статистики 2.1 Основні поняття вибіркового методу

Нехай випадкова величина, що спостерігається у випадковому експерименті. Передбачається, що ймовірнісний простір задано (і нас не цікавитиме).

Вважатимемо, що, провівши якраз цей експеримент в однакових умовах, ми отримали числа , , , — значення цієї випадкової величини в першому, другому і т.д. експериментах. Випадкова величина має деякий розподіл , який нам частково чи невідомо.

Розглянемо докладніше набір, званий вибіркою.

У серії вже зроблених експериментів вибірка – це набір чисел. Але якщо цю серію експериментів повторити ще раз, замість цього набору ми отримаємо новий набір чисел. Замість числа з'явиться інше число — одне із значень випадкової величини. Тобто (і, і, і т.д.) - змінна величина, яка може приймати ті ж значення, що і випадкова величина, і так само часто (з тими жймовірностями). Тому до досвіду - випадкова величина, однаково розподілена з , а після досвіду - число, яке ми спостерігаємо в першому експерименті, тобто. одне з можливих значень випадкової величини.

Вибірка обсягу - це набір з незалежних і однаково розподілених випадкових величин («копій»), що мають, як і , розподіл .

Що означає «за вибіркою зробити висновок про розподіл»? Розподіл характеризується функцією розподілу, щільністю або таблицею, набором числових характеристик - , , і т.д. По вибірці необхідно вміти будувати наближення всім цих параметрів.

2.2 Вибірковий розподіл

Розглянемо реалізацію вибірки одному елементарному результаті — набір чисел , , . На відповідному ймовірнісному просторі введемо випадкову величину , Що приймає значення , , З ймовірностями по (якщо якісь із значень збіглися, складемо ймовірності відповідне число разів). Таблиця розподілу ймовірностей та функція розподілу випадкової величини виглядають так: