Логарифмічно нормальний розподіл

Логарифмічно нормальний розподіл - розділ Філософія, Математична статистика Випадкова Змінна Y Має Логарифмічно Нормальний Розподіл З Параме.

Випадкова змінна Y має логарифмічно нормальний розподіл із параметрами μ та σ, якщо випадкова змінна X = lnY має нормальний розподіл із тими самими параметрами μ та σ. Знаючи характер зв'язку між змінними X та Y, можемо легко побудувати графік щільності ймовірності випадкової змінної з логарифмічно нормальним розподілом (Малюнок 4.2).

Рисунок 4.2 – Криві щільності логарифмічно нормального розподілу при різних значеннях параметрів μ та σ

Якщо випадкова змінна X має функцію щільності ймовірності, яка визначається формулою (4.6), і якщо X = lnY, то:

, звідки маємо для > 0:

(4.14)

З визначення випливає, що випадкова змінна, що підкоряється логарифмічно нормальному розподілу, може набувати лише позитивних значень. Як показано на малюнку 4.2, криві функції f(y) мають лівосторонню асиметрію, яка тим сильніша, чим більше значення параметрів μ та σ. Кожна крива має один максимум і є певною для всіх позитивних значень.

Обчислення математичного очікування та дисперсії випадкової змінної з логарифмічно нормальним розподілом не становить особливих труднощів:

(4.15)

(4.16)

(4.17)

Шляхом підстановок та введення нових змінних в інтегралах 4.15 та 4.16 отримаємо:

(4.18)

(4.19)

Взагалі, для обчислення ймовірності того, що випадкова змінна Y з логарифмічно нормальним розподілом і щільністю f(y, μ, σ), набуде значення в інтервалі (а, b), слід взяти інтеграл:

(4.20)

Однак нана практиці зручніше скористатися тим, що логарифм випадкової змінної Y має нормальний розподіл. Імовірність того, що а ≤ Y ≤ b рівнозначна ймовірності того, що lnа ≤ lnY ≤ lnb.

Обчислимо ймовірність того, що випадкова змінна з логарифмічно розподілом μ = 1, σ = 0,5, набуде значення в інтервалі (2, 5). Маємо:

З таблиць логарифмів знаходимо ln2 = 0,6932 та ln5 = 1,6094.

Позначивши lnY = X, можемо написати:

Причому випадкова змінна X підпорядкована нормальному розподілу із середнім значенням μ = 1 та стандартним відхиленням σ = 0,5. Тепер шукану ймовірність неважко обчислити за таблицями інтегральної функції нормального розподілу:

Запитання для самоконтролю

1 Визначення прямокутного розподілу.

2 Графік щільності ймовірності випадкової змінної з прямокутним розподілом

3 Основне значення прямокутного розподілу.

4 Математичне очікування та дисперсія випадкової змінної у прямокутному розподілі.

5 Роль нормального розподілу математичної статистики.

6 Що таке нормальне розподілення і як воно пов'язане з біномним?

7 Графік густини ймовірності випадкової змінної з нормальним розподілом.

8 Якими статистичними параметрами може бути заданий нормальний розподіл?

9 Чому нормальний розподіл є безперервним?

10 Зрівняння нормальної кривої.

11 Що таке нормоване відхилення?

12 Рівняння кривої нормального розподілу у нормованій формі.

13 Якими значеннями μ та σ характеризується нормальна сукупність у нормованій формі?

14 Яка частка даних вибірки укладається в межах ±1?, ±2?, ±3?

15 Що показує таблицянормального інтегралу ймовірностей?

16 Рівняння логарифмічно нормальної кривої.

17 Графік густини ймовірності випадкової змінної з логарифмічно нормальним розподілом.

18 Які необхідно виконати перетворення, щоб з логарифмічно нормального розподілу отримати нормальний розподіл?

19 Якими статистичними параметрами логарифмічно задається нормальний розподіл?

ТЕМА 5 Розподіл параметрів вибірки

5.1 t – розподіл Стьюдента

5.2 F-розподіл Фішера-Снедекору

5.3 χ 2 -розподіл

5.1 t - розподіл Стьюдента

Закон нормального розподілу проявляється за кількістю ознак n> 20-30. Проте експериментатор часто проводить обмежену кількість вимірів, грунтує свої висновки на малих вибірках. При невеликій кількості спостережень результати зазвичай близькі і рідко з'являються великі відхилення. Це легко пояснити законом нормального розподілу, згідно з яким ймовірність появи малих відхилень більша, ніж відхилень значних. Так, ймовірність відхилень, що перевищують по абсолютній величині ±2σ, дорівнює 0,05 або один випадок на 20 вимірювань, а відхилень ± 3σ – 0,01, або один випадок на 100.

Якщо ж польовий досвід проводять, наприклад, у 4 – 6 повторностях, то природно очікувати, що серед показань урожаїв на паралельних ділянках великих відхилень не буде. Тому стандартне відхилення s, підраховане за малою вибіркою, в більшості випадків буде менше, ніж у всій генеральній сукупності. Отже, у випадках покладатися на критерії нормального розподілу у висновках не можна.

З початку XX століття в математичній статистиці став розроблятися новий напрямок, який можна назвати статистикоюмалих вибірок. Найбільше практичне значення для експериментальної роботи мало відкрите в 1908 р. англійським статистиком і хіміком В. Держсетом t-розподіл, що отримав назву розподілу Стьюдента (англ. Стюдент - студент, псевдонім В. Госсета).

Розподіл t Стьюдента для вибіркових середніх визначається рівністю:

(5.1)

Чисельник формули означає відхилення вибіркової середньої від середньої сукупності , а знаменник:

- є показником, що оцінює величину стандартної помилки середньої вибіркової сукупності.

Таким чином, величина t вимірюється відхиленням вибіркової середньої від середньої сукупності, вираженим у частках помилки вибірки, прийнятої за одиницю.

Максимуми частоти нормального та t-розподілу збігаються, але форма кривої t-розподілу повністю залежить від числа ступенів свободи. При дуже малих значеннях ступенів свободи вона набуває вигляду плосковершинної кривої, причому площа, відмежована кривою, більша, ніж при нормальному розподілі, а при збільшенні числа спостережень (n 30) розподіл t наближається до нормального і переходить у нього при n = ∞.

На малюнку 1.1 представлено диференціальний та інтегральний розподіл t-Стьюдента при 10 степенях свободи.

Рисунок 5.1 – Диференціальний (ліворуч) та інтегральний (праворуч) розподіл t–Стьюдента

Розподіл t-Стьюдента має важливе значення при роботі з малими вибірками: дозволяє визначити довірчий інтервал, що накриває середню сукупність, та перевірити ту чи іншу гіпотезу щодо генеральної сукупності. При цьому немає необхідності знати параметри сукупностіі, достатньо мати їх оцінки μ та σ для певного обсягу вибірки n.

5.1.1 ПроблемаБеренса-Фішера

Перевірка гіпотези про генеральні середні дві групи з нормальним розподілом і нерівними дисперсіями в математичній статистиці називається проблемою Беренса-Фішера і має нині лише наближені рішення. Чому така важлива вимога рівності дисперсій у порівнюваних групах? Не вдаючись у деталі цієї проблеми, відзначимо, що чим більше різняться між собою дисперсії та обсяги вибірок, тим сильніше відрізняється розподіл "t-критерію, що обчислюється" від розподілу "t-критерію Стьюдента". У цьому різну величину має як сам t-критерій, і такий параметр цих розподілів, як число ступенів свободи. У свою чергу число ступенів свободи позначається на величині досягнутого (критичного) рівня значущості (р Fтеор. Теоретичні значення F для 5%-ного та 1%-ного рівня значимості дано в таблиці, де табульовані тільки праві критичні точки для F ≥ 1, так як завжди прийнято знаходити відношення більшої дисперсії до меншої.

Криві, отримані з функції розподілу для всіх можливих значень F, особливо при невеликій кількості спостережень, мають асиметричну форму - довгий хвіст великих значень і велику концентрацію малих величин F (рисунок 5.2).

Рисунок 5.2 – Диференціальний (ліворуч) та інтегральний (праворуч) F-розподіл Фішера–Снедекору

Зазначимо, що t-розподіл Стьюдента є окремим випадком F-розподілу при числі ступенів свободи ν1 = 1 і ν2 = ν, тобто дорівнює числу ступенів свободи для розподілу t. У цьому випадку спостерігається наступне співвідношення між F та t:

(5.3)

5.3 χ 2 -розподіл

Багато фактичних розподілів відповідають моделям теоретичних розподілів (нормальний, біноміальний, Пуассон) Однак, на практицііснують розподіли, що сильно відрізняються від нормального. Для оцінки ступеня розбіжності або ступеня згоди між чисельностями фактичного та теоретичного розподілів запроваджуються статистичні критерії згоди, наприклад, критерій 2 . Цей критерій застосовується для вирішення завдань статистичного аналізу, наприклад, для перевірки гіпотез: про незалежність двох принципів, покладених в основу угруповання результатів спостережень з однієї сукупності; про однорідність груп щодо деяких визначених характеристик; про згоду теоретичної та експериментальної кривих чисельностей. Критерій 2 може називатися як критерієм згоди, так і критерієм незалежності, критерієм однорідності. Закон розподілу χ 2 (хі-квадрат) відкрив К. Пірсон. Крива розподілу, отримана з функції хі-квадрат:

(5.4)

де f – фактичні та F – теоретичні частоти чисельності об'єктів вибірки. Її вигляд сильно залежить від числа ступенів свободи. Для малого числа ступенів свободи крива асиметрична (рисунок 5.3), але зі збільшенням асиметрія зменшується і при ν = крива стає нормальною гаусової.

Розподіл χ 2 , як і t–розподіл, окремий випадок F – розподілу при ν1 = ν і ν2 = ∞.

Рисунок 5.3 – Диференційне (ліворуч) та інтегральне (праворуч) χ 2 –розподіл

Запитання для самоконтролю

1 У яких випадках краще використовувати t-розподіл Стьюдента, а не нормальний розподіл?

2 Які величини необхідно оцінювати для використання t-розподілу Стьюдента?

3 У чому суть проблеми Беренса-Фішера?

4 Чим чисельно виражається F-розподіл для двох незалежних вибірок із загальної сукупності змінних?

5 Від яких характерних величинвипадкових змінних залежить F-розподіл?

6 На які питання може відповісти значення критерію 2 при статистичній обробці експериментальних даних?