Аналіз рядів розподілу
АНАЛІЗ РЯДІВ РОЗПОДІЛУ
1. Характеристики центру розподілу
1.3 Показники диференціації
2. Характеристики варіації
2.1 Абсолютні характеристики варіації
2.1.1 Розрахунок дисперсії способом моментів
2.1.2 Розрахунок дисперсії альтернативної ознаки
2.1.3 Міжгрупова дисперсія. Правило складання дисперсій
2.2 Відносні характеристики варіації
3. Теоретичні криві розподіли
3.1 Нормальний розподіл
3.2 Вирівнювання емпіричного розподілу по кривій нормального розподілу
3.3 Критерії згоди
3.4 Характеристики нерівномірності розподілу
Ряд розподілу (тобто впорядкований розподіл одиниць сукупності, що вивчається на групи за певною варіюючою ознакою) характеризує склад, структуру сукупності за певною ознакою. Його будують для того, щоб виявити характер розподілу одиниць сукупності за ознакою, що варіює, визначити закономірності в цьому розподілі.
Для аналізу ряду розподілу використовують низку статистичних характеристик:
Показники центру розподілу;
Показники нерівномірності розподілу.
Частотні характеристики ряду розподілу, а саме частоти
1. Характеристики центру розподілу
До характеристик центру розподілу відносять середню, моду та медіану. Ці характеристики прийнято також називати структурними середніми, вони визначають вид полігону та гістограми, емпіричного закону розподілу.
Як середню для характеристики центру розподілу найчастіше використовують середню арифметичну просту або зважену.
Мода (Мо) - це варіант, якийнайчастіше зустрічається у досліджуваній сукупності. Мода не залежить від крайніх значень варіанта і може застосовуватися для характеристики центру в рядах розподілу з невизначеними межами.
У дискретному варіаційному ряді мода визначається візуально і дорівнює варіанті з найбільшою частотою чи частістю. Дані розподілу робочих за стажем роботи (див. лекцію "Зведення та угруповання статистичних даних") показують, що найбільше робочих мають стаж роботи 4 роки, тобто. варіанта, що дорівнює 4, є модою ознаки. Мо = 4.
У інтервальних рядах розподілу для знаходження моди спочатку найбільшою частотою визначають модальний інтервал, тобто. інтервал, що містить моду, а потім приблизно розраховують її за формулою:
Трапляються ряди, які мають дві моди (бімодальний ряд) або кілька (полімодальний).
Розрахуємо моду інтервального ряду розподілу робітників за розміром заробітної плати (див. лекцію "Зведення та угруповання статистичних даних").
У цьому варіаційному ряді інтервал 900-1000 грн., до якого потрапила максимальна кількість робітників (9 осіб), є модальним.
Отримане значення моди свідчить про те, що в аналізованій сукупності найбільш типовою є заробітна плата 914,29 грн., що вище за раніше розраховану середню зарплату (870 грн).
Для ряду з нерівними інтервалами модальний інтервал визначається найбільшою щільністю розподілу, а в розрахунковій формулі моди замість частот використовують абсолютні щільності розподілу.
Для інтервальних варіаційних рядів із рівними інтервалами моду можна приблизно визначити графічно.
Для цього на гістограмі цього ряду (див. гістограму в лекції "Зведення та угруповання статистичних даних") вибирають найвищий прямокутник,який і є модальним.
Далі праву верхню вершину прямокутника, що передує модальному (частота fMо-1 ), з'єднують з правою верхньою вершиною модального прямокутника (частота fMо ), а ліву верхню вершину цього прямокутника - з лівою верхньою вершиною прямокутника, наступного за модальним (частота fMо+1).
З точки перетину опускають перпендикуляр на горизонтальну вісь. Підстава перпендикуляра покаже значення моди Мо. Точність визначення залежить від масштабу графіка.
1.2 Медіана
Медіаною Ме називають таке значення ознаки, яке припадає на середину ранжованого ряду і поділяє його на дві рівні за кількістю одиниць частини. Таким чином, у ранжированому ряду розподілу одна половина ряду має значення ознаки, що перевищують медіану, інша – менше медіани. Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжованого ряду (найменша та найбільша) порівняно з іншими виявляються надмірно більшими або надмірно малими.
У дискретному варіаційному ряду, що містить непарне число одиниць, медіана дорівнює варіанті ознаки, що має номер
де N-число одиниць сукупності.
У дискретному ряду, що складається з парного числа одиниць сукупності, медіана визначається як середня варіант, що мають номери
У розподілі робітників за стажем роботи медіана дорівнює середній варіант, що мають у ранжованому ряду номери 10: 2 = 5 і 10: 2 + 1 = 6. Варіанти п'ятої та шостої ознаки дорівнюють 4 рокам, таким чином
При обчисленні медіани в інтервальному ряду спочатку знаходять медіанний інтервал (тобто медіану, що містить), для чого використовують накопичені частоти або частоти. Медіанним є інтервал, накопичена частота якого дорівнює або перевищує половину всього обсягусукупності. Потім значення медіани розраховується за такою формулою:
Розрахуємо медіану низки розподілу робітників за розміром зарплати (див. лекцію "Зведення та угруповання статистичних даних").
Медіанним є інтервал заробітної плати 800-900 грн., оскільки його кумулятивна частота дорівнює 17, що перевищує половину суми всіх частот (
Отримане значення говорить про те, половина робітників мають заробітну плату нижче 875 грн., але це вище за середній її розмір.
Для визначення медіани можна замість кумулятивних частот
Медіана, як і мода, не залежить від крайніх значень варіанта, тому також застосовується для характеристики центру в рядах розподілу з невизначеними межами.
Властивість медіани: сума абсолютних величин відхилень варіант від медіани менше, ніж від будь-якої іншої величини (у тому числі і від середньої арифметичної):
Ця властивість медіани використовується на транспорті при проектуванні розташування трамвайних та тролейбусних зупинок, бензоколонок, складальних пунктів тощо.
Приклад.На шосе завдовжки 100 км розташовано 10 гаражів. Для проектування будівництва бензоколонки були зібрані дані про кількість їздок на заправку по кожному гаражу.
Таблиця 2 – Дані про кількість їздок на заправку по кожному гаражу.