Методологія статистичних угруповань - Статистика Бібліотека українських підручників

Науковому статистичному угрупованню передує теоретико-економічний аналіз досліджуваного явища і водночас використання сучасних статистичних методів дозволяє кількісно оцінити ступінь однорідності виділених груп, здійснити відбір суттєвих групувальних ознак, удосконалювати методику визначення величини інтервалів груп.

Від вибору групувального ознаки залежить вирішення питання створення груп. Угруповання за атрибутивною ознакою обмежується кількістю значень ознаки. Наприклад, поголів'я спортивних коней можна поділ лити лише на таку кількість груп за породним складом, скільки фактично є таких поруїд.

Після відбору групувального ознаки постає питання кількості груп, куди буде розподілено досліджувана сукупність, і межах груп. Вирішення цього питання залежить від конкретних умов та завдань

На цьому етапі встановлюють величину та межі кожного інтервалу. Оскільки характер реально існуючих сукупностей та його розподіл дуже різноманітні, то існують різні методичні підходи у вирішенні питання про кількість груп. Загальним принципом, з якого треба виходити, є характер матеріалу та чисельність досліджуваної сукупності. Характерні особливості розподілу не виявляються, якщо при невеликій сукпності одиниць спостереження прийняти велику або занадто малу кількість груп. До цього питання є різні підходи. Розглянемо їх.

групувальна ознака може змінюватися дискретно, тобто безперервно та безперервно. Якщо мінливість ознаки має дискретний характер, число груп варіаційного ряду, як правило, визначається числом цих дискретних значень (якщо їх небагато). Наприклад, угруповання підприємств за наявністю виробничихбригад – 1,2,3 і т.д. Д.

При мінливості ознаки безперервного характеру звертають увагу ранжированный ряд. Якщо зростання рівнів групувального ознаки відбувається з плавними переходами, перевага надається рівним інтервалам. У разі стрибкоподібних змін групувального ознаки будують групи з нерівними інтервалами. Межі у разі встановлюють, зазвичай, у точках різких переходедів.

Таким чином, у процесі угруповання за кількісною ознакою для обмеження окремих груп утворюють рівні або нерівні інтервали

Питання визначення кількості груп в умовах порівняно поступових змін групувальної ознаки (у ранжований ряд) може вирішуватись з різних методичних підходів

Орієнтовно кількість інтервалів (груп) можна визначити шляхом вилучення квадратного кореня з обсягу сукупності, що вивчається. При цьому число інтервалів не повинно бути менше 5 і більше 20. Так при чисельності вибірки 50 одиниць спостереження число

інтервалів дорівнює 7 ^ Л ^ 50 )

Якщо сукупність невелика за обсягом, інтервальний ряд будують таким чином, щоб крайні групи (першу і третю) потрапило по 25% одиниць сукупності, а середньому - 50%. У цьому випадку угруповання складу ається з трьох нерівних інтервалів. Наприклад, сукупність із 28 підприємств буде розподілено: І група – 7 одиниць, ІІ – 14, ІІІ – 7 одиниць.

Визначення числа груп, запропонованих. Стерджес, полягає у розрахунку формули: ^"" = 1 3,3221 § *, де - число груп (інтервалів);п- чисельність сукупності. Застосовуючи цю формулу, матимемо сукупності розміром 10-100 одиниць 4-7 груп: 100-1000 одиниць – 710; 1000-10000 – 12-14 груп. Як бачимо, відносне зростання числа груп з - збільшенням сукупності відбуваєтьсядуже інтенсивно в інтервалі 10-100 одиниць і уповільнюється в інтервалі 100-1000 одиниць. Майже зовсім відсутнє таке зростання в інтервалі 100010000 одиниць сук упностсті.

Слід зазначити, що підхід є досить формальним і небезпечним, який звільняє від можливості економічного мислення. Адже підводити умовно кожен своєрідний емпіричний розподіл під єдиний тип без урахування. Ання особливостей конкретних сукупностей не можна.

Слід визнати вдалими рекомендації. В. П. Левинського, який пропонує своєрідні нормативи числа інтервалів, зумовлені

обсягами досліджуваної сукупності (табл. 6)

_. Рекомендована кількість груп для різної кількості спостережень_

Кількість одиниць спостережень

Рекомендована кількість інтервалів (груп)

Якщо кількість одиниць спостереження налічується до 40, кількість інтервалів складе 3 або 5. Розподіл сукупності на 4 групи небажаний, адже в такому випадку втрачається середня група (інтервал)

Перевага рекомендації. В. П. Левинського проти рекомендацією. Стерджес в тому, що вона не так жорстко пов'язує число груп з чисельністю одиниць спостереження. А в такому разі досліднику надасться можливість певного вибору числа груп залежно від характеру сукупності. У економічних дослідженнях найпоширеніший обсяг сукупності 100-500 одиниць. За формулою. Стерджеса число груп дорівнює 7-10, за рекомендацією. В. П. Левинського - від 10 до 17 гру17 груп.

Слід пам'ятати, що кількість обраних інтервалів (груп) залежить від коливності групувальних ознак: чим вона більша, тим більше треба утворювати груп. Треба також намагатися, щоб виділені групи були заповнені одиницями спостереження. Наявністьнезаповнених інтервалів чи потрапляння до них лише окремих одиниць сукупності - результат те, що невдало обрано інтервали, кількість їх взята, ймовірно, зайвий. Наявність малонаповнених інтервалів (груп) має право існування лише з обох боків угруповання, де концентруються характеристики як передових, і відстаючих показників за розміри щодо середнього рівня. Особливо це стосується структурних груп. Число груп тут має бути досить великою досить малою. У першому випадку є ризик загубитися в дрібницях, у другому - не вияви ти досить важливі властивості досліджуваної сукупності. Оптимальна кількість інтервалів дозволяє викрити всі суттєві особливості досліджуваної сукупності упності.

Отже, якщо вирішено питання визначення числа груп, на яке буде розділена сукупність, вихідні варіанти розташовують у ранжований ряд за групувальних ознак. У разі відсутності ускладнюючих обставин авин, тобто. наявності порівну поступових змін факторної ознаки, простим способом визначення величини інтервалу при побудові рівновеликих інтервалів буде відношення:

деі- величина інтервалу х тах і х тип - відповідно максимальна та мінімальна варіанти; п - задане число груп (інтервалів)

У випадках, коли невелика частина сукупності значно віддалена за розміром групувальної ознаки від сукупності основного масиву, за бажанням приймається максимальна варіанта основного масиву

Існують рекомендації щодо встановлення величини інтервалу угруповання з деякими поправками до попередньої формули. В цьому

у разі формула набуває вигляду:"

У випадках, коли максимальне та мінімальне значення ранжованого ряду групувальних ознак значно відрізняється від іншихпоказників, по х тах приймається суміжне наступне значення ознаки х тах 1, а за х тип суміжне попереднє її значення х тип-1.

У ряді випадків вихідна величина інтервалу угруповання задається

- =п

дослідником, а число груп у такому разі є похідним, тобто: 1

Якщо розрахована величина рівного інтервалу складає

дробове число, його округлюють до цілого, тим самим

розширюючи межі, якими охоплює інтервал розмаху колівності

значень групувального ознаки

Маючи встановлену кількість інтервалів та величину інтервалу

визначають межі інтервалів (груп). Так, нижня меж першого

інтервалу (л 1) встановлюється за мінімальним варіантом (х тип)

Верхня межа цього інтервалу (Л2) дорівнює (х тип г). Нижня межа другому інтервалі відповідає (умовно) верхній межі першого інтервалу (а верхня межа другому інтервалі (* 3 ) дорівнює ( х 2 + ') і т. д. При встановленні меж інтервалів (груп) необхідно пам'ятати, що верхня межа завжди менше нижньої межі наступного інтервалу на ціну поділу, тобто одиницю

. Приклад. Дані про середньоденну зарплату 57 підприємств згрупувати, утворивши групи з рівними інтервалами

Вихідні дані: 29,3; 31,0; 21,5; 21,4; 28,3; 35,7; 37,6; 19,8; 23,8; 21,6; 32,8, 27 9,6; 21,1; 26,3; 21,5; 27,5; 295; 24,3; 21,3; 30,4; 30,4;

39,5; 25,8; 26,6; 24,4; 32,3; 26,6; 25,9; 32,8; 29,3; 32,3; 25,3; 32,6;

Розмістивши варіанти ранжированный ряд, маємо: 16,5; 19,3; 19,8;

Крок інтервалу дорівнює:

Заокругливши до цілих варіанти, розрахуємо нижні та верхні межі інтервалів: 1 – 16 4 – 20 (тобто 16-20); II - 20 4 (тобто 20-24) і т.д.

Будуємо макет таблиці групованимрозподіл частот результатів спостереження (табл. 7)

. Угруповання підприємств зарівнемденної зарплати_

Групи підприємств за рівнем зарплати, грн.

Наведений у таблиці ряд пар чисел становить емпіричний розподіл частот", - за значеннями х, -

Сума частот дорівнює обсягу вибіркової сукупності

Теорія групам вимагає отримання всебічної характеристики досліджуваного явища чи його типів. Виділити та охарактеризувати типи можна лише за умови попереднього теоретичного висвітлення факторів, за поєднання статистичних методів узагальнення з теоретичними положеннями наук, що вивчають дане явище.

Одним з основних положень теорії груп вважається виділення з усієї різноманітності зв'язків основного процесу, який визначає всі інші зміни явища і веде до якісних перетворень

На наступному етапі теоретичного обґрунтування з'ясовують, які нові якісні зміни відбуватимуться в ході розвитку даного процесу, тобто, які нові типи даного явища знаходять свій прояв і виявляються їх найбільш суттєві риси.

Викладене вище дає підстави стверджувати, що практичному застосуванню методу статистичних угруповань передує ретельний теоретичний аналіз факторів, виявлення головного напряму розвитку досліджуваного явища і виділення зі складної сукупності окремих груп одиниць, що належать до різних типів.

Але слід зазначити, що попереднє теоретичне вивчення даних при угрупованнях перестав бути догмою і отже, що метод групам грає певну технічну, тобто. пасивну роль у аналізі. Це не так. Вік використання статистичних угруповань дозволяє отримати кількісну характеристикустану досліджуваних явищ, виявити якісні перетворення, перевірити гіпотези щодо напряму розвитку явища і цим з амім збагатити теорію питання, поставленого на дослідженні.

Таким чином, метод статистичних угруповань дає об'єктивні результати в аналізі лише в умовах, коли за виділеними групами буде розрахований комплекс найбільш суттєвих статистичних показників, що характеризують основні сторони та взаємозв'язки досліджуваних явищ. Відбір показників здійснюється з урахуванням теоретичних положень окремих наук, що розкривають якісні особливості суті досліджуваних процесів, а також з урахуванням вимог статистичної науки, що потребує наявності досить великої чисельності одиниць спостереження в групах та застосування найбільш істотної форми показників. Важливим моментом у практичному використанні результатів груп слід вважати процес перевірки на достовірність. Це питання вимагає детального розгляду окремо.

На початковому етапі здійснення статистичних угруповань перевіряють "сумнівні" варіанти на належність їх до ряду розподілу. З цією метою використовують т-критерій. Так, як розрахувати величину рівновеликого інтервалу, попередньо оцінюються крайні варіанти ранжированного низки розподілу на належність до останнього. Критерієм належності сумнівних варіант у досліджуваній сукупності виступає стандартизоване відхилення значень сумнівних варіант (це, як правило, мінімальна та максимальна та близькі до них варіанти) від середньої. Розмір станного відхилення не повинен перевищувати число 3, тобто:

де т – критерій приналежності; . Хі - максимальне та мінімальне значення групувальної ознаки; в * – середнє квадратичне відхилення

Розглянемо розрахунок названого критерію на прикладі вибіркової сукупності показників середньоденної зарплати, наведеної вище, 8 визначимо належність максимальної (42,7) та мінімальної (16,5) варіанти цієї сукупності (табл. 8). За даними робочої таблиці 8, обчислюємо х і *

. Розрахунок г - критерію щодо вибіркової сукупності показників денної