Плюси та мінуси стратифікованого відбору Стратифікована вибірка у будь-якому випадку виявляється

Однак стратифікована вибірка може бути застосована лише за наявності додаткової інформації про генеральну сукупність (наприклад, нам необхідне відсоткове співвідношення чоловіків та жінок, якщо ми хочемо стратифікувати вибірку за статтю). Відсутність такої інформації робить застосування стратифікованої вибірки неможливим. Ще одна вада стратифікованого відбору – це можливість систематичної помилки. Далі на прикладах спробуємо проілюструвати різні засоби застосування стратифікованої вибірки.

Приклад: [6, 41] Візьмемо знову дані про доходи з таблиці 1. Тільки тепер із цього ж масиву зробимо не випадкову, а стратифіковану вибірку із чотирьох осіб.

Для можливості проведення стратифікованої вибірки зробимо припущення, що з попереднього перепису ми знаємо доходи респондентів за попередній період і маємо підстави припускати, що до цього періоду вони не змінилися або пропорційно змінилися.

З цих даних можна стратифікувати генеральну сукупність з доходу. Результати цього поділу представлені у таблиці 12.

Розподіл респондентів за стратами. № групи. Респонденти, які потрапили до групи. 1. A, J, D. 2. L, G, F. 3. I,H,C. 4. E,K,B.

Тут у кожній групі (або страті) знаходяться люди з максимально близькими доходами. Необхідні нам чотири особи ми відбираємо шляхом випадкового відбору однієї людини з кожної групи (тобто проводимо пропорційну вибірку).

У результаті отримуємо цілком репрезентативну за доходом вибірку, т.к. у нашій вибірці будуть у потрібній пропорції представлені люди з різним матеріальним статком.

Понад те, подібний відбір є надійніше випадкового, т.к. при такому відборі неможе бути обрані «погані» вибірки, тобто. вибірки, які містять лише бідних чи багатих (наприклад, ADJL чи BCEK). Однак стратифікована вибірка не завжди приносить користь, що показано в наступному прикладі.

Приклад:[6, 42] Припустимо, що ми знову постала необхідність провести стратифіковану вибірку з респондентів, поданих у таблиці 1. Далі припустимо, що у період між переписом і опитуванням доходи респондентів зазнали значних змін, то виділені нами групи з урахуванням даних перепису можуть вийти не гомогенними (в одну страту потраплять люди з різними доходами). Наприклад, такими, що представлені в таблиці 13.

Розподіл респондентів за стратами. № групи. Респонденти, які потрапили до групи. 1. A,F,C. 2. L, J, D. 3. K,E,G. 4. H,B,I.

І тут практично ніякої вигоди проти власно-випадковою вибіркою стратифікований відбір не принесе, т.к.

Приклад:[6, 42-46] Тепер розглянемо випадок із неоднорідною генеральною сукупністю, тобто. сукупністю, у якій існують окремі різкі відхилення середньої тенденції. Наприклад, генеральна сукупність, подана у таблиці 1, буде неоднорідною, якщо, наприклад, респондент B замість доходу 6300 отримуватиме дохід 20000.

Стратифікувати у разі можна двома шляхами: оскільки було стратифіковано у таблиці 12 і оскільки це зроблено у таблиці 14.

Розподіл респондентів за стратами. № групи. Респонденти, які потрапили до групи. 1. A,J,D,L. 2. G, F, I, H. 3. C,E,K. 4. B.

У першому випадку, як було зазначено, було проведено пропорційний відбір, а разі - відповідно непропорційний. Пропорційний відбір у разі (у разі неоднорідної генеральної сукупністю) негодиться, т.к. він не забезпечить однорідність страт (в яку страту не потрапив B, ця страта відразу ж стане неоднорідною).

Проте за непропорційному доборі порушується принцип рівної ймовірності потрапляння у вибірку, т.к. респондент B потрапляє в нашу вибірку за будь-якого результату.

Для виправлення цієї обставини за непропорційного відбору застосовується процедура зважування. Зважування покликане «відновити» Зважуванням ми збільшуємо питому вагу респондентів із великих страт. Для нашого прикладу середня розраховуватиметься

Якщо відібрати всі можливі вибірки при даній стратифікації (таб. 14), без зважування ми отримаємо зміщену вибіркову оцінку (генеральна середня = 3817, а вибіркова середня = 6852). Однак якщо зробити зважування, то в даному випадку непропорційний відбір (стандартне відхилення = 277) буде ефективнішим за пропорційне (стандартне відхилення = 1878).

Розглянемо далі розглянутий вище приклад із мікрорайонами. Вирішення проблеми може полягати у збільшенні обсягу вибірки або у проведенні випадкового опитування. Але останнє може призвести до деяких спотворень та неточностей, т.к. мікрорайони відрізняються також між собою. Перше пов'язане з додатковими витратами.

Тут нам допоможе може прийти стратифікована вибірка. Її можна здійснити, якщо нам вдасться об'єднати кілька мікрорайонів як подібні. Розділивши всі мікрорайони на кілька відносно однорідних груп, можна збудувати репрезентативну вибірку, не збільшуючи її обсяг.

Стратифікована вибірка допоможе нам і тоді, коли немає повного списку мешканців міста. В цьому випадку можна з кожної страти вибрати один мікрорайон, в якому проводитиметься опитування, та зібрати інформацію про його мешканців.

Однак якщоми неправильно виберемо критерії для об'єднання мікрорайонів, це призведе до серйозної систематичної помилки.