Невибіркові помилки в обстеженнях підприємств
Для забезпечення якості вибіркових обстежень не менш важливе значення має запобігання та зменшення невиборчих обстежень.
Як уже зазначалося,невибіркові помилки -це похибки, які виникають з причин, які не пов'язані з випадковим відбором одиниць для обстеження, зокрема, через недоліки основи вибірки, наявність невідповідей, навмисне чи ненавмисне спотворення даних статистиком або респондентом, невдалі формулювання питань в анкеті та пояснення в інструкції щодо її заповнення, неправильну організацію обстеження, недоліки введення, передача, редагування та кодування даних тощо.
Однією з найпоширеніших видів невиборчих похибок є похибки охоплення і похибки, викликані відсутніми відповідями.Розрізняють три типи похибок охоплення:
- недоохоплення:коли не всі одиниці цільової сукупності присутні у вибірці;
- надохоплення:коли в основі вибірки є такі одиниці, які не належать до цільової сукупності;
- подвійний облік:коли одиниці цільової сукупності представлені в основі два і більше разів.
Недоохоплення є найбільш серйозним типом похибки охоплення, що тягне за собою зсув вибіркових оцінок. Виявити недоохоплення можна, наприклад, виявивши підприємства, яких немає у вибірці структурного обстеження, але вони є у фінансовій звітності.
Однією із суттєвих причин виникнення похибок у вибіркових обстеженнях за діяльністю підприємств, а відповідно – розбіжностей між їх характеристиками генеральної та вибіркової сукупностей, є відсутність чи неповнота відповідей респондентів. За висновкамиспеціалістів [стара 74-76], причинами відсутності відповідей можуть бути:
- підприємство ліквідоване чи перебуває на стадії ліквідації;
- підприємство реорганізовано шляхом приєднання до головного або здало звіт за іншою формою як структурна одиниця більшого підприємства;
- на підприємство поширюється спрощена система оподаткування;
- звіт не подано через відсутність бухгалтера чи директора. Причинами неповних відповідей є помилки при збиранні первинних статистичних даних чи неякісність матеріалу (анкет тощо), недбалість, а також незнання, нездатність чи небажання респондентів відповідати на деякі питання обстеження.
Виправити ситуацію через відсутність відповідей допоможуть такі методичні кроки [74]:
- Визначення видів відсутніх відповідей підприємств;
- Класифікація методів обробки матеріалів з відсутніми відповідями;
- агрегований контроль якості обробки даних за відсутності відповідей респондентів (часткової та повної);
- Розрахунок похибки оцінки з урахуванням результатів обробки матеріалів із відсутніми відповідями.
Розрізняють два види перепусток даних.
Якщо у бланку анкети відсутні будь-які результати обстеження одиниці спостереження, маємо справу з повною відсутністю відповіді.
Якщо дані відсутні лише за деякими пунктами анкети, - це неповна відповідь. Неповними відповідями вважаються також помилкові та невизначені відповіді, внесені до бланку анкети через нерозуміння питання, неточності чи просто неуважність.
В обох випадках перепустки можуть бути як випадковими, так і невипадковими. Можна припустити, що відсутність відповіді здебільшого не є випадковою.
У табл. 3.6 наведено зведені дані про причини невідповідей таїх рівні у вибіркових обстеженнях малих підприємств у 2008 році.
Таблиця 3.6. уРівні невідповідей за причинами у вибірковому обстеженні малих підприємств в Україні
Причина
Рівень невідповідей, %
Ліквідовано (або на стадії ліквідації)
Визнано банкрутом (або порушено справу про визнання банкрутом)
Не відповідає умовам відбору (фермерське господарство з чисельністю менше 50 осіб, зміна ОПФГ, перетворена на філію або відокремлений підрозділ)
Категорична відмова звітувати
Відмова звітувати (зупинена діяльність, новостворене підприємство) та має найманих працівників або здійснювало реалізацію продукції (робіт, послуг)
Відмова звітувати (зупинена діяльність, новостворене підприємство) та не має найманих працівників або не здійснювало реалізацію продукції (робіт, послуг)
Рівні відповідей (аналогічно до рівня невідповідей) відповідно бувають такими:
- рівень повних відповідей:відношення кількості одиниць, які мають дані за всіма ознаками, до загальної кількості одиниць, що мали обстежуватися;
- рівень часткових відповідей:відношення кількості одиниць, для яких дані є принаймні за декількома ознаками, до загальної кількості одиниць, що мали обстежуватися.
Існують три підходи до проблем обробки матеріалів через відсутність відповідей.
Перший підхід– ігнорування пропущених даних. Пропущені значення позначають як немає відповіді і роботу проводять тільки з повними даними. Такий підхід застосовують, якщо кількість відсутніх відповідей у файлі даних обстеження незначна.
Другий підхід- обробка пропущених даних на стадії оцінки. Як правило, застосовується довипадки повної відсутності відповідей.
Перший спосіб- перезваження, що може виконуватися на різних рівнях: страта, область, одиниця спостереження. Основна ідея - збільшення ваги респондентів, які відповіли, для обліку відсутніх відповідей.
Другий метод -вирівнювання, використовується тільки в тому випадку, коли доступна додаткова (допоміжна) інформація із зовнішніх джерел.
Третій підхід -заповнення перепусток значеннями показників на стадії редагування даних, перед стадією оцінки. Рекомендується застосовувати тоді, коли відповіді неповні. Однак на практиці буває краще використовувати метод заповнення, ніж перезваження, та за повною відсутністю відповідей, особливо якщо існує додаткова інформація.
Детермінантніметоди передбачають внесення точних значень. До них відносяться:
- Заповнення з відбором (h-t deck): послідовним, випадковим, найближчого сусіда;
- Заповнення без відбору;
- Заповнення по регресії та ставленням;
- методи багаторазового наповнення.
стохастичнихвідносяться методи, в яких значення, що вноситься, може бути визначене з деяким ступенем випадковості:
- Заповнення методом випадкового відбору;
- методом випадкового відбору у класах;
- стохастичне заповнення з регресії.
Методи заповнення можуть бути застосовані до всієї множини даних або незалежно всередині класів, причому класи будуються на підставі змінних, які є однорідними всередині класів.
Окремо можна відзначити метод обробки перепусток на етапі збору даних при обстеженні, що відноситься до методів заповнення. Він полягає у заміні об'єкта, що не відповів, іншим об'єктом, не включеним у вибірку. Бо ті, хто даєвідповіді можуть систематично відрізнятися від тих, кого не вдається опитати, то одержувану вибірку неправильно розглядати як повну.
При обробці матеріалів за повної відсутності відповідей сукупність підприємств поділяють на три групи:
- підприємства, які припинили (зупинили) діяльність або виходять за межі обстеження;
- Активні підприємства (що здійснюють діяльність);
- підприємства, положення про які не вдалося отримати достовірну інформацію.
Дані підприємств першої групи не відновлюються, а підприємств другої та третьої груп обробляються по-різному (з огляду на те, що підприємства третьої групи можуть також не здійснювати економічну діяльність).
Два найпоширеніші методи обробки за повної відсутності відповідей - це: заповнення випадковим підбором і переважування.
Обробляти неповні відповіді технологічно складно, тому зазвичай виділяють обмежену кількість ознак (2-5), які становлять основний інтерес для обстеження, щодо яких ідентифікують і відновлюють неповні відповіді.
Для обробки неповних відповідей доцільно застосовувати детермінантні методи, якщо це можливо. Для цього необхідно або передбачати надмірну інформацію у банку обстеження, або мати якісну інформацію з інших джерел.
Заповнення з відбором (h-t deck) є основним методом автоматичної обробки неповних відповідей. Також застосовується метод заповнення за регресією. Метод перезважування застосовується рідко, оскільки потребує розрахунку великої кількості вагових коефіцієнтів.
У цілому в процесі обробки даних вибіркових обстежень виділяють такі етапи:
- Виправлення індивідуальних даних;
-відновлення даних (за відсутності відповідей);
- Розповсюдження результатів обстеження на всю сукупність.Агрегований контроль- це етап обробки даних, проведений перед етапом екстраполяції, наприкінці індивідуальної обробки даних підприємства. Він здійснюється автоматично та призначений для виявлення нетипових одиниць обстеження (аномалій), їх впливу на кінцеві результати, а також контролю якості обробки відповідей респондентів.
Аналіз ґрунтується на попередньо визначеному стандарті чи критерії, від якого відхиляються деякі параметри певного підприємства.
Результатом роботи є перелік нетипових підприємств, що передається менеджеру обстеження для подальшого виправлення або підтвердження.