Метод Каплана-Мейєра - Чинники, що впливають на тривалість безробіття
Метод Каплана-Мейєра є непараметричним методом, який використовується для оцінки ймовірності виживання до заданих моментів часу. Велика перевага методу Каплана-Мейєра полягає в тому, що він справляється із цензурованими даними. Графік оцінки Каплана-Мейєра являє собою спадну ступінчасту лінію, оскільки значення функції між точками спостережень передбачаються рівними константі. Цей метод може бути використаний, якщо виконуються шість основних припущень.
1.4.1 Основні передумови використання
Метод Каплана-Мейєра може бути використаний, якщо виконуються шість основних припущень (Kaplan-Meier using SPSS Statistics, n.d.).
Припущення №1. Статус події повинен складатися з двох станів, що взаємно виключаються: «подія» і «неповна (цензурована) подія». З іншого боку, має спостерігатися повна група подій, тобто. неодмінно має відбутися хоча б одна з подій.
Припущення №3. Лівостороннє цензурування має бути представлене в мінімальному обсязі, а краще, щоб його взагалі не було. Лівостороннє цензурування відбувається, коли невідомий момент початку експерименту, що часто трапляється в медичних дослідженнях, тому що не можна з упевненістю сказати, коли певне захворювання почало розвиватися в організмі людини. У нашому дослідженні ж момент початку експерименту - становлення індивіда безробітним, і проблема з початком відліку зустрічається вкрай рідко, т.к. майже завжди індивіди можуть точно сказати, коли вони стали безробітними.
Припущення №4. Незалежність цензурування та події. Це припущення передбачає те, що причина позначення події як цензурована не повинна бути пов'язана абоблизька до події, що цікавить дослідника. Тобто дослідник має бути впевнений, що позначення спостереження як цензуроване відбувається не тому, що відповідний респондент мав більший ризик настання події. Проте спостереження може стати цензурованим з таких причин: 1) респондент відмовився від подальшої участі в експерименті або більше не зміг брати в ньому участь (наприклад, переїхав до іншого міста). 2) якщо цікава подія не настала до кінця експерименту. Дане припущення надзвичайно важливо, оскільки метод Каплана-Мейєра передбачає, що цензуровані спостереження поводяться так само, як і нецензуровані. Загалом, не можна цензурувати подію з причин близьких до події, що цікавить. Наприклад, у нашому дослідженні індивід не повинен бути помічений як цензуроване спостереження, якщо, будучи безробітним, він отримав півроку виправних робіт.
Припущення №5. Не повинні спостерігатися довгострокові тренди. Багато досліджень, що застосовують аналіз виживання, характеризуються тим, що: 1) період між початком і кінцем експерименту занадто великий; 2) момент початку експерименту всім подій різниться (у разі це означає, що дата початку періоду безробіття індивідуальна кожному за респондента). Проте, у таких дослідженнях точка початку відліку передбачається єдиною всім спостережень (початковий час ). Однак якщо з часом фактори сильно змінилися, що могло вплинути на ймовірність настання події, що цікавить, то оцінки будуть сильно зміщені. Наприклад, якщо за аналізований період розмір допомоги по безробіттю зріс у кілька разів, то включення до дослідження всіх періодів безробіття, зареєстрованих за період, що розглядається, може такожпризвести до зміщених результатів (оскільки збільшення розміру допомоги по безробіттю часто призводить до зростання середньої тривалості безробіття).
Припущення 6. У кожній досліджуваній підвиборці частка цензурованих спостережень повинна бути приблизно однакова. Це потрібно при порівнянні функцій виживання для двох різних груп допомогою, наприклад, log-rank тесту. Недотримання цієї умови може спричинити помилки першого і другого роду. Дане припущення перевіряється у п. 3.2.
1.4.2 Застосування методу Каплана-Мейєра для оцінки функції виживання
Припустимо, що дослідник має вибіркою з незалежних спостережень, де кожне спостереження позначається змінна, що містить у собі тривалості перебування у стані безробіття кожному за респондента, а індикатор цензурування. Припустимо також, що з спостережень існує випадків настання певного події (у разі - знаходження нового місця роботи). Упорядкуємо тривалість безробіття за зростанням. Позначимо за кількість респондентів «під ризиком» у час , тобто. число тривалостей безробіття, які тривали не менше, ніж . За позначимо кількість об'єктів, котрим цікава подія настала у цей час часу, тобто. число респондентів, які знайшли роботу на момент часу . Тоді оцінка Каплана-Мейєра обчислюється за формулою (Hosmer Jr & Lemeshow, 1999):
за умови, що
Зауважимо, що слід перемножувати значення лише тих моментів часу, котрим , тобто. коли спостерігався хоча б один результат, тому що якщо , то .
Практично завжди на додаток до оцінки Каплана-Мейєра дослідники будують довірчий інтервал виживання. Довірчий інтервал виживання розраховується за наступноюформулі:
де стандартна помилка виживання, а – квантиль нормального розподілу. Зазвичай прийнято будувати 95% довірчий інтервал, тобто вважати.
Стандартна помилка виживання розраховується за формулою Грінвуда:
Загалом оцінка Каплана-Мейєра застосовується для оцінки закону розподілу ймовірностей і є деяким аналогом емпіричної функції розподілу стосовно неповних даних.
1.4.3 Огляд статистичних методів порівняння кривих виживання
Метод Каплана-Мейєра дозволяє досліднику побудувати криві виживання для груп фактора, але візуально оцінити, чи важлива різниця між ними, не завжди можливо. Внаслідок цього необхідно звертатися до статистичних тестів. Існує кілька тестів для перевірки ідентичності кривих виживання, найпоширеніші з них – логранговий критерій Кохрана-Мантеля-Гензеля, тест Вілкоксона для цензурованих даних та тест Тарона-Уера. Всі три тести засновані на порівнянні зваженої різниці між спостеріганими та очікуваними частотами в кожний момент часу, і відрізняються лише методом надання ваги спостереженням. У багатьох джерелах говориться про те, що практично всі три тести покажуть один і той же результат, проте, для кожного типу даних краще визначити найбільш підходящий, адже покладатися на тест, який показав найменше p-значення «непрофесійно» (“Kaplan -Meier using SPSS Statistics,” n.d.).
Логранговий критерій є найбільш сильним, коли відношення шансів є постійним (спостерігаються пропорційні ризики) протягом певного періоду часу. Перевірити припущення про пропорційні ризики можна візуально - досить подивитися, чи криві виживання перетинаються. Якщо вони перетинаються, то ризикинепропорційні. Логранговий критерій кращий за інших, якщо дослідник надає більшої ваги пізнішим спостереженням. Критерії Уілкоксона слід застосовувати в протилежному випадку - якщо більшу вагу слід накласти на більш ранні спостереження, так як вага дорівнює кількості об'єктів, схильних до ризику в кожний момент часу. Тест Тарона-Уера є чимось середнім між двома згаданими тестами, оскільки вага в цьому тесті визначається як квадратний корінь із кількості спостережень, підтверджених ризиком у кожний момент часу.
Проте, основний недолік всіх перерахованих тестів у тому, що тести дуже добре справляються з ситуаціями, коли криві виживання перетинаються. Флемінг, Харрінгтон і О'Салліван (Fleming, Harrington, & O'sullivan, 1987) запропонували тест, який вирішує цю проблему шляхом використання в якості тестової статистики максимальну різницю між цими двома функціями виживання. Однак цей тест не представлений в жодному статистичному пакеті.