Самовчитель з пакету STATISTICA
Дисперсія життя.
;Реєстраційний код (якщо є)
; Відкривати у новому вікні?
;Ім'я нового вікна
; Швидкість зміни (1-255)
; Зміна малюнків зі спецефектами ("YES" або "NO")
;Довільний малюнок поверх аплету
;X зміщення накладеного малюнка
;Y усунення накладеного малюнка
;Затримка звільнення пам'яті
;Пріоритет задачі (1..10)
; мін. час синхр. кадру (мс); Sorry, your browser doesn't support Java ; Повідомлення для браузерів без підтримки Java (tm) Клікніть по фотографії, і ви зможете .
Самовчитель з пакету STATISTICA
- Введення в аналіз виживання
- Таблиці часів життя
- Оцінки Каплана-Мейєра
- Порівняння виживання у групах
- Регресійні моделі в аналізі виживання
- Модель Коксу
- Експонентна регресія
- Нормальна та логнормальна регресія
- Огляд системи
- Альтернативні процедури
- Приклад 1. Таблиці часів життя
- Завдання параметрів аналізу
- Приклад 2. Регресійна модель Коксу
- Завдання параметрів аналізу
- Оцінювання параметрів
- Результати
Введення в аналіз виживання
Методи аналізу виживання інтенсивно застосовуються в медицині, біології, страхуванні та промисловості.
Однією з важливихПоказників, що описують перебіг хвороби, є тривалість життя пацієнтів з моменту надходження до клініки або після проведення операції.
В принципі, для опису середніх часів життя та порівняння нової методики зі старою можна використовувати стандартні статистичні методи.
Проте дані мають специфіку, яку слід враховувати. Справа в тому, що в медичній практиці ми часто маємо справу з неповними даними.
Це пов'язано з тим, що важко спостерігати весь час життя пацієнта після операції, оскільки пацієнта могли бути виписані або переведені в іншу клініку і зв'язок з ним був втрачений. При цьому ми маємо не повну інформацію про час життя пацієнта, а лише часткову.
Природне бажання дослідника використовувати всі дані, т. е. аналізувати як повні часи життя, і неповні, і втрачати важко зібрану інформацію.
Для цього і призначені методи аналізу виживання, які дають змогу вивчати неповні або цензуровані дані.
Спостереження, які містять неповну інформацію, називаються неповними або цензурованими (наприклад, «пацієнт А живий принаймні 4 місяці після того, як був переведений в іншу клініку і контакт з ним був втрачений»). Це приклад цензурованого спостереження: інформація про те, що пацієнт живий 4 місяці, важлива і може бути використана для побудови оцінок.
Спостереження від моменту операції до смерті називається повними.
Отже, в аналізі виживання розрізняють повні (англійською complete) і неповні, або цензуровані, спостереження (англійською censored).
Звичайно, можна було використовувати лише повні часи життя, але тоді ми мали б у своєму розпорядженні дуже мало спостережень і, відповідно, неточні оцінки.
Використання, поряд із повними спостереженнями, неповних чи цензурованих спостережень є головною особливістю методів аналізу виживання.
Таблиці часів життя
Насамперед, спробуємо оцінити ймовірність того, що пацієнт прожив більше t днів після операції. Це важливий показник, який називається функцією виживання.
Найбільш природний спосіб опису функції виживання полягає у побудові Таблиць часів життя.
Це один із найстаріших прийомів аналізу даних про виживання та традиційно використовується, наприклад, у страхуванні, де такі таблиці називаються таблицями дожиття.
Вихідний файл даних має вигляд:

Організація файлу така.
Восьма змінна AGE містить вік пацієнтів.
Змінні 9, 10 містять спеціальну медичну інформацію про особливості операції.
Значення змінної 11 – назва госпіталю, де зроблено операцію. Нижче показано таблицю життя цього файлу даних.

Звісно, подібну таблицю життя можна як «расцшренную» таблицю частот. Однак звичайна таблиця частот будується за повними спостереженнями. У таблиці життя враховано як повні, і неповні спостереження.
Ідея таблиць життя, або дожиття, у термінології страхування, проста. Нам потрібно вирахувати найпростіші статистики, щоб описати час виживання пацієнтів.
Для цього тимчасова вісь розбивається на кілька інтервалів. У наведеній вище таблиці це число дорівнює 12. У системі STATISTICA кількість інтервалів на часовій осі користувач може вибрати на власний розсуд.
Для кожного інтервалу обчислюється кількість об'єктів, які на початку розглянутого інтервалу були «живі» (див. відповідний стовпець в електронній таблиці — змінна ЧИСЛОНА ПОЧАТКУ), і кількість об'єктів, які «померли» в даному інтервалі (змінна ЛІК ПОМЕРШИХ).
Також обчислюється число цензурованих чи вилучених із спостереження об'єктів кожному інтервалі — змінна КІЛЬКІСТЬ вилучених (у таблицях життя вживають термін вилучені — withdrawn для цензурованих спостережень, у цьому прикладі це виписані хворі). Обчислюються частки цих об'єктів.
Для розуміння таблиць корисно пам'ятати, що на даному часовому інтервалі спостереження може бути або цензуроване (хворий виписаний або переведений в іншу клініку), або спостерігається фатальний результат.
Розглянемо формальніше змінні в електронній таблиці життя.
Це число об'єктів, які були «живі» на початку тимчасового інтервалу, що розглядається.
Це число цензурованих на даному інтервалі об'єктів (об'єктів, вилучених із
спостереження). Ці об'єкти мають позначку цензуровані (censored).
Це кількість об'єктів, які були «живі» на початку тимчасового інтервалу, що розглядається, мінус половина від числа вилучених.
Це кількість об'єктів, що померли на даному інтервалі. Померлі або об'єкти, що відмовили, зазвичай мають мітку complete.
Це відношення числа об'єктів, що померли у відповідному інтервалі, до об'єктів, що вивчаються на цьому інтервалі.
Прокрутимо електронну таблицю вправо і розглянемо змінні таблиці, що залишилися.

Ця частка дорівнює одиниці мінус частка померлих. Кумулятивна частка об'єктів, що вижили, або функція виживання Це оцінка функції виживання, тобто ймовірність того, що пацієнт переживе даний інтервал. Вона дорівнює добутку часток об'єктів, що вижили, за всіма попередніми інтервалами. Якщо подивитися на стовпець КУМ. ДОЛЯ ВИЖИВШ. наведеної вище таблиці, можна побачити, наприклад, що 0,582759= 0,672414 ×0,866667, 0,569514 = 0,582759×0,977273 і т.д.

Центр БІОСТАТИСТИКА виконує роботи зі статистичного аналізу експериментальних даних вже понад 30 років. У його складі дослідники України, США, Ізраїлю, Англії, Канади та інших країн. Послугами Центру користуються аспіранти та докторанти в галузі медицини, біології, соціології, психології тощо. Стандартні терміни аналізу даних: для статей та доповідей – 5-10 днів, для кандидатських дисертацій 1 місяць, для докторських дисертацій 1,5 місяця. (Див. далі)