Використання методу Бутстреп (Bootstrap) у статистиці для оцінки біоеквівалентності двох

Запрошуємо на чергове засідання гуртка епідмоделювання!

З доповіддю виступитьзавідувач лабораторії доказової медицини та біостатистики Наукового центру психічного здоров'я, к.б.н., Анатолій Никифорович Симонов.

Пропоноване повідомлення у форматі презентації буде присвячене практичному застосуванню методу бутстрепу на прикладі побудови довірчих інтервалів бутстрепівських для деяких медико-біологічних показників.

Аналіз літератури показує, що переваги бутстрепу перекривають його недоліки, про що свідчить широке використання бутстрепу у тому числі й у клінічних дослідженнях. Найчастіше метод бутстрепу використовується у фармакокінетиці [4,5,6], а US FDA навіть рекомендує використання бутстрепу для офіційної оцінки біоеквівалентності двох препаратів [7].

В останні роки у зв'язку з появою потужних комп'ютерів отримали бурхливий розвиток нові статистичні методи під загальною назвою ресемплінг (resampling) або методи взяття повторних вибірок [1]. Існує навіть думка серед деяких статистиків, що ресемплінг процедури незабаром витіснять загальноприйняті непараметричні процедури і можуть замінити багато параметричних методів [2].

Методи ресемплінгу включають три основні підходи, що відрізняються за технікою, але близьких по суті: метод «складного ножа» (jackknife), метод «рандомізації» і найпопулярніший - метод бутстреп (bootstrap). Всі ці підходи засновані на тому, що отримана експериментальна вибірка розглядається як би генеральною сукупністю і вже з неї вилучаються випадковим чином нові вибірки (з поверненням або без повернення), на основі яких розраховують тічи інші статистики.

Вибірки бутстрепу генеруються в такий спосіб. З вихідних даних одержують колосальну кількість копій, скажімо, мільярд, і ці копії ретельно перемішують. Далі з мільярда отриманих копій отримують випадковим чином вибірки вихідного обсягу, і для кожної такої вибірки підраховується статистика, що цікавить: середнє, медіана, дисперсія і т.д.

Отримані у такий спосіб вибірки називаються вибірками бутстрепу. З розподілом розрахованих статистик для вибірок бутстрепу можна поводитися як і, як і це було розподіл реальних вибірок: воно оцінює статистичної достовірності значень бутстреп-статистик.

Дослідження, проведені рядом вчених: Р. Біраном, П. Бікелом та Д. Фрідманом з Каліфорнійського університету в Берклі, а також Сінгхом з Ратгерського університету та Б. Ефроном зі Станфордського університету, показали, що для багатьох статистичних характеристик ширина інтервалу, що відповідає розподілу бутстре , і ширина інтервалу, що відповідає реальному розподілу, як правило, збігаються [3] Виходить, що з інформації про одну вибірку можна отримати цілком задовільну апроксимацію параметрів для всіх реальних вибірок того ж обсягу. Це щось на зразок статистичного аналога голограми - образу світлових хвиль, що застигли на поверхні. Об'ємний образ, що послужив джерелом цих хвиль, може бути у всіх подробицях відновлено по всій поверхні голограми, але навіть якщо голограму розбити на фрагменти, об'єкт можна відновити по будь-якому фрагменту. Однак виявляється, що не всяка вибірка подібна до фрагмента голограми: хороші якості бутстрепу - це лише хороші якості в середньому. Подібно до будь-якої іншої статистичної процедури, бутстреп буде вводити впомилка для невеликого відсотка можливих вибірок.