Що таке регресія до середнього - Логістика у питаннях та відповідях

логістика
Чи вірите ви у те, що після великого везіння завжди настає смуга невдач? Наприклад, якщо сьогодні у покері вам прийшов справді сильний розклад, то завтра вас ігноруватиме навіть апарат з видачі бахіл. А може ви думаєте, що ваш талант до випилювання лобзиком чи ваша неземна краса обов'язково маємо передатися у спадок вашим дітям? Якщо ви у цьому впевнені, то статистика висловлюється з цього питання більш стримано. Пояснити подібні явища допоможе статистичний принцип під назвою регресія до середнього. Його ігнорування може призвести, як мінімум, до поганого настрою, а як максимум – до повного розчарування у своєму житті. Насправді, ідея дуже проста. Розберемо її.

Талановитість чи геніальність, велике везіння, провал чи інше екстраординарне явище зустрічаються вкрай рідко, тобто ймовірність їх виникнення надзвичайно мала. Імовірність повторення такої рідкісної події буде ще меншою, оскільки для її знаходження використовується множення ймовірностей. Таким чином, після будь-якої екстремальної події (поганої чи доброї) все повертається на круги своя. Тут дуже важливий момент – життя не компенсує ваші невдачі чи перемоги, просто ваші показники везіння спрямовуються до своїх середніх значень. Це і є регресія до середнього (від лат. Regressio - зворотний рух). Те саме відбувається і при зміні поколінь. Ваші діти обов'язково будуть талановиті, але найімовірніше в іншій області.

Вперше поняття регресії запровадив сер Френсіс Гальтон, англійський дослідник широкого профілю. На його рахунку ще одне основне поняття статистики – кореляція. Вивчаючи спадковість, Гальтон вимірював у своїх співвітчизників все, що можна було виміряти: голови, носи,руки, кількість метушливих рухів, ступінь привабливості тощо. Гальтон вважав, що характер людини, її розумові здібності та талант також визначаються спадковістю та підпорядковуються принципу нормального розподілу.

В одній своїй роботі він намагався знайти зв'язок між зростанням батьків та зростанням їхніх дітей. Залежність очевидна – високі батьки народжують високих дітей і навпаки. Але Гальтон, крім того, виявив також не зовсім логічні закономірності. Наприклад, він виявив, що у батьків із зростанням вище за середнє були високі діти, але вони були не такими високими, як їхні батьки. А у батьків із зростанням нижче середнього діти були низькі, але не нижчі за своїх батьків. Це означає, що зростання вже дорослих дітей відхиляється меншою мірою від середнього значення, ніж зростання батьків. Тобто нащадки сильніше «регресують» до середнього. Взагалі Гальтон назвав це явище "регресією до посередності", що більш точно відображає сенс, ІМХО.

Гальтон побудував графік, що нагадує сучасну діаграму розсіювання.

середнього
Він розбив людей по групах залежно від їхнього зростання (у дюймах), для кожної групи розрахував середнє арифметичне і відзначив ці значення на графіку. Далі Гальтон апроксимував ці точки та побудував прямі, так звані лінії регресії. Гальтон навіть розрахував коефіцієнт кореляції – 2/3. Це означає, що лише на 67% зростання дітей визначається зростанням батьків. На графіку підписано: “Коли середнє зростання батьків більше середнього з популяції, діти виявляють тенденцію бути нижчою за своїх батьків. І навпаки, коли середнє зростання батьків менше середнього з популяції, діти виявляють тенденцію бути вищими за своїх батьків”.

Хоча зараз висновки та ідеї Гальтона не критикують, а м'яко ставлять під сумнів, вони маютьреволюційне значення статистики. Завдяки цьому різнобічному вченому нині широко використовуються регресійний та кореляційний аналізи.

Нижче нами побудована діаграма розсіювання (вона точкова діаграма) для даних, зібраних Гальтоном. У 1886 році він представив табличку, де було вказано зростання 928 вже дорослих дітей та зростання їх 205 батьків (середньозважене значення зростання батька та матері). З того часу ці дані часто використовують як чудовий приклад регресії до середнього.

регресія