Кількісні методи аналізу господарської діяльності - Річард Томас - Стор 4
Цес вибору між двома підприємствами стає складнішим. Найбільш амбітні працівники віддадуть перевагу роботі на підприємстві А, а низькооплачувані працівники — на підприємстві Б.
Понеділкова заробітна плата
Мал. 1.19. Порівняння середніх
Понеділкова заробітна плата
Мал. 1.20. Порівняння підприємств
Даний приклад ілюструє ситуацію, коли середні не дають повної картини: крім показників середнього значення корисно отримати дані з розкиду у двох наборах даних. У цьому розділі ми розглянемо деякі заходи розкиду, які можна використовувати з цією метою.
1.8.1. Розмах варіації
Розмах варіації - це найпростіший захід розкиду набору даних. Розмах варіації — проміжок між найбільшим та найменшим значеннями розподілу. На наступних прикладах ви познайомитеся з порядком розрахунку розмаху варіації.
Т Визначення. Розмах варіації — це простий захід варіації, який обчислюється шляхом віднімання найменшого значення в наборі даних з найбільшого. •
Знайдемо розмах варіації виходячи з значень тижневого доходу невеликого роздрібного підприємства протягом останніх десять тижнів. (Дані наведені в тис. ф. ст.)
12, 20, 15, 8, 5, 14, 22, 13, 10, 17.
Щоб отримати розмах варіації, необхідно знайти найбільше та найменше значення у послідовності даних. Такими в даному прикладі є цифри 22 (максимальне значення) та 5 (мінімальне значення). Отже, розмах варіації розраховується так:
Розмах варіації = 22 - 5 = 17.
Отже, цих даних розмах варіації становить 17 000 ф. ст.
У таблиці наведено дані щодо кількостівідсутні на роботі за останні 50 днів:
Згідно з цією таблицею, найбільша кількість відсутніх за день становила 10 осіб, а найменша — 3 особи. Таким чином, розмах варіації дорівнює 10 - 3 = 7 осіб.
У таблиці наведено дані обсягу виробництва невеликого підприємства з виробництва електроніки за період 40 тижнів:
Згідно з цією таблицею, найбільше можливе значення знаходиться нижче 44 000 дол. США (при припущенні, що інтервали фупування мають однакову довжину). Аналогічно, найменше можливе значення становить 20 000 дол. Звідси для цих даних розмах варіації дорівнює 44 000 - 20 000 = 24 000 дол.
1.8.2. Міжквартильний розмах
Розмах, описаний у попередньому розділі, має низку недоліків. В цілому, розмах не можна задовільно застосовувати при порівнянні наборів даних, оскільки він може бути легко спотворений екстремальними окремими значеннями. Наприклад, у наступній таблиці наведено дані щодо тижневої заробітної плати 100 працівників підприємств А та Б відповідно:
працівників: підпр. А:
Розмах для кожного набору даних складає відповідно:
для підприємства А розмах = 1000 - 200 = 800 ф. ст. для підприємства Б розмах = 600 - 200 = 400 ф. ст.
Як видно, варіація згідно з розмахом для підприємства А в два рази більша від варіації для підприємства Б. Однак при дослідженні вихідних таблиць частот цю різницю можна віднести на рахунок єдиного працівника, одержую-
ного в інтервалі 900—1000, порівняно з ще одним працівником підприємства Б, який отримує в інтервалі 500—600. Таким чином, одне екстремальне значення повністю спотворило значення розмаху. Тому цей розмах не варто покладатися при проведенні прийнятного порівняння наборівданих. Отже, потрібен альтернативний спосіб визначення величини варіації. Для цього прийнятною величиною вважається значення міжквартильного розмаху. Міжквартильний розмах отримують шляхом виняткового розгляду «розмаху» для центральних 50% значень набору даних. На рис. 1.21 наведено розподіл набору даних. Якщо ми опустимо 25% найменших значень і 25% найбільших, тоді ми отримаємо, як це показано на малюнку, розмах, що включає центральні 50% значень, тобто міжквартильний розмах. Два крайніх значення із центральних 50% називаються квартилями. Міжквар тильний розмах (IQR) — відстань між меншою квартиллю (Q^) і більшою квартиллю (Qi), як це показано на малюнку. Квартілі можна отримати багато в чому аналогічно до того, як ми визначали медіану раніше. Адже медіана — це середина розподілу і є [(і + 1)/2] порядковим значенням.
Мал. 1.21. Розрахунок міжквартильного розмаху
Аналогічно, менша квартиль знаходиться на відстані 1/4 від початку розподілу, а велика квартиль - на відстані 3/4. Таким чином, ці квартілі можна розрахувати так:
Найменша квартиль, 0,
п + \ -е порядкове значення;
• Визначення. Міжквартильний розмах – це різниця між більшою меншою квартилями. Це значення показує розмах для центральних даних. •
У наступних прикладах розглянемо порядок розрахунку міжквартильного розмаху.
У таблиці наведено дані довільної вибірки з 15 акцій, що котируються на Лондонській фондовій біржі: