4.2.3. Інтервальна шкала

Вимірювання інтервального та пропорційного рівня рідко аналізуються за допомогою прямої вказівки частот чи відсоткових відносин. На відміну від номінальних або рангових вимірювань значення змінних, що вимірюються за допомогою інтерваль-

Критеріями центральної тенденції для пропорційного та інтервального рівнів вимірювань виступають мода, медіана та середнє арифметичне. Середнє арифметичне є сумою значень змінної, розділену на число значень. Загальна формула для її обчислення алгебраїчно виглядає так

де X/ - числове значення /-й позиції, a N - загальна кількість спостережень (обсяг вибірки).

Розглянемо обчислення середньої арифметичної величини з прикладу розрахунку середньої відвідуваності занять у студентській групі за даними перевірок деканату. Дані про відвідуваність наведено у табл. 4.7.

Склавши числа у правій колонці і розділивши їх на 10 (число перевірок), ми отримаємо, що середня відвідуваність групи склала х = 18,6.

Зрозуміло, що отримане число — 18,6 студента — не може мати реального фізичного сенсу, воно придатне лише для порівняння між собою рівня відвідуваності у двох та більше групах. Хоча й цієї мети отримані середні величини спочатку слід нормувати, розділивши їх у загальну чисельність студентів кожної групи.

Середнє може виявитися оманливим показником центральної тенденції, якщо в обсязі вибіркової сукупності серед значень змінної, що цікавить нас, з'явиться якась екстремальна величина. Наприклад, середньодушові щомісячні доходи сімей у двох гіпотетичних громадах (скажімо, серед мешканців двох під'їздів одного будинку, кожен з яких налічує по 10 квар-

тир) ідентичні, крім доходу однієї сім'ї (табл. 4.8). Середньодушовий дохід сім'ї мешканців1-го під'їзду - 4230 руб. - Більш ніж удвічі перевищує середньодушовий дохід у 2-му під'їзді - 2050 руб. Саме розрахунок середнього доходу в кожному з під'їздів створює помилкове враження, що люди в 1-му під'їзді вдвічі багатші, ніж люди в 2-му під'їзді, тоді як насправді є лише одна сім'я в 1-му під'їзді, яка набагато багатша за будь-яку сім'ю з обох під'їздів. У цьому випадку медіана буде кращим показником центральної тенденції, ніж середня. Медіанний підхід дасть для обох під'їздів однаковий результат: 2100 руб. - Досить близький до середнього значення по 2-му під'їзду. Якщо середнє та медіана не подібні за своїм значенням, можна зробити висновок, що на значення середнього впливають одне або кілька екстремальних значень змінної, що вимірюється.

Таблиця 4.7 Відвідуваність занять студентами академічної групи Номер заняття Кількість присутніх 1 17 2 21 3 18 4 14 5 20 Номер заняття Кількість присутніх 6 20 7 16 8 17 9 21 10 22 Джерело: Гіпотетичні дані.

Таблиця 4.8 Середньодушові щомісячні доходи сімей у двох під'їздах будинку (руб.) Номер квартири 1-й під'їзд Номер квартири 2-й під'їзд 1 1000 11 1000 2 1000 12 1000 3 1000 13 1200 4 18 0 6 2200 16 2200 7 2500 17 2500 8 2800 18 2800 9 3000 19 3000 10 25 000 20 3000 Середнє 4230 Середнє 2050 Обчислення середньої арифметичної величини для змінних, значення яких а значень має свої особливості. Тут розраховується не середнє арифметичне, а середньозважене. Припустимо, що потрібно обчислити середній вік опитаних респондентів (табл. 4.9).

Спочатку ми маємо визначити середину кожного інтервалу; це виробляється шляхом обчислення простого середнього, тобто. сума крайніх значеньділиться навпіл. Потім необхідно помножити це значення на число респондентів відповідного віку, скласти отримані твори і розділити на загальний обсяг вибірки (див. табл. 4.9а).

Таблиця 4.9а Результат 2-го етапу обчислення середньовікової величини Вік, роки Частота Середина інтервалу Твір 18-24 46 21 966 25-29 55 27 1485 30-39 97 34,5 3346,5 45-49 50-59 74 54,5 4033 60-70 70 65 4550 Всього 457 I 19498 Джерело: Гіпотетичні дані.

Розділивши отриману суму на 457, ми отримаємо середній вік 42,6 року. Таким чином, формула для середньозваженого значення виглядає аналогічно співвідношенню (4.1) з урахуванням того, що X/ тут відноситься до середини інтервалу:

Показники розкиду даних інтервального або пропорційного рівня включають середнє відхилення, дисперсію та середнє неквадратичне відхилення. Середнє відхилення (MD) є мірою розкиду, засновану на відхиленні кожного зі значень від середнього. Приклад її обчислення наведено нижче, за даними табл. 4.10.

Распределение, отклонение и среднее распределение доходов среди жильцов подъезда № 2 Номер квартиры 2-й подъезд х-х \х-х\ 11 1000 -1050 1050 12 1000 -1050 1050 13 1200 -850 850 14 1800 -150 150 15 2000 -50 50 16 2200 50 50 17 2500 450 450 18 2800 750 750 19 3000 950 950 20 3000 950 950 Середнім чином відхилення виглядає:

де символ абсолютної величини (модуля).

Якщо ми беремо кожну позначку і віднімаємо з неї середнє, ми обчислюємо ту величину, на яку кожна з позначок (друга колонка) відрізняється від середнього (нижній осередок другої колонки). Сума цих відхилень завжди дорівнює нулю - важлива математична властивість середнього (перевірте це самі, склавшичисла у третій колонці). Оскільки ми цікавимося лише величиною відхилення, а чи не напрямом чи знаком його, то знаходимо абсолютні значення відхилення (четверта колонка). Потім ми 205

беремо їх суму і ділимо на число відміток, щоб знайти середнє відхилення відміток від середнього; отримуємо MD = 630. Чим більше середнє відхилення, тим більше розкид позначок навколо середнього.

Хоча середнє відхилення і виявляє розкид, частіше для його вимірювання використовуються дисперсія та середньоквадратичне відхилення.

Дисперсія є сумою квадратів відхилень від середнього, розділену на число позначок:

Середньоквадратичне відхилення являє собою квадратний корінь з дисперсії:

Чим більший розкид даних навколо середнього, тим вище значення ст2 і S. Це означає, що якщо всі дані однакові, то s2 і нульові Нравны.

Таким чином, для обчислення дисперсії та середньоквадратичного відхилення треба пройти послідовно сім етапів:

1) обчислити середнє;

2) обчислити різниці між середнім та кожним із значень;

3) звести у квадрат різниці, обчислені на етапі 2;

4) помножити квадрати різниць на частоти спостережень кожного зі значень;

5) підсумувати квадрати різниць, обчислені на етапі 4;

6) розділити суму квадратів, отриману на етапі 5, на N; це дорівнює дисперсії;

7) витягти квадратний корінь із числа, обчисленого на етапі 6; це дорівнює середньоквадратичному відхилення.

респонденту пропонується висловити своє ставлення до цікавого дослідника якості за сукупністю біполярних шкал (у разі дев'ятибальних). Одна з запропонованих для оцінки якостей мера — доступність — була виражена за допомогою такої шкали: 98 7 6 5 4 3 2 1Неприступний Результати в дослідженні розподілилися таким чином:

Розподіл оцінок якості «доступність» Оціночний бал Частота Немає відповіді 58 1 7 2 11 3 40 4 46 5 108 6 51 7 55 8 24 9 26 Всього 426 Відкинувши нулі (табл. 4.11), тобто. варіанти «немає відповіді» (після чого Зупиниться рівним 368), ми підраховуємо, що середнє значення оцінки (за формулою середньозваженого) становить:

Звернімо увагу: якби ми відкинули значення «немає відповіді», тобто. прийняли б цю позицію нуль як математичну величину, то отримали б середнє значення:

тобто. помітно менше, ніж розраховане нами. Воно більш точно в математичному сенсі, але спотворює соціологічний зміст, оскільки ті, хто не дали відповіді, зовсім не виставляли оцінку «0», вони просто не виставили жодної оцінки.

Розрахуємо відхилення від середнього та квадрат відхилення від середнього за кожним балом (табл. 4.12).

207 Зразок розрахунку Таблиця 4.12 х, (оціночний бал) (х,-х) (х,-х)' 1 -4,4 135,52 2 -3,4 127,16 3 -2,4 230,4 4 - 1,4 90,16 5 -0,4 17,28 6 0,6 18,36 7 1,6 140,8 8 2,6 162,24 9 3,6 336,96 Склавши числа крайньої правої колонки, ми отримаємо :

Що дає для аналізу даних знання дисперсії? Нагадаємо, що «дисперсія» (dispersion) англійською означає «розкидання, розсіювання»; у разі це розсіяння реально отриманих емпіричних даних навколо середнього значення. Залежно від того, наскільки велика (точніше, мала) дисперсія або середньоквадратичне відхилення, ми можемо судити, наскільки одностайні були у своїх оцінках респонденти (за меншого значення дисперсії), або навпаки — наскільки сильно вони розходяться у своїх думках (за більшого значення дисперсії) )19. Порівняємо, наприклад, розкид оцінок (за п'ятибальною шкалою: від 5 - дуже важливе, до 1 -важко відповісти), яку, в ході дослідження особливостей сексуальної поведінки, дали респонденти ступеня впливу на їхню «сексуальну освіту» різних джерел інформації (табл. 4.13):

Оцінка ступеня впливу різних джерел на поінформованість про сферу інтимних відносин (у середніх значеннях за 5-бальною шкалою)

З цієї таблиці крім відомостей про те, що максимальний вплив на поінформованість про найбільш інтимні сторони життя має сексуальний партнер, а найменше — педагоги, ми дізнаємося також, що з найбільшою одностайністю респонденти оцінили низький рівень впливу такого джерела, як педагоги, про що говорить мінімальне значення середньоквадратичного відхилення, а найбільшу розбіжність в оцінках викликало таке джерело, як чоловік/дружина, - максимальне значення S (що, можливо, пов'язане з великими відмінностями в індивідуальному досвіді).