Математика (стор

З-за великого обсягу цей матеріал розміщено на декількох сторінках: 1 2 3 4 5 6 7 8 9

математика

Угрупуваннямназивається процес упорядкування та систематизації даних, отриманих у ході проведення експерименту, спрямований на вилучення інформації, що міститься в них. У процесі угруповання здійснюється розподіл варіант вибірки за групами або інтервалами угруповання, кожен із яких містить певний діапазон значень досліджуваного ознаки. Процес угруповання починається з розбиття всього діапазону варіювання ознаки інтервали угруповання.

Для кожної конкретної мети статистичного дослідження, обсягу аналізованої вибірки та ступеня варіювання ознаки у ній існує оптимальне значення числа інтервалів та ширини кожного з них. Орієнтовне значення оптимального числа інтервалівkможе бути визначено, виходячи з обсягу вибіркипабо за допомогою даних, наведених у таблиці 3. або за допомогою формули Стерджесса:

Визначення кількості інтервалів угруповання

Об'єм вибіркиn

Число інтервалівk

Отримуване за формулою значенняkмайже завжди виявляється дробовою величиною, яку необхідно округлити до цілого числа, оскільки кількість інтервалів не може бути дробовим. Практика показує, що, як правило, краще округляти в меншу сторону, бо формула дає хороші результати при більших значенняхn, а за малих - трохи завищені.

Розглянемо угруповання варіант вибірки на конкретному прикладі. Для цього звернемося, наприклад, з штовхачами ядра (див. таблиці 1, 2). Визначення кількості інтервалів угруповання будемо проводити на основі даних, наведених у таблиці 3.обсяг вибіркиn=29 число інтервалів доцільно вибрати рівнимk=5 (формула Стерджесса дає значенняk=5,9).

Умовимося використовувати в прикладі інтервали рівної ширини. У цьому випадку після того, як кількість інтервалів угрупування визначено, слід обчислити ширину кожного з них за допомогою співвідношення:

.

Тутh- ширина інтервалів, ахmax іхmin - відповідно максимальне та мінімальне значення ознаки у вибірці. Величинихmax тахmin визначаються безпосередньо за таблицею вихідних даних (див. таблицю 2). У цьому випадку:

(М).

Тут слід зупинитися на точності визначення ширини інтервалу. Можливі дві ситуації: точність обчисленого значення h збігається з точністю проведення експерименту або перевищує її. У разі можливо використання двох підходів визначення меж інтервалів. З теоретичної точки зору найбільш правильно використовувати отримане значенняhдля побудови інтервалів. Такий підхід не внесе додаткових спотворень, пов'язаних із обробкою експериментальних даних. Однак для практичних цілей у статистичних дослідженнях, що відносяться до фізичної культури та спорту, прийнято округляти отримане значенняhдо точності вимірювання даних. Пов'язано це про те, що з наочного подання одержуваних результатів зручно, щоб межами інтервалів були можливі значення ознаки. Таким чином, отримане значення ширини інтервалів слід округлити з урахуванням точності експерименту, що проводиться. Особливо відзначимо, що округлення необхідно проводити не у загальноприйнятому математичному сенсі, а у бік збільшення, тобто з надлишком, щоб не зменшити загальнийдіапазон варіювання ознаки - сума ширини всіх інтервалів не повинна бути меншою від різниці між максимальним і мінімальним значеннями ознаки. У прикладі експериментальні дані визначені з точністю до сотих (0,01 м), тому отримане вище значення ширини інтервалів слід округлити з надлишком з точністю до сотих. В результаті отримуємо:

Після визначення ширини інтервалів угруповання слід визначити їх межі. Нижню межу першого інтервалу доцільно прийняти рівною мінімальному значенню ознаки у вибірціxmin:

У прикладіxН1 = 13,04 (м).

Для отримання верхньої межі першого інтервалу (xВ1) слід до значення нижньої межі першого інтервалу додати значення ширини інтервалу:

Зауважимо, що верхня межа кожного інтервалу (тут - першого) буде одночасно і нижньою межею наступного (в даному випадку другого) інтервалу:xН2=xВ1.

Подібним чином визначаються значення нижніх і верхніх кордонів всіх інтервалів, що залишилися:

У цьому прикладі:

Перед групуванням варіант введемо поняттясереднього значення інтервалуxi, рівного значенню ознаки, рівновіддаленого від кінців цього інтервалу. Враховуючи, що воно віддалено від нижньої межі на величину, що дорівнює половині ширини інтервалу, для його визначення зручно скористатися співвідношенням:

деxНі - нижня межаi-ro інтервалу, аh- його ширина. Серединні значення інтервалів будуть використовуватися в подальшому для обробки згрупованих даних.

Після визначення меж всіх інтервалів слід розподілити вибіркові варіанти цих інтервалів. Але попередньо слід вирішити питання про те, до якогоінтервалу віднести значення, що знаходиться в точності на межі двох інтервалів, тобто коли значення варіанти збігається з верхнім кордоном одного і нижньою межею сусіднього з ним інтервалу. У такому випадку варіанта може бути віднесена до будь-якого з двох сусідніх інтервалів і, для виключення неоднозначності при угрупуванні, умовимося у таких випадках відносити варіанти до верхнього інтервалу. На користь такого підходу можна навести наступний аргумент. Оскільки мінімальне значення ознаки збігається з нижньою межею першого інтервалу і входить в цей інтервал, то варіанту, що потрапляє на межу двох інтервалів, слід віднести до того з них, значення нижньої межі якого дорівнює варіанті, що розглядається.

Перейдемо до розгляду статистичної таблиці – див. таблицю 4, яка складається із семи стовпців.

Табличне подання результатів у штовханні ядра