Дослідження кореляційної залежності щодо вибірки
Встановлення кореляційних зв'язків між ознаками багатовимірної вибірки. Статистичні параметри регресійного аналізу лінійних та нелінійних вибірок. Знаходження функцій регресії та перевірка гіпотези про значущість вибіркового коефіцієнта кореляції.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче
Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.
Розміщено наhttp://www.allbest.ru/
Розміщено наhttp://www.allbest.ru/
ДЕРЖАВНИЙ БЮДЖЕТНИЙ ОСВІТНИЙ ЗАКЛАД
ВИЩОЇ ПРОФЕСІЙНОЇ ОСВІТИ МОСКІВСЬКОЇ ОБЛАСТІ
«Міжнародний університет природи, суспільства та людини «Дубна»
Кафедра вищої математики
КУРСОВА РОБОТА ЗА ТЕОРІЮ МОЖЛИВОСТЕЙ І МАТЕМАТИЧНОЇ СТАТИСТИКИ
ТЕМА: «ДОСЛІДЖЕННЯ КОРРЕЛЯЦІЙНОЇ ЗАЛЕЖНОСТІ З ВИБІРКИ»
Виконав: студент 2071 групи 2 курсу
Сірий Сергій Андрійович
Керівники: ст. викл. Чебоненко З.О.
Список використаної літератури
Математична статистика - наука про математичні методи систематизації та використання статистичних даних для наукових та практичних висновків. У багатьох розділах математична статистика спирається на теорію ймовірностей, що дозволяє оцінити надійність і точність висновків, роблених виходячи з обмеженого статистичного матеріалу, вибірки генеральної сукупності.
Під час статистичних спостережень кожного об'єкта часом можна виміряти значення кількох ознак. Таким чином, виходить багатовимірна вибірка. Якщо багатовимірну вибірку обробити за значеннями окремої ознаки,то вийде нормальна обробка одновимірної вибірки.
Сенс обробки багатовимірних вибірок у тому, щоб встановити зв'язок між ознаками. Зв'язки з-поміж них можуть бути функціональними, тобто кожному значенню однієї величини відповідає певне значення інший величини.
Зв'язок між випадковими величинами часто має випадковий характер. Вона називається статистичною, якщо зміна однієї величини викликає зміну розподілу іншої величини. Якщо середнє значення однієї випадкової величини функціонально залежить від значення іншої випадкової величини, така статистична залежність називається кореляційної.
Метою даної курсової є дослідження кореляційної залежності за вибіркою.
Вибірковий метод -статистичний метод дослідження загальних властивостей сукупності будь-яких об'єктів на основі вивчення властивостей лише частини цих об'єктів, взятих на вибірку.
Генеральна сукупність, генеральна вибірка --це безліч об'єктів (суб'єктів), відібраних спеціальним чином обстеження (опитування). Будь-які дані, отримані на підставі вибіркового обстеження (опитування), мають імовірнісний характер. Насправді це означає, що в ході дослідження визначається не конкретне значення, а інтервал, в якому визначається значення знаходиться.
Вибіркове середнє--це середнє арифметичне значення ознаки вибіркової сукупності. Якщо всі значення ознаки вибірки обсягу n різні, то:
Вибіркова дисперсія--середнє арифметичне квадратів відхилення значень ознаки від їх середнього значення.
Вибіркове середньо квадратичне відхилення -квадратний корінь з вибіркової дисперсії.
Парна вибірка- вибірка що складаються з тих самих об'єктів обстежених у різні моменти часу.
Парні вибірки-- це дві вибірки, які набираються в такий спосіб, що кожним спостереженням однієї вибірки зіставлено спостереження інший вибірки зіставлення грунтується, зазвичай, збігу значень однієї чи більше заданих характеристик(ознак).
Вибіркова коваріація -числова характеристика спільного розподілу двох випадкових величин, що дорівнює математичному очікуванню твору відхилень випадкових величин від їх математичних очікувань.
Кореляційна залежність --статистичний взаємозв'язок двох або більше випадкових величин (або величин, які можна з деяким допустимим ступенем точності вважати такими).
Вибірковий коефіцієнт кореляції -оцінка коефіцієнта кореляції, що служить для визначення лінійного зв'язку між величинами X і Y. Коефіцієнт кореляції змінюється не більше -1 до 1.
Вибірковий коефіцієнт кореляції показує тісноту лінійного зв'язку між X і Y - чим ближче до одиниці абсолютне значення коефіцієнта, тим сильніший лінійний зв'язок між змінними.
Регресія- залежність середнього значення будь-якої величиниYвід іншої величиниX. Поняття регресії у певному сенсі узагальнює поняття функціональної залежностіy=f(x). Тільки у разі регресії тому самому значеннюxу різних випадках відповідають різні значенняу.
Регресійний аналіз полягає у визначенні аналітичного виразу зв'язку, в якому зміна однієї величини (званої залежною або результативною ознакою) обумовлена впливом однієї або кількох незалежнихвеличин (чинників).
За формою залежності розрізняють:
- Лінійну регресію, яка виражається рівнянням прямої:
Дослідження лінійної регресії:
Визначимо коефіцієнти лінійної функції шляхом найменших квадратів. Для цього складемо суму:
Для того щоб ця сума була мінімальною, необхідно, щоб її приватні похідні за параметрами A і B дорівнювали нулю:
Розкривши дужки, ми отримаємо:
Оскільки вибірка відібрано випадково, то не можна зробити висновок, що коефіцієнт кореляції генеральної сукупності r також відмінний від нуля. Виникає необхідність при цьому рівні значущості перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта кореляції при конкуруючій гіпотезі.
Як критерій перевірки нульової гіпотези застосовують випадкову величину
Величина T при справедливості нульової гіпотези має розподіл Стьюдента зі ступенями свободи. Тому обчислюється емпіричне значення критерію і за таблицею критичних точок розподілу Стьюдента за вибраним рівнем значимості б і числу ступенів свободи знаходять критичну точку:
Якщо, то нульову гіпотезу відкидають, і вибірковий коефіцієнт кореляції істотно відрізняється від нуля, а X і Y корелированы, тобто. пов'язані лінійною залежністю.
Якщо немає підстав відкидати нульову гіпотезу і стверджують, що вибірковий коефіцієнт кореляції незначний, а X і Y некоррелированные, тобто. не пов'язані лінійною залежністю.
Практична частина
Постановка задачі
· Провести статистичний аналіз даних для змінних X та Y. Знайти вибіркові середні, дисперсії та середньоквадратичні відхилення для X та Y окремо;
· Знайти підступність Cov (X, Y);
· Знайтикоефіцієнт кореляції X та Y;
· Знайти за вибіркою рівняння лінійної регресії (Y як функцію X) методом найменших квадратів;
· Знайти за вибіркою рівняння параболічної регресії другого порядку (Y як функцію X) методом найменших квадратів;
· Побудувати графіки, що зображують дані вибірки та знайдені функції регресії;
· Перевірити гіпотезу про значущість вибіркового коефіцієнта кореляції при заданому рівні значущості альфа = 0.001;
Вихідні дані
Нам дана вибірка (об'ємомn=20)залежності числаYвід числаX