Кореляційний аналіз порядкових змінних

Змінна(англійський термін variable) - це те, що можна вимірювати, контролювати або чим можна маніпулювати у дослідженнях. Інакше кажучи, змінна — те, що варіюється, змінюється, а чи не є постійним (від англійського кореня var).

Очевидно, що це дуже різні за своїми властивостями змінні, і тому можна сказати, що змінні відрізняються характеристиками, зокрема, роллю, яку вони грають у дослідженнях, типом вимірювань.

Ключовим поняттям, що описує зв'язки між змінними, єкореляція(від англійської correlation - узгодження, зв'язок, взаємозв'язок, співвідношення, взаємозалежність); термін вперше запроваджено Гальтоном (Gallon) у 1888 р.

Якщо є пара змінних, тоді кореляція між ними — це міра зв'язку (залежності) саме між цими змінними.

Також тісно корелюється кількість хостів та кількість хітів на сайті (див. графіки нижче).

Кореляція між парою змінних називається парною кореляцією. Статистики вважають за краще говорити про коефіцієнт парної кореляції, який змінюється в межах від -1 до +1.

Залежно від типу шкали, у якій виміряно змінні, використовують різні види коефіцієнтів кореляції.

Якщо досліджується залежність між двома змінними, виміряними в інтервальній шкалі, найбільш відповідним коефіцієнтом буде коефіцієнт кореляції Пірсона (Pearson, 1896), званий такожлінійною кореляцією,оскільки він відображає ступінь лінійних зв'язків між змінними. Ця кореляція найпопулярніша, тому часто, коли говорять про кореляцію, мають на увазі саме кореляцію Пірсона.

Отже, коефіцієнт парної кореляції змінюється не більше -1 до +1. Останні значення мають особливий сенс.Значення -1 означає повну негативну залежність, значення +1 означає повну позитивну залежність, іншими словами, між змінними, що спостерігаються, є точна лінійна залежність з негативним або позитивним коефіцієнтом.

Значення 0,00 інтерпретується як кореляції.

Кореляція визначає ступінь, з яким значення двох змінних пропорційні один одному.

Метод найменших квадратів

Метод найменших квадратівє одним з найбільш поширених та найбільш розроблених внаслідок своєї простоти та ефективності методів оцінки параметрів лінійних економетричних моделей.

Разом з тим, при його застосуванні слід дотримуватись певної обережності, оскільки побудовані з його використанням моделі можуть не задовольняти цілий ряд вимог до якості їх параметрів і, внаслідок цього, недостатньо «добре» відображати закономірності розвитку процесу.

Назва свій метод найменших квадратів отримав, виходячи з основного принципу, якому повинні задовольняти отримані на його основі оцінки параметрів: сума квадратів помилки моделі має бути мінімальною.

Метод найменших квадратів– один із методів теорії помилок для оцінки невідомих величин за результатами вимірювань, що містять випадкові помилки.

Метод найменших квадратів застосовується також для наближеного представлення заданої функції іншими (простішими) функціями і часто виявляється корисним при обробці геодезичних вимірів.

Метод найменших квадратів містить у собі 2 основних способи:коррелатнийіпараметричний, які при строгому зрівнюванні дають однакові результати. Вибір способу зазвичай залежить від обсягу обчислень, що визначається впереважно кількістю спільно розв'язуваних рівнянь, тобто. конфігурацією мережі.

Коррелатний спосіббільш оптимальний для вільних мереж і мереж з невеликим числом вихідних пунктів і більшим числом визначених - оскільки кількість рівнянь дорівнює кількості надлишкових вимірювань.

Параметричний спосіб,навпаки, вигідний для мереж з великим числом вихідних і малим числом визначених, оскільки кількість рівнянь буде дорівнює кількості необхідних вимірювань.

Ідея коррелатного способу полягає у відшуканні поправок до виміряних величин через допоміжні невизначені множники, які називають корелатами. Сутність вирівнювання корелатним способом полягає в тому, що завдання знаходження мінімуму функції рівняння розкладеного по ряду Тейлора вирішують за способом Лагранжа з певними корелатами, в результаті чого отримують корелатні рівняння поправок (вектори поправок). Перетворивши рівняння поправок отримують нормальні рівняння коррелат, якими знаходять ймовірні значення поправок.

Параметричний спосіб передбачає обчислення поправок немає виміряним величин, а якимось наближеним значенням (параметрам), тобто. до кінцевих результатів рівняння, якими в геодезичних мережах є координати або висоти пунктів, і безпосереднє отримання найімовірніших значень параметрів, минаючи найімовірніше значення вимірюваних елементів мережі.

Метод найменших квадратів було запропоновано К. Ф. Гауссом (1794-95) та А. Лежандром (1805-06). Спочатку цей метод використовувався для обробки результатів астрономічних та геодезичних спостережень. Суворе математичне обґрунтування та встановлення меж змістовної застосовності методу найменших квадратів дано А. А. Марковим та А. Н. Колмогоровим. Нині спосібє одним з найважливіших розділів математичної статистики і широко використовується для статистичних висновків у різних галузях науки та техніки.