Факторний аналіз - Подання знань

Факторний аналіз орієнтований пояснення кореляцій, наявних між ознаками. Тому він застосовується у складніших випадках спільного прояви у структурі експериментальних даних дії латентних чинників.

Основна модель факторного аналізу записується наступною системою рівностей:

Тобто передбачається, що значення кожної ознаки можуть бути виражені виваженою сумою латентних змінних (простих факторів),кількість яких менша за кількість вихідних ознак.

Завданняфакторного аналізу немає однозначного рішення. Подання кореляційної матриці факторами (як кажуть, її факторизацію) можна зробити нескінченно більшим числом способів. Відомо багато методів факторного аналізу. Тому нерідко в тому самому пакеті програм аналізу даних реалізовано відразу кілька версій таких методів, і в дослідників виникає закономірне питання, який із них краще.

У STATGRAPHICSPlusfor Windows реалізовано три методи обертання факторів: варімакс, квартімакс та еквімакс. Обертання методом варимакс ставить за мету спростити стовпці факторної матриці, зводячи всі значення до 1 або 0. Обертання методом квартимакс ставить за мету аналогічне спрощення тільки по відношенню до рядків факторної матриці. І нарешті, еквімакс займає проміжне положення - при обертанні факторів за цим методом одночасно робиться спроба спростити стовпці і рядки.

Факторний анализ широко застосовується економіки, соціології, медицині виявлення прихованих закономірностей у даних. Але, можливо, найбільш широко він використовується в психології, з якої власне йде коріння факторної статистичної техніки. Цим пояснюється вибір нижченаведеного прикладу, пов'язаного звивчення структури інтелекту на основі даних, отриманих за допомогою психологічного тестування.

Даний приклад адаптований за даними, наведеними у звіті про вивчення людей похилого віку (Morrison D. F. (1990). Multivariate Statistical Methods, 3rd edition. N. Y.: McGraw-Hill). Випробувані були розбиті допомогою тесту Векслер на дві полярні групи. Для першої групи характерна наявність ознак старіння, другої такі ознаки відсутні.

У нашому випадку буде розглянуто 37 осіб, які мають ознаки старіння. Ми виділимо (на основі експериментальних даних) фактори та проінтерпретуємо їх.

Таблиця з експериментальними даними наведена нижче (табл. 6.3).

Отримання та інтерпретація зведення аналізу

Виберемо Special Multivariate Methods Factor Analysis. Система видасть вікно діалогу завдання змінних.

Введемо в полі аналізу змінні arith (арифметичний тест), info (інформаційний тест), picture (тест доповнення картинок) та similars (тест на кшталт).

У полі Select запишемо first(37) — перші 37 об'єктів, тоді як повна матриця містить більше об'єктів. Заповнене вікно діалогу введення змінних до аналізу показано на рис. 6.15.

аналізу

Таблиця 6.3. Експериментальні дані

Натисніть кнопку ОК. Система видасть первинне зведення факторного аналізу (рис. 6.16).

З отриманого зведення слід, що у перші три чинника припадає 95% дисперсії.

Пересунемо курсор на вікно первинного зведення і клацніть правою кнопкою миші. Система надасть діалогове вікно для завдання опцій факторного аналізу. Залишимо в недоторканності перемикачі, що вказують на: Listwise, Principal Components (тип факторизації) та Varimax (метод обертання факторів). Знімемо прапорець Standardize, оскількими маємо справу з вже стандартизованими психологічними даними, виміряними у певних шкалах.

аналізу

Мал. 6.15. Заповнене вікно діалогу введення даних для проведення факторного аналізу

подання

Встановимо перемикач у положення Number of Factors (кількість факторів) та у відповідному полі змінимо 4 на 3. Натисніть кнопку ОК (рис. 6.17). Система здійснить необхідні розрахунки та видасть нове зведення факторного аналізу (рис. 6.18). Рис. 6.16. Первинне зведення факторного аналізу

Отримання та інтерпретація табличних результатів

Натисніть кнопку табличних опцій (друга ліворуч у верхньому ряду). Система видасть відповідне вікно діалогу.

Клацніть мишею на кнопці АІ (все) і тим самим оберемо всі наявні види чисельних уявлень результатів факторного аналізу. Натисніть кнопку ОК. Система видасть на робоче поле екрана чотири вікна із табличними результатами.

аналізу

Мал. 6.17. Вікно діалогу для визначення параметрів факторного аналізу

факторний

Мал. 6.18. Друге зведення факторного аналізу

Двічі клацнемо лівою кнопкою миші на табличному вікні Extraction Statistics (виділені статистики). Вікно займе все робоче поле екрана (рис. 6.19).

У таблиці наведено значення факторних навантажень до застосування процедури обертання факторів. Але оскільки обертання факторів нерідко допомагає отримати більш корисні відомості про структуру експериментальних даних, розглянемо значення факторних навантажень після такого обертання.

Двічі клацніть на відкритому вікні лівою кнопкою миші, мінімізуючи його розміри.

Зробимо подвійне клацання на вікні Rotation Statistics (навантаження після проведення обертання) - розгорнемо його на все робоче поле (рис. 6.20).

подання

Мал.6.19. Результати факторизації до обертання факторів

аналізу

Мал. 6.20. Матриця факторних навантажень після проведення обертання

Неважко бачити, що після застосування процедури обертання в факторі 2 набагато більше значення має факторне навантаження для змінної arith, яка відображає здатність випробуваних до проведення арифметичних дій в розумі. Разом з тим, у факторі 1 високі величини навантажень спостерігаються для змінних similars і info, у той час як у змінної picture навантаження мала. Це говорить про те, що фактор 1 відображає відмінності людей за так званим основним інтелектом.

Отримання та інтерпретація графічних відображень

Натисніть кнопку графічних опцій (третя зліва). З'явиться відповідне вікно діалогу.

Клацніть на кнопці АН, задіявши всі графічні опції. Система додасть на робоче поле 5 вікон із різними графічними відображеннями результатів факторного аналізу (рис. 6.21).

подання

Мал. 6.21. Усі табличні та графічні вікна факторного аналізу

Розкриємо спочатку вікно під назвою Scree Plot. Цей графік у вихідному побудові ілюструє власні значення кожному за фактора. Але, припустимо, хочеться мати висловлювання величини своїх значень у відсотках.

Клацніть на графіці правою кнопкою миші та отримаємо вікно діалогу для завдання опцій даного виду відображення результатів факторизації. Встановимо прапорець Percent of Variance (відсоток дисперсії) замість Eigenvalues ​​(власні значення). Зауважимо, що фактор 1 має дуже високе і, звичайно, найбільше значення відсотка дисперсії. На фактор 2 припадає менше 20% дисперсії, а фактор 4 зовсім малопомітний за цим показником (рис. 6.22).

факторний

Мал. 6.22. Ілюстрація відсоткадисперсії для виділених факторів

Мінімізуємо розміри розглянутого графіка.

Двічі клацніть лівою кнопкою миші на другому графічному вікні 2D Scatterplot (двовимірна діаграма розсіювання). На отриманому малюнку показана проекція об'єктів, що досліджуються, на площину, утворену першим і другим факторами. Судячи з конфігурації хмари точок, перший і другий фактори сильно корелюють. Тобто в нашому випадку, стосовно літніх людей з вираженими ознаками старіння, загальний інтелект у них тісно пов'язаний зі здатністю до твору в розумі арифметичних дій (рис. 6.23)

факторний

Мал. 6.23. Проекція об'єктів на площину першого та другого факторів

Повернімо двовимірній діаграмі розсіювання колишні мінімальні розміри, двічі клацнувши на ній лівою кнопкою миші.

Максимізуємо розміри графічного 3D відображення Scatterplot. Цей графік є проекцією об'єктів у тривимірне простір, утворене першими трьома чинниками.

Згорнемо розглянуте відображення.

аналізу

Мал. 6.24. Графічне зображення факторних навантажень

Двічі клацніть лівою кнопкою миші на графіку 2D Factor Plot (двовимірне відображення факторних навантажень), розкриваючи графік на все робоче поле (рис. 6.24).

На графіці добре видно, що змінна arith має значення як першого, так другого чинників. Разом про те у змінної picture малі навантаження попри всі чинники, а тестові виміри info і similars мають великі навантаження лише з перший чинник.

Згорнемо відчинене вікно до мінімальних розмірів, двічі клацнувши на ньому лівою кнопкою миші.

Розкриємо до максимальних розмірів вікно 3D Factor Plot (тривимірний факторний графік). Графік зображує факторні навантаження вже впросторі трьох факторів (рис. 6.25)

аналіз

Мал. 6.25. Відображення факторних навантажень у просторі трьох факторів

З наведеного малюнка видно, що дуже високе навантаження має змінне зображення. Однак це навантаження припадає на третій виділений фактор, а, як відомо з попередніх даних, третій фактор відіграє несуттєву роль при описі розглянутих експериментальних спостережень.