Багатомірне шкалювання

1. Заходи відмінності, типи моделей

2. Неметрична модель та модель індивідуальних відмінностей

3. Побудова математичних моделей за допомогою комп'ютера

Список використаної літератури

1. Заходи відмінності, типи моделей

Багатомірне шкалювання пропонує геометричне уявлення стимулів у вигляді точок координатного простору мінімально можливої ​​розмірності.

Існує два типи моделей: дистанційні та векторні. У дистанційних моделях вихідні відмінності повинні бути наближені до відстаней, у більшості випадків використовують звичну евклідову відстань:

У векторних моделях міри близькостей чи зв'язків — величини, обернені відмінностям, апроксимуються скалярними творами векторів, що з'єднують точки, що відповідають стимулам, з початком координат:

При побудові зміни стимулів використовується апарат лінійної чи нелінійної оптимізації. Чому ж така проста модель та формальні методи пошуку екстремуму дозволяють отримати змістовно інтерпретоване рішення? Чому осі, побудовані формальним чином, набувають сенсу добре інтерпретованих факторів?

Векторна модель.Обговоримо геометричні властивості векторної моделі. Почнемо зі шкалювання бінарних даних, тобто висловлювань типу «схожі-несхожі». Припустимо, що ми маємо матрицю, що містить інформацію про те, що всі стимули не схожі один на одного. Як можна уявити геометрично таку структуру? Стимули повинні розташовуватися або на ортогональних прямих або на початку координат. І тут всі скалярні твори будуть нулями.

Перейдемо до ситуації наявності кількох груп схожих між собою стимулів. Стимули з однієї групи мають бути однією точкою;точки, що відповідають різним групам, повинні належати ортогональним прямим. Ізольовані стимули можуть бути поміщені на початок координат. Тоді скалярні твори між схожими стимулами будуть більшими, а скалярні твори між несхожими стимулами будуть нулями.

Орієнтуємо осі координатного простору вздовж ортогональних напрямків. Тоді кожна вісь буде пов'язана з групою схожих між собою стимулів, і фактор, що відповідає їй, лежатиме в основі подібності цих стимулів. Різним групам будуть відповідати ортогональні осп і, отже, незалежні фактори. Виняток становлять ізольовані стимули, які можуть потрапити на початок координат. Чим більше стимулів об'єднуються у групи, тим менше вимірів необхідно.

Нехай тепер ми маємо дискретні або безперервні дані, т. с. отримуємо оцінки про подібності чи зв'язки або у вигляді балів, або у вигляді чисел. Припустимо, що в цьому випадку матриця має квазіблочп структуру. Тоді по ній можна розбити все безліч на кілька груп так, що стимули всередині кожної групи будуть сильно пов'язані, а стимули з різних груп слабко пов'язані між собою. Характер відображення буде приблизно таким же, як у випадку бінарних даних, що не перетинаються. Однак стимули з однієї групи не будуть представлятися однією точкою, а будуть сконцентровані в деякій її околиці. Така структура, взагалі кажучи, не співпадатиме з ортогональною системою координат, оскільки точки можуть лежати дещо осторонь осей. Однак якщо зв'язки в групах досить сильні, а зв'язки між групами досить слабкі, то й у цьому випадку кожен вимір буде пов'язаний з однією групою і фактор, що відповідає йому, лежатиме в основі подібності стимулів з цієї групи.

На практиці сильноструктуризовані дані, що характеризують групи стимулів, що не перетинаються, зустрічаються рідко, зазвичай групи мають перетину. Є стимули, схожі одночасно стимули з двох чи кількох груп. Природно, що вони не потраплять на осі, а розташовуватимуться у просторі між ними. Характер розподілу залежатиме від матриці вихідних даних. Картина буде тим контрастніше, чим структуровані дані, тобто сильніше внутрішньогрупові зв'язки і слабше — міжгрупові. Осі будуть визначатися групами стимулів, які дуже схожі між собою та мінімально схожі на стимули з інших груп. Такі стимули характеризуються великими значеннями координат за відповідними осями. Ці групи стимулів є основою всієї структури. Інші стимули, схожі одночасно на стимули з кількох груп, повинні зайняти проміжні положення між цими групами.

Оскільки вихідна матриця не є матрицею точних відстаней або скалярних творів, всі стимули не можуть бути відображені в просторі, що визначається ортогональними осями, відповідними ізольованим групам. Для їхнього розміщення знадобляться додаткові розмірності. Якщо перший тип розмірностей визначається великими міжгруповими відмінностями і кожна розмірність характеризується значним розкидом стимулів, другий тип розмірностей виникає з допомогою те, що суб'єктивні різницю між стимулами неможливо знайти відображені в просторі невеликого числа розмірностей. Розкид стимулів уздовж розмірностей другого типу невеликий і в багатьох випадках їх можна знехтувати.

Центрована векторна модель.Інший варіант векторної моделі - модель центрованих скалярних творів. На ній заснований широко поширений метод Торгерсона, який започаткувавтеорії багатовимірного шкалювання. У цій моделі вважається, що початок координат розміщено у центрі тяжкості структури. Вихідні близькості або зв'язки повинні бути апроксимовані скалярними творами векторів, що з'єднують точки, що відповідають стимулам, із центром тяжкості конфігурації. Матриця вихідних близькостей попередньо центрується, отже поруч із позитивними числами у ній виникають і негативні. Якщо пронормувати наведені дані: ajk  1, їх можна розглядати як коефіцієнти кореляції.

Рішення, що породжується моделлю центрованих скалярних творів, відрізняється від рішення, одержуваного звичайною векторною моделлю. У вихідній матриці близькості (зв'язку) між стимулами можуть набувати позитивне, нульове та негативне значення; будемо наближати їх скалярними творами. Природно, що стимули, що характеризуються сильними позитивними зв'язками (великими мірами близькостей), повинні концентруватися на околиці однієї точки, що знаходиться на значній відстані від початку координат. Тоді скалярні твори між відповідними векторами будуть більшими. Стимули, що характеризуються негативними зв'язками, повинні бути по різні боки від початку координат. Скалярні твори між ними прийматимуть максимальні негативні значення, якщо вони належать різним кінцям однієї прямої, яка проходить через початок координат. Пари стимулів з нульовими зв'язками повинні належати ортогональним прямим; у разі скалярні твори з-поміж них будуть нулями. Ізольовані стимули, що мають нульові зв'язки з рештою, можуть потрапляти на початок координат.

Дистанційна модель.Подивимося тепер, які властивості має дистанційна модель; обмежимося евклідовою метрикою. Почнемо знову зсистеми, де всі стимули не схожі друг на друга. Для точної передачі структури цієї системи слід помістити кожен стимул одну з N вершин багатогранника з однаковими ребрами (симплекса). Тоді стимули відстоятимуть один від одного на однаковій відстані.

Нехай є кілька ізольованих груп-стимулів. Тоді стимули з однієї групи повинні бути поміщені в одну вершину, і багатогранник матиме розмірність, яка дорівнює кількості груп. На відміну від векторної моделі ізольовані стимули не можуть бути поміщені в одну точку — початок координат, кожен з них повинен займати окрему вершину.

У загальному випадку довільної матриці відмінностей групи схожих між собою стимулів будуть сконцентровані поблизу однієї вершини, а стимули, схожі одночасно на стимули двох або декількох груп, будуть розташовуватися між цими вершинами.

Характер конструкції визначатиметься переважно великими відмінностями між стимулами чи групами стимулів. Однак, як і у випадку векторної моделі, через те, що матриця відмінностей не є точною матрицею відстаней, для передачі структури потрібні додаткові розмірності. Але розкид стимулів у цих напрямках буде порівняно малим.