Кохонена карта - це

Самоорганізована карта Кохонена(англ.Self-organizing map— SOM) — нейронна мережа змагання з навчанням без вчителя, що виконує завдання візуалізації та кластеризації. Ідею мережі запропоновано фінським ученим Т. Кохоненом. Є методом проектування багатовимірного простору в простір з нижчою розмірністю (найчастіше двовимірне), застосовується також для вирішення завдань моделювання, прогнозування та ін. Є однією з версій нейронних мереж Кохонена.

Зміст

Структура мережі

Карта, що самоорганізується, складається з компонентів, званих вузлами або нейронами. Їхня кількість задається аналітиком. Кожен із вузлів описується двома векторами. Перший - т.з. вектор ваги m, що має таку ж розмірність, як і вхідні дані. Другий – координати вузла на карті, далі вектор r. Зазвичай вузли розташовують у вершинах регулярних ґрат з квадратними або шестикутними осередками.

Спочатку відома розмірність вхідних даних, нею якимось чином будується початковий варіант карти. У процесі навчання вектори ваги вузлів наближаються до вхідних даних. Для кожного спостереження (семплу) вибирається найбільш схожий по вектору ваги вузол, і значення його вектора ваги наближається до спостереження. Також до спостереження наближаються вектори ваги кількох вузлів, розташованих поруч, таким чином якщо у багатьох вхідних даних два спостереження були схожі, на карті їм відповідатимуть близькі вузли. Циклічний процес навчання, що перебирає вхідні дані, закінчується після досягнення картою допустимої (заздалегідь заданої аналітиком) похибки, або після здійснення заданої кількості ітерацій.

Робота мережі

  • Ініціалізація картки, тобто початкове завдання векторів ваги для вузлів.
  • Цикл:
  • Вибір наступного спостереження (вектора з множини вхідних даних).
  • Знаходження для нього кращої одиниці відповідності (best matching unit, BMU, або Winner) — вузла на карті, вектор ваги якого найменше відрізняється від спостереження (в метриці, що задається аналітиком, найчастіше евклідовою).
  • Визначення кількості сусідів BMU та навчання – зміна векторів ваги BMU та його сусідів з метою їхнього наближення до спостереження.
  • Визначення помилки картки.
  • Ініціалізація

Найбільш поширені три способи завдання початкових ваг вузлів:

  • Завдання всіх координат є випадковими числами.
  • Надання вектору ваги значення випадкового спостереження з вхідних даних.
  • Вибір векторів ваги лінійного простору, натягнутого на головні компоненти набору вхідних даних.
  • Цикл

Нехайt– номер ітерації (ініціалізація відповідає номеру 0).

  • Вибрати довільне спостереженняx(t) з множини вхідних даних.
  • Знайти відстані від нього до векторів ваги всіх вузлів карти і визначити найближчий вузолMc(t) . Це – BMU або Winner. УмоваMc(t) :
для будь-якогоmi(t) , деmi(t) - Вектор ваги вузлаMi(t) . Якщо є кілька вузлів, що задовольняють умові, BMU вибирається випадково серед них.
  • Визначити за допомогою функціїh(функції сусідства) сусідівMcта зміна їх векторів ваги.
  • Завданняh
Функціявизначає "міру сусідства" вузлівMiтаMcта зміна векторів ваги. Вона повинна поступово уточнювати їх значення, спочатку у більшої кількості вузлів і сильніших, потім у менших і слабших. Часто як функція сусідства використовується гауссівська функція: де 0ri,rc— координати вузлівMi(t) таMc(t) на карті; σ(t) - співмножник, що зменшує кількість сусідів з ітераціями, монотонно зменшується. Параметри α, σ та їх характер зменшення задаються аналітиком. Простіший спосіб завдання функції сусідства:hci(t) = α(t) , якщоMi(t) знаходиться в околиціMc(t) заздалегідь заданого аналітиком радіусу, і 0 в інакше. Функціяh(t) дорівнює α(t) для BMU та зменшується з видаленням від BMU.
  • Зміна векторів ваги
Змінити вектор ваги за такою формулою: В.о. вектори ваги всіх вузлів, які є сусідами BMU, наближаються до спостереження, що розглядається.
  • Обчислення помилки картки
Наприклад, як середнє арифметичне відстаней між спостереженнями та векторами ваги відповідних їм BMU: , де N - кількість елементів набору вхідних даних.

Метод був запропонований фінським ученим Теуво Кохоненом у 1984 році. Існує безліч модифікацій вихідної моделі.