Алгоритм кластер аналіз типу «Форель»

Розроблено Загоруйком та Єлкіною у 1967 році в Інституті математики Сибірського відділення РАН.

FOREL - (формальний елемент) є прикладом евристичного алгоритму класифікації, заснованого на ідеї об'єднання в 1 кластер об'єктів у сфері їхнього найбільшого згущення.

Розглянемо алгоритм «Форель-1»

Нехай сукупність спостережень потрібно розбити на деяке, наперед невідоме число класів. Нехай знайдено вектор середніх і - радіус мінімальної гіперсфери з центром , що містить всі точки досліджуваної сукупності.

Задамо довільний радіус і з будь-якої точки прийнятої за центр, радіусом R описується гіперсфера С1.

Знаходиться центр тяжкості точок сукупності, що потрапили до гіперсфери С1.

З радіусом R описується гіперсфера С2 і визначається - центр тяжкості точок, що потрапили до С2

Процедура побудови гіперсфер і точок повторюється до того часу, поки «центри тяжкості», точки не перестануть змінюватися. Точки сукупності, що потрапили до «стаціонарної» гіперсфери, приймаються за перший клас S1.

Для всіх точок, що не потрапили в клас S1 процедура застосовується заново і виділяється клас S2

і так далі, поки всі точки сукупності не будуть розподілені за класами.

Застосування алгоритму "Форель-1" для низки послідовних значень

дозволяє орієнтовно оцінити найбільш переважне число класів для сукупності об'єктів.

У цьому основою вибору числа класів може бути багаторазове повторення однієї й тієї числа класів для кількох послідовних значень . Процедура алгоритму Форель є схожою за кінцеве число кроків в евклідовому просторі будь-якої розмірності при довільному розташуванні точок ібудь-якому виборі гіперсфери.

Якщо ставиться завдання розбити сукупність на задане число класів,то використовується одна з модифікацій алгоритму «Форель-2», що дозволяє методом послідовного наближення знаходити мінімальний радіус , що дає розбиття нак-класів.