Кластеризація в Excel - об’єднання кластерів

Розбір є ключовим інструментом надбудови і потрібен для того, щоб об'єднувати кластери запитів, працюючи тільки з їх вершинами. Послідовність роботи складається з кількох етапів.

Перший етап

excel

На малюнку ліворуч проілюстровано перший етап. Ми вказуємо стовпець з унікальним ідентифікатором кластера (підписаний як H1) та стовпець з частотністю. Натискаємо Ok і отримуємо новий аркуш з назвою «Розбір 1004» (1004 кластери у нас було), на якому у нас з'явилося 2 стовпці. І в першому, і в другому, у нас виписані вершини кластерів. Але другий стовпець зафарбований зеленим і має примітки (червоний трикутник у правому верхньому кутку комірки). Примітки відображають сумарну частотність запитів у кластері (за вибраним стовпцем).

Другий етап

кластеризація

Стовпець A спеціально створюється автоматично кожного разу, коли починається новий розбір. Це допоміжний стовпець, ми можемо редагувати вміст осередків у цьому стовпці. Зробимо в стовпці A Вижимання.

Третій етап

єднання

Нам залишилося тільки відсортувати наші рядки по стовпцю A. Якщо вичавки було зроблено правильно, то вершини кластерів з однаковим інтеном стануть поруч, тепер символічно об'єднаємо кластери виставляючи до ряду їх вершини. Можна для зручності ще пофарбувати стовпець з вичавкою, тоді однакова вичавка залишиться без заливання.

Четвертий етап

excel

Завершуємо розбір. Нам абсолютно не важливо, що у нас залишилося в стовпці A. Головне щоб не було порожніх осередків у стовпці B, де ми перетягували осередки. Видаляємо порожні рядки, виділивши порожні комірки в стовпці B і натискаємо Завершити розбір. Створюється новий аркуш, на ньому отримуємо об'єднані кластери. Кластери розташовуються в порядку зменшення сумарної частотності. Зверху найвищі частотикластери, знизу низькочастотні. Межі кластера виділені кольором, але ми досі можемо бачити якому кластеру належав запит до розбору. Для того, щоб залишити тільки один ідентифікатор для кластера потрібно відсортувати кластера інструментом Сортування, а потім інструментом H1 прописати найчастіший запит як ідентифікатор.

Починаючи з версії 1.2.0 на аркуші Розбір примітки містять не лише сумарну частотність кластера за вибраним стовпцем, але й усі запити кластера, таким чином його наочно представляючи. Тому змінилася форма викликана кнопкою Почати розбір, там потрібно тепер вказувати стовпець із запитами.