Кластеризація запитів семантичного ядра

При збиранні семантичного ядра (СЯ) я зазвичай роблю кластеризацію руками, за допомогою Key Collector, ось посилання на тему:
Але все це легко і просто, коли ми маємо чіткі групи запитів за різним логічним змістом. Ми чудово знаємо, що для запиту "Коляска для близнюків" та "Коляска для хлопчика" повинні існувати різні посадкові сторінки.
Але бувають запити, які поділяються між собою не зовсім явно і важко "відчуттям" визначити, які запити потрібно садити на одну сторінку, а які запити розкидати по різних посадкових URL.
Один із учасників мого SEO марафону запитав мене: "Петя, як бути з цими ключами: саджати все на одну сторінку, створювати кілька, якщо так, то скільки?" А ось і сам уривок зі списку ключових слів:

Одне лише слово "java" використовує у трьох варіаціях ("ява", "джава"), плюс до цього народ шукає його для різних ігор, пристроїв і т.д. Запитів там дуже багато і реально важко зрозуміти, як краще зробити.
Як ви вважаєте, як правильно? Правильно. Найкраще підійде аналіз конкурентів, які вже перебувають у ТОПі за цими ключовими словами. Сьогодні я розповім вам, як можна зробити кластеризацію семантичного ядра на основі даних у конкурентів.
Якщо у вас є готовий список ключових слів для кластеризації, ви можете відразу переходити до 4-го пункту.
1. Матриця запитів
Візьму ще інший приклад: є в мене один клієнт з інтернет-магазином електро- та світлотехніки. У магазину дуже багато товарів (кілька десятків тисяч).
Звичайно, будь-який магазин має товари, які найбільш пріоритетні для продажу. У цих товарів може бути високамаржинальність, або просто потрібно позбутися цього товару зі складу. Так от, прийшов мені лист, щось подібне до цього "Петя, ось список товарів, які цікаві нам". І там списком було перераховано:
- вимикачі;
- світильники;
- лампи;
- прожектори;
- подовжувачі;
- та ще кілька пунктів.
Я попросив скласти так звану "матрицю запитів". Так як власники магазину краще за мене знають свій асортимент, мені потрібно було зібрати весь товар і основні характеристики/відмінності у кожного товару.
Вийшло щось на кшталт цього:
При складанні матриці, не забуваємо, що деякі англомовні бренди запитуються і українською, це потрібно врахувати та додати їх.
Звичайно, якщо у товару були ще й інші характеристики, додавався стовпець. Це можуть бути "Колір", "Матеріал" і т.д.
І така робота була зроблена для найпріоритетніших товарів.
2. Перемноження запитів
Далі потрібно було згенерувати всілякі запити із цих слів методом "перемноження". Вручну перемножувати ці запити один на одного – неефективна трата часу.
Для перемноження запитів є багато сервісів та програм. Я скористався цим генератором ключових фраз http://key-cleaner.ru/KeyGenerator, вбиваємо туди всі наші запити по стовпцям:
Маркер – це основна фраза, від якої потрібно генерувати ключ. Без маркера неможливо створити адекватний ключовий запит. Нам не потрібні фрази "іек оптом", або "на котушці купити".
При перемноженні важливо, щоб у кожному ключовому словосполученні був цей маркер. У нашому прикладі – це фраза "подовжувач". У результаті згенерувалося в цьому прикладі 1439 (!) Унікальних ключових фраз:

3. Очищення запитів від"сміття"
Наразі є 2 варіанти розвитку подій. Можна зайнятися кластеризацією всіх цих запитів і насмоктувати величезну кількість сторінок, що згенерували під кожен кластер, якщо дозволяє це зробити система вашого сайту. Звичайно, кожна сторінка повинна мати свої унікальні метатеги, h1 і т.д. Та й проблемно іноді подібні типи сторінок засовувати до індексу.
А в нас такої можливості в технічному плані не було, тому ми навіть не розглядали цей варіант. Потрібно було в "напівручному" режимі створювати тільки найнеобхідніші нові посадкові сторінки.
Що далі робити? Звісно, видалити весь список від сміття. Що є сміттям у цьому випадку? Пустушки. Просто заганяємо в Кей Колектор весь цей список і знімаємо частоти нашого регіону.
З яким типом частотності працювати? Так як у нас список товарів + перетинів зустрічалися не дуже популярні (вузькоспрямовані), я робив акцент начастотності з лапками (без знаків оклику) - тобто в різних словоформах. Це ключові фрази у різному відмінку, числі, роді, відмінюванні. Саме цей показник дозволяє більш-менш оцінити трафік, який ми зможемо отримати з Яндекса у разі потрапляння до ТОПу.
Знімаємо в Key Collector частотності в лапках у даних фраз (звичайно, якщо у вас сезонний товар, то потрібно зняти частотність у "сезон"):

І видаляємо все те, що дорівнює нулю. Якщо у вас популярніша тематика і дуже багато слів з ненульовою частотністю, ви можете збільшити нижній поріг до 5, або ще вище. У мене ж ненульових запитів із 1439 фраз залишилося всього 43 по регіону Москва та область.
Ці 43 фрази з даними частотностей я переношу в Excel:

4. Кластеризація запитів
Далі потрібно зайнятисякластеризації ключових слів. Я вже описав метод на початку статті, продублюю:кластеризовуватимемо запити на основі конкурентів.
Все це я роблю в Rush Analytics, ось алгоритм кластеризації в даному сервісі:
Під кожен запит "висмикується" з видачі ТОП-10 URL по заданому регіону. Далі за загальним URL відбувається кластеризація. Точність кластеризації можна задати самому (від 3 до 8 загальних url).
Допустимо ми виставили точність 3. Система запам'ятовує URL сторінок, які в ТОП-10 на перший запит. Якщо за другим запитом зі списку в ТОП-10 зустрічаються ті ж 3 URL, які були в першому, то ці два запити потраплять у нас до 1 кластера. Кількість загальних URL-адрес залежить від заданої нами точності. І така обробка відбувається із кожним запитом. У результаті ключові слова розбиваються кластери.
Висновок
Якщо ж ми зробили б неправильну кластеризацію, то дуже багато запитів важко було б просунути. Це було б "якорем", який би стримував нас, незважаючи на те, що ми витрачали б купу грошей на просування цих сторінок.
Правильна кластеризація допоможе вам пристойно заощадити та суттєво полегшить попадання у заповітний ТОП.
Що ви думаєте з цього приводу? А як ви робите кластеризацію запитів семантичного ядра?