Як виключити спам цифрами в Google Analytics або хто псує ваші дані

Коли в джерелах реферального трафіку з'являються нетематичні ресурси, або коли ви відкриваєте «Поведінка → Події → Огляд», і бачите подію, яку точно не налаштовували самостійно, саме час розібратися, в чому тут справа.

цифрами
Спам у подіях від event-tracking.com

Навіщо спамувати в Google Analytics?

Google Analytics є найпопулярнішим інструментом веб-аналітики, його використовують мільйони користувачів. Спамери розраховують на переходи цікавих власників сайтів, а що вже робити з цими переходами — монетизувати через банери, перенаправляти до магазину чи використати будь-яким іншим способом — кожен вирішує сам. Навіть якщо прийняти відсоток цікавості за 10%, у порівнянні з мільйонами користувачів Google Analytics, це вийде значна цифра.

Як вони це роблять? Метод спаму Google Analytics #1: Ghost spam

Як дані потрапляють в Google Analytics? GA використовує протокол для передачі даних - Measurement Protocol, який дозволяє розробникам відправляти дані безпосередньо на сервери Google Analytics. Measurement Protocol сам по собі - хороша річ, він дозволяє використовувати можливості Google Analytics для збору даних практично з будь-якого середовища. Таким чином, можна використовувати інструменти аналітики GA, наприклад, у мережі магазинів роздрібної торгівлі. Дані з продажу або будь-які інші взаємодії з покупцями магазинів будуть зібрані в Google Analytics подібно до даних з веб-сайтів.

цифрами
Проте той же Measurement Protocol можна використовувати і для передачі спаму.

Так як безпосередньої взаємодії з сайтом немає, то не можна відсікти спамні дані на рівні сервера, використовуючи .htaccess. Дані можна виключити ззвітів лише за допомогою фільтрів Google Analytics.

Приклад Ghost spam: спам у подіях GA від www.event-tracking.com

Ви, звичайно, знаєте, які саме події налаштовані на сайті, і що хочете відстежувати. Тому ідентифікувати спам у подіях дуже просто. Якщо у подіях ви виявили чуже повідомлення, наприклад, "to use this feature visit: www.event-tracking.com" - це спам. Щоб відсіяти неправдиві дані щодо неіснуючої події, потрібно налаштувати окремий фільтр — докладні інструкції, як це зробити, дивіться наприкінці посту.

google

Метод спаму Google Analytics #2: Crawler Referrer Spam

Є роботи, які здійснюють обхід сайтів із метою залучити трафік на певний портал. Дані, які такі роботи залишають у Google Analytics, не мають жодної корисної інформації, а сфабриковані показники спотворюють статистику. Такі роботи ігнорують директиви robots.txt, тому блокувати їх там нема рації. Хороша новина у тому, що тут є звернення до сайту. Це означає, що можна заблокувати робота-спамеру не тільки в налаштуваннях Google Analytics, але і в .htaccess на рівні сервера.

Як визначити реферальний спам у звітах?

Які параметри слід проаналізувати для ідентифікації спамеру?

псує
Порівняння даних імені хоста та назви екрана для однакових джерел.

5.Списки спамерів Google Analytics у мережі. Якщо мішень спамерів стає велика кількість людей, то і списки спам-роботів збігатимуться. Розуміючи це, Ви можете відсіяти частину спаму заздалегідь. Налаштуйте фільтр по чужому списку спамерів – приклад такого списку тут. Або зробіть загальний список спамерів для кількох SEO-проектів та застосуйте до кожного сайту окремо.

Як виключити реферальний спам: фільтриGoogle Analytics

Як ми вже писали вище, обидва види спаму – Ghost spam та Crawler Referrer Spam – можна виключити зі звітів внутрішніми інструментами GA, налаштувавши відповідні фільтри.

Важливо! Не застосовуйте фільтри до основного представлення Google Analytics, інакше частина даних для вашого сайту не буде зібрана. Для фільтрації даних використовуйте наявне додаткове подання або створіть його (детальніше).

Фільтр за джерелом кампанії

Будь-які метрики Google Analytics — кількість переходів, тривалість сесій, події та інше — мають джерело. Щоб виключити їх зі звіту, внесіть URL певного сайту як джерела кампанії у фільтр подання з налаштуванням «Виключити». Надалі всі дані із цього джерела не будуть додані до звіту. Як налаштувати фільтр:

спам
4. У меню відразу під вибраним поданням виберіть "Фільтри". 5. Натисніть «Фільтри» → «Новий фільтр». 6. Заповніть поля, як показано нижче.
виключити
Настроювання антиспам фільтра за джерелом кампанії. 7. Збережіть фільтр. Такий фільтр виключить всі дані, що надходять із зазначеного джерела, у тому числі і спам у розділі «Події».

Фільтр на ім'я хоста або за будь-яким іншим параметром

Як налаштувати фільтр: пункти 1-5 ті ж — перейдіть на вкладку «Адміністратор», виберіть подання та відкрийте вкладку створення нового фільтра. Далі також заповнюємо фільтр, тільки замість «Джерело кампанії» вибираємо «Ім'я хоста».

Аналогічно можна відфільтрувати спамні дані і за іншими параметрами. Головне визначити параметр, який однозначно визначить небажане джерело.

Виключення звернень роботів

Виключити Crawler Referrer Spam можна у налаштуваннях подання. Послідовність та ж:

виключити
Як налаштувати представлення Google Analytics 5. Позначте пункт «Виключення звернень роботів та павуків».
google
Виключення звернень роботів з даних представлення Google Analytics Тепер Google Analytics на підставі власного алгоритму визначатиме звернення роботів і відсіюватиме їх.

А чи потрібно морочитися?

Щоб уникнути плутанини в подіях, можна заздалегідь віднести кожну налаштовану подію до окремої групи, при цьому всі можливі зовнішні події залишатимуться в загальному списку і ніяк не потраплять до однієї з груп. Коли ви створюєте окрему виставу, безумовно варто відсіяти зі статистики звернення роботів та павуків. Чи налаштовувати додатково фільтри від спаму потрібно дивитися для кожного проекту індивідуально.

Короткі висновки

Виявили помилку? Виділіть її та натисніть Ctrl+Enter.