Методи виміру в Інтернеті - Аналіз ефективності в інтернет-маркетингу

Особливістю Інтернету як інструменту комунікацій є його опосередкованість через безліч технічних пристроїв: сервери, маршрутизатори, файрволи і т.д. Дії користувачів, які здійснюються через це обладнання, автоматично фіксуються в пам'яті пристроїв, де можуть іноді зберігатися значний час. Цей простий факт надає маркетологам величезні можливості для аналізу поведінки відвідувачів сайту.

Технологія запису подій на сервері може бути різною, але в загальному випадку для кожного запиту користувача, тобто для кожного запиту браузером чогось із сервера, записується певний набір даних, зазвичай у вигляді текстового рядка. Щоразу, коли на нашому комп'ютері з'являється або оновлюється будь-яка інформація з Інтернету, включаючи пошту та системи обміну миттєвими повідомленнями, ми робимо безліч таких запитів. Навіть просте відкриття однієї сторінки на сервері пишеться кілька десятків рядків лог-файла. Текстовий рядок містить велику кількість полів з параметрами, найважливіші з яких для аналізу в інтернет-маркетингу наведені нижче.

ДАТА ТА ЧАС, до яких зроблено запит. Вказується час, встановлений на сервері, а не на комп'ютері користувача, і вони можуть відрізнятися. Однак навіть якщо час на сервері встановлено неправильно, воно неправильне для всіх користувачів одночасно.

Поле referrer може бути порожнім, якщо користувач звертається до сторінки (або будь-якого іншого елемента):

перейшовши на «домашню сторінку»;

перейшовши з поштової програми або з будь-якої програми (наприклад, Word).

У цьому випадку сервер не може визначити, звідки було зроблено перехід, і не вказує це у журналі запису подій.Всі переходи на сайті без вказівки посилання називаються Type-in-трафіком.

USER AGENT - кодове позначення операційної системи та браузера, які використовуються для доступу до сайту. Приклад UA: "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" - це Windows XP з IE 6.0.

РЕЗУЛЬТАТ - код результату запиту користувачів. Найбільш відомий результат - це 404 «сторінка не знайдена», проте найпоширеніший - 200 «дані передані успішно». Нам для аналізу результат потрібен саме для того, щоб визначати випадки, коли користувач із якихось причин не отримав потрібну сторінку.

Нарешті, за допомогою додаткового програмного забезпечення ми можемо фіксувати такі параметри, як наявність java-script та його версії, наявність та версії flash-модуля, роздільна здатність екрану та інші параметри, які також можуть бути цікавими, проте не важливими для аналізу ефективності маркетингових дій.

Один і той же користувач може переглядати досить велику кількість сторінок, вимагати на сервері безліч різних файлів, тому перше завдання статистики - визначення приналежності різних запитів одному користувачеві, або, говорячи суворою мовою, ідентифікація унікального відвідувача. Без ідентифікації всі відвідування та відвідувачі зливаються в одну суцільну масу, і ми вже не можемо відокремити поведінку одного користувача від інших.

Існує чотири основні методи ідентифікації відвідувачів, які використовуються у різних ситуаціях для вирішення різних завдань.

Але вона не позбавлена похибок. Користувачі можуть відключати cookie - це роблять небагато, всього близько 4% всіх користувачів, cookie можуть стиратися користувачем в результаті перевстановлення системи або після закінчення кожного сеансу зв'язку з Інтернетом,якщо зроблено такі налаштування на комп'ютері. Однак найбільшою похибкою методу є те, що він визначає не користувачів, а браузери, за якими працюють користувачі. Якщо за одним комп'ютером працює кілька користувачів, вони користуються загальним обліковим записом і одним і тим же браузером, тому вони будуть вважатися одним користувачем. І навпаки, людина, яка з якихось причин використовує кілька браузерів на одному комп'ютері, буде вважатися стільки разів, скільки різних браузерів вона використовує.

Цей метод ідентифікації, очевидно, може бути використаний тільки в рамках однієї сесії, проте протягом сесії він точніший за всіх інших. Основне застосування сесійних ідентифікаторів - це збереження параметрів під час переходу між сторінками. Наприклад, запити користувача або налаштування набагато простіше зберегти на сервері в базі даних і зіставляти з ідентифікатором, ніж передавати в рядку, де вони можуть банально не поміститися.

Сесійні ідентифікатори мають дві важливі негативні якості: по-перше, вони ускладнюють індексацію пошуковими машинами, аж до повної заборони. Справа в тому, що пошуковий робот не розрізняє ідентифікатори і змушений вважати кожну сторінку багато разів, що засмічує базу даних пошукової машини. По-друге, на сторінку з таким ідентифікатором часто неможливо поставити закладку або відправити будь-кому у вигляді посилання. В силу цього сфера застосування сесійних ідентифікаторів обмежена саме вирішенням технічного завдання передачі налаштувань користувача між сторінками сайту та, в основному, застосовується для внутрішніх інтерфейсів систем, де не потрібно ставити закладку та які не повинні індексуватись пошуковими машинами. Наприклад, для внутрішніх інтерфейсів банків.

Наприклад, близько третинипокупців інтернет-магазину «Озон» (найбільшого сьогодні в Україні за кількістю покупців) забувають свої реєстраційні дані і за наступної купівлі заново реєструються. Навіть запровадження пластикових карток із даними користувача, які безкоштовно видавалися при першій покупці, хоч і покращило ситуацію, але не вирішило її повністю. Для магазину «Озон» це критична проблема, оскільки три чверті продажів відбувається постійними покупцями, і з постійними покупцями -- найважливіша складова маркетингу компанії.

Нарешті, користувач може просто передати пароль (ми все це нерідко робимо) своїм друзям або знайомим, щоб вони могли здійснювати якісь дії від його імені.

Таким чином, метод ідентифікації за реєстраційними даними - найточніший метод визначення людей (не браузерів, а саме людей). Однак він має вузьку сферу застосування через небажання користувачів залишати про себе інформацію в Інтернеті.

ЧАС НА САЙТІ - час, проведений користувачем на сайті протягом однієї сесії. Час на сайті може бути виміряний як проміжок часу з моменту запиту першої сторінки до моменту запиту останньої сторінки сесії. Важливо, що час, проведений користувачем на сторінці, зазвичай може бути виміряно, якщо користувач перейшов наступну сторінку, оскільки браузер після отримання сторінки не спілкується із сервером;

Згадані вище дані записуються в лог-файл - текстовий файл, де на кожен запит/звернення до сервера записується один рядок даних. У цьому рядку поля з описаними вище параметрами відокремлені один від одного пробілами, комами, лапками (залежить від налаштувань). Для кожної сторінки сайту записується багато рядків лог-файлу - залежно від кількості елементів, що підвантажуються насторінку, а також від формату запису в балку це може бути до декількох десятків записів.

Навряд чи ви захочете переглядати сирі дані, вам більше стануть у нагоді оброблені статистичні дані. Скільки на сайті було відвідувачів, які сторінки та з якою частотою вони дивилися, звідки прийшли на сайт, які запити вводили в пошукових машинах, щоб знайти сайт, як часто користувачі поверталися на сайт та інші важливі дані щодо поведінки відвідувачів на сайті. Потрібні статистичні звіти, а не сирі дані, оскільки саме з цифрами звітів ми працюватимемо.

Розглянемо різноманітні інструменти аналізу статистики докладніше.

ЛОГ-АНАЛІЗАТОРИ - «коробкові» програми, що встановлюються на локальний комп'ютер або сервер, які аналізують журнали запису подій (лог-файли), що накопичуються на серверах. Інакше кажучи, це аналітичні пакети, які здійснюють обробку текстового файлу і будують безліч статистичних звітів, набір яких залежить від налаштувань та можливостей лог-аналізатора.

Як і будь-який складний програмний продукт, тим більше не призначений для масової аудиторії, лог-аналізатори мають громіздкий інтерфейс, що вимагає помітної підготовки оператора. Крім того, сам аналіз логів вимагає від дослідника знань особливостей Інтернету як медіа, багатьох технічних моментів, розуміння як мінімум основ інтернет-маркетингу. Наприклад, якщо заздалегідь не налаштувати винятки, то лог-аналізатор зарахує як відвідувачів усіх пошукових роботів, які надходять на сайт для індексації контенту.

Існує кілька тисяч різних лог-аналізаторів - у базовому варіанті вони є нескладним програмним продуктом, тому їх наробили чимало. Частина з них комерційні, але більшість - безкоштовні, що з'явилисяяк розвага чи побічний продукт зовсім інших розробок. Найбільш відомі на сьогоднішній день продукти – WebTrends, NetTracker, Analog, WebAlyzer. Перші два - комерційні продукти, останні - поширюються безкоштовно. Безкоштовність лог-аналізаторів - оманлива річ. Для того щоб безкоштовна система лог-аналізу правильно працювала, досліднику необхідна незвичайна кваліфікація, а часто потрібно ще й програміст, щоб дописати необхідні модулі (благо, безкоштовні лог-аналізатори найчастіше поставляються у вихідних кодах). Таким чином, експлуатація програмного продукту, що вільно розповсюджується, може виявитися більш витратною, ніж комерційного.

Найважливіша властивість лог-аналізаторів - це можливість будувати з допомогою довільні статистичні звіти. Вони можуть називатися «Списки користувача», або Custom Reports, або Filters, або ще як-небудь, але сенс однаковий - можливість побудувати звіт за специфічними параметрами. Не виключено, що саме на цьому етапі вам знадобиться програміст, щоб написати потрібний модуль.

Приклади довільних статистичних звітів:

сторінки, які відвідували користувачі з Новосибірська, які приходять на сайт не вперше;

час, у який користувачі сайту найчастіше переглядають сторінку контактів,

частка користувачів, які переглядають цю сторінку вночі.

Лічильники - серверні програми, що ґрунтуються на статистиці викликів лічильника - невеликого шматка коду, що включається до сторінки. При завантаженні сторінки користувач браузер виявляє код лічильника, зчитує його і викликає з серверів лічильника невелику картинку. У цей момент на сервері лічильника зараховується відвідування сайту. Таким чином, лічильник враховує не запит сторінки,який відображається у лог-файлі на сервері сайту, а запит користувачем лічильника. Тобто лічильник - це дані не прямих, як у випадку з лог-файлом, а непрямих вимірів.

На відміну від лог-аналізаторів, лічильники не вимагають знання технічних подробиць функціонування веб-серверів та навичок програмування. Це продукт, що має більш простий інтерфейс і менше можливостей для налаштування, а отже, висуває менше вимог до оператора.

Нині існує чимало лічильників, у країні налічуються десятки варіантів локальних лічильників, є й міжнародні системи. Системи можуть бути комерційними, можуть бути безкоштовні. Перші зазвичай деталізовані, пропонують більше сервісів та мають безліч додаткових можливостей. Найбільш відомі сьогодні в Україні сервіси - це Google Analytics, Livelnternet (безкоштовні), SpyLOG (комерційний лічильник), за кордоном - Omniture, HitBox і WebtrendsLive (комерційні), а також безкоштовний Google Analytics.

Статистичний модуль, вбудований у CMS, може поєднувати бізнес-статистику сайту зі статистикою поведінки користувача, тобто отримати незрівнянно більший обсяг статистики, причому статистики, що безпосередньо відображає роботу сайту як бізнесу. Важливо також, що ця статистика зрозуміліша і наочніша - вона виражена безпосередньо в грошах і продажах.

На жаль, найчастіше вбудовані в CMS статистичні модулі не мають таких можливостей і є простими лічильниками, рідше - простими лог-аналізаторами, що робить їх нецікавими для використання. Для розробників CMS розробка системи лог-аналізу - зайва витрата ресурсів, якщо є окремий лічильник або лог-аналізатор, які краще пророблені, оскільки над ними постійнопрацює окрема команда програмістів, а статистичний модуль CMS - це побічний продукт, якому приділяється мало уваги. Наявність просунутого модуля аналізу в CMS системі - ще один плюс на її користь, який має бути врахований при виборі CMS-системи, оскільки дозволяє скоротити витрати на обробку статистики.

Таблиця 1. Переваги та недоліки різних інструментів вимірювання