Телевимірювання відверто про потаємне, Mediasat
— Що спричинило збір статистики телегляду в мережі Ланет?


— Як відбувається збір та обробка даних?

Моніторингова частина відпрацьовує служби моніторингу працездатності всіх систем і алгоритмів. Внутрішня статистика здійснює автоматичний перерахунок у певні параметри за заданими принципами. Публічна статистика використовує частину даних внутрішньої і генерує розраховані серії даних для panel.lanet.tv.
Усі дані, які можуть бути представлені у внутрішній або зовнішній системі статистики, є знеособленими. Тобто, побудовані на основі телебачення даних певної групи користувачів, але без прямого віднесення до профілю конкретного користувача або навіть персональних системних ідентифікаторів. Однак всі типи інформації про профілі доступні як критерії для сегментації та фільтрації даних, як перед, так і після обробки.
— Як відбувається ідентифікація глядачів, хто ці люди, що ви про них знаєте?
— Чим методика відрізняється від Nielsen, BigData, DeepMetrics, VoliaSmart?
У наведеному ряду є три різні історії. Якщо говорити про вимірювання в рамках ТВ-панелі ACNielsen, то це насамперед класичне панельне дослідження. Спочатку проводиться настановне дослідження, будується репрезентативна вибірка, регулярно проводяться зважування показників, встановлюється спеціальне додаткове обладнання у домогосподарствах вибірки, що дозволяє відстежувати активність кожного глядача. Тобто основна ідея – це побудова певної моделі всієї України за заданими контрольними критеріями та вимірювання у її рамках з метою дати відповіді напитання про статистично достовірні тенденції по країні в цілому. Наша ж історія зовсім про інше. Ми маємо справу з загальним виміром (суцільним вимірюванням) усієї генеральної сукупності, що складається з усіх користувачів нашого сервісу. І результати наших досліджень лише на них і поширюються. Це далеко не вся Україна, але ми шукаємо відповіді на глибші питання, якими навіть не може поставитися класична ТВ-панель через свої технічні та ідеологічні обмеження. Оперуючи значними обсягами даних, ми маємо ступінь свободи для:
- надання даних у реальному часі без затримок;
- дослідження найвужчих сегментів користувачів, як на підставі додаткових критеріїв, так і на підставі поведінки;
- розрахунку даних про показники та динаміку середніх і дрібних каналів, які не просто не мають фінансових можливостей стати ліцензованим користувачем ТВ-панелі Nielsen, але й через її розмір не побачать там будь-яку репрезентативну картинку з осудним рівнем похибки;
- вивчення контексту споживаного контенту на телеканалах, що не вимірюються в ТВ-панелі з метою формування характеристик жанрових та тематичних переваг аудиторій.
Щодо гравців, озвучених у питанні, на мою скромну думку, у найбільш паралельному з нами напрямі рухається DeepMetrics. Принаймні їх джерела даних зрозумілі, методики прозорі, об'єкт вимірювань досить схожий на наш, і цілі значною мірою близькі – формування інструменту, що доповнює та поглиблює доступні ринку ТБ-вимірювання. Також близькими, очевидно, результатами до наших, є дослідження BigDataUa. Але на даному етапі складно судити про застосовувані методики, прозорість результатів та гнучкість.інтерпретації. Вони вийшли з досить амбітною пропозицією, яка, безумовно, має право на життя. І я сподіваюся, що їм вдасться повною мірою реалізувати свої починання.
Квартальні звіти VoliaSmart, що спираються просто на кількість перемикань каналів, це щось зовсім інше, що мало місце. Може, комусь дало поштовх, комусь допомогло, але, мабуть, має бути витіснено більш технологічними продуктами аналізу телебачення, що спираються на час та інформацію про користувача.
— Як саме поведінка користувача у сервісі може впливати на статистику?
Всі ці та подальші напрацювання, що розкривають нові типи знань про глядача, дають додаткові ступені свободи для обробки та інтерпретації результатів телебачення.
— Чи можливе стороннє втручання та спотворення даних?
Наївно стверджуватиме, що щось принципово неможливо. У сучасному світі можливо все. «Але є одне Але»… Ми вживаємо багато заходів щодо забезпечення безпеки, дублювання та резервування даних. Частина показників надходить у реальному часі, таким чином, ймовірність ручного втручання або їхнього селективного спотворення прагне нуля.
Маючи доступ до повного набору уявлень та показників, у тому числі й у реальному часі, регулярно працюючи з даними, досить легко відстежити аномальні зміни та невідповідності показників, багато з яких пов'язані між собою. Також системи початкових даних та розрахованих знеособлених показників повністю ізольовані та у будь-який момент доступна можливість «ручного» моніторингу для виявлення стороннього втручання.

— Як перевіряєте достовірність аномальних показників?
На даному етапі деякі аномалії ми відсікаємо на технологічномурівні, а при розрахунках не беремо до уваги сеанси без перемикання каналу довше 6 годин. Чому саме шість запитаєте Ви? Тому що така ж величина передбачена в ТВ панелі Nielsen і ми вирішили дотримуватись цього стандарту.
— Чи братиме Ланет участь у вимірюваннях BigData?
- Чи можливе використання методики іншими провайдерами? Монетизація?
Звичайно, для тих, кому доводиться працювати з даними телегляду, кошмарним сном може здатися кількість постачальників даних, що дорівнює кількості операторів. Але зараз у нас спостерігається процес становлення культури виміру телегляду на онлайн-платформах. І, можливо, кориснішим для майбутнього цієї сфери буде саме відкритий діалог і розвиток єдиних загальних прозорих правил гри зараз. Є надія, що дух здорового сусідства різних команд, які працюють за єдиними описаними принципами в рамках різних проектів, дозволить розвинути онлайн-вимірювання значно швидше та якісніше, ніж зливання всіх «в одну хвіртку». Можете вважати таку позицію надто ідеалістичною, але ж ніхто не має права заборонити мріяти. 🙂