Використання контенту соцмереж для аналізу Big Data корейський досвід - Інформаційний портал
Дивна пішла мода, запозичена у Заходу: безапеляційно і не доречно заявляти про першість. Куди не глянь - суцільно кращі компанії, що локалізуються на п'ятачку суші в полі зору: так черв'як хвалить яблуко, не помічаючи сусідні плодові, не здогадуючись про існування інших садів.
Покемони проникли у суспільну свідомість феноменом без тіні реальності, складських запасів, витонченої логістики, відходів виробництва. А мені нещодавно довелося брати участь у проекті збагачення клієнтської бази представника корейського мережевого роздробу та її обробки інструментами аналізу Big Data.
Пропонувалося три рівні інтеграції:
повідомити додаток ідентифікатори профілю, тригер онлайн-статусу і міток геопозицій в режимі «знайомого» за 10% знижку зробили 21% обережних і нежадібних клієнтів.
Численні експерименти показали, що другим крилом «птаха споживання» є товариськість і сприйнятливість клієнта. Мешканці мережі, які публікують більше 10 постів, що не дублюються на день, виявилися поганими комунікаторами - занадто розпорошують увагу фоловерів різномасним публікаціями.
Ті, хто публікує від 5 до 10 постів на день, пишуть експресивні тексти, забирають увагу на себе, легко йдуть у нетрі спілкування незалежно від точки інформаційного входу. Найбільш зосередженими виявилися клієнти, які публікують 15–30 постів на тиждень, – тримають фокус, спілкуються предметно.
Групу середньої активності назвали «Амбівертами», припустили серединні показники активності, сприйнятливості… і прогадали: на їхні пости предметно відгукувалися 67% екстравертів (перша, найбільш товариська група), 41% амбівертів та 23% інтровертів з розподілом фотографічно18, 7 та 8% при фактичному споживанні: 26, 11 та 6%.
Екстраверти частіше за інших розміщували в початкових постах фотографії себе в одязі бренду, але не виявляли ні найменшої лояльності до ритейлерів, що намагаються порадувати знижками. Схоже, їхня поведінка не провокувала ланцюгових реакцій, які ведуть фоловерів до магазинів. Початкові гіпотези не підтвердилися та не дали корисних закономірностей.
Кластеризація виділила чотири стійкі групи мешканців мережі з передбачуваними моделями особистої споживчої та мережевої поведінки («Новички», «Адепти», «Стримані», «Захоплені»), але жоден із кластерів не чинив значного впливу постами ні на свою групу, ні на сусідні. Проект переставав бути важким.
Численні експерименти та гіпотези з даними, зазначеними в профілях, та числовими параметрами напруженості участі в дискусіях не давали результатів, тому було прийнято рішення відмовитися від аналізу анкетної інформації, перейшовши до семантичного аналізу текстів та компонентної оцінки фотографій.
Фотографії вивантажувалися в потік, нормувалися, ротувалися, відсіювалися засвічені та затемнені, потім проводилася незалежна оцінка трьома експертами послідовних параметрів:
Художність смаку та оригінальність композиції;
Загальне враження завзяття та щастя на обличчях у кадрі;
Доброзичливість та ступінь призовності підпису під постом;
Наявність на фото елементів магазину, одягу чи логотипу бренду;
Актуальність колекції та поєднання речей усередині клубу торгових марок рітейлера;
Згадуваність місця покупки, об'єктивність відгуків про предмет гардеробу, порівняльний ступінь у тексті.
На другому етапі провели аналіз поведінки споживачів у точках продажу, зіставивши його з мережевими даними. Wi-Fi в магазинах, акції на ігрові мобільні додатки сторонніх виробників (корпоративна знижка за обсяг завантажень) та RFID-мітки допомогли пов'язати занесені у примірювальні, але не куплені речі з номерами мобільних власників.
За кожним артикулом почала накопичуватися раніше недоступна інформація:
скільки разів міряли та не купили представники кожного кластера та з яких причин:
не сів по фігурі;
не подобається принт;
не відповідає розміру;
погано поєднується з рештою одягу;
скільки схожих речей заносилося в примірювальну:
той самий артикул, але інший колір;
той самий артикул, але інший принт;
той самий артикул, але інший розмір;
скільки супутніх речей заносилося в примірювальну:
верх для низу чи навпаки;
інші колекції чи капсули.
Закономірності почали вимальовуватися, коли побудували ланцюжки кластерів: «Спільність» (фотографії та пости) – «Профіль» (дані анкети) – «Примірюваність» (успішність примірок у магазині) – «Успішність» (відсоток придбань після примірок) – «Спостережуваність» ( площа, поверх, тип торгової точки).
Вийшло дві матриці по 1'200 ймовірностей для кожного артикула (3 «Товариські» x 4 «Профілю» x 5 «Примірюваностей» x 5 «Удачностей» x 4 «Спостережності») – ймовірність того, що:
Саме цей клієнт придбає певний товар у конкретному магазині.
Покупець спровокує ланцюгову реакцію інтересу та покупок серед мережевих друзів.
Враховуючи розподіл популяції в магазинах та успішність товарів у кластерів покупців, я планував змінити асортиментну матрицю, щоб вхідні покупці стикалися з великою кількістю хітів, але власник міжнародної мережі казуального одягу попередив мою запопадливість:«Залишиш лише хіти, і частина з них неминуче перетвориться на аутсайдерів».