Ідентифікація користувача руху мишки, Блог ph, КОНТ
Актуальність питань безпеки персональних даних та масового стеження нині важко переоцінити. Такі інженери як Джуліан Ассанж та Едвард Сноуден розплющили очі світової громадськості на реальні можливості всюдисущих спецслужб різних країн. Трохи менше уваги світової громадськості приділяється можливостям великих інформаційних компаній, таких як Google, Яндекс, Фейсбук або Вконтакте.
У цій статті йдеться про один із методів неявного стеження за користувачами персональних комп'ютерів, заснований на аналізі біометричних даних, що поставляються користувачами добровільно та у великому обсязі: про аналіз даних рухів миші.
Автор не має підтверджень використання описуваного підходу великими компаніями та спецслужбами.
Теоретичне обґрунтування
Хоча користувачу здається, що курсор миші переміщається плавно, для комп'ютера рух миші є послідовним набором дискретних даних. Одна одиниця даних містить положення курсору, стан кнопок миші і поточний час події. Під подією миші розуміється як натискання кнопки, і рух самої миші.
Користувач переміщає курсор миші по складній кривій і зі швидкістю, що змінюється в процесі переміщення. Як сама крива руху курсора, і швидкість руху обумовлені низкою фізіологічних і психологічних чинників. Рух миші залежить не тільки від таких факторів як розмір і маса руки, положення руки та всього тіла, але й від стану нервової системи та звичок користувача. Рух курсору миші можна порівняти з почерком: як текст папері складається з ліній, і з рухів миші складається цифровий почерк. Кожен, хто використовує мишу залишає підпис таким почерком у пам'ятікомп'ютера.
Згідно з Вікіпедією, біометрія - розпізнавання людей по одній або більше фізичних, або поведінкових рис. Рухи миші є біометричними даними, оскільки є можливість однозначного визначення користувача комп'ютера.
Методи збору та аналізу даних
На основі аналізу наукових праць з цієї тематики є можливим виділення наступних ключових етапів:
• збирання та передача сирих даних;
• зберігання сирих даних;
• виділення ключових характеристик даних («фіч»);
• навчання нейронної мережі;
• зберігання стану нейронної мережі;
• класифікація (визначення) користувачів за допомогою навченої нейронної мережі.
Є варіанти щодо обробки сирих даних. Одні системи на комп'ютері користувача збирають дані та відправляють їх на сервер для аналізу, тоді як інші обчислюють ключові характеристики безпосередньо на комп'ютері користувача та відправляють на сервер вже оброблені дані.
Вже 2007 року системи визначення користувача з урахуванням біометричних даних, отриманих з допомогою миші давали точність 95%. Пізніше вченим вдалося збільшити точність до 99,7% (три помилкові спрацьовування на 1000 порцій даних).
Характеристики персональних даних, що збираються
В основному вчені ставлять собі завдання ідентифікації користувача за отриманими біометричними даними. Однак ідентифікація – не єдина можлива сфера застосування цього підходу. У ряді робіт є заяви про отримання таких типів інформації:
• визначення емоційної реакції на матеріал, що вивчається;
• визначення психофізичних характеристик (наприклад, втома);
• визначення фізичних характеристик (зростання, вага);
Даний список може бути розширений за допомогою аналізу факторів організму та особистості, що впливають на аналізовану біометрію.
Можливі сфери застосування
При аналізі біометричних даних найчастіше використовуються нейронні мережі. Особливістю нейронних мереж є зростаюча ефективність при зростаючій кількості навчальної вибірки. Чим більшим набором зібраних даних мережа має, тим точніше працює система.
Розглянемо основні групи організацій, які можуть володіти великим набором навчальних даних в області:
• Пошукові системи. Як Яндекс, так і Google надають розробникам сайтів зручний інструмент аналізу відвідуваності сайту (Аналітікс та Метрика відповідно). Дані про рухи миші надходять до пошукових гігантів у великій кількості. Не буде перебільшенням сказати, що Яндекс може мати біометричні дані всіх громадян України. Навіть якщо користувач безпосередньо не використовує пошуковик, дані пересилаються безпосередньо з відвідуваних сайтів.
• Розробники ПЗ. Не секрет, що багато програм надсилають своїм розробникам дані про використання їх програм. Навіть якщо програма безпосередньо не надсилає вказані користувачем особисті дані, вона може надсилати дані руху миші, тим самим дозволяючи однозначно ідентифікувати користувача. Операційна система комп'ютера також є такою програмою.
• Власники каналів зв'язку. Передача біометричних даних від комп'ютера користувача сервер здійснюється через мережі провайдерів. Провайдер має можливість аналізувати дані, що передаються, по мережі даних і витягувати з них дані біометрії.
• Служби безпеки країн. Кожна спецслужба, що поважає себе, має доступ до каналів передачі якмінімум своєї країни.
Перспективи розвитку
На основі вищевикладених методів можлива постійна автентифікація користувачів під час роботи із системою. На підставі даних біометрії програмні системи можуть зрозуміти, коли певний користувач перестав працювати з системою.
Засоби захисту
На підставі можливих областей застосування методів збору біометричних даних про використання миші, а також виходячи з необхідного рівня конфіденційності, можна сформувати наступний перелік заходів протидії.
2. Для анонімного використання загальнодоступного комп'ютера слід обмежити використання миші. Дані використання клавіатури також несуть у собі біометрію, проте значно меншому обсязі.
3. Для анонімного використання особистого персонального комп'ютера, крім пункту 1, варто також налаштувати міжмережевий екран на передачу даних тільки тим серверам і лише за тими протоколами, які відомі та зрозумілі користувачеві, яким він довіряє.
4. Для роботи з критичними даними варто використовувати комп'ютер взагалі без можливості мережевої взаємодії. Або не використовувати комп'ютер взагалі.
Важливо відзначити, що ідентифікація користувача на основі даних руху миші є лише одним із багатьох способів ідентифікації. Кожен із методів має свої засоби блокування та нейтралізації.
Метод аутентифікації на основі даних руху миші, як і будь-який інший інструмент, можна використовувати як для спрощення життя, так і для покращення. Ключовим моментом тут є обізнаність користувача та його добровільна згода на збирання даних.
Цьому методу піддаються всі персональні комп'ютери, оснащені мишею. Тобто, потенційна можливість аутентифікації існує завжди. Питаннязастосування методу полягає лише в тому, чи представляє користувач інтерес для організації, що має достатнього розміру навчальною вибіркою.
Немає універсального методу захисту від збору біометричних даних, закладених у русі миші, крім як користуватися мишею.