Особи Чернова

Основна ідея представлення інформації в "особах Чернова" полягає у кодуванні значень різних змінних у характеристиках чи рисах людської особи [66]. Приклад такого "особи" наведено на рис.16.2.

Мал. 16.2. "Обличчя Чернова"

До кожного спостереження малюється окреме "обличчя". На кожному "особі" відносні значення змінних представлені як форми та розміри окремих рис обличчя (наприклад, довжина та ширина носа, розмір очей, розмір зіниці, кут між бровами).

Аналіз інформації за допомогою такого способу відображення базується на здібності людини інтуїтивно знаходити подібності та відмінності в межах особи.

чернова

На рис. 16.3 представлений набір даних, кожен запис якого виражений у вигляді "особи Чернова".

Мал. 16.3. Приклад багатовимірного зображення даних за допомогою "особ Чернова"

Перед використанням методів візуалізації необхідно:

∙ Проаналізувати, чи слід зображати всі дані або їх частину.

∙ Вибрати розміри, пропорції та масштаб зображення.

∙ Вибрати метод, який може яскраво відобразити закономірності, властиві набору даних.

Багато сучасних засобів аналізу даних дозволяють будувати сотні типів різних графіків та діаграм. Тому вибір методу візуалізації, якщо він самостійно здійснюється користувачем, не такий простий і легкий, як здається на перший погляд. Наявність великої кількості засобів візуалізації, представлених в інструменті, який застосовує користувач, може викликати навіть розгубленість.

Одну і ту ж інформацію можна подати за допомогою різних засобів. Для того, щоб засіб візуалізації міг виконувати своє основне призначення - представляти інформацію в простому і доступному для людськогосприйняття у вигляді - необхідно дотримуватися законів відповідності обраного рішення змісту інформації, що відображається, і її функціональному призначенню. Іншими словами, потрібно зробити так, щоб при погляді на візуальне подання інформації можна було відразу виявити закономірності у вихідних даних та приймати на їх основі рішення.

Серед двовимірних та тривимірних засобів найбільш широко відомі лінійні графіки, лінійні, стовпчикові, кругові секторні та векторні діаграми.

Наведемо рекомендації щодо використання цих найпростіших і найпопулярніших засобів візуалізації.

За допомогою лінійного графіка можна відобразити тенденцію, передати зміни ознаки у часі. Для порівняння кількох рядів чисел такі графіки наносяться на ті самі осі координат.

Гістограму застосовують для порівняння значень протягом деякого періоду або співвідношення величин.

Кругові діаграми застосовують, якщо потрібно відобразити співвідношення елементів і цілого, тобто. для аналізу складу чи структури явищ. Складові частини цілого зображуються секторами кола. Сектори рекомендують розміщувати за їх величиною: вгорі - найбільший, інші - рух годинникової стрілки в порядку зменшення їх величини. Кругові діаграми застосовують також для відображення результатів факторного аналізу, якщо дії всіх факторів є односпрямованими. При цьому кожен фактор відображається у вигляді одного із секторів кола.

Вибір того чи іншого засобу візуалізації залежить від поставленого завдання (наприклад, потрібно визначити структуру даних або динаміку процесу) і від характеру набору даних.

Якість візуалізації

Сучасні аналітичні засоби, у тому числі Data Mining, немислимі без якісної візуалізації. В результатівикористання засобів візуалізації мають бути отримані наочні та виразні, ясні та прості зображення, за рахунок використання різноманітних засобів: кольору, контрасту, кордонів, пропорцій, масштабу тощо.

У зв'язку зі зростанням вимог до засобів візуалізації, а також необхідності порівняння їх між собою, в останні роки було сформовано низку принципів якісного візуального подання інформації.

Принципи Тафта (Tufte's Principles) графічного представлення даних високої якості [67] свідчать:

∙ надавайте користувачеві найбільшу кількість ідей, у найкоротший час, з найменшою кількістю чорнила на найменшому просторі;

∙ кажіть правду про дані.

[65] описані основні принципи компонування візуальних засобів подання інформації:

1. Принцип лаконічності.

2. Принцип узагальнення та уніфікації.

3. Принцип акценту на основних смислових елементах.

4. Принцип автономності.

5. Принцип структурності.

6. Принцип стадійності.

7. Принцип використання звичних асоціацій та стереотипів.

Принцип лаконічності говорить про те, що засіб візуалізації повинен містити лише ті елементи, які необхідні для повідомлення користувачеві істотної інформації, точного розуміння її значення або прийняття (імовірно не нижче допустимої величини) відповідного оптимального рішення.

даних

Крім зазначених вище принципів, засіб візуалізації повинен мати високу надійність і швидкість, яка влаштує користувача, який приймає на основі цієї інформації рішення.

Подання просторових характеристик

Окремим напрямом візуалізації є наочне уявлення просторових показників об'єктів. УУ більшості випадків такі кошти виділяють на карті окремі регіони та позначають їх різними кольорами в залежності від значення аналізованого показника.

На рис. 16.4 наведено приклад такої візуалізації в середовищі MineSet [26], що є в даному випадку інструментом візуального Data Mining. Карта представлена ​​у вигляді графічного інтерфейсу, що відображає дані у вигляді тривимірного ландшафту довільно визначених та позиціонованих форм (стовпчастих діаграм, кожна з індивідуальними висотою та кольором). Такий спосіб дозволяє наочно показувати кількісні та реляційні характеристики даних та швидко ідентифікувати в них тренди.

Мал. 16.4. MineSet. Ландшафтний візуалізатор

Основні тенденції у галузі візуалізації

Як зазначалося, за допомогою засобів візуалізації підтримуються важливі завдання бізнесу, серед яких - процес прийняття рішень. У зв'язку з цим виникає необхідність переходу засобів візуалізації на якісніший рівень, який характеризується появою абсолютно нових засобів візуалізації та поглядів на її функції, а також розвитком низки тенденцій у цій галузі.

Серед основних тенденцій у галузі візуалізації Філіп Рассом (Philip Russom) виділяє [68]:

∙ Розробка складних видів діаграм.

∙ Підвищення рівня взаємодії з візуалізацією користувача.

∙ Збільшення розмірів та складності структур даних, що надаються візуалізацією.

1. Розробка складних видів діаграм.

Більшість візуалізацій даних побудовано на основі діаграм стандартного типу (секторні діаграми, графіки розсіювання тощо). Ці способи є одночасно найстарішими, найбільш елементарними та поширеними. В останні роки перелік видів діаграм, що підтримуються інструментальнимизасобами візуалізації, суттєво розширився. Оскільки потреби користувачів дуже різноманітні, інструменти візуалізації підтримують різні типи діаграм. Наприклад, відомо, що воліють секторні діаграми та гістограми, тоді як вчених більше влаштовують візуалізації у вигляді графіків розсіювання та діаграм констеляції. Користувачі, що працюють з геопросторовими даними, сильніше зацікавлені в картах та інших тривимірних поданнях даних. Електронні інструментальні панелі, у свою чергу, популярніші серед керівників, що використовують технології для контролю за показниками роботи компанії. Такі користувачі потребують наочної візуалізації у вигляді "спідометрів", "термометрів" та "світлофорів".

Засоби створення діаграм та презентаційної графіки призначені головним чином для візуалізації даних. Однак можливості такої візуалізації зазвичай вбудовані і в безліч різних інших програм і систем - інструменти репортингу і OLAP, засоби для Text Mining і Data Mining, а також додатки для управління бізнесом. Для створення вбудованої візуалізації багато постачальників реалізують візуалізаційну функціональність у вигляді компонентів, що вбудовуються в різні інструменти, програми, програми (у тому числі інструментальні панелі та персоналізовані сторінки порталів).

2. Підвищення рівня взаємодії з візуалізацією користувача.

Наприклад, базова взаємодія дозволяє користувачеві обертати діаграму або змінювати її тип у пошуках найбільш повного представлення даних. Крім того, користувач може змінювати візуальні властивості - наприклад, шрифти, кольори та рамки. У візуалізаціях складного типу (графіках розсіювання або діаграм констеляції) користувач може вибирати інформаційні точки за допомогоюмиші і переміщати їх, полегшуючи цим розуміння подання даних.

Більш досконалі методи візуалізації даних часто включають діаграму або будь-яку іншу візуалізацію як складовий рівень. Користувач може поглиблюватися (drill down) у візуалізацію, досліджуючи подробиці

узагальнених нею даних, або заглиблюватись у OLAP, Data Mining чи інші складні технології.

Складна взаємодія дозволяє користувачеві змінювати візуалізацію знаходження альтернативних інтерпретацій даних. Взаємодія з візуалізацією передбачає мінімальний за своєю складністю інтерфейс користувача, в якому користувач може керувати поданням даних, просто "кликаючи" на елементи візуалізації, перетягуючи і поміщаючи уявлення об'єктів даних або вибираючи пункти меню. Інструменти OLAP або Data Mining перетворюють безпосередню взаємодію з візуалізацією на один з етапів ітераційного аналізу даних. Засоби Text Mining або управління документами надають такій безпосередній взаємодії характеру навігаційного механізму, що допомагає користувачеві досліджувати бібліотеки документів.

Візуальний запит є найсучаснішою формою складної взаємодії користувача з даними. У ньому користувач може, наприклад, бачити крайні інформаційні точки графіка розсіювання, вибирати їх мишкою та отримувати нові візуалізації, які представляють саме ці точки. Програма візуалізації даних генерує відповідну мову запиту, керує прийняттям запиту базою даних і візуально представляє результуючу множину. Користувач може сфокусуватись на аналізі, не відволікаючись на складання запиту.

3. Збільшення розмірів та складності структур даних, що надаються візуалізацією.

Елементарна секторна діаграмаабо гістограма візуалізує прості послідовності числових інформаційних точок. Однак нові вдосконалені типи діаграм здатні візуалізувати тисячі таких точок і навіть складні структури даних, наприклад, нейронні мережі.

Скажімо, засоби OLAP (а також інструменти генерації запитів та випуску звітів) вже давно підтримують діаграми для своїх звітів онлайн. Нові візуалізаційні програми оновлюють контент за рахунок зчитування даних, що періодично повторюється. Фактично користувачі візуалізаційних програм, що відстежують лінійні процеси (коливання фондового ринку, показники роботи комп'ютерних систем, сейсмограми, сітки корисності та ін.), потребують завантаження даних у режимі реального часу або близького до нього режиму.

Користувачі інструментів Data Mining зазвичай аналізують великі набори чисельних даних. Традиційні типи діаграм для бізнесу (секторні діаграми та гістограми) погано справляються з поданням тисяч інформаційних точок. Тому інструменти Data Mining майже завжди підтримують форму візуалізації даних, здатну відображати структури і закономірності досліджуваних наборів даних, відповідно до того аналітичного підходу, який використовується в інструменті.

Крім того, що візуалізація підтримує обробку структурованих даних, вона є ключовим засобом представлення схем про неструктурованих даних, наприклад текстових документів, тобто.