Сховища та бази даних - Інформатика, програмування

1. Сховища даних

-Підтримка високої швидкості даних зі сховища;

-підтримка внутрішньої несуперечності даних;

-Можливість отримання та порівняння даних;

-повнота і достовірність даних, що зберігаються;

-Підтримка якісного процесу поповнення даних.

1)Звичайна база даних призначена для того, щоб допомогти користувачам виконувати повсякденну роботу, тоді як сховища даних призначені для прийняття рішень;

2)Звичайна база даних схильна до постійних змін у процесі роботи користувачів, а сховища даних щодо стабільно;

-дані в ньому оновлюються згідно з розкладом (наприклад, щогодини, щодня, щомісяця),

-в ідеалі, процес поповнення даними за певний період часу без зміни колишньої інформації, що знаходиться вже в сховищі.

3) Звичайна база даних найчастіше є джерелом даних, що потрапляють у сховище, крім того сховище може поповнюватися за рахунок зовнішніх джерел (наприклад, стиснення даних).

2. Принципи побудови

2.1 Основні концепції

Інформація, що завантажується у сховище, має інтегруватися в цілісну структуру, що відповідає цілям аналізу даних. При цьому мінімізуються невідповідності між даними різних оперативних систем, в сховище іменуються і виражаються єдиним чином. Дані інтегровані на множині рівнів: на рівні ключа, атрибута, на описовому, структурному рівні тощо. Загальні дані та загальна обробка даних є консолідованими і є однаковою для всіх даних, які подібні або схожі в сховищі даних. При цьому інформація структурується за різними рівнями деталізації:

-Високий ступінь сумаризації;

-низький ступіньсумаризації;

-Поточна детальна інформація.

Сховища можна як набір моментальних знімків стану даних: можна відновити картинку будь-якої миті часу. Атрибут часу завжди є у структурах даних сховища.

Потрапивши одного разу в сховище, дані вже ніколи не змінюються, а лише поповнюються новими даними з оперативних систем, де постійно змінюються. Нові дані у міру надходження узагальнюються з вже накопиченою інформацією сховища даних.

2.2 Основні компоненти сховища даних

Використання технології сховищ даних передбачає наявність у системі наступних компонентів:

-оперативних джерел даних;

-засобів перенесення та трансформації даних;

-метаданих - включають каталог сховища та правила перетворення даних при завантаженні їх з оперативних баз даних;

-засобів доступу та аналізу даних.

Призначення цих компонентів таке. Оперативні дані збираються із різних джерел. Оперативні дані, що надійшли, очищаються, інтегруються і складаються в реляційні сховища. Вони вже доступні для аналізу за допомогою засобів побудови звітів. Далі дані (повністю або частково) готуються з використанням засобів перенесення та трансформації даних для OLAP-аналізу, який реалізується застосуванням засобів доступу та аналізу даних. Вони можуть бути завантажені в спеціальну базу даних OLAP або залишатися в реляційному сховищі.

Найважливішим елементом сховища є метадані, тобто. дані про структуру, розміщення, трансформацію даних, що використовуються будь-якими процесами сховища. Метадані можуть бути потрібні для різних цілей, наприклад: вилучення та завантаження даних; обслуговування сховища та запитів.Метадані щодо різних процесів може мати різну структуру, тобто. для того самого елемента даних може існувати кілька варіантів метаданих.

Отже, сховища даних структуровані. Вони містять базові дані, які утворюють єдине джерело обробки даних у всіх системах підтримки прийняття рішень. Елементарні дані, присутні у сховищі, можуть бути представлені у різній формі. Сховища даних винятково великі, оскільки в них містяться інтегровані та деталізовані дані.

Ці характеристики є спільними всім сховищ даних. Але, незважаючи на те, що сховища мають спільні властивості, різні типи сховищ мають свої індивідуальні особливості.