Лекція Застосування технології OLAP у діяльності підприємства
Код роботи: 925
Вид роботи: Лекція
Предмет: Сучасні інформаційні технології (СІТ)
Тема: Застосування технології OLAP у діяльності підприємства
Кількість сторінок: 11
Дата виконання: 2016
Мова написання: українська
Ціна: безкоштовно
Призначення сховищ даних – надання користувачам інформації для статистичного аналізу і прийняття управлінських рішень. Сховища даних повинні забезпечувати високу швидкість одержання даних, можливості одержання і порівняння, так званих зрізів даних, а також повноту і вірогідність даних.
OLAP (On-line Analitical Processing) є ключовим компонентом побудови і застосування сховищ даних. Ця технологія заснована на побудові багатомірних наборів даних – OLAP-кубів, осі якого містять параметри, а осередку – залежні від них агрегатні дані.
Оперативна аналітична обробка багато років використовувалася переважно бізнес-аналітиками й іншими експертами в області обробки даних. Але з недавньою появою Web-OLAP систем, що спрощують упровадження програмного забезпечення і пропонують користувачеві знайомий інтерфейс браузера, компанії стали впроваджувати складні аналітичні можливості в масштабах усього підприємства.
1. Система підтримки прийняття рішень у людино-машинних системах керування. Праці Інституту проблем керування РАНЕЙ ім. В.А. Трапезникова.
2. Том УШ. М.: ИПУРАН, 2002р. с. 46-59.
3. Арлазаров В.Л., Журавльов Ю.И., Ларичев О.И., Лохин В.М., Макаров И.М., Рахманкулов В.З., Фін В.К. Теорія і методи створення інтелектуальних комп’ютерних систем // Інформаційні технології і обчислювальні системи – 1999. – №1.
4. Валькман Ю.Р. Інтелектуальні технології дослідницького проектування. – Київ: Port-Royal. – 1998.
5. Комарова Л.Г. Оптимізація обчислювальної системи на її імітаційній моделі. // Вісник МГТУ ім. Н.Э.Баумана. – сірий. «Приладобудування». – 1999. - №2. – С. 48-60.
6. Литвак Б.Г. Експертні технології керування. М.: Справа, 2004 р.
7. Трахтенгеру Э.А. Комп’ютерна підтримка прийняття рішень. – М.: Наука, 1998р.
8. Чекинов Г.П., Куляниця А.Л., Бондаренко В.В. Застосування ситуаційного керування в інформаційній підтримці прийняття рішень при проектуванні організаційно-технічних систем // Інформаційні технології в проектуванні і виробництві, №2, 2003.
9. Львів В. Створення систем підтримки прийняття рішень на основі сховищ даних // Системи керування базами даних. – 1999. - №3. – С. 30-40.
10. Цукрі А.А. Концепції побудови і реалізації інформаційних систем, орієнтованих на аналіз даних // Системи керування базами даних. – 1998. - №4. – С. 55-70.
Роботи іноземною мовою:
11. Codd E.F., Codd S.B., Salley C.T. Providing OLAP (On-line Analitical Processing) to User-Analysts: An IT Mandate. - E.F.Codd & Associates, 2003. – http://www.hyperion.com/downloads/OLAP CoddWP.pdf.
12. Inmon W.H. Building the Data Warehouse. 3rd Edition.- John Wiley & Sons, 2005. – 356 p.
Електронні ресурси:
13. Інтернет-сайт підтримки російськомовних користувачів OLAP – http://www.olap.ru.
Ми розуміємо, що таке БД і навіщо вони потрібні. Створюються і обробляються реляційні БД за допомогою відповідних СУБД (Access, ORACLE та ін.).
БД – це організована структура, яка призначена для зберігання інформації на комп’ютерних носіях.
БД призначені для того, щоб допомагати користувачам виконувати повсякденну роботу, тобто БД постійно змінюються в процесі роботи. Наприклад, продаж товарів і виписка рахунків виконується з використанням БД, призначеної для обробки транзакцій. Такі БД – оперативні.
Менш зрозумілим є термін «сховище даних» та для чого створюються сховища даних і як їх використовувати.
Сховище даних відповідає таким умовам:
1) Створюється із оперативних БД за декілька років, а також за рахунок зовнішніх джерел, наприклад, статистичних звітів.
2) Дані відносно стабільні. Процес поповнення - це просте додавання нових даних за останній рік.
Сховища реляційних даних призначені тільки для обробки та аналізу інформації для прийняття управлінського рішення.
Задача АНАЛІТИКА – знаходити закономірності у великих масивах даних. Для цього йому потрібен гнучкий і потужний інструмент. Традиційних звітів, навіть побудованих на основі єдиного сховища даних підприємства, недостатньо.
Інструментом для гнучкого перегляду даних сховища для статистичного аналізу та створення аналітичних звітів є технологія OLAP (On-line Analitical Processing).
Оперативні дані збираються з різних джерел, очищаються, інтегруються і складаються в реляційне сховище. Зараз вони вже доступні для аналізу за допомогою різних засобів побудови звітів. Потім дані (цілком або частково) підготовляються для OLAP-аналізу. Вони можуть бути завантажені у спеціальну БД OLAP або залишені в реляційному сховищі.
Метадані – інформація про структуру, розміщення і трансформацію даних.
Завдяки метаданим забезпечується ефективна взаємодія різних компонентів сховища.
Розглянемо стисло використання технології OLAP
Якщо дані компанії відображаються в двовимірному виді (Excel, Cristal Reports) , то поле для аналізу плоске.
|
USA |
CAM |
Russia |
Продукт 1 |
534 |
174 |
534 |
Продукт 2 |
18 |
19 |
148 |
Продукт 3 |
49 |
20 |
29 |
Продукт 4 |
186 |
48 |
18 |
Продукт 5 |
18 |
56 |
19 |
Незважаючи на те, що одночасно видно лише два параметри, можна змінювати параметри і переглянути все потрібне. Для такого перегляду можна скористатися технологією ЗВЕДНІ ТАБЛИЦІ ТП Excel.
Якщо параметрів для перегляду багато, то більш доцільно скористатися можливостями OLAP інструмента, наприклад, MS SQL Server 7.0 OLAP Services, аналітична платформа Deduktor.
Реляційні БД представляють дані у виді двовимірної (плоскої) структури. БД OLAP застосовують багатомірну структуру – куб (не обов’язково три виміри). Куби можуть будуватися на звичайних реляційних БД. Куби можна оновлювати або заповнювати звичайним способом з використанням багатомірного аналізу даних.
Рис. 1 - Приклад OLAP куба
OLAP надає зручні швидкодіючі засоби доступу, перегляду й аналізу ділової інформації. Користувач одержує природньо зрозумілу модель даних, організовану у вигляді багатовимірних кубів (Cubes).
Осями багатовимірної системи координат служать основні атрибути аналізованого бізнес-процесу. Наприклад, для продаж це можуть бути товар, регіон, час, тип покупця.
На перетинаннях осей вимірів (Dimensions) знаходяться дані. Кількісно процес оцінюється мірами (Measures).
Користувач аналізуючи інформацію може «розрізати» куб по різним напрямкам, одержувати зведені або, навпаки, детальні дані і виконувати інші потрібні маніпуляції.
Розглянемо тривимірний куб, де як міри використаємо суми продаж, а як виміри – час, товар, магазин. Виміри представлені на певних рівнях угрупування: товари групуються по категоріях, магазини - по країнах, дані про час здійснення операцій – по місяцях. Пізніше ми розглянемо рівні угруповання (ієрархії) докладніше.
Рис. 2 - Приклад куба в OLAP
«Розрізування» куба
Навіть тривимірний куб складно відобразити на екрані комп’ютера так, щоб було видно значення цікавлячих мір. Що вже говорити про куби з кількістю вимірів, більше 3-х ? Для візуалізації даних, що зберігаються в кубі, застосовуються, як правило, звичні двовимірні, тобто табличні, представлення, що мають складні ієрархічні заголовки рядків і стовпців.
Двовимірне представлення куба можна одержати, «розрізавши» його поперек однієї або кількома осями (вимірами): ми фіксуємо значення усіх вимірів, крім двох, - і отримуємо звичайну двовимірну таблицю. У горизонтальній осі таблиці (заголовки стовпців) представлено один вимір, у вертикальній (заголовки рядків) – інше, а в осередках таблиці – значення мір. При цьому набір мір фактично розглядається як один з вимірів – ми або вибираємо для показу одну міру (і тоді можемо розмістити в заголовках рядків і стовпців два виміри), або показуємо кілька мір (і тоді одну з осей таблиці займуть назви мір, а іншу – значення єдиного «нерозрізаного» виміру).
На рис. 3 зображений двовимірний зріз куба для однієї міри – Unit Sales (продано штук) і двох «нерозрізаних» вимірів - Store (магазин) і Час (Time).
Рис. 3 - Двовимірний зріз куба для однієї міри в OLAP
На рис. 4 представлено лише один «нерозрізаний» вимір – Store Sales (сума продажі) і Store Cost (витрати магазину).
Рис. 4 - Двовимірний зріз куба для декількох мір в OLAP
Двовимірне представлення куба можливо і тоді, коли «нерозрізаними» залишаються і більш двох вимірів. При цьому на осях зрізу (рядках і стовпцях) будуть розміщені два або більше вимірів куба, що розрізається – див. рис. 5.
Рис. 5 - Двовимірний зріз куба з декількома вимірами на одній осі в OLAP
Класифікація OLAP програм
Спочатку повторимо загальновідоме визначення OLAP. OLAP (On-line Analitical Processing) – процес оперативного аналізу – це клас програмного забезпечення, що надає користувачеві можливість миттєво, у режимі реального часу одержувати відповіді на довільні аналітичні запити.
Так склалося, що не будь-які програми, що швидко виконують довільні запити, розрахунки і видають користувачеві дані у зрозумілому йому виді прийнято вважати OLAP-засобами. До класу OLAP відносять тільки ті програми, що як зовнішній інтерфейс надають користувачеві багатомірну керовану таблицю. Ця таблиця дозволяє користувачеві змінювати місцями стовпчики і рядки, закривати і розкривати <виміри> - описові стовпчики, задавати умови фільтрації і при цьому вона автоматично обчислює проміжні в групах дані і остаточні підсумки по <фактах> - цифровим стовпчикам. Невід’ємною частиною OLAP-аналізу є графічне відображення даних.
Програми, що реалізують цю методику, поділяються на наступні категорії:
- OLAP-сервер або MOLAP-багатомірна СУБД. Це машина обчислень і багатомірна БД, до якої звертаються клієнтські програми з командами на одержання даних і виконання обчислень. У МOLAP зберігаються <куби> - набори даних, фактів і вимірів, із заздалегідь обчисленими агрегатами.
- MOLAP-компонента. Це інструмент програміста, за допомогою якого розробляються клієнтські програми, що одержують обчислені <зрізи> кубів від OLAP-сервера по якому-небудь інтерфейсі, наприклад OLE DB for OLAP корпорації Microsoft.
- ROLAP-компонента. Це теж інструмент програміста. На відміну від візуального OLAP-компонента вона містить власну OLAP-машину для перетворення реляційних даних або багатомірної матриці в багатомірні куби. Іншими словами, ця програма по запиті користувача в оперативній пам’яті обчислює агрегати і сама ж їх відодражає на екрані.
- ROLAP-сервер. Відносно новий клас програмного забезпечення. На відміну від OLAP-сервера не має у своєму складі багатомірної бази даних, а перетворить дані реляційної СУБД у багатомірні куби по запиті багатьох клієнтських додатків.
- OLAP-програма. Це закінчене рішення, що містить у своєму складі OLAP-компонент, засоби опису довільних запитів (Ad-hoc querty) і інтерфейс доступу до БД. У свою чергу такі програми можна розбити на дві групи: МOLAP- і ROLAP-програми.
МOLAP (Multidimensional OLAP) – ісходні і агрегатні дані зберігаються в багатомірній БД. Shlecht – багатомірні дані повністю «содержат» ісходні реляційні дані.
ROLAP (Relational OLAP) – ісходні дані зберігаються в тій же самій реляційній БД. Агрегатні дані розміщуються в спеціальній таблиці в тій же БД.
HOLAP (Hybrid OLAP) – ісходні дані зберігаються в тій же самій реляційній БД, а агрегатні дані зберігаються в багатомірній БД.