Распечатать страницу
Главная \ База готовых работ \ Готовые работы по компьютерным дисциплинам \ Системы поддержки и принятия решений \ 870. Лабораторна робота №3, Візуалізація даних та OLAP-аналіз в аналітичній платформі Deductor

Лабораторна робота №3, Візуалізація даних та OLAP-аналіз в аналітичній платформі Deductor

« Назад

Код роботи: 870

Вид роботи: Лабораторна робота

Предмет: Системи підтримки та прийняття рішень (СППР)

Тема: №3, Візуалізація даних та OLAP-аналіз в аналітичній платформі Deductor

Кількість сторінок: 1

Дата виконання: 2015

Мова написання: українська

Ціна: 250 грн

Мета роботи: вивчення засобів візуалізації та OLAP – аналіз в аналітичній платформі Deductor

Хід роботи

1. Візуалізація даних

Теоретичні відомості

Для візуалізації даних в Deductor призначений Майстер візуалізації, який запускається за допомогою контекстного меню, або клавіші F5, або ж кнопки  Крім Майстра візуалізації, виконати відображення даних можна і на останніх кроках Майстра імпорту та Майстра експорту.

В аналітичній платформі Deductor до простих засобів візуалізації відносяться (рис. 1):

  Б870, Рис. 1. Засоби візуалізації в аналітичній платформі Deductor

Рис. 1. Засоби візуалізації в аналітичній платформі Deductor

1. Таблиця – класичне представлення інформації в стовпцях та колонках. В Deductor таблиця підтримує складну структуру, об’єднання по колонках, різноманітне форматування.

2. Статистика (рис. 2) – надає інформацію про статистичні характеристики досліджуваної вибірки. Як правило, вона представлена в табличній формі та ведеться для кожного поля вибірки. Статистичні характеристики часто дозволяють висувати гіпотези про поведінку даних та наявні закономірності, контролювати результати обробки даних на різних етапах аналітичного процесу.

 Б870, Рис. 2. Таблиця статистики процесу «Продажи»

Рис. 2. Таблиця статистики процесу «Продажи»

3. Діаграма – як правило використовуються для візуалізації дискретного (скінченого) набору значень (в той же час, як графіки в основному використовують для відображення неприливних числових значень, хоча принципової різниці між першим (діаграмою) та другим (графіком) нема). Як правило, в діаграмах по горизонтальній осі Х відкладають категорії, а по вертикальній У – значення. Різновидами діаграми є: стовпчикова, лінійна, кругова та листкова (рис. 3а – 3г).

4. Гістограма – є різновидом діаграми (зазвичай, стовпчиковою), яка відображає частоту появи тієї або іншої події в загальній сукупності всіх можливих подій. Наприклад, якщо вважати подією те, що досліджувана величина набуває деякого значення або потрапляє деякий діапазон значень, то кожен елемент гістограми показує, скільки разів дана подія відбувається. Гістограми широко використовуються в статистиці для визначення найбільш вірогідних значень, яких може набувати деяка величина, а також для виявлення законів розподілу яким підкоряється випадкова величина.

  Б870, Рис. 3а. Стовпчикова діаграма

Рис. 3а. Стовпчикова діаграма

Б870, Рис. 3б. Лінійна діаграма

Рис. 3б. Лінійна діаграма

  Б870, Рис. 3в. Кругова діаграма

Рис. 3в. Кругова діаграма

Б870, Рис. 3г. Листкова діаграма

Рис. 3г. Листкова діаграма

5. OLAP – куб – фактично це крос-таблиця, яка служить для відображення багатовимірних процесів.

6. Загальні відомості – відображають загальну інформацію про виконану операцію – вузла (імпорту,обробки, експорту тощо). Загальні відомості є, наприклад, єдиним візуалізатором, який створюється при завантаженні даних у сховище. В загальних відомостях виводиться характеристика вузла, об’єкта та виконаної операції (рис. 4).

  Б870, Рис. 4. Загальні відомості вузла завантаження виміру «Група.Код» в СД

Рис. 4. Загальні відомості вузла завантаження виміру «Група.Код» в СД

Побудований будь-який візуалізатор відображається у вигляді окремої закладки (рис.5)

   Б870, Рис. 5. Візуалізатори на закладках

Рис. 5. Візуалізатори на закладках

Для редагування параметрів візуалізаторів призначені спеціальні панелі інструментів. Детально зупинимося на панелі інструментів для редагування параметрів діаграм та гістограм (рис. 6)

  Б870, Рис. 6. Панель інструментів для редагування параметрів діаграм

Рис. 6. Панель інструментів для редагування параметрів діаграм

Таблиця

Властивості панелі інструментів для редагування параметрів діаграм

 Б870, Таблиця 1 - Властивості панелі інструментів для редагування параметрів діаграм

 

Практичне завдання 1

1. Імпортуйте дані з файлу Data.txt

Як бачите, ми маємо дані про продаж груп молочних товарів за 5 років по місяцях.

2. Залиште в таблиці лише дані продаж по товарній групі «Кефір».

3. Запустіть майстер візуалізації та створіть діаграму динаміки продаж кефіру в тисячах гривень.

4. За допомогою панелі інструментів на закладці «Диаграмма» зробіть наступне:

А. Вертикальне вирівнювання підписів осі Х(тобто дат).

Б. Виведіть одночасно динаміку продаж в тис. грн. і тонах.

С. Виведіть легенду внизу.

Д. Кінцевий вигляд діаграми показано нижче.

 Б870, Таблиця 2 - динаміка продаж в тис. грн. і тонах

5. Використавши обробник «Группировка» до кореневого вузла імпорту, відобразіть агреговані дані про продажах по товарних групах (при цьому дата нас вже не цікавить).

6. До нового вузла застосуйте майстер візуалізації та побудуйте секторну діаграму, яка б показала частку кожної товарної групи в тонах. Введіть для секторів мітки з процентами.

7. Кінцевий вигляд діаграми показано нижче:

 Б870, Таблиця 3 - майстер візуалізації та побудова секторної діаграми

 

2. OLAP-аналіз

Теоретичні відомості

В Detuktor Studio OLAP – візуалізатором виступає OLAP-куб (або просто Куб), який є дуже зручним способом аналізу багатовимірної інформації та дозволяє простим маніпулюванням мишки отримати аналітичні дані в різних розрізах.

Для ілюстрації можливостей побудуємо OLAP – куб на прикладі СД, що будувалося в лабораторній роботі №3.

Поставимо перед собою завдання побудувати багатовимірний звіт, яки би відображав динаміку сум продажу по місяцям року в розрізі аптек та груп товарів.

Першою проблемою, з якою ми зіткнемося, є відсутність в нашому СД виміру «Місяць (є тільки вимір «Дата», однак аналізувати, наприклад, продажі окремо по 100 різних датах, м’яко кажучи, не дуже зручно та розумно). Вирішенням проблеми є застосування спеціального обробника «Дата и время». Послідовність дії виглядає наступною:

1. Переконатися чи є в Detuktor Studio підключене та активоване потрібне СД з ЛР2 (рис. 4, у Вас може виглядає по-іншому). В разі потреби підключіть потрібне СД.

  Б870, Рис. 4. Підключення СД

Рис. 4. Підключення СД

2. На закладці сценарії «Сценарии» здійснимо імпорт процесу «Продажи» зі СД (імпортувати потрібно виміри: «Група: Найменування», «Відділ. Найменування», «Дата» та факти «Кількість. Сумма» та «Сума. Сумма») – рис.5

  Б870, Рис. 5. Гілка імпорту процесу «Продажи»

Рис. 5. Гілка імпорту процесу «Продажи»

3. За допомогою кнопки Б870, Deductor - 2, Майстер опції застосуйте до імпортованої гілки обробник «Дата и время», вказавши на 2 кроці майстра опції, що відображені на рис. 6. Результатом даної дії стане поява в таблиці даних двох нових колонок «Дата (Год)» та «Дата (Месяц)».

 Б870, Рис. 6. Застосування до гілки «Продажи» обробника «Дата и время»

Рис. 6. Застосування до гілки «Продажи» обробника «Дата и время»

Після цього можна переходити до побудови OLAP – кубу. Для цього запустимо Майстер візуалізації (кнопка Б870, Deductor - 1, Майстер візуалізації  та виконаємо наступні кроки:

- виберемо спосіб візуалізації – OLAP – аналіз – Куб (рис. 7а).

- Тепер вкажемо, які поля повинні бути виміром, які – фактами, а які – інформаційними (наприклад, дата) – рис. 4 б.

- наступний крок – 4-ий – задає, які з полів будуть відображатися в стовпцях, а які – в рядках. Відмітимо, що розміщення полів по замовчуванню, оскільки в процесі роботи з OLAP- кубом все це можна змінити (рис. 7в).

- Далі слід визначити, що буде відображатися на перетині рядків та стовпців. В даному випадку це значення «Количество. Сумма» та «Сумма. СУмма». Відмітимо, що цей параметр в процесі роботи з OLAP-кубом можна змінювати (рис. 7г).

  Б870, Рис. 7а. Вибір візуалізатора

Рис. 7а. Вибір візуалізатора

Б870, Рис. 7б. Завдання вимірів та фактів, що беруть участь в кубі

Рис. 7б. Завдання вимірів та фактів, що беруть участь в кубі

  Б870, Рис. 7в. Вибрання полів для стовпців та рядків

Рис. 7в. Вибрання полів для стовпців та рядків

Б870, Рис. 7г. Вибір відображення фактів

Рис. 7г. Вибір відображення фактів

Результатом виконаної роботи є побудований OLAP-куб (рис. 8)

 Б870, Рис. 8. Побудований OLAP-куб

Рис. 8. Побудований OLAP-куб

Варто відмітити, що в Кубі синіми полями позначаються виміри, які беруть участь у побудові кубу, а зеленими – виміри, як не беруть участь у побудові кубу, так звані приховані або «запасні» виміри. Перетворювати прихований вимір у активний можна його перетягуванням в область над колонкою або рядком (на рис. 9. жовта стрілка), аналогічна для перетворення виміру з активного в неактивний слід виконати протилежну дію (на рис. 9. червона стрілка).

 

Практичне заняття 2

1. Продажі по місяцях та групах товарів.

2. Продаж по відділах та групах товарів.

3. Після цього повернуть OLAP-куб у вихідне положення, яке зображено на рис. 8.

Тепер розглянемо, які операції можна виконувати над OLAP-куб при аналізі даних. Але для цього потрібно вивчити кнопки на панелі інструментів, які для цього призначені.

Отож, панель інструментів OLAP-кубу (аналогічне можна здійснювати через праву кнопку миші).

 Б870, Рис. 9. Панель інструментів для редагування параметрів діаграм

Рис. 9. Панель інструментів для редагування параметрів діаграм

Таблиця

Властивості кнопок панелі інструментів для редагування діаграм

Б870, Таблиця 4 - Властивості кнопок панелі інструментів для редагування діаграм

Найбільш важливі операції розглянемо детальніше:

До таких операцій належать: фільтрація, спосіб відображення фактів,сортування.

Фільтрація даних – виконується за допомогою Б870, Deductor - 3, Фільтрація даних , після чого відкриється вікно селектора (рис. 10),де власне і задаються параметри фільтрування.

З’ясуймо призначення елементів цього вікна:

- «Измирения и факты» - фільтрація розуміє під собою відображення не всього масиву даних, а лише його частини і власне цей розділ задає ті виміри,по яким потрібно провести фільтрування даних.

- «Факты и варианты агрегации» - дозволяє провести фільтрацію фактів, тобто відобразити ті суми чи кількості товарів (для даного випадку), які задовольняють певну умову.

- «Условие» - умова фільтрації записів по значеннях вибраного факту.

Розглянемо на конкретному прикладі дію даного механізму.

Б870, Рис. 10. Вікно селектора для фільтрування

Рис. 10. Вікно селектора для фільтрування

Нехай нам потрібно відібрати ті товарні групи, що приносять 70% доходів. Для цього:

1. Привести OLAP-куб до наступного вигляду (рис. 11)

  Б870, Рис. 11. OLAP-куб

Рис. 11. OLAP-куб

2. Відкрити селектор фільтрування.

3. Задати параметри, що відображені на рис. 10.

Слід зауважити, якщо в OLAP-кубі відфільтровані дані, то піктограма кнопки фільтрації має червоний колір  Б870, Deductor - 4, відфільтровані дані в OLAP-кубі (за допомогою цієї кнопки фільтр можна прибрати).

Зніміть фільтрацію в кубі.

Перетягніть вимір «Відділ» в колонки OLAP-кубу.

Також зручно фільтрувати виміри можна за допомогою кнопки  Б870, Deductor - 5, фільтрування і їх назві, відмітивши у випадаючому списку ті значення вимірів, які Вас цікавлять, наприклад (рис. 12) та натиснувши кнопку  Б870, Deductor - 6, ОК.

  Б870, Рис. 12. Випадаючий список для фільтрації вимірів

Рис. 12. Випадаючий список для фільтрації вимірів

Відобразити приховане значення вимір можна протилежним способом до його приховування.

Налаштування відображення фактів. За допомогою кнопки Б870, Deductor - 7, відображення фактів можна:

- підкнопка Б870, Deductor - 8, максимальні та мінімальні факти у фактах, крім сум, можна ввести, наприклад, максимальні, мінімальні та інші значення, а також, крім абсолютних значень, ще й відносні (рис. 13).

- підкнопка  Б870, Deductor - 9, обрахування фактів - обрахувати додаткові показники, на основі існуючих. Наприклад, якщо суми поділити на курс долара, то отримаємо продажі у відповідній валюті.

 Б870, Рис. 13. Вікно «Настройка фактов»

Рис. 13. Вікно «Настройка фактов»

Для прикладу, ми хочемо побачити, крім абсолютних значень, ще й відносні значення (відсотки) кількостей та сум груп товарів, проданих по всіх аптеках. Задавши параметри, що показані на рис. 13, ми отримаємо наступний вигляд OLAP-кубу (рис. 14).

 Б870, Рис. 14. OLAP-куб після налаштування фактів

Рис. 14. OLAP-куб після налаштування фактів.

 

Практичне завдання 3

Тепер спробуйте самостійно створити новий факт – «Суми, $» (існуючий факт «сума» поділити на 8).

Сортування. Для сортування можна скористатися двома способами:

1. Швидкий спосіб – навести курсор на заголовок стовпця. Поки останній не матиме вигляд,що зображений на рис. 15, та натиснути мишку. Перший клік призведе до сортування по зростанню,другий – сортування по спаданню,а третій – поверне дані до початкового вигляду.

  Б870, Рис. 15. Вигляд курсору при сортуванні фактів

Рис. 15. Вигляд курсору при сортуванні фактів

2. Розширений спосіб полягає у використання кнопки Б870, Deductor - 10, Розширений спосіб сортування , яка відкриває діалогове вікно, в якому можна провести сортування як фактів, так і вимірів. В цьому власне і полягає різниця між першим та другим способом.

 

Завдання для самостійної роботи

1. В існуючому OLAP-кубі вивести наступні виміри? У стовпці – Відділи, у рядки – Групи товарів.

2. Вивести наступні значення фактів: Суму продаж по кожній групі та Максимум суми за місяць по кожній групі товарів.

3. Залишити в кубі лише дані по Аптеці 1 та Аптеці 2.

4. Відсортувати стовпець «Сума» по зростанню.

5. Побудувати стовпчикову діаграму, яка б точно відповідала рис. 16.

 Б870, Рис. 16. Стовпчикова діаграма обсягів продаж по Аптеці 1 та Аптеці 2 груп товарі

Рис. 16. Стовпчикова діаграма обсягів продаж по Аптеці 1 та Аптеці 2 груп товарі