Лабораторна робота №12, Використання інструментів prediction calculator і shopping basket analysis
Код роботи: 2516
Вид роботи: Лабораторна робота
Предмет: Інтелектуальний аналіз данних
Тема: №12, Використання інструментів prediction calculator і shopping basket analysis
Кількість сторінок: 12
Дата виконання: 2017
Мова написання: українська
Ціна: 250 грн (+ програма)
Мета: ознайомитися з використання інструментів «PREDICTION CALCULATOR» і «SHOPPING BASKET ANALYSIS»
Хід роботи
Розрахунок прогнозу.
Інструмент Prediction Calculator допомагає згенерувати і налаштувати «калькулятор», який дозволяє оцінити шанси на отримання очікуваного значення цільового параметра без підключення до аналітичних служб SQL Server. Зокрема, така можливість може бути дуже корисна для віддалених користувачів.
В якості навчального набору даних у цій частині лабораторної роботи будемо використовувати локалізований приклад для Excel, взятий з http://russiandmaddins.codeplex.com/.
Перейдемо на набір даних «Клієнти» та на вкладці Analyze виберемо Prediction Calculator. У вікні налаштувань треба вказати цільовий стовпець і шукане значення (рис. 1).
Рис. 1 - Настройки інструменту Prediction Calculator
Якщо значення цільового стовпця розглядаються як числові з безперервного діапазону, то можна вказати, як точне значення, так і бажаний інтервал. Інакше - тільки точне значення.
Нехай мета аналізу - визначити, чи купить клієнт велосипед. В якості цільового стовпця вказуємо «Придбав велосипед» і значення «Так». Далі можна вказати стовпці для аналізу. Як і в попередніх роботах, рекомендується виключати з розгляду стовпці з унікальними значеннями і стовпці, один з яких дублює інший (наприклад, точне значення заробітної плати і діапазон заробітної плати).
Інструмент завжди формує звіт Prediction Calculator Report, крім того, за замовчуванням формуються два необов'язкових звіти - Prediction Calculator («калькулятор» прогнозу у вигляді таблиці Excel) і Printable Calculator (таблиця калькулятора для друку і ручної обробки).
Щоб краще розібратися з результатами роботи інструменту, перейдемо спочатку на лист із звітом Prediction Calculator. У верхній частині звіту розташований сам калькулятор (рис. 2), у нижній - таблиця балів, що відповідає різним значенням параметрів (рис. 3).
Рис. 2 - Калькулятор
Працюючи з калькулятором, можна описати аналізований приклад, вказуючи значення для кожного параметра. Значення в стовпець Value можна вводити або вибирати з випадаючих списків (що краще, тому що менше шансів ввести некоректне значення або діапазон). Для описуваного прикладу розраховується сума балів, яка порівнюється з рекомендованим пороговим значенням. Якщо значення вище «порогу», то прогноз отримує значення «істина» (на рис. 2 сума балів 572, порогове значення 565). Друга частина звіту пояснює отриманий результат, показуючи, скільки балів за яке значення ставиться.
Рис. 3 - Таблиця балів для параметрів
Представлений на рис. 4 звіт «Printable Calculator» дозволяє вивести на друк готову форму для ручного підрахунку балів і отримання оцінки без використання комп'ютера. Це може бути зручно, наприклад, для торгових представників або інших співробітників, що працюють поза офісом і не мають доступу до комп'ютера. Все що потрібно для розрахунку прогнозу - відзначити варіанти, підсумувати бали і порівняти з пороговим значенням.
Тепер перейдемо до питання - як же було визначено порогове значення.
Звіт Prediction Calculator Report дозволяє з цим розібратися.
Рис. 4 - Звіт Printable Calculator
За підсумками аналізу формується прогноз, який може бути віднесений до однієї з чотирьох категорій:
1) істинний позитивний прогноз (англ. True Positive) - вірний прогноз. Наприклад, клієнт, для якого прогноз показав істину, насправді зацікавлений в покупці велосипеда. Магазин отримав прибуток;
2) істинний негативний прогноз (англ. True Negative) - вірний негативний прогноз. Клієнт, для якого прогноз показав незацікавленість у купівлі, насправді не збирається купувати велосипед. Магазин не отримав прибутку, але і не поніс витрат (на розсилку рекламних пропозицій і ін.);
3) помилковий позитивний прогноз (англ. False Positive; помилка 1 роду) - невірний прогноз, що показує, що клієнт хоче зробити покупку, хоча насправді це не так. Може призвести магазин до витрат на супровід клієнта;
4) помилковий негативний прогноз (англ. False Negative; помилка 2 роду) - невірний прогноз, що показує, що клієнт не хоче зробити покупку, хоча насправді він у ній зацікавлений. Може призвести до втраченого прибутку.
Звіт Prediction Calculator Report дозволяє вказати прибуток від істинних прогнозів і збиток від помилкових. На основі цих даних визначається порогове значення, що забезпечує максимум прибутку. За замовчуванням, для істинного позитивного прогнозу вказується прибуток 10 (доларів або інших одиниць), для помилкового позитивного - такий же збиток (рис. 5, таблиця в лівій верхній частині екрану). У цьому випадку максимум прибутку (графік на рис. 5 справа вгорі) якраз і буде відповідати пороговому значенню для прогнозу в 565 балів.
Рис. 5 - Звіт Prediction Calculator Report
У нижній частині звіту Prediction Calculator ліворуч розташовується таблиця з відносними вагами значень розглянутих параметрів (її ми вже зустрічали в таблиці Prediction Calculator) і графіком втрат від помилкових прогнозів.
Хай продаж велосипеда приносить магазину не 10, а 50 доларів. У цьому випадку, прибуток від одного продажу буде перекривати витрати на супровід до 5 клієнтів, що відмовилися від покупки. Відповідно зміниться і співвідношення прибутку/витрат. На рис. 6 показано, що в цьому випадку, для максимізації прибутку рекомендується встановити порогове значення для прогнозу в 443 бали.
Нове значення буде автоматично підставлено і в таблицю Prediction Calculator.
Рис. 6 - Звіт Prediction Calculator Report: при введенні нової оцінки прибутку від правильного прогнозу змінюється рекомендоване порогове значення
Завдання 1. Проведіть аналіз для двох різних наборів значень прибутку від істинних прогнозів і збитків від помилкових. Прокоментуйте результати.
Аналіз купівельної корзини
У наборі Table Analysis Tools нам залишилося розглянути інструмент Shopping Basket Analysis. Він дозволяє, наприклад, на основі даних про покупки виділити товари, що найчастіше зустрічаються в одному замовленні, і сформувати рекомендації щодо спільних продажів. У процесі аналізу використовується алгоритм Microsoft Association Rules.
Для вивчення цього інструменту, замість використаного раніше локалізованого набору даних, звернемося до прикладу з поставки надбудов інтелектуального аналізу (у попередньому файлі потрібного набору даних просто немає). Через меню «Пуск» знайдіть «Надбудови інтелектуального аналізу даних» -> «Зразки даних Excel». У цій книзі Excel c першого аркуша (рис. 7) перейдіть за посиланням «Пошук взаємозв'язків і купівельна поведінка».
Рис. 7 - Зразки даних
Рис. 8 - Запуск інструменту Shopping Basket Analysis
Відповідний набір даних (рис. 8) містить інформацію про замовлення (номер замовлення - Order Number), включених до них товарах (їх категорії - Category і власне товар - Product) і цінах.
Проаналізуємо, які категорії найчастіше потрапляють в одне замовлення. Запустимо інструмент Shopping Basket Analysis. У його настройках треба вказати ідентифікатор транзакції (Transaction ID), в нашому випадку, це Order Number і предмет аналізу (ми будемо проводити аналіз для категорій - Category). Необов'язковим параметром, що кількісно характеризує предмет аналізу (Item Value), в нашому випадку буде ціна. Якщо Item Value не вказаний, то аналізуватися буде тільки частота виявлених поєднань. Результати роботи Shopping Basket Analysis відображаються у двох звітах -
Bundled Items і Recommendations. Перший із звітів містить інформацію про сполучення (сочетания) категорій товарів, що найбільш часто зустрічаються в «одному чеку». Так, наприклад, в першому рядку звіту на рис. 9 ми бачимо, що найчастіше зустрічається поєднання категорій «дорожні велосипеди» і «шоломи» (Road Bikes, Helmets).
У розглянутому наборі воно виявлено в 805 замовленнях. Далі вказується середня ціна набору і сумарна вартість всіх подібних наборів. Можна сказати, що цей звіт описує купівельні шаблони (або переваги) клієнтів.
Рис. 9 - Звіт Shopping Basket Bundled Items
Рис. 10 - Звіт Shopping Basket Recommendations
Другий звіт - Shopping Basket Recommendations - містить рекомендації про товари, які можуть бути запропоновані разом.
Наприклад, третя сходинка звіту (рис. 10) вказує, що людям які купили шолом, варто також запропонувати придбати шини. Цей висновок базується на тому, що серед 3794, що включають шоломи покупок, 1617 включали і шини. Частка таких зв'язаних продаж дорівнює 42,62 %. Далі наводиться середній дохід від зв'язаних продаж (загальна вартість, поділена на число транзакцій, які містять «рекомендуючий» продукт, у нашому випадку - шолом) і загальна сума пов'язаних продаж. Ґрунтуючись на подібному звіті, власник магазину може вирішити, як розмістити товари, які зв'язані пропозиції можна сформувати і т.д.
Для видалення результатів роботи інструменту достатньо видалити сформовані звіти.
Завдання 2. Проведіть аналіз, аналогічний описаному вище.
Завдання 3. Проаналізуйте, які товари (а не категорії товарів, як було раніше), купуються разом. Опишіть отримані результати.