Добавление статической модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

В ходе изучения модели прогнозирования было показано, что хотя продажи в большинстве регионов и следуют тому или иному шаблону, некоторые регионы и некоторые модели, например модель M200 в Тихоокеанском регионе, имеют очень разные тренды. Различия между регионами не являются редкостью и могут быть вызваны многими факторами, включая маркетинговые акции, неточные отчеты или геополитические события.

Чтобы максимально снизить воздействие таких факторов на проекции, принимается решение создать обобщенную модель интеллектуального анализа данных, основанную на статистических вычислениях продаж по всему миру. Затем с помощью этой модели можно сделать прогнозы и применить их к отдельным регионам. Наконец, требуется выполнить сравнение прогнозов, созданных для различных продуктов.

Создание данных для общей модели

Первым шагом в создании обобщенной модели является статическая обработка данных по продажам во всем мире. Для этого создается специальное представление источника данных, которое использует существующий источник данных, но выполняет вычисления, например расчет суммы или средних значений.

Создание представления источника данных с помощью пользовательского запроса или вычисления

  1. В окне Обозреватель решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.

  2. На странице приветствия мастера нажмите кнопку Далее.

  3. На странице Выбор источника данных выберите Adventure Works DW2008R2 и нажмите кнопку Далее.

  4. На странице Выбор таблиц и представлений сделайте нужный выбор и нажмите кнопку Далее.

  5. На странице Завершение работы мастера введите имя AllRegions и нажмите кнопку Готово.

  6. После этого щелкните правой кнопкой мыши пустую область конструктора представления источника данных и выберите команду Создать именованный запрос.

  7. В диалоговом окне Создание именованного запроса в поле Имя введите AllRegions, а в поле Описание — Сумма и среднее значение продаж для всех моделей и регионов.

  8. На текстовой панели SQL введите следующую инструкцию:

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Нажмите кнопку ОК..

  10. Щелкните правой кнопкой мыши таблицу AllRegions и выберите команду Просмотреть данные.

    Новое представление источника данных содержит и сумму, и среднее значение продаж всех продуктов по всему миру. Также можно сгруппировать продажи по модели и выполнить их статистическое вычисление. Однако в рамках данного учебника нужно создать одну модель временных рядов, которую можно использовать для прогнозирования с применением любого сочетания региона или продукта.

После создания нового представления данных необходимо построить новую структуру интеллектуального анализа данных, а затем модель интеллектуального анализа данных на основе этой структуры. К этому моменту вы уже должны уметь создавать структуры интеллектуального анализа данных. Поэтому следующие инструкции упрощены.

Построение структуры и модели интеллектуального анализа данных с использованием статистических данных

  1. В окне Обозреватель решений щелкните правой кнопкой мыши узел Структуры интеллектуального анализа данных и выберите команду Создать структуру интеллектуального анализа данных, чтобы запустить мастер интеллектуального анализа данных.

  2. В окне мастера интеллектуального анализа данных выберите указанные ниже элементы.

    • Алгоритм: алгоритм временных рядов (Майкрософт)

    • Представление источника данных: AllRegions

    • Раздел реестра: ReportingDate (Key Time)and Region (Key)

    • Input и Predict: AvgAmt, AvgQty, SumAmt, SumQty

    • Имя структуры интеллектуального анализа данных: Все области

    • Имя модели интеллектуального анализа данных: Все области

  3. Выполните обработку структуры и модели.

Просмотр результатов

Прежде чем решить, какую модель применять в качестве общей модели для выполнения проекций по всему миру, необходимо лучше понять прогнозы. При просмотре моделей интеллектуального анализа данных и прогнозов для различных статических рядов в средстве просмотра временных рядов (Майкрософт) возникает несколько вопросов.

  • Вплоть до июня 2006 года каждая из линий трендов следует приблизительно одному и тому же шаблону. С этого момент линии количества и суммы расходятся. Что стало причиной изменения?

  • В июле 2008 года линии расходятся снова. Что произошло?

  • Следует помнить, что прогнозы для ряда M200 North America были гораздо выше, чем для других продуктов и регионов. Возникает беспокойство по поводу того, что эти проекции могут быть неверными, следовательно, включение этого ряда может иметь негативное последствие для созданной общей модели.

В следующей задаче нужно сравнить линии трендов и прогнозы для моделей отдельных рядов с моделью, основанной на статистических данных, чтобы увидеть, как базовые данные влияют на модель.

Если модель оказалась правильной и нет необходимости в более глубоком понимании результатов, можно сразу же переходить к задаче Прогнозирование с помощью усредненной модели прогнозов (учебник по интеллектуальному анализу данных — средний уровень).