Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

После создания модели интеллектуального анализа для прогнозирования полученные результаты можно изучить с помощью вкладки Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. Средство просмотра временных рядов (Майкрософт) содержит две вкладки: Диаграммы и Модель.

Построенная модель интеллектуального анализа прогнозирования описывает продажи продуктов в трех различных регионах (в Европе, Северной Америке и Тихоокеанском регионе) за 2005–2010 г.г. В связи с этим алгоритм временных рядов (Майкрософт) создает модель временных рядов, содержащую несколько деревьев, каждое из которых содержит различное сочетание региона, продукта и прогнозируемого атрибута.

Каждая из вкладок средства просмотра позволяет получить различное представление сведений, имеющихся во всей модели временных рядов.

  • Вкладка «Диаграммы»

  • Вкладка «Модель»

  • Представление общего содержимого

Вкладка «Диаграммы»

На вкладке Диаграммы средства просмотра временных рядов (Майкрософт) в графическом виде отображаются все деревья, созданные алгоритмом. Дерево временного ряда содержит в себе уникальное сочетание из товара, региона и прогнозируемого атрибута.

В условных обозначениях, расположенных в правой части средства просмотра, перечислены выбранные в раскрывающемся списке временные ряды вместе с соответствующими им флажками. Устанавливая и снимая соответствующие флажки в условных обозначениях, можно управлять отображением временных рядов в средстве просмотра.

Также можно изменить такие параметры отображения, как цвет каждого временного ряда, или указать, отображаются ли значения при точках диаграммы.

Выбор временных рядов

  1. Перейдите на вкладку Диаграммы вкладки Средство просмотра моделей интеллектуального анализа данных, если она еще не открыта.

  2. Установите все флажки в раскрывающемся списке, расположенном справа от представления диаграммы. На диаграмме должны располагаться 24 различные линии рядов.

  3. Нажмите кнопку ОК.

  4. Снимите флажки, расположенные справа от диаграммы, чтобы временно скрыть линии всех рядов, основанных на сумме.

  5. Теперь снимите флажки, связанные с моделями велосипедов R750 и R250.

    В результате этих действий сейчас на диаграмме представлены следующие шесть линий рядов, что позволяет упростить сравнение трендов для моделей велосипедов M200 и T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Ряд, прогнозирующий количество M200 и T1000Ряд, прогнозирующий количество M200 и T1000

Диаграмма отображает как данные с предысторией, так и прогнозируемые данные. Прогнозируемые данные выделены затенением, чтобы они отличались от исторических. Для упрощения сравнения различных рядов можно изменить цвета, соответствующие каждой линии графа. Дополнительные сведения см. в разделе Как изменить цвета, используемые в средстве просмотра интеллектуального анализа данных.

Линии трендов показывают, что общий объем продаж по всем регионам в целом растет, при этом пик наступает каждые 12 месяцев в декабре. В целом прогнозы предсказывают продолжение этого тренда. Анализируя данную диаграмму, можно также сказать, что велосипеды модели T1000 имеют не такой большой объем исторических данных, как другие ряды товаров.

По умолчанию службы Analysis Services показывают пять этапов прогнозирования для каждого временного ряда. Количество этапов прогнозирования можно увеличить или уменьшить, изменив это значение. Также можно графически отобразить стандартное отклонение для прогноза путем добавления в диаграмму значений погрешностей.

Изменение параметров прогноза и отображения в представлении диаграммы

  1. Измените значение Этапы прогнозирования последовательно от 5 до 10, а затем обратно до 6.

    ПримечаниеПримечание

    Прогнозируемая амплитуда колебаний возрастает для тех линий трендов, которые соответствуют данным со значительной амплитудой колебаний в прошлом.

  2. Установите флажок Отображать отклонения.

  3. Наведите указатель мыши на планки погрешностей для ряда модели M200.

  4. Наведите указатель мыши на планки погрешностей для ряда модели T1000, продаваемой в Тихоокеанском регионе.

Эти результаты будут использоваться для дальнейшего анализа. Позднее будет разработана усредненная по всем регионам модель, не подверженная таким значительным колебаниям.

В начало

Вкладка «Модель»

Вкладка Модель средства просмотра временных рядов (Майкрософт) в конструкторе интеллектуального анализа данных позволяет просматривать временные ряды в виде диаграммы дерева принятия решений. Для каждого ряда модели вычисляется отдельное дерево. В модели временных рядов диаграмма дерева принятия решений может иметь единственный узел, если временной ряд линейный, или несколько узлов и условий, связанных с каждой веткой, как и обычное дерево принятия решений.

Узлы временных рядов на диаграмме дерева принятия решений содержат следующие сведения.

  • Концентрация вариантов состояния прогнозируемого атрибута, которая задается в элементе управления Окружение. Точное число вариантов указано в окне Условные обозначения узла, а также во всплывающих подсказках, которые появляются при наведении указателя мыши на объект дерева.

  • Формула регрессии для узла. Формула регрессии ARTXP может использоваться только в конечных узлах. Уравнение ARIMA может использоваться в корневом узле дерева.

  • Диаграмма-ромб, отображающая диапазон атрибута. Ромб расположен в точке среднего арифметического для узла, ширина ромба отражает дисперсию атрибута в этом узле.

Просмотр дерева принятия решений для модели временных рядов

  1. В списке Дерево на вкладке Модель средства просмотра выберите ряд M200 North America: Amount.

    На диаграмме будет отображен единственный узел.

  2. Наведите курсор мыши на узел.

    Для узла Все всплывающая подсказка будет содержать такие данные, как количество вариантов во всем ряду и уравнения временного ряда, полученные в ходе анализа данных.

  3. Щелкните узел, чтобы просмотреть Обозначения интеллектуального анализа данных.

    Обозначения интеллектуального анализа данных содержат информацию, аналогичную всплывающим подсказкам, и дополнительные сведения, включая гистограмму значений.

  4. В списке Дерево на вкладке Модель средства просмотра выберите ряд M200 Pacific: Amount.

    Диаграмма дерева сейчас включает в себя узел Все и два дочерних узла. Текст в дочерних узлах описывает условия, которые привели к разветвлению дерева.

  5. Наведите курсор мыши на один из дочерних узлов и изучите содержимое всплывающей подсказки. Кроме того, можно щелкнуть узел и просмотреть Обозначения интеллектуального анализа данных.

    В описании дочерних узлов приводится количество вариантов в каждой ветке дерева и любые дополнительные условия, которые привели к его разветвлению.

В начало

Средство просмотра деревьев содержимого общего вида

В дополнение к собственному средству просмотра временных рядов, службы Analysis Services предоставляют возможность использовать Средство просмотра деревьев содержимого общего вида(Майкрософт). Это средство просмотра может использоваться для всех моделей интеллектуального анализа данных независимо от используемого алгоритма. Средство просмотра деревьев содержимого общего вида доступно из раскрывающегося списка Средство просмотра.

В данном средстве просмотра каждая модель интеллектуального анализа данных, независимо от данных или используемого для анализа алгоритма, представлена в виде дерева, содержащего ряд узлов. Каждый узел представляет сведения о некотором подмножестве данных. Конкретное содержимое узлов зависит от алгоритма и типа прогнозируемого атрибута, но общая схема содержимого одинакова.

Поскольку созданная модель интеллектуального анализа данных представляет собой смешанную модель, в которой используются алгоритмы ARTXP и ARIMA, службы Службы Analysis Services используют каждый из алгоритмов для создания отдельных моделей ARTXP и ARIMA для каждого временного ряда. Если для изучения модели интеллектуального анализа данных прогнозирования используется средство просмотра временных рядов (Майкрософт), то службы Службы Analysis Services совмещают результаты двух алгоритмов и отображают модель в виде единого дерева, в котором каждый узел содержит информацию, полученную из обоих алгоритмов.

Однако, когда используется Средство просмотра деревьев содержимого общего вида(Майкрософт), содержимое, сформированное каждым алгоритмом, отображается в модели интеллектуального анализа данных для прогнозирования в виде двух узлов разного типа. Можно выполнить детализацию углублением сведений о модели, полученных с помощью алгоритма ARTXP или ARIMA.

Просмотр сведений для определенного ряда данных в средстве просмотра содержимого общего вида

  1. На вкладке Средство просмотра моделей интеллектуального анализа данных выберите Средство просмотра деревьев содержимого общего вида (Майкрософт) из раскрывающегося списка Средство просмотра.

  2. На панели Заголовок узла щелкните самый верхний узел («Все»).

  3. На панели Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд, или сочетание товара и региона, содержится в этом узле. В примере с фирмой AdventureWorks самый верхний узел соответствует ряду M200 Europe.

  4. На панели Заголовок узла найдите первый узел, у которого присутствуют дочерние узлы.

    Если узел ряда имеет дочерние узлы, то представление в виде дерева, которое отображается на вкладке Модель средства просмотра временных рядов (Майкрософт), также будет иметь разветвленную структуру.

  5. Разверните узел и щелкните один из его дочерних узлов.

    Столбец NODE_DESCRIPTION схемы содержит условие, которые привело к разбиению дерева.

  6. На панели Заголовок узла щелкните самый верхний узел ARIMA и разверните его таким образом, чтобы отобразились все дочерние узлы.

  7. На панели Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд содержится в этом узле. Самый верхний узел в разделе ARIMA должен совпадать с самым верхним узлом в разделе («Все»). В примере с фирмой AdventureWorks данный узел содержит результаты алгоритма ARIMA для ряда M200 Europe.

Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных).

В начало