Занятие 1. Создание модели интеллектуального анализа данных временных рядов и структуры интеллектуального анализа данных

На этом занятии будет создана модель интеллектуального анализа данных, с помощью которой можно спрогнозировать значения во времени на основании исторических данных. После создания модели автоматически будет создана базовая структура, которую можно использовать в качестве основы для дополнительных моделей интеллектуального анализа данных.

На этом занятии предполагается, что вы знакомы с моделями прогнозирования и требованиями алгоритма временных рядов (Майкрософт). Дополнительные сведения см. в разделе Алгоритм временных рядов (Майкрософт).

Инструкция CREATE MINING MODEL

Инструкция CREATE MINING MODEL (расширения интеллектуального анализа данных) используется для непосредственного создания модели интеллектуального анализа данных и автоматического формирования базовой структуры интеллектуального анализа данных. Код инструкции можно разбить на следующие части:

  • присвоение имени модели;

  • определение временной метки;

  • определение необязательного ключевого столбца ряда;

  • определение прогнозируемого атрибута или атрибутов.

В следующем фрагменте показан стандартный пример инструкции CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]
(
   <key columns>,
   <predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH

Первая строчка кода определяет имя модели интеллектуального анализа данных:

CREATE MINING MODEL [Mining Model Name]

Службы Analysis Services автоматически формируют имя базовой структуры путем добавления строки «_structure» к имени модели, что гарантирует несовпадение имени структуры и модели. Дополнительные сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе Идентификаторы (расширения интеллектуального анализа данных).

В следующей строке кода задается ключевой столбец модели интеллектуального анализа данных, который в случае с моделью временных рядов уникально определяет временной этап в исходных данных. Временной этап определяется с помощью ключевых слов KEY TIME после имени столбца и типов данных. Если модель временных рядов имеет отдельный ключ ряда, она определяется с помощью ключевого слова KEY.

<key columns>

Следующая строка кода используется для определения столбцов в прогнозируемой модели. Отдельная модель интеллектуального анализа данных может иметь несколько прогнозируемых атрибутов. В таком случае алгоритм временных рядов (Майкрософт) создает отдельный анализ для каждого ряда:

<predictable attribute columns>

Задачи занятия

На этом занятии будут выполняться следующие задачи:

  • Создание нового пустого запроса

  • Изменение запроса, чтобы создать модель интеллектуального анализа данных

  • Выполнение запроса

Создание запроса

На первом этапе необходимо подключиться к экземпляру служб Службы Analysis Services и создать новый DMX-запрос в среде Среда SQL Server Management Studio.

Создание нового DMX-запроса в среде SQL Server Management Studio

  1. Откройте среду Среда SQL Server Management Studio.

  2. В диалоговом окне Соединение с сервером в списке Тип сервера выберите Службы Analysis Services. В поле Имя сервера введите LocalHost или имя экземпляра служб Службы Analysis Services, к которому необходимо подключиться на данном занятии. Щелкните Соединить.

  3. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и щелкните Расширения интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый пустой запрос.

Изменение запроса

Следующим шагом будет изменение инструкции CREATE MINING MODEL, чтобы создать модель интеллектуального анализа данных, используемую для составления прогнозов, а также ее базовую структуру интеллектуального анализа данных.

Настройка инструкции CREATE MINING MODEL

  1. В редакторе запросов скопируйте общий пример инструкции CREATE MINING MODEL в пустое окно запроса.

  2. Замените следующий код:

    [mining model name] 
    

    на

    [Forecasting_MIXED]
    
  3. Замените следующий код:

    <key columns>
    

    на

    [Reporting Date] DATE KEY TIME,
    [Model Region] TEXT KEY
    

    Ключевое слово TIME KEY указывает на то, что столбец ReportingDate содержит значения временных этапов, используемые для определения порядка следования значений. Временными этапами могут быть даты и значения времени, целые числа или любой другой тип упорядоченных данных при условии, что значения уникальны, а данные отсортированы.

    Ключевые слова TEXT и KEY указывают на то, что столбец ModelRegion содержит дополнительный ключ ряда. Допускается использование только одного ключа ряда, при этом значения в столбце должны отличаться друг от друга.

  4. Замените следующий код:

    < predictable attribute columns> )
    

    на

        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    
  5. Замените следующий код:

    USING <algorithm name>([parameter list])
    WITH DRILLTHROUGH
    

    на

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    

    Параметр алгоритма AUTO_DETECT_PERIODICITY = 0,8 указывает на то, что алгоритм должен обнаруживать циклы в данных. Установка значения, близкого к 1, позволяет обнаружить множество шаблонов, но может замедлить процесс обработки.

    Параметр алгоритма FORECAST_METHOD задает алгоритм анализа данных ARTXP или ARIMA или сочетание обоих алгоритмов.

    Ключевое слово WITH DRILLTHROUGH обеспечивает возможность просмотра подробной статистики в исходных данных после завершения создания модели. Добавьте это предложение в том случае, если нужно просматривать модель с помощью средства просмотра временных рядов (Майкрософт). Для создания прогноза оно не требуется.

    Полная инструкция теперь должна выглядеть следующим образом:

    CREATE MINING MODEL [Forecasting_MIXED]
         (
        [Reporting Date] DATE KEY TIME,
        [Model Region] TEXT KEY,
        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В диалоговом окне Сохранить как перейдите к соответствующей папке и присвойте файлу имя Forecasting_MIXED.dmx.

Выполнение запроса

На последнем шаге нужно выполнить запрос. Создав и сохранив запрос, его необходимо выполнить, чтобы сформировать модель интеллектуального анализа данных и соответствующую структуру на сервере. Дополнительные сведения о выполнении запросов в редакторе запросов см. в разделе Окно «Редактор запросов компонента Database Engine в среде SQL Server Management Studio».

Выполнение запроса

  • На панели инструментов в редакторе запросов щелкните Выполнить.

    Состояние запроса после завершения выполнения инструкции отображается на вкладке Сообщения в нижней части редактора запросов. Сообщение должно выглядеть следующим образом:

    Executing the query 
    Execution complete
    

    Теперь на сервере содержится новая структура с именем Forecasting_MIXED_Structure, а также связанная с ней модель интеллектуального анализа данных Forecasting_MIXED.

На следующем занятии к созданной структуре интеллектуального анализа данных Forecasting_MIXED будет добавлена модель интеллектуального анализа данных.