Занятие 2. Добавление моделей интеллектуального анализа к структуре интеллектуального анализа «Покупатель велосипеда»

На этом занятии к структуре интеллектуального анализа «Покупатель велосипеда», созданной на занятии Занятие 1. Создание структуры интеллектуального анализа данных для покупателя велосипеда, будет добавлено две модели интеллектуального анализа данных. Эти модели интеллектуального анализа позволяют просматривать данные, используя одну модель, и создавать прогнозы с помощью другой модели.

Для просмотра того, каким образом потенциальные заказчики могут быть упорядочены в соответствии со своими характеристиками, необходимо создать модель интеллектуального анализа на основе Алгоритм кластеризации (Майкрософт). На одном из следующих занятий будет изучено, каким образом этот алгоритм находит кластеры заказчиков с похожими характеристиками. Например, может оказаться, что некоторые заказчики живут близко друг от друга, ездят на велосипеде и имеют примерно равный уровень образования. Можно использовать данные кластеры, чтобы лучше понять, каким образом различные заказчики связаны между собой, и использовать эти сведения для создания маркетинговой стратегии, рассчитанной на конкретных заказчиков.

Для прогнозирования того, купит ли потенциальный заказчик велосипед, следует создать модель интеллектуального анализа данных на основе Алгоритм дерева принятия решений (Майкрософт). Этот алгоритм просматривает данные, связанные с каждым потенциальным заказчиком, и находит характеристики, релевантные для прогнозирования покупки велосипеда. Затем он сравнивает значения характеристик заказчиков, уже купивших велосипеды, с характеристиками потенциальных заказчиков для определения возможности того, что они купят велосипеды.

Инструкция ALTER MINING STRUCTURE

Инструкция ALTER MINING STRUCTURE (расширения интеллектуального анализа данных) используется для добавления модели интеллектуального анализа данных к структуре интеллектуального анализа. Исходный код инструкции можно разбить на части:

  • Определение структуры интеллектуального анализа данных

  • Указание имени модели интеллектуального анализа

  • Определение ключевого столбца

  • Определение столбцов исходных данных и прогнозируемых столбцов

  • Идентификация алгоритма и изменений параметра

В следующем фрагменте показан стандартный пример инструкции ALTER MINING MODEL:

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

В первой строке кода идентифицируется существующая структура интеллектуального анализа данных, к которой будут добавлены модели интеллектуального анализа данных:

ALTER MINING STRUCTURE [<mining structure name>]

В следующей строчке кода модели интеллектуального анализа данных, добавляемой к структуре интеллектуального анализа, присваивается имя:

ADD MINING MODEL [<mining model name>]

Дополнительные сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе Идентификаторы (расширения интеллектуального анализа данных).

Следующие строки кода задают столбцы из структуры интеллектуального анализа, которые будут использоваться моделью интеллектуального анализа:

[<key column>],
<mining model columns>

Можно использовать только существующие столбцы структуры интеллектуального анализа, причем первый столбец из списка должен быть ключевым столбцом структуры интеллектуального анализа.

В последней строчке кода определяется алгоритм интеллектуального анализа данных, который создает модель интеллектуального анализа, и параметры, которые можно передать алгоритму:

) USING <algorithm name>( <algorithm parameters> )

Дополнительные сведения о задаваемых параметрах алгоритма см. в разделах Алгоритм дерева принятия решений (Майкрософт) и Алгоритм кластеризации (Майкрософт).

С помощью следующего синтаксиса можно указать столбец модели интеллектуального анализа, который следует использовать для прогнозирования:

<mining model column> PREDICT

В последней строке кода, которая является необязательной, определяется фильтр, применяемый при обучении и проверке модели. Дополнительные сведения о применении фильтров к моделям интеллектуального анализа данных см. в разделе Создание фильтров для моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Задачи занятия

На этом занятии вы выполните следующие задачи:

  • Добавьте модель интеллектуального анализа данных дерева принятия решений к структуре интеллектуального анализа «Покупатель велосипеда» с помощью алгоритма дерева принятия решений (Майкрософт)

  • Добавьте модель интеллектуального анализа данных кластеризации к структуре интеллектуального анализа «Покупатель велосипеда» с помощью алгоритма кластеризации (Майкрософт)

  • Поскольку требуется ознакомиться с результатами для всех вариантов, ни для одной модели не должен быть добавлен фильтр.

Добавление модели интеллектуального анализа дерева принятия решений к структуре интеллектуального анализа данных

Сначала следует добавить модель интеллектуального анализа данных на основе алгоритма дерева принятия решений (Майкрософт).

Для добавления модели интеллектуального анализа дерева принятия решений

  1. В обозревателе объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и выберите пункт DMX, чтобы открыть редактор запросов и создать новый, пустой запрос.

  2. Скопируйте стандартный пример использования инструкции ALTER MINING STRUCTURE в пустое окно запроса.

  3. Вместо:

    <mining structure name> 
    

    используйте

    [Bike Buyer]
    
  4. Вместо:

    <mining model name> 
    

    на:

    Decision Tree
    
  5. Замените:

    <mining model columns>,
    

    на

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    В этом случае столбец [Bike Buyer] обозначается как столбец PREDICT.

  6. Замените:

    USING <algorithm name>( <algorithm parameters> ) 
    

    на:

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    Инструкция WITH DRILLTHROUGH позволяет просматривать объекты, использованные для построения модели интеллектуального анализа.

    В результате инструкция должна выглядеть следующим образом:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. В меню Файл выберите Сохранить DMXQuery1.dmx как.

  8. В диалоговом окне Сохранить как укажите расположение соответствующей папки и назовите файл DT_Model.dmx.

  9. На панели инструментов нажмите кнопку Выполнить.

Добавление модели интеллектуального анализа кластеризации к структуре интеллектуального анализа данных

Теперь можно добавить модель интеллектуального анализа данных к структуре интеллектуального анализа «Покупатель велосипеда» на основе алгоритма кластеризации (Майкрософт). Поскольку модель интеллектуального анализа данных кластеризации будет использовать все столбцы, определенные в структуре интеллектуального анализа данных, можно использовать контекстное меню, чтобы добавить модель к структуре без определения столбцов интеллектуального анализа данных.

Добавление модели интеллектуального анализа кластеризации

  1. В обозревателе объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и выберите пункт DMX, чтобы открыть редактор запросов и создать новый, пустой запрос.

  2. Скопируйте стандартный пример использования инструкции ALTER MINING STRUCTURE в пустое окно запроса.

  3. Вместо:

    <mining structure name> 
    

    используйте

    [Bike Buyer]
    
  4. Вместо:

    <mining model> 
    

    на:

    Clustering Model
    
  5. Удалите:

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. Вместо:

    USING <algorithm name>( <algorithm parameters> )
    

    используйте

    USING Microsoft_Clustering
    

    Полная инструкция должна выглядеть так:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. В меню Файл выберите Сохранить DMXQuery1.dmx как.

  8. В диалоговом окне Сохранить как укажите расположение соответствующей папки и назовите файл Clustering_Model.dmx.

  9. На панели инструментов нажмите кнопку Выполнить.

На следующем занятии вы научитесь обрабатывать модели и структуры интеллектуального анализа.