Занятие 4. Просмотр моделей интеллектуального анализа данных для покупателя велосипеда

На этом занятии инструкция SELECT (DMX) будет использована для исследования содержимого дерева решений и кластерных моделей интеллектуального анализа данных, созданных на Занятии 2. Добавление моделей интеллектуального анализа данных в прогнозирующую структуру интеллектуального анализа данных.

Столбцы, содержащиеся в модели интеллектуального анализа данных, не являются столбцами, определенными структурой интеллектуального анализа данных, а являются особым набором столбцов, который описывает шаблоны и тренды, найденные алгоритмом. Эти столбцы модели интеллектуального анализа данных описаны в наборе строк схемы DMSCHEMA_MINING_MODEL_CONTENT Rowset. Например, столбец MODEL_NAME в наборе строк схемы содержимого содержит имя модели интеллектуального анализа данных. Для кластерной модели интеллектуального анализа данных столбец NODE_CAPTION содержит имя каждого кластера, а столбец NODE_DESCRIPTION содержит описание характеристик каждого кластера. Можно просматривать эти столбцы при помощи инструкции расширения интеллектуального анализа данных SELECT FROM <model>.CONTENT. Эту инструкцию можно также использовать, чтобы исследовать данные, использованные для создания модели интеллектуального анализа данных. Должна быть включена детализация структуры интеллектуального анализа данных, чтобы использовать эту инструкцию. Дополнительные сведения об этой инструкции см. в разделе SELECT FROM <модель>.CASES (расширения интеллектуального анализа данных).

Также можно возвращать все состояния отдельного столбца при помощи инструкции SELECT DISTINCT. Например, при выполнении этой операции со столбцом «Пол» запрос вернет male и female.

Задачи занятия

На этом занятии будут выполняться следующие задачи:

  • Исследование содержимого моделей интеллектуального анализа данных

  • Возвращение из исходных данных случаев, которые использовались для обучения моделей интеллектуального анализа данных

  • Исследование различных состояний, доступных для отдельного столбца

Возвращение содержимого модели интеллектуального анализа данных

На этом занятии с помощью инструкции SELECT FROM <модель>.CONTENT (расширения интеллектуального анализа данных) будет получено содержимое модели кластеризации.

Ниже следует базовый пример инструкции SELECT FROM <model>.CONTENT:

SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>

В первой строке исходного кода определяются столбцы, возвращаемые из содержимого модели интеллектуального анализа данных, и модель интеллектуального анализа данных, с которой они связаны:

SELECT <select list> FROM [<mining model].CONTENT

Предложение .CONTENT рядом с именем модели интеллектуального анализа данных указывает на то, что вы возвращаете содержимое из модели интеллектуального анализа данных. Дополнительные сведения о столбцах модели интеллектуального анализа данных см. в разделе Набор строк DMSCHEMA_MINING_MODEL_CONTENT.

При необходимости можно использовать последнюю строку, чтобы отфильтровать возвращаемый результат при помощи инструкции:

WHERE <where clause>

Например, если нужно ограничить результаты запроса до тех кластеров, которые содержат большое количество случаев, можно добавить предложение WHERE в инструкцию SELECT:

WHERE NODE_SUPPORT > 100

Дополнительные сведения об использовании инструкции WHERE см. в разделе SELECT (расширения интеллектуального анализа данных).

Возврат содержимого кластерной модели интеллектуального анализа данных

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и щелкните Расширения интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый пустой запрос.

  2. Скопируйте базовый пример инструкции SELECT FROM <model>.CONTENT в пустой запрос.

  3. Вместо:

    <select list> 
    

    вставьте:

    Также можно заменить символ «*» на список любых столбцов набора строк DMSCHEMA_MINING_MODEL_CONTENT.

  4. Вместо:

    [<mining model>] 
    

    вставьте:

    [Clustering]
    

    Полная инструкция теперь должна выглядеть следующим образом.

    SELECT * FROM [Clustering].CONTENT
    
  5. В меню Файл выберите Сохранить DMXQuery1.dmx как.

  6. В диалоговом окне Сохранить как укажите расположение соответствующей папки и назовите файл SELECT_CONTENT.dmx.

  7. На панели инструментов нажмите кнопку Выполнить.

    Запрос возвращает содержимое модели интеллектуального анализа данных.

Использование детализации

Следующим шагом будет использование инструкции детализации для возвращения выборки ситуаций, использованных для обучения дерева решений модели интеллектуального анализа данных. На этом занятии с помощью инструкции SELECT FROM <модель>.CASES (расширения интеллектуального анализа данных) будет получено содержимое модели дерева решений.

Ниже следует базовый пример инструкции SELECT FROM <model>.CASES:

SELECT <select list> 
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')

В первой строке исходного кода определяются столбцы, возвращаемые из исходных данных, и модель интеллектуального анализа данных, в которой они хранятся:

SELECT <select list> FROM [<mining model>].CASES

Предложение .CASES указывает на то, что выполняется запрос детализации. Чтобы использовать детализацию, нужно включить ее при создании модели интеллектуального анализа данных.

Последняя строка исходного кода является необязательной и указывает узел модели интеллектуального анализа данных, из которой извлекаются ситуации:

WHERE IsInNode('<node id>')

Дополнительные сведения об использовании инструкции WHERE с функцией IsInNode см. в разделе SELECT FROM <модель>.CASES (расширения интеллектуального анализа данных).

Возврат ситуаций, использованных для обучения модели интеллектуального анализа данных

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и щелкните Расширения интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый пустой запрос.

  2. Скопируйте базовый пример инструкции SELECT FROM <model>.CASES в пустой запрос.

  3. Вместо:

    <select list> 
    

    вставьте:

    Также можно заменить символ «*» на список любых столбцов исходных данных (например [Bike Buyer]).

  4. Вместо:

    [<mining model>] 
    

    используйте

    [Decision Tree]
    

    Полная инструкция теперь должна выглядеть следующим образом.

    SELECT * 
    FROM [Decision Tree].CASES
    
  5. В меню Файл выберите Сохранить DMXQuery1.dmx как.

  6. В диалоговом окне Сохранить как укажите расположение соответствующей папки и назовите файл SELECT_DRILLTHROUGH.dmx.

  7. На панели инструментов нажмите кнопку Выполнить.

    Запрос возвращает исходные данные, использованные для обучения дерева решений модели интеллектуального анализа данных.

Возвращение состояний отдельного столбца модели интеллектуального анализа данных

Следующим шагом будет использование инструкции SELECT DISTINCT для возвращения различных доступных состояний в указанном столбце модели интеллектуального анализа данных.

Ниже следует базовый пример инструкции SELECT DISTINCT:

SELECT DISTINCT [<column>] 
FROM [<mining model>]

Первая строка исходного кода определяет столбцы модели интеллектуального анализа данных, для которых возвращаются состояния:

SELECT DISTINCT [<column>] 

Необходимо включить DISTINCT, чтобы вернуть все состояния столбца. Если не включить DISTINCT, полная инструкция становится ярлыком для прогноза и, скорее всего, возвращает состояние указанного столбца. Дополнительные сведения см. в разделе SELECT (расширения интеллектуального анализа данных).

Возврат состояний отдельного столбца

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите пункт Создать запрос и щелкните Расширения интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый пустой запрос.

  2. Скопируйте базовый пример инструкции SELECT Distinct в пустой запрос.

  3. Вместо:

    [<column,name> 
    

    вставьте:

    [Bike Buyer]
    
  4. Вместо:

    [<mining model>] 
    

    используйте

    [Decision Tree]
    

    Полная инструкция теперь должна выглядеть следующим образом.

    SELECT DISTINCT [Bike Buyer] 
    FROM [Decision Tree]
    
  5. В меню Файл выберите Сохранить DMXQuery1.dmx как.

  6. В диалоговом окне Сохранить как укажите расположение соответствующей папки и назовите файл SELECT_DISCRETE.dmx.

  7. На панели инструментов нажмите кнопку Выполнить.

    Запрос возвращает возможные состояния столбца Bike Buyer.

На следующем занятии вы спрогнозируете, будут ли потенциальные клиенты покупать велосипеды, используя дерево решений модели интеллектуального анализа данных.