Занятие 4. Прогнозирование «Потребительской корзины»

Добавления: 5 декабря 2005 г.

На этом занятии с помощью формы SELECT FROM <модель> PREDICTION JOIN (расширения интеллектуального анализа данных) инструкции «SELECT» требуется создать прогнозы, основанные на моделях взаимосвязей, созданных на занятии Занятие 2. Добавление моделей интеллектуального анализа к структуре интеллектуального анализа «Потребительская корзина». Типы этих прогнозов определены ниже.

Форма SELECT FROM <модель> PREDICTION JOIN (расширения интеллектуального анализа данных) инструкции «SELECT» содержит три части:

  • Список столбцов модели интеллектуального анализа и функции прогнозирования, возвращаемые в результирующем наборе. Здесь же могут содержаться входные столбцы источника данных.
  • Запрос-источник, определяющий данные, которые используются при создании прогноза. Например: в пакетном запросе это может быть список клиентов.
  • Сопоставление столбцов модели интеллектуального анализа данных исходным данным. При совпадении этих имен можно использовать синтаксис «NATURAL» и пропустить процесс сопоставления столбцов.

Запрос можно расширить функциями прогнозирования. Функции прогнозирования предоставляют дополнительные данные, например, вероятность возникновения предсказанного события, а также поддержку прогнозирования на наборе обучающих данных. Дополнительные сведения о функциях прогнозирования см. в разделе Функции (расширения интеллектуального анализа данных).

Для создания прогнозирующих запросов можно также использовать построитель прогнозирующих запросов среды Business Intelligence Development Studio. Дополнительные сведения см. в разделе Использование построителя прогнозирующих запросов для создания прогнозирующих запросов расширений интеллектуального анализа данных.

Задачи занятия

На этом занятии будут выполняться следующие задачи.

  • Создать запрос для определения последующих возможных покупок клиента, основываясь на информации о позициях товара, уже находящихся в его корзине. Данный запрос будет создан с использованием модели интеллектуального анализа, у которой свойство MINIMUM_PROBABILITY имеет значение по умолчанию.
  • Создать запрос для определения последующих возможных покупок клиента, основываясь на информации о позициях товара, уже находящихся в его корзине. Данный запрос будет создан с использованием модели интеллектуального анализа со значением MINIMUM_PROBABILITY, равным 0,01.

Одноэлементная инструкция PREDICTION JOIN

На первом этапе в одноэлементной инструкции прогнозирования используется SELECT FROM <модель> PREDICTION JOIN (расширения интеллектуального анализа данных). В следующем фрагменте показан общий пример одноэлементной инструкции:

SELECT <select list>
    FROM [<mining model>] NATURAL PREDICTION JOIN
(SELECT '<value>' AS [<column>], 
    (SELECT 'value' AS [<nested column>] UNION
        SELECT 'value' AS [<nested column>] ...) 
    AS [<nested table>])
AS [<input alias>]

В первой строке кода определяются столбцы модели интеллектуального анализа, которые возвращает запрос, а также модель интеллектуального анализа данных, которая использовалась для создания прогноза:

SELECT <select list> FROM [<mining model>] 

Следующие строки кода определяют товар в корзине покупателя, на основе которого будет сформирован прогноз относительно следующих покупок данного клиента:

(SELECT '<value>' AS [<column>], 
    (SELECT 'value' AS [<nested column>] UNION
        SELECT 'value' AS [<nested column>] ...) 
    AS [<nested table>])

Формирование прогноза с помощью модели со значением свойства MINIMUM_PROBABILITY по умолчанию

Создание запроса взаимосвязей

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Analysis Services, укажите пункт Создать запрос и щелкните DMX.

    Откроется редактор запросов, содержащий новый пустой запрос.

  2. Скопируйте общий пример использования инструкции PREDICTION JOIN в пустое окно запроса.

  3. Вместо:

    <select list> 
    

    вставьте:

    PREDICT([Association].[Products],INCLUDE_STATISTICS,3)
    

    Можно было бы включить только имя столбца [Products], но функция Predict позволяет ограничить количество позиций товара, возвращаемых алгоритмом, до трех. С помощью инструкции INCLUDE_STATISTICS можно получить основание, вероятность и скорректированную вероятность для каждой позиции товара. Такие статистические данные позволяют оценить точность прогнозирования.

  4. Вместо:

    [<mining model>] 
    

    вставьте:

    [Association]
    
  5. Вместо:

    (SELECT '<value>' AS [<column>], 
        (SELECT 'value' AS [<nested column>] UNION
            SELECT 'value' AS [<nested column>] ...) 
        AS [<nested table>])
    

    вставьте:

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    

    Здесь инструкция UNION используется для задания трех позиций товара, которые должны быть добавлены в корзину вместе с прогнозируемыми компонентами. Столбец «Модель» инструкции SELECT относится к столбцу модели, содержащемуся во вложенной таблице товаров.

    Полная инструкция теперь должна выглядеть следующим образом:

    SELECT
      PREDICT([Association].[Products],INCLUDE_STATISTICS,3)
    From
      [Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В диалоговом окне Сохранить как укажите путь к соответствующей папке и присвойте файлу имя Association Prediction.dmx.

  8. На панели инструментов нажмите кнопку Выполнить.

    По этому запросу возвращается таблица, в которой перечислены три позиции товара (HL Mountain Tire, Fender Set - Mountain и ML Mountain Tire) в порядке вероятности их попадания в ту же корзину, где находятся три продукта, указанные в запросе. Кроме этого, в таблице содержатся статистические данные, описывающие точность прогноза.

Формирование прогноза с помощью модели со значением 0,01 у свойства MINIMUM_PROBABILITY

Создание запроса взаимосвязей

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Analysis Services, укажите пункт Создать запрос и щелкните DMX.

    Откроется редактор запросов, содержащий новый пустой запрос.

  2. Скопируйте общий пример использования инструкции PREDICTION JOIN в пустое окно запроса.

  3. Вместо:

    <select list> 
    

    вставьте:

    PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)
    
  4. Вместо:

    [<mining model>] 
    

    вставьте:

    [Modified Association]
    
  5. Вместо:

    (SELECT '<value>' AS [<column>], 
        (SELECT 'value' AS [<nested column>] UNION
            SELECT 'value' AS [<nested column>] ...) 
        AS [<nested table>])
    

    вставьте:

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    

    Здесь инструкция UNION используется для задания трех позиций товара, которые должны быть добавлены в корзину вместе с прогнозируемыми компонентами. Столбец «Модель» инструкции SELECT относится к столбцу модели, содержащемуся во вложенной таблице товаров.

    Полная инструкция теперь должна выглядеть следующим образом:

    SELECT
      PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)
    From
      [Modified Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В диалоговом окне Сохранить как укажите путь к соответствующей папке и присвойте файлу имя Modified Association Prediction.dmx.

  8. На панели инструментов нажмите кнопку Выполнить.

    По этому запросу возвращается таблица, в которой перечислены три позиции товара (HL Mountain Tire, Water Bottle и Fender Set - Mountain) в порядке вероятности их попадания в ту же корзину, где находятся три продукта, указанные в запросе. Кроме этого, в таблице содержатся статистические данные, описывающие точность прогноза.

    По результатам запроса становится понятно, что значение параметра MINIMUM_PROBABILITY влияет на результаты, возвращаемые запросом.

Это было последним этапом учебника «Потребительская корзина». Созданный набор моделей может быть использован для прогнозирования типов товаров, которые клиент обычно покупает одновременно.

Дополнительные сведения об использовании DMX в других сценариях прогнозирования см. в разделе Учебник по расширениям интеллектуального анализа данных «Покупатель велосипеда».