Поделиться через


Создание прогнозов (учебник по интеллектуальному анализу данных — начальный уровень)

 

Применимо к: SQL Server 2016 Preview

После тестирования точности моделей интеллектуального анализа данных и решили, что вы удовлетворены результатами, то можно создавать прогнозы с помощью построителя прогнозирующих запросов на Прогноз модели интеллектуального анализа данных в конструкторе интеллектуального анализа данных.

Построитель прогнозирующих запросов имеет три представления. С разработки и запроса представлений, можно создать и проверить запрос. Затем можно выполнить запрос и просмотреть результаты в результат представления.

Во всех прогнозирующих запросах используется DMX — язык расширений интеллектуального анализа данных. Синтаксис расширения интеллектуального анализа данных похож на синтаксис T-SQL, но служит для написания запросов к объектам интеллектуального анализа данных. Хотя синтаксис расширения интеллектуального анализа данных не является сложным, с помощью построителя запросов, подобного указанному, или в SQL Server данных надстройки интеллектуального анализа для Office, делает гораздо проще выбирать входные данные и создавать выражения, поэтому мы настоятельно рекомендуем основные сведения.

Создание запроса

Первым шагом в создании прогнозирующего запроса является выбор модели интеллектуального анализа данных и входной таблицы.

Выбор модели и входной таблицы

  1. На модель интеллектуального анализа данных вкладки конструктора интеллектуального анализа данных в модель интеллектуального анализа данных нажмите кнопку Выбор модели.

  2. В выберите модель интеллектуального анализа данных диалоговом окне перейдите по дереву к Прямая почтовая рассылка структуры, разверните структуру, выберите TM_Decision_Tree, и нажмите кнопку ОК.

  3. В Выбор входных таблиц выберите выбрать таблицу вариантов.

  4. В выберите таблицу диалогового источника данных Выберите представление источника данных Adventure Works DW Multidimensional 2012.

  5. В имя таблицы или представления, выберите ProspectiveBuyer (dbo) таблицы, а затем нажмите кнопку ОК.

    ProspectiveBuyer таблицы больше всего похож vTargetMail таблицы вариантов.

Сопоставление столбцов

После выбора входной таблицы в построителе прогнозирующих запросов будет создано сопоставление по умолчанию между моделью интеллектуального анализа данных и таблицей входных данных на основе имен столбцов. По крайней мере один столбец структуры необходимо сопоставить со столбцом внешних данных.

Важно!


Данные, которые используются для определения точности моделей, должны содержать столбец, который может быть сопоставлен с прогнозируемым столбцом. Если такой столбец не существует, то можно создать его с пустыми значениями, однако этот столбец должен иметь тот же тип данных, что и прогнозируемый.

Сопоставление входных данных с моделью

  1. Щелкните правой кнопкой мыши линии, соединяющие модель интеллектуального анализа данных окна Выбор входной таблицы затем выберите Изменить соединения.

    Обратите внимание, что сопоставляется не каждый столбец. Добавим сопоставления для нескольких столбцов таблицы. Кроме того, сформируем новый столбец с датой рождения, исходя из текущего столбца данных так, чтобы столбцы лучше совпадали.

  2. В разделе столбец таблицы, нажмите кнопку Bike Buyer ячейку и выберите ProspectiveBuyer.Unknown из раскрывающегося списка.

    При этом прогнозируемый столбец [Bike Buyer] сопоставляется со столбцом входной таблицы.

  3. Нажмите кнопку ОК.

  4. В обозревателе, щелкните правой кнопкой мыши Прямая почтовая рассылка представление источника данных и выберите Конструктор представлений.

  5. Щелкните правой кнопкой мыши таблицу ProspectiveBuyer и выберите Создать именованное вычисление.

  6. В Создание именованного вычисления диалоговом для имя столбца, тип calcAge.

  7. Для Описание, тип расчета возраста, исходя из даты рождения.

  8. В выражение введите DATEDIFF(YYYY,[BirthDate],getdate()) и нажмите кнопку ОК.

    Так как входной таблице нет возраст столбца, соответствующего столбцу в модели, это выражение можно использовать для расчета возраста заказчика из столбца BirthDate входной таблицы. Поскольку возраст был определен как наиболее важный столбец для прогнозирования покупок велосипедов, он должен присутствовать в модели и входной таблицы.

  9. В конструкторе интеллектуального анализа данных выберите модель интеллектуального анализа данных и снова откройте Изменить соединения окна.

  10. В разделе столбец таблицы, нажмите кнопку возраст ячейку и выберите ProspectiveBuyer.calcAge из раскрывающегося списка.

    Предупреждение


    Если столбец не появился в списке, то может потребоваться обновить определение представления источников данных, загруженного в конструктор. Для этого из файла выберите пункт Сохранить все, а затем закройте и повторно откройте проект в конструкторе.

  11. Нажмите кнопку ОК.

Проектирование прогнозирующего запроса

  1. Первую кнопку на панели инструментов Прогнозирование моделей интеллектуального анализа Вкладка коммутатора для разработки Просмотр / переключиться в представление результатов / переключиться в режим запросов кнопки. Щелкните стрелку вниз на эту кнопку и выберите конструктора.

  2. В сетке на модель интеллектуального анализа данных щелкните ячейку в первой пустой строке в источника столбец, а затем выберите Прогнозирующая функция.

  3. В Прогнозирующая функция в строке поле выберите PredictProbability.

    В псевдоним столбец той же строки введите вероятность результата.

  4. Из модель интеллектуального анализа данных окно выше, выберите и перетащите [Bike Buyer] в Критерий или аргумент ячейки.

    Когда вы отпускаете, [TM_Decision_Tree]. [Bike Buyer] появляется в Критерий или аргумент ячейки.

    Указывает целевой столбец для PredictProbability функции. Дополнительные сведения о функциях см. в разделе расширений интеллектуального анализа данных ( расширений интеллектуального анализа данных ) Функция ссылка.

  5. Щелкните следующую пустую строку в источника столбца и выберите модель интеллектуального анализа данных TM_Decision_Tree**.**

  6. В TM_Decision_Tree в строке поле выберите Bike Buyer.

  7. В TM_Decision_Tree в строке Критерий или аргумент введите = 1.

  8. Щелкните следующую пустую строку в источника столбец, а затем выберите Таблица ProspectiveBuyer.

  9. В ProspectiveBuyer в строке поле выберите ProspectiveBuyerKey.

    При этом к прогнозирующему запросу добавляется уникальный идентификатор, который позволяет определить, кто, скорее всего, будет или не будет покупать велосипед.

  10. Добавьте еще пять строк в сетку. Для каждой строки, установите Таблица ProspectiveBuyer как источника и добавьте следующие столбцы в поле ячейки:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Наконец, выполните запрос и просмотрите результаты.

Построителя прогнозирующих запросов также включает эти элементы управления:

  • Показать флажок

    Позволяет удалять предложения из запроса без удаления их из конструктора. Это может потребоваться при работе со сложными запросами, когда возникает необходимость сохранять их синтаксис, не прибегая к копированию и вставке кода DMX в окне редактирования.

  • Группирование

    Вставляет открывающую (левую) скобку в начале выделенной строки или закрывающую (правую) скобку в конце текущей строки.

  • AND/OR

    Вставляет AND оператор или или оператор сразу после текущей функции или столбца.

Выполнение запроса и просмотр результатов

  1. В модель интеллектуального анализа данных выберите результат кнопки.

  2. После выполнения запроса отображаются результаты для просмотра.

    Модель интеллектуального анализа данных вкладке отображаются контактные данные заказчиков, которые, скорее всего покупателей велосипедов. Вероятность результата столбца указывается вероятность получения точного прогноза. Эти результаты можно использовать, чтобы определить, для каких потенциальных заказчиков следует выполнить прямую почтовую рассылку.

  3. На этом этапе можно сохранить результаты. Имеются три параметра.

    • Щелкните правой кнопкой мыши строку данных в результатах и выберите копирования Сохранить только это значение (и заголовок столбца) в буфер обмена.

    • Щелкните правой кнопкой мыши любую строку в результатах и выберите Копировать все Чтобы скопировать весь результирующий набор, включая заголовки столбцов, в буфер обмена.

    • Щелкните Сохранить результат запроса для сохранения результатов непосредственно в базу данных следующим образом:

      1. В сохранения данных результата запроса интеллектуального анализа диалоговом выбрать источник данных или определить новый источник данных.

      2. Введите имя таблицы, которая будет хранить результаты запроса.

      3. Используйте параметр, Добавить к представлению источника данных, чтобы создать таблицу и добавить его в существующее представление источника данных. Это удобно, если нужно хранить в модели в одном и том же представлении источников данных все связанные таблицы, такие как обучающие данные, исходные данные для прогнозирования и результаты запроса.

      4. Используйте параметр Перезаписать, если существует, чтобы обновить существующую таблицу с использованием последних результатов.

        Необходимо использовать параметр перезаписи таблицы при добавлении любых столбцов к прогнозирующему запросу, изменении имен или типов данных любых столбцов в прогнозирующем запросе или при выполнении любых инструкций ALTER для целевой таблицы.

        Кроме того Если несколько столбцов имеют то же имя (например, имя столбца по умолчанию выражение) необходимо создать псевдоним для столбцов с одинаковыми именами, или если конструктор пытается сохранить результаты в SQL Server, будет выдана ошибка. Причина в том, что SQL Server не разрешает применять несколько столбцов с одинаковыми именами.

        Дополнительные сведения см. в разделе сохранения данных интеллектуального анализа данных запроса диалоговое окно Result ( Интеллектуального анализа данных представление прогноза модели ).

Следующая задача занятия

Использование детализации в структуре данных ( Учебник по основам интеллектуального анализа данных )

См. также:

Создание прогнозирующего запроса с помощью построителя прогнозирующих запросов