Поделиться через


Создание структуры модели интеллектуального анализа данных прямой почтовой рассылки (учебник по интеллектуальному анализу данных — начальный уровень)

Первым шагом в создании сценария прямой почтовой рассылки является использование мастера интеллектуального анализа данных среды Business Intelligence Development Studio для создания новой структуры интеллектуального анализа данных и модели интеллектуального анализа данных дерева решений.

В этой задаче будет создана исходная структура интеллектуального анализа данных на основании алгоритма дерева принятия решений (Майкрософт). Для создания такой структуры сначала необходимо выбрать таблицы и представления, а затем указать столбцы для обучения и столбцы для проверки.

Создание структуры интеллектуального анализа данных для сценария прямой почтовой рассылки

  1. В обозревателе решений щелкните правой кнопкой мыши узел Структуры интеллектуального анализа данных и выберите команду Создать структуру интеллектуального анализа данных, чтобы запустить мастер интеллектуального анализа данных.

  2. На странице Мастер интеллектуального анализа данных нажмите кнопку Далее.

  3. Убедитесь, что на странице Выбор метода определения выбран параметр На основе существующей реляционной базы данных или хранилища данных, затем нажмите кнопку Далее.

  4. На странице Создание структуры интеллектуального анализа данных в поле Какой метод интеллектуального анализа данных использовать? выберите Алгоритм дерева принятия решений (Майкрософт).

    ПримечаниеПримечание

    Если появится предупреждение о том, что алгоритмов интеллектуального анализа данных не обнаружено, это может означать, что свойства проекта настроены неправильно. Это предупреждение выдается, только когда проект пытается получить список алгоритмов интеллектуального анализа данных с сервера служб Службы Analysis Services и не находит сервера. По умолчанию служба BI Development Studio использует в качестве сервера localhost. Если используется другой экземпляр или именованный экземпляр, нужно изменить свойства проекта. Дополнительные сведения см. в разделе Создание проекта служб Analysis Services (учебник по интеллектуальному анализу данных — начальный уровень).

  5. Нажмите кнопку Далее.

  6. На странице Выбор представления источников данных в области Доступные представления источника данных выберите Прямая почтовая рассылка. Нажмите кнопку Обзор, чтобы просмотреть таблицы в представлении источника данных, а затем нажмите кнопку Закрыть, чтобы вернуться в окно мастера.

  7. Нажмите кнопку Далее.

  8. На странице Определение типов таблиц установите флажок в столбце Вариант рядом с таблицей vTargetMail, чтобы ее использовать в качестве таблицы вариантов, и нажмите кнопку Далее. Таблица ProspectiveBuyer будет использоваться позже в целях проверки, поэтому на данном этапе ее не нужно учитывать.

  9. На странице Определение обучающих данных для своей модели необходимо определить по крайней мере один прогнозируемый столбец, один ключевой столбец и один входной столбец. Установите флажок в столбце Прогнозируемый, расположенном в строке BikeBuyer.

    ПримечаниеПримечание

    Обратите внимание на предупреждение в нижней части окна. На следующую страницу можно будет перейти только после выбора хотя бы одного столбца Входной и одного столбца Прогнозируемый.

  10. Нажмите кнопку Предложить, чтобы открыть диалоговое окно Предложение связанных столбцов.

    Кнопка Предложить доступна, если был выбран по крайней мере один прогнозируемый атрибут. В диалоговом окне Предложение связанных столбцов перечисляются столбцы, которые наиболее тесно связаны с прогнозируемым столбцом, а также перечисляются атрибуты в порядке их корреляции с прогнозируемым атрибутом. Столбцы со значительной корреляцией (степень достоверности превышает 95 %) автоматически выделены как включаемые в модель.

    Просмотрите предложения и нажмите кнопку Отмена, чтобыих не обрабатывать.

    ПримечаниеПримечание

    Если нажать кнопку ОК, все предложения в списке будут помечены в мастере как входные столбцы. Если нужны не все предложения, значения придется изменять вручную.

  11. Установите флажок в столбце Ключевой, расположенном в строке CustomerKey.

    ПримечаниеПримечание

    Если для таблицы с входными данными из представления источника данных указан ключ, мастер интеллектуального анализа данных автоматически выберет этот столбец в качестве ключа для модели.

  12. Установите флажки в столбце Входной в перечисленных ниже строках. Чтобы установить флажки в нескольких столбцах, можно выделить диапазон ячеек и удерживать нажатой клавишу CTRL при установке флажка.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. В крайнем левом столбце на странице установите флажки в перечисленных ниже строках.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName.

    Убедитесь, что эти строки имеют флажки только в левом столбце. Эти столбцы будут добавлены в структуру, но не будут включены в модель. Однако после построения модели их можно будет использовать для детализации и проверки. Дополнительные сведения о детализации см. в разделе Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

  14. Нажмите кнопку Далее.