Проекты интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

При разработке решения по интеллектуальному анализу данных в службах Службы Analysis Services сначала создается проект служб Analysis Services. В этом проекте определяется источник данных, который будет использоваться для анализа, а затем задается модель, которая включает алгоритм и специальные инструкции по обработке данных. В рамках проекта можно продолжить тестирование и доработку модели. Если решение показывает удовлетворительные результаты, то его можно развернуть на другом сервере или использовать в приложении для прогнозирования или анализа.

В следующих разделах приведены описания средств и процессов для создания решения по интеллектуальному анализу данных и ссылки на ресурсы, которые используются на каждом из шагов.

Создание проекта служб Analysis Services

При разработке решения по интеллектуальному анализу данных сначала необходимо создать новый проект служб Службы Analysis Services в среде Business Intelligence Development Studio. Каждый проект интеллектуального анализа данных содержит объекты следующих четырех типов: источники данных, представления источников данных (основаны на источниках данных), структуры интеллектуального анализа данных (определяют, каким образом данные используются в модели) и модели интеллектуального анализа данных (в которых создаются и хранятся закономерности).

Дополнительные сведения см. в разделахОпределение проекта служб Analysis Services, Определение источника данных при помощи мастера источников данных (службы Analysis Services)

Определение источника данных

В источнике данных определяется строка соединения и данные проверки подлинности, которые сервер служб Службы Analysis Services будет использовать для соединения с источником данных. Источник данных может содержать несколько таблиц или представлений. Службы Службы Analysis Services могут использовать наборы данных из реляционных баз данных и из баз данных оперативной аналитической обработки (OLAP), а также от внешних поставщиков.

После определения этого соединения с источником данных создается представление, в котором определяются конкретные данные, относящиеся к модели. Представление источника данных также позволяет задать способ передачи данных, содержащихся в источнике, в модель интеллектуального анализа данных. Структуру данных можно изменить таким образом, чтобы она лучше подходила для задач проекта, или выбрать только данные определенных типов. Отфильтровать данные можно либо в представлении источника данных, либо с помощью фильтров, применяемых на уровне модели.

Требования к объему данных и к способам их очистки и форматирования будут различаться в зависимости от алгоритма, используемого для анализа этих данных.

Дополнительные сведения см. в разделеОпределение представления источника данных (службы Analysis Services)

Добавление структур интеллектуального анализа данных к проекту служб Analysis Services

Когда данных становится достаточно для начала анализа, необходимо выбрать столбцы данных, которые больше всего релевантны для решаемой бизнес-задачи, и добавить структуры интеллектуального анализа данных в проект. В структуре интеллектуального анализа данных определяются столбцы данных и столбцы с вложенными таблицами, которые получаются из представления источника данных или из куба OLAP в проекте.

Чтобы добавить новую структуру интеллектуального анализа данных, запустите мастер интеллектуального анализа данных, который поможет выполнить определение данных, а при необходимости — и создание первоначальной модели интеллектуального анализа данных. Кроме этого, при создании структуры можно секционировать данные, образовав набор данных для обучения, который используется для построения моделей, и проверочный набор данных, который используется для проверки всех моделей интеллектуального анализа данных, основанных на этой структуре. Для изменения существующих структур интеллектуального анализа данных, включая добавление столбцов и вложенных таблиц, можно использовать вкладку Структура интеллектуального анализа данных конструктора интеллектуального анализа данных.

Дополнительные сведения см. в разделахСоздание новой структуры интеллектуального анализа данных, Конструктор интеллектуального анализа данных, Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Работа с моделями интеллектуального анализа данных

В каждую структуру интеллектуального анализа данных добавляется одна или несколько моделей интеллектуального анализа данных. Модель интеллектуального анализа данных определяет алгоритм, то есть метод анализа, который будет применяться к данным. Обработка каждой модели заключается в обработке данных из представления источника данных алгоритмом, в результате которой создается математическая модель данных. Этот процесс также называется обучением модели.

После обработки становится доступным просмотр модели интеллектуального анализа данных и создание прогнозирующих запросов к ней.

Службы Службы Analysis Services предлагают несколько вариантов для обработки объектов модели интеллектуального анализа данных, включая возможность выбора объектов для обработки и метода обработки. Например, можно обработать структуру и поместить данные в кэш, а затем продолжить добавление новых моделей в структуру. Если данные находятся в кэше, то запросы детализации дают возможность получить подробные сведения о вариантах, используемых в модели.

Дополнительные сведения см. в разделахАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Обработка объектов служб Analysis Services, Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Проверка моделей интеллектуального анализа данных

После создания модели можно изучить результаты и решить, какие модели работают лучше всего. На вкладке Средство просмотра моделей интеллектуального анализа данных в конструкторе интеллектуального анализа данных службы Службы Analysis Services предлагают средства просмотра для каждого типа модели интеллектуального анализа данных, которые можно использовать для работы с моделями интеллектуального анализа данных.

На вкладке Диаграмма точности интеллектуального анализа данных конструктора службы Службы Analysis Services предлагают средства, которые можно использовать для непосредственного сравнения моделей интеллектуального анализа данных, чтобы выбрать самую точную или самую полезную модель. К таким средствам относятся диаграмма точности прогнозов, диаграмма роста прибыли и матрица классификации. 

Можно также воспользоваться новой функцией SQL Server 2008 — отчетом перекрестной проверки. Он позволяет выполнить итеративную усредняющую выборку данных, чтобы определить, является ли модель смещенной в отношении определенного набора данных. Статистика, представленная в отчете, может использоваться для объективного сравнения моделей и оценки качества обучающих данных.

Дополнительные сведения см. в разделахПросмотр модели интеллектуального анализа данных, Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Создание прогнозов

Основной целью большинства проектов интеллектуального анализа данных является создание прогнозов с помощью модели интеллектуального анализа данных. После просмотра и сравнения моделей интеллектуального анализа данных можно воспользоваться одним из средств создания прогнозов. Расширения интеллектуального анализа данных (DMX) — это поддерживаемый службами Службы Analysis Services язык запросов, который удобен для использования в сценариях и является основой для создания прогнозов. Чтобы упростить построение прогнозирующих DMX-запросов, SQL Server предоставляет построитель запросов, доступный в среде Среда SQL Server Management Studio и среде Business Intelligence Development Studio, а также шаблоны расширений интеллектуального анализа данных для редактора запросов в среде Management Studio. В среде BI Development Studio доступ к построителю запросов выполняется на вкладке Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных.

Дополнительные сведения см. в разделахСоздание прогнозирующих запросов расширений интеллектуального анализа данных, Справка по инструкции расширений интеллектуального анализа данных

Среда SQL Server Management Studio

После использования среды BI Development Studio для построения моделей интеллектуального анализа данных в проекте интеллектуального анализа данных можно управлять и работать с этими моделями, а также создавать прогнозы в среде Management Studio. Средства работы с запросами в среде Среда SQL Server Management Studio позволяют просматривать данные в моделях, создавать сложные запросы к содержимому и управлять объектами интеллектуального анализа данных, хранящимися в экземпляре SQL Server.

Дополнительные сведения см. в разделахИнтеллектуальный анализ данных в среде SQL Server Management Studio, Интеллектуальный анализ данных в среде SQL Server Management Studio

SQL Server Reporting Services

После создания модели интеллектуального анализа данных, возможно, потребуется распространить результаты для различных пользователей. Поскольку результаты интеллектуального анализа данных хранятся в согласованной схеме, доступ к которой возможен через запросы базы данных, разнообразные клиентские средства позволяют представлять результаты анализа, просматривать закономерности в модели и составлять прогнозы.

В конструкторе отчетов в службах Microsoft SQL Server Службы Reporting Services можно создавать отчеты, которые позволяют представлять данные, содержащиеся в моделях интеллектуального анализа данных. В качестве основы отчета можно использовать результаты любого DMX-запроса и все преимущества параметризации и форматирования, доступные в службах Службы Reporting Services.

Дополнительные сведения см. в разделахТип соединения для расширения интеллектуального анализа данных служб Analysis Services (SSRS), Интеграция служб Reporting Services в приложения

Работа с интеллектуальным анализом данных программным путем

Службы Службы Analysis Services предоставляют несколько средств для программирования интеллектуального анализа данных. Язык расширений интеллектуального анализа данных (DMX) содержит инструкции для создания, обучения и использования моделей интеллектуального анализа данных. Эти задачи также можно выполнить с помощью комбинации XML для аналитики (XMLA) и языка сценариев служб Analysis Services (ASSL), или с помощью объектов AMO.

Доступ ко всем метаданным, связанным с интеллектуальным анализом данных, выполняется с помощью набора строк схемы интеллектуального анализа данных. Например, наборы строк схемы можно использовать для определения типов данных, поддерживаемых алгоритмом, или для определения имен моделей, имеющихся в базе данных.

Дополнительные сведения см. в разделахСправочник по расширениям интеллектуального анализа данных, Наборы строк схемы интеллектуального анализа данных, Использование XML для аналитики в службах Analysis Services (XMLA)