Использование детализации в моделях и структурах интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Детализация — это возможность делать запросы как к модели, так и к структуре интеллектуального анализа данных для уточнения по поводу вариантов в составе модели или структуры. В SQL Server 2008 предусмотрено две различных возможности детализации данных по вариантам. Можно детализировать варианты, которые были использованы для построения данных, либо варианты в структуре интеллектуального анализа данных.

Детализация данных по вариантам применяется в том случае, если нужно просмотреть варианты, использованные для обучения модели, в противоположность вариантам, которые используются для ее проверки, либо также для просмотра атрибутов данных по вариантам.

Детализация вариантов структуры используется, если структура содержит сведения, которые могут не быть доступными в модели. Как правило, при наличии структуры интеллектуального анализа данных, которая поддерживает много различных типов моделей, данные из структуры используются в модели более выборочно. Например, не используются контактные сведения покупателей в модели кластеризации, даже если эти данные включены в структуру. Однако после создания модели может потребоваться получить контактные сведения покупателей, сгруппированных в определенный кластер.

Использование детализации в конструкторе интеллектуального анализа данных

Возможность детализации предусмотрена в модели интеллектуального анализа данных, и при наличии соответствующих разрешений во время просмотра модели можно щелкнуть узел в соответствующем средстве просмотра и получить подробные сведения о вариантах в данном узле.

Если при обработке структуры интеллектуального анализа данных обучающие варианты кэшировались и у пользователя есть необходимые разрешения, то можно получать сведения из вариантов модели и структуры интеллектуального анализа данных, включая столбцы, не включенные в модель интеллектуального анализа данных. Дополнительные сведения см. в разделе Как выполнить детализацию до данных вариантов из модели интеллектуального анализа данных.

Сведения о том, как включить детализацию в существующей модели интеллектуального анализа данных, см. в разделе Как включить детализацию для модели интеллектуального анализа данных.

Вопросы, связанные с использованием детализации

  • Если используется мастер интеллектуального анализа данных, то включить детализацию можно на его последней странице. По умолчанию детализация отключена. Дополнительные сведения см. в разделе Завершение работы мастера (мастер интеллектуального анализа данных).

  • При создании структуры интеллектуального анализа данных с помощью расширения интеллектуального анализа данных следует использовать предложение WITH DRILLTHROUGH. Дополнительные сведения см. в разделе CREATE MINING STRUCTURE (расширения интеллектуального анализа данных).

  • Возможность детализации можно добавить в существующую модель интеллектуального анализа данных, но в этом случае модель необходимо обработать повторно, чтобы изменения вступили в силу.

  • Детализация работает посредством получения информации об обучающих вариантах структуры интеллектуального анализа данных. Эта информация была кэширована при обработке структуры. Поэтому, если произвести удаление всех кэшированных данных изменением свойства MiningStructureCacheMode на ClearAfterProcessing, детализация работать не будет. Чтобы разрешить детализацию до столбцов структуры, нужно изменить значение свойства MiningStructureCacheMode на KeepTrainingCases а затем выполнить повторную обработку структуры..

  • Если детализация разрешена в модели интеллектуального анализа данных, но не разрешена в структуре, то сведения можно просматривать только из вариантов модели, но не из структуры интеллектуального анализа данных.

Вопросы безопасности, связанные с детализацией

Для детализации вариантов из структуры через модель необходимо, чтобы как в структуре, так и в модели интеллектуального анализа данных свойство AllowDrillThrough имело значение True. Более того, необходимо быть членом роли, обладающей разрешением на детализацию как в структуре, так и в модели. Дополнительные сведения о создании ролей см. в разделе Конструктор ролей (службы Analysis Services — многомерные данные). Сведения о присвоении разрешений, относящихся к конкретным структурам и моделям интеллектуального анализа данных, см. в разделе Предоставление доступа к структурам и моделям интеллектуального анализа данных.

Разрешения на детализацию устанавливаются отдельно для структуры и для модели. Разрешение на детализацию модели позволяет проводить детализацию на основе модели, даже если у пользователя нет разрешения на детализацию структуры. Разрешение на детализацию структуры предоставляют дополнительную возможность включать столбцы структуры в запросы детализации с помощью функции StructureColumn (расширения интеллектуального анализа данных).

ПримечаниеПримечание

Если включить детализацию как структуры, так и модели интеллектуального анализа данных, то любой пользователь, являющийся членом роли с разрешениями детализации в модели, также видит столбцы в структуре, даже если эти столбцы не входят в модель интеллектуального анализа данных. Поэтому, чтобы защитить конфиденциальные данные, необходимо настроить в представлении источника данных маскирование личных сведений и разрешать доступ к детализации структуры интеллектуального анализа данных только при необходимости.

Ограничения по детализации

  • Приведенные ниже ограничения относятся к операциям по детализации с моделью и зависят от алгоритма, с помощью которого была создана модель.

Имя алгоритма

Проблема

Упрощенный алгоритм Байеса (Майкрософт)

Не поддерживается. В этих алгоритмах не назначаются варианты для отдельных узлов содержимого.

Алгоритм нейронной сети (Майкрософт)

Не поддерживается. В этих алгоритмах не назначаются варианты для отдельных узлов содержимого.

Алгоритм логистической регрессии (Майкрософт)

Не поддерживается. В этих алгоритмах не назначаются варианты для отдельных узлов содержимого.

Алгоритм линейной регрессии (Майкрософт)

Поддерживается. Однако, поскольку модель содержит только один узел, All, при детализации возвращаются все обучающие варианты модели. Если задан большой обучающий набор, то загрузка результатов может занять много времени.

Алгоритм временных рядов (Майкрософт)

Поддерживается. Однако нельзя выполнять детализацию структуры или данных вариантов с помощью Средства просмотра моделей интеллектуального анализа данных в конструкторе интеллектуального анализа данных. Вместо этого необходимо создать DMX-запрос.

Кроме того, нельзя выполнять детализацию по конкретным узлам или писать DMX-запросы для получения вариантов из конкретных узлов модели временных рядов. Данные вариантов можно извлечь из модели или структуры с помощью других критериев, например значений атрибутов.

Просматривать узлы ARTxp и ARIMA, созданные алгоритмом временных рядов (Майкрософт), можно с помощью Средство просмотра деревьев содержимого общего вида (Майкрософт) (конструктор интеллектуального анализа данных).

Создание запросов детализации с помощью расширений интеллектуального анализа данных

Для всех моделей, поддерживающих детализацию (и при условии, что она включена), можно детализировать данные вариантов или структуры путем создания DMX-запроса в среде Среда SQL Server Management Studio или другом клиенте, поддерживающем расширения интеллектуального анализа данных. Ниже приведен общий синтаксис для получения вариантов модели и структуры:

SELECT <model column list>, StructureColumn('<structure column name') FROM <modelname>.CASES

Например, приведенный ниже DMX-запрос возвращает варианты для конкретной линейки продуктов в модели временных рядов. Этот запрос также возвращает столбец Amount, который не был использован в модели, но доступен в структуре интеллектуального анализа данных.

SELECT [DateSeries], [Model Region], Quantity, StructureColumn('Amount') AS [M200 Pacific Amount]
FROM Forecasting.CASES
WHERE [Model Region] = 'M200 Pacific'

Обратите внимание, что в этом примере столбец структуры переименован с использованием псевдонима. Если столбцу структуры не присвоить псевдоним, то он будет возвращен с именем Expression.

Дополнительные сведения о получении данных по вариантам с помощью DMX-запросов см. в разделах SELECT FROM <модель>.CASES (расширения интеллектуального анализа данных) и SELECT FROM <структура>.CASES.