Настройка модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

После выбора алгоритма в соответствии с задачами организации, можно выполнить индивидуальную настройку модели, что может повысить эффективность результатов. Настройка выполняется следующими способами.

  • Использование в модели других столбцов данных либо изменение режима использования или типов содержимого для столбцов.

  • Создание в модели интеллектуального анализа данных фильтров, ограничивающих данные, используемые в обучении модели.

  • Задание параметров алгоритма, управляющих пороговыми значениями, разбиением деревьев и другими условиями.

  • Изменение алгоритма, используемого по умолчанию для анализа данных или составления прогнозов.

Изменение данных, используемых моделью

На результаты анализа сильно влияют принимаемые решения о выборе столбцов данных для использования в модели, а также о способах их использования и обработки. В следующих разделах приводятся сведения, которые помогут принять такие решения.

Если используется мастер интеллектуального анализа данных, можно настроить в службах Службы Analysis Services автоматический выбор данных, наиболее полезных для построения определенной модели.

Настройка параметров алгоритма

Выбор алгоритма определяет тип получаемых результатов. Общие сведения о работе определенных алгоритмов и о бизнес-сценариях, в которых наиболее эффективно будет использоваться какой-либо алгоритм, см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Алгоритмы интеллектуального анализа данных, входящие в состав служб Службы Analysis Services, также имеют широкие возможности индивидуальной настройки. Задавая параметры алгоритма, можно управлять работой алгоритма и порядком обработки данных. В следующих разделах представлены подробные сведения о параметрах, поддерживаемых каждым алгоритмом.

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по упрощенному алгоритму Байеса (Майкрософт)

Технический справочник по алгоритму взаимосвязей (Майкрософт)

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

Технический справочник по алгоритму нейронной сети (Майкрософт)

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Технический справочник по алгоритму временных рядов (Майкрософт)

В разделе для каждого типа алгоритма также приведены прогнозирующие функции, которые можно использовать с моделями, основанными на данном алгоритме.

Список параметров алгоритма

Каждый алгоритм поддерживает параметры, которые используются для настройки его режима работы и точной фильтрации результатов модели. Описание использования каждого параметра см. в следующих разделах.

Имя свойства

Область применения

AUTO_DETECT_PERIODICITY

Технический справочник по алгоритму временных рядов (Майкрософт)

CLUSTER_COUNT

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

CLUSTER_SEED

Технический справочник по алгоритму кластеризации (Майкрософт)

CLUSTERING_METHOD

Технический справочник по алгоритму кластеризации (Майкрософт)

COMPLEXITY_PENALTY

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму временных рядов (Майкрософт)

FORCE_REGRESSOR

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Флаги моделирования (интеллектуальный анализ данных)

FORECAST_METHOD

Технический справочник по алгоритму временных рядов (Майкрософт)

HIDDEN_NODE_RATIO

Технический справочник по алгоритму нейронной сети (Майкрософт)

HISTORIC_MODEL_COUNT

Технический справочник по алгоритму временных рядов (Майкрософт)

HISTORICAL_MODEL_GAP

Технический справочник по алгоритму временных рядов (Майкрософт)

HOLDOUT_PERCENTAGE

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

ПримечаниеПримечание
Этот параметр отличается от значения процентной доли контрольных данных, которое применяется к структуре интеллектуального анализа данных.

HOLDOUT_SEED

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

ПримечаниеПримечание
Этот параметр отличается от начального контрольного значения, которое применяется к структуре интеллектуального анализа данных.

INSTABILITY_SENSITIVITY

Технический справочник по алгоритму временных рядов (Майкрософт)

MAXIMUM_INPUT_ATTRIBUTES

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Технический справочник по упрощенному алгоритму Байеса (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

Технический справочник по алгоритму логистической регрессии (Майкрософт)

MAXIMUM_ITEMSET_COUNT

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MAXIMUM_ITEMSET_SIZE

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MAXIMUM_OUTPUT_ATTRIBUTES

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Технический справочник по упрощенному алгоритму Байеса (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

MAXIMUM_SEQUENCE_STATES

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

MAXIMUM_SERIES_VALUE

Технический справочник по алгоритму временных рядов (Майкрософт)

MAXIMUM_STATES

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

MAXIMUM_SUPPORT

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MINIMUM_IMPORTANCE

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MINIMUM_ITEMSET_SIZE

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MINIMUM_DEPENDENCY_PROBABILITY

Технический справочник по упрощенному алгоритму Байеса (Майкрософт)

MINIMUM_PROBABILITY

Технический справочник по алгоритму взаимосвязей (Майкрософт)

MINIMUM_SERIES_VALUE

Технический справочник по алгоритму временных рядов (Майкрософт)

MINIMUM_SUPPORT

Технический справочник по алгоритму взаимосвязей (Майкрософт)

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

Технический справочник по алгоритму кластеризации последовательностей (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)

Технический справочник по алгоритму временных рядов (Майкрософт)

MISSING_VALUE_SUBSTITUTION

Технический справочник по алгоритму временных рядов (Майкрософт)

MODELLING_CARDINALITY

Технический справочник по алгоритму кластеризации (Майкрософт)

PERIODICITY_HINT

Технический справочник по алгоритму временных рядов (Майкрософт)

PREDICTION_SMOOTHING

Технический справочник по алгоритму временных рядов (Майкрософт)

SAMPLE_SIZE

Технический справочник по алгоритму кластеризации (Майкрософт)

Технический справочник по алгоритму логистической регрессии (Майкрософт)

Технический справочник по алгоритму нейронной сети (Майкрософт)

SCORE_METHOD

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

SPLIT_METHOD

Технический справочник по алгоритму дерева принятия решений (Майкрософт)

STOPPING_TOLERANCE

Технический справочник по алгоритму кластеризации (Майкрософт)

Дополнительные требования

Выбор и подготовка данных являются важной частью процесса интеллектуального анализа данных. Например, алгоритмы, предоставляемые корпорацией Майкрософт, не допускают наличия повторяющихся ключей. Тип данных, необходимых для каждой модели, зависит от алгоритма. Дополнительные сведения см. в подразделе «Требования» следующих разделов.

Настройка результатов с помощью запросов и прогнозирующих функций

После построения и обработки модели можно просмотреть данные с помощью одного из средств просмотра, предназначенных для моделей каждого типа. Кроме того, чтобы получить более подробные сведения о закономерностях, обнаруженных в данных, можно написать нестандартные запросы с помощью расширений интеллектуального анализа данных.

Сведения о создании запросов, возвращающих содержимое моделей, см. в разделе Запрос моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Можно использовать функции для расширения результатов, возвращаемых моделью интеллектуального анализа данных. Некоторые функции также возвращают статистические данные, представляющие вероятность того или иного исхода, а также другие показатели. Отдельные алгоритмы также поддерживают дополнительные функции. Например, если в модели интеллектуального анализа данных применяется кластеризация, для поиска сведений о кластерах можно использовать специальные функции. Однако если модель основана на алгоритме временных рядов, для составления прогнозов и запроса содержимого модели доступен другой набор функций. Дополнительные сведения см. в разделе «Технический справочник» для каждого алгоритма.

Примеры запросов к модели интеллектуального анализа данных и использования прогнозирующих функций, предназначенных для определенных типов моделей, см. в разделе Запрос моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Список прогнозирующих функций, поддерживаемых всеми типами алгоритмов, см. в разделе Сопоставление функций с типами запросов (расширения интеллектуального анализа данных).

Оценка изменений в модели

При экспериментировании с разными моделями для решения бизнес-задачи или при построении вариантов на модели необходимо измерять точность каждой модели, а также оценивать, насколько хорошо та или иная модель помогает решить задачу. Общие сведения по оценке моделей интеллектуального анализа данных см. в разделе Проверка моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных). Дополнительные сведения о том, как построить диаграмму точности разных моделей интеллектуального анализа данных см. в разделе Средства проверки точности построения моделей (службы Analysis Services — интеллектуальный анализ данных).