Алгоритм взаимосвязей (Microsoft)

Изменения: 17 ноября 2008 г.

Алгоритм взаимосвязей (Microsoft) является алгоритмом взаимосвязей и предоставляется службами Microsoft SQL Server 2005 Analysis Services (SSAS). Этот алгоритм полезен для ядер рекомендаций. Ядро рекомендаций рекомендует программы пользователям на основе элементов, которые они уже купили, или к которым проявили интерес. Алгоритм взаимосвязей (Microsoft) полезно использовать для анализа потребительской корзины. Дополнительные сведения об анализе потребительской корзины см. в разделе Занятие 4. Построение сценария потребительской корзины в учебнике по интеллектуальному анализу данных.

Модели взаимосвязей построены на наборах данных, содержащих идентификаторы для отдельных вариантов и элементов этих вариантов. Группа элементов в варианте называется набор элементов. Модель взаимосвязей состоит из рядов наборов элементов и правил, описывающих, как эти элементы группируются в вариантах. Правила, определяемые алгоритмом, могут использоваться для прогнозирования вероятных будущих покупок покупателей на основе элементов, уже имеющихся в корзине покупателя. На следующей диаграмме представлен ряд правил в наборе элементов.

Набор правил для модели ассоциаций

Как видно на диаграмме, алгоритм взаимосвязей (Microsoft) потенциально может находить в наборе данных много правил. Для описания набора элементов и формируемых ими правил алгоритм использует два параметра: поддержка и вероятность. Например, если X и Y представляют два элемента, которые могут находиться в корзине, то параметр поддержки представляет собой количество вариантов в наборе данных, содержащих комбинацию элементов X и Y. Используя параметр поддержки в комбинации с пользовательскими параметрами MINIMUM_SUPPORT и MAXIMUM_SUPPORT, алгоритм контролирует количество сформированных элементов. Параметр вероятности, называемый достоверность, представляет часть вариантов в наборе данных, содержащих X и Y. Используя параметр вероятности в комбинации с параметром MINIMUM_PROBABILITY, алгоритм контролирует количество сформированных правил.

Примеры

Компания Adventure Works Cycles изменяет функциональные возможности своего веб-узла. Цель этого изменения заключается в увеличении успешных продаж продукции. Записи компании о каждой продаже хранятся в транзакционной базе данных, поэтому можно использовать алгоритм взаимосвязей (Microsoft) для определения набора продуктов, которые часто покупаются вместе. Затем, на основе элементов в корзине покупателей, можно прогнозировать дополнительные элементы, в которых могут быть заинтересованы покупатели.

Принцип работы алгоритма

Алгоритм взаимосвязей (Microsoft) прослеживает набор данных для поиска элементов, которые находятся в варианте совместно. Затем алгоритм группирует в наборы элементов любые связанные элементы, найденные, как минимум, в количестве вариантов, определенных параметром MINIMUM_SUPPORT. Например, возможен набор элементов «Горный 200=Существующий, Спортивный 100=Существующий», поддержка которого может составлять 710. Затем алгоритм формирует правила из наборов элементов. Правила используются для прогнозирования наличия элемента в базе данных на основе наличия других определенных элементов, которые алгоритм определяет как значимые. Например, возможно правило «если Туристический 1000=существующий и Контейнер для фляги=существующий, то Фляга=существующий» с вероятностью 0,812. В этом примере алгоритм определяет, что если в корзине имеется туристическая шина 1000 и контейнер для фляги, то, вероятно, там может быть и фляга для воды.

Использование алгоритма

Модель взаимосвязей должна содержать ключевой столбец, входные столбцы и один прогнозируемый столбец. Входные столбцы должны быть дискретными. Входные данные для модели взаимосвязей часто содержатся в двух таблицах. Например, в одной таблице могут содержаться сведения о покупателе, а в другой — сведения о покупках покупателя. Можно ввести эти данные в модель с помощью вложенной таблицы. Дополнительные сведения о вложенных таблицах см. в разделе Вложенные таблицы.

Алгоритм взаимосвязей (Microsoft) поддерживает типы содержимого входных столбцов, прогнозируемых столбцов и флаги моделирования, перечисленные в следующей таблице.

Типы содержимого входных столбцов

Cyclical, Discrete, Discretized, Key, Table и Ordered

Типы содержимого прогнозируемых столбцов

Cyclical, Discrete, Discretized, Table и Ordered

Флаги моделирования

MODEL_EXISTENCE_ONLY и NOT NULL

Все алгоритмы Microsoft поддерживают общий набор функций. Алгоритм взаимосвязей (Microsoft) также поддерживает дополнительные функции, представленные в следующей таблице.

IsDescendant

PredictHistogram

IsInNode

PredictNodeId

PredictAdjustedProbability

PredictProbability

PredictAssociation

PredictSupport

Список функций, общих для всех алгоритмов Microsoft, см. в разделе Алгоритмы интеллектуального анализа данных. Дополнительные сведения об использовании этих функций см. в разделе Ссылка на функцию расширений интеллектуального анализа данных.

Алгоритм взаимосвязей (Microsoft) не поддерживает использование языка разметки прогнозирующих моделей (PMML) для создания моделей интеллектуального анализа данных.

Алгоритм взаимосвязей (Microsoft) поддерживает несколько параметров, влияющих на производительность и точность результирующей модели интеллектуального анализа данных. В следующей таблице содержатся описания всех параметров.

Параметр

Описание

MINIMUM_SUPPORT

Указывает минимальное количество вариантов, которые должны содержать набор элементов перед созданием алгоритмом правила. Значение меньше 1 указывает минимальное количество вариантов как процент от общего количества вариантов. Целое значение больше 1 задает минимальное количество вариантов как абсолютное количество вариантов, которые должны содержать набор элементов. Алгоритм может увеличить значение этого параметра, если объем памяти ограничен.

Значение по умолчанию равно 0,03.

MAXIMUM_SUPPORT

Указывает максимальное количество вариантов, в которых может поддерживаться набор элементов. Если это значение меньше 1, то оно представляет процент от общего количества вариантов. Значения больше 1 представляют абсолютное количество вариантов, в которых может содержаться набор элементов.

Значение по умолчанию равно 1.

MINIMUM_ITEMSET_SIZE

Указывает минимальное количество элементов, допустимых в наборе элементов.

Значение по умолчанию равно 1.

MAXIMUM_ITEMSET_SIZE

Указывает максимальное количество элементов, допустимых в наборе элементов. Задание этого значения равным 0 указывает, что размер набора элементов не ограничен.

Значение по умолчанию равно 3.

MAXIMUM_ITEMSET_COUNT

Указывает максимальное количество создаваемых наборов элементов. Если не указано количество, подразумевается значение по умолчанию. Значение по умолчанию равно 200000.

ms174916.note(ru-ru,SQL.90).gifПримечание.

Наборы элементов ранжируются только по поддержке. Среди наборов элементов с одинаковой поддержкой устанавливается произвольный порядок.

MINIMUM_PROBABILITY

Указывает минимальную вероятность того, что правило верно. Например, задание этого значения равным 0,5 указывает, что правила с вероятностью меньше 50% не формируются.

Значение по умолчанию равно 0,4.

OPTIMIZED_PREDICTION_COUNT

Определяет количество элементов, кэшируемых или оптимизируемых для прогноза.

По умолчанию используется значение 0. В этом случае алгоритм создаст столько прогнозов, сколько указано в запросе.

Журнал изменений

Версия Журнал

17 ноября 2008 г.

Добавления
  • Добавлено описание значения по умолчанию параметра OPTIMIZED_PREDICTION_COUNT и выполняемых по умолчанию действий.

15 сентября 2007 г.

Изменения
  • Исправлено описание поведения по умолчанию для параметра MAXIMUM_ITEMSET_COUNT.
  • Дополнительные сведения о проблемах, относящихся к значению по умолчанию параметра MINIMUM_SUPPORT, см. в базе знаний Майкрософт.

См. также

Основные понятия

Алгоритмы интеллектуального анализа данных
Мастер интеллектуального анализа данных
Использование средств интеллектуального анализа данных
Просмотр модели интеллектуального анализа данных при помощи средства просмотра правил взаимосвязи (Microsoft)

Другие ресурсы

CREATE MINING MODEL (расширения интеллектуального анализа данных)

Справка и поддержка

Получение помощи по SQL Server 2005