Изучение модели «Потребительская корзина» (учебник по интеллектуальному анализу данных — средний уровень)

 

Применимо к: SQL Server 2016 Preview

Теперь, когда вы создали ассоциации модели, ее можно просмотреть с помощью Microsoft просмотра взаимосвязей в средство просмотра модели интеллектуального анализа вкладки конструктора интеллектуального анализа данных. В данном учебнике рассказано, как использовать средство просмотра для изучения взаимосвязей между элементами. С помощью средства просмотра можно визуально определить, какие продукты имеют тенденцию появляться вместе, а также получить общее представление о появляющихся закономерностях.

Microsoft Просмотра взаимосвязей содержит три вкладки: правила, наборы элементов, и Сеть зависимостей. Поскольку каждая вкладка отображает немного отличающееся представление данных, при изучении обычно нужно переключаться несколько раз между различными панелями для понимания модели.

  • Вкладка «Сеть зависимостей»

  • Вкладка «Наборы элементов»

  • Вкладка «Правила»

  • Представление общего содержимого

В этом учебнике вы начнете на Сеть зависимостей вкладку, а затем используйте правила вкладку и наборов элементов вкладку для более глубокого понимания связей, выявленных в средстве просмотра. Также можно использовать Microsoft просмотра деревьев содержимого общего для получения подробной статистики для отдельных правил или наборов элементов.

Вкладка «Сеть зависимостей»

С Сеть зависимостей вкладке можно исследовать взаимодействие различных элементов в модели. Каждый из узлов в средстве просмотра отображает элемент, а линии между ними представляют правила. Выбрав узел, можно просмотреть, какие другие узлы предсказывают выбранный элемент, либо какие элементы предсказывает текущий элемент. В некоторых случаях между элементами возникает двухсторонняя взаимосвязь. Это означает, что они часто встречаются в одной транзакции. Чтобы определить направление связи, можно обратиться к цветовым условным обозначениям в нижней части вкладки.

Соединяющая два элемента линия означает, что такие элементы с большой долей вероятности будут присутствовать в одной транзакции. Другими словами, покупатели, скорее всего, покупают эти два элемента одновременно. Ползунок связан со значением вероятности правила. Передвигая ползунок вверх или вниз, можно отфильтровать слабые взаимосвязи, то есть правила с низкой вероятностью.

Диаграмма сети зависимостей показывает парные правила, которые могут быть представлены логически как A->B. Это означает, что если приобретается товар A, то покупка товара B имеет определенную вероятность. Диаграмма не отображает правила типа AB->C. Если переместить ползунок в положение, в котором должны отображаться все правила, а на диаграмме никакие линии не появляются, это означает, что отсутствуют парные правила, которые соответствуют критериям параметров алгоритма.

Также имеется возможность поиска узлов по имени. Для этого необходимо ввести первые буквы имени атрибута. Дополнительные сведения см. в разделе Диалоговое окно "Найти узел" (средство просмотра моделей интеллектуального анализа данных).

Открытие режима взаимосвязей в средстве просмотра правил взаимосвязей (Майкрософт)

  1. В обозревателе, дважды щелкните структуру взаимосвязей.

  2. В конструкторе интеллектуального анализа данных перейдите на вкладку Средство просмотра моделей интеллектуального анализа данных .

  3. Выберите связь из списка моделей интеллектуального анализа данных в модели интеллектуального анализа данных раскрывающегося списка.

Перемещение по диаграмме зависимостей и поиск определенных узлов

  1. В средство просмотра модели интеллектуального анализа щелкните Сеть зависимостей вкладки.

  2. Щелкните Увеличение несколько раз, пока можно легко просмотреть метки для каждого узла.

    По умолчанию на диаграмме отображаются все узлы. В сложной модели может быть много узлов, из-за чего их изображение будет достаточно мелким.

  3. Щелкните + входа в правом нижнем углу окна, удерживая нажатой кнопку мыши для панорамирования диаграммы.

  4. Перетащите ползунок, расположенный в левой части средства просмотра, все ссылки (по умолчанию) в нижней части элемента управления "ползунок".

  5. В результате этого на диаграмме будут отображаться только самые тесные взаимосвязи, в данном случае между шиной и камерой для шины туристического велосипеда.

  6. Щелкните узел с меткой туристического велосипеда = существующий.

    В результате этого на диаграмме будут выделены только те элементы, которые явно связаны с данным элементом. Обратите внимание на стрелку между двумя такими элементами.

  7. Перетащите ползунок, расположенный в левой части средства просмотра, в среднее положение.

    Обратите внимание на изменения стрелки, соединяющей такие элементы.

  8. Выберите Показать только имя атрибута из раскрывающегося списка в верхней части панели сети зависимостей.

    После обновления текстовые метки на диаграмме будут содержать только имя модели.

В начало

Вкладка «Наборы элементов»

Далее будет рассказано о правилах и наборах элементов, сформированных моделью для шин и камер для туристических велосипедов. Наборы элементов вкладке отображаются три важных аспекта сведений, относящихся к наборам элементов, Microsoft алгоритмом взаимосвязей:

  • **Поддержка по телефону:**количество транзакций, в которых возникает набор элементов.

  • **Размер:**число элементов в наборе элементов.

  • **Элементы:**список элементов, включенных в каждом наборе элементов.

В зависимости от того, каким образом настроены параметры алгоритма, он может сформировать большое число наборов элементов. Каждый набор элементов, отображаемый средством просмотра, содержит сведения о транзакциях, в которых был продан определенный элемент. С помощью элементов управления в верхней части наборы элементов вкладке, можно отфильтровать средство просмотра для отображения только наборы элементов, содержащих указанный минимальный размер несущего множества и набора элементов.

Если при работе с какой-либо другой моделью интеллектуального анализа данных отсутствуют наборы элементов, это объясняется тем, что ни один из наборов элементов не удовлетворяет условиям параметров алгоритма. В такой ситуации можно изменить параметры алгоритма с целью снижения требований к наборам элементов.

Фильтр по имени наборов элементов, отображаемых в средстве просмотра

  1. Щелкните наборы элементов средства просмотра.

  2. В фильтровать набор элементов введите для туристического велосипеда, а затем щелкните за пределами поля.

    В результате этого фильтр отобразит все элементы, в которых присутствует указанная строка.

  3. В Показать выберите Показать только имя атрибута.

  4. Выберите Показывать длинное имя флажок.

    После обновления в списке наборов элементов будут отображаться только те наборы, которые содержат строку «Шина для туристического велосипеда». Длинное имя набора элементов состоит из имени таблицы, содержащей атрибут, и значения для каждого элемента.

  5. Очистить Показывать длинное имя флажок.

    После обновления в списке наборов элементов будут отображаться только короткие имена.

Значения в поддержки столбец указывает число транзакций для каждого набора элементов. Транзакция для набора элементов означает покупку, в состав которой входят все элементы набора.

По умолчанию в средстве просмотра отображаются наборы элементов в порядке уменьшения поддержки. Чтобы выполнить сортировку по другому столбцу, например по столбцу, в котором содержится размер или имя набора элементов, следует щелкнуть заголовок такого столбца. Если требуется получить дополнительную информацию об отдельных транзакциях, которые входят в какой-либо набор элементов, можно выполнить детализацию из набора элементов до уровня отдельных вариантов. Столбцы структуры в результатах детализации представляют собой уровень доходов покупателя и идентификатор покупателя, которые в данной модели не используются.

Просмотр подробных сведений о наборе элементов

  1. В списке наборов элементов щелкните набор элементов заголовок столбца для сортировки по имени.

  2. Найдите элемент, для туристического велосипеда (с без второго элемента).

  3. Щелкните правой кнопкой мыши элемент, для туристического велосипеда, выберите Детализация, а затем выберите столбцы модели и структуры.

    Детализация диалоговое окно отображает отдельные транзакции, которые используются в качестве поддержки данного набора элементов.

  4. Разверните вложенную таблицу vAssocSeqLineItems, чтобы просмотреть фактический список покупок в транзакции.

Фильтр набора элементов по значению поддержки или размеру

  1. Очистите весь текст, который может находиться в фильтровать набор элементов поле. Использование текстового фильтра совместно с числовым фильтром не допускается.

  2. В Минимальная поддержка Введите 100 и затем щелкните фон средства просмотра.

    После обновления в списке наборов элементов будут отображаться только те наборы элементов, у которых поддержка имеет значение не меньше 100.

В начало

Вкладка «Правила»

Правила вкладке отображаются следующие сведения, относящиеся к правилам, которые выявляет алгоритм.

  • Вероятность: вероятность правила определяется как вероятность правый элемент заданного элементом левой части окна.

  • **Важность:**измерения степени полезности правила. Чем больше значение, тем лучше правило.

    Важность служит для оценки полезности правила, поскольку значение одной вероятности может привести к неверным выводам. Например, если в каждой транзакции содержится фляга для воды (возможно, эта фляга предоставлялась каждому покупателю автоматически в качестве рекламной акции), модель в этом случае создаст правило, которое прогнозирует продажу фляги для воды с вероятностью 1. На основе одной вероятности данное правило имеет высокую точность, но не предоставляет полезной информации.

  • **Правило:**определения правила. Для модели потребительской корзины правило описывает определенное сочетание товаров элементов.

Каждое из правил можно использовать для прогноза наличия позиции в транзакции на основе наличия других позиций. Как и в наборы элементов вкладке можно фильтровать правила, чтобы отображались только наиболее интересных правил. Если в используемой модели интеллектуального анализа данных отсутствуют какие-либо правила, возможно, потребуется изменить параметры алгоритма, чтобы снизить порог вероятности для правил.

Просмотр правил, в которых имеется только модель велосипеда Mountain-200

  1. В средство просмотра модели интеллектуального анализа щелкните правила вкладки.

  2. В правило фильтрации введите Mountain-200.

    Очистить Показывать длинное имя флажок.

  3. Из Показать выберите Показать только имя атрибута.

    Средство просмотра отобразит только правила, содержащие слова «Mountain-200». Вероятность правила рассказывается, как скорее всего это то, что если кто-нибудь купит Mountain-200 велосипедов, он купит другие перечисленные товары.

Правила отображаются в нисходящем порядке, однако можно изменить порядок сортировки, щелкнув заголовок столбца. Если существует необходимость дополнительных данных о конкретном правиле, можно получить результаты детализации для изучения поддерживаемых вариантов.

Просмотр вариантов, которые поддерживают определенное правило

  1. В правила щелкните правой кнопкой мыши правило, которое требуется просмотреть.

  2. Выберите Детализация, а затем выберите только столбцы модели, или столбцы модели и структуры.

    Детализация диалоговое окно предоставляет сводку правила в верхней части панели и список всех вариантов, которые использовались в качестве поддерживающих данных для правила.

В начало

Средство просмотра деревьев содержимого общего вида

Это средство просмотра может использоваться для всех моделей независимо от типа модели и алгоритма. Microsoft просмотра деревьев содержимого общего доступна из просмотра раскрывающегося списка.

Дерево содержимого представляет модель интеллектуального анализа данных в виде ряда узлов, каждый из которых представляет полученные знания о каком-либо подмножестве данных. Узел может содержать закономерность, набор правил, кластер или определение интервала дат, объединяемых некоторыми общими характеристиками. Конкретное содержимое узлов зависит от алгоритма и типа прогнозируемого атрибута, но общее представление содержимого одинаково. Каждый узел можно раскрыть, чтобы увеличить уровень детализации, и скопировать содержимое любого узла в буфер обмена.

Просмотр подробных сведений о правиле с помощью средства просмотра содержимого

  1. В средство просмотра модели интеллектуального анализа выберите Microsoft просмотра деревьев содержимого общего из просмотра списка.

  2. В панели «Заголовок узла» прокрутите список вниз до конца и щелкните последний узел.

    В средстве просмотра будут вначале показаны наборы элементов со следующими за ними правилами, но без группировки. Самый простой способ найти определенный узел — это создать запрос к содержимому. Дополнительные сведения см. в статье Примеры запросов моделей взаимосвязей.

  3. В панели «Сведения об узле» проверьте значения NODE_TYPE и NODE_DESCRIPTION.

    Тип узла 8 представляет собой правило, а тип узла 7 представляет собой набор элементов. Значение NODE_DESCRIPTION для правила содержит условия, из которых состоит такое правило. Значение NODE_DESCRIPTION для набора элементов содержит элементы, включенные в набор.

Также можно создать запрос к содержимому для получения подробной статистики и правил. Дополнительные сведения о содержимом модели интеллектуального анализа данных и их интерпретации см. в разделе содержимое модели интеллектуального анализа данных для модели взаимосвязей ( Службы Analysis Services — Интеллектуальный анализ данных ).

В начало

Следующая задача занятия

Фильтрование вложенной таблицы в модели интеллектуального анализа данных ( учебник по интеллектуальному анализу данных — средний )

См. также:

Урок 3. Построение сценария покупательского поведения (учебник по интеллектуальному анализу данных — средний уровень)
Занятие 4: Построение сценария кластеризации последовательностей ( учебник по интеллектуальному анализу данных — средний )
Алгоритм взаимосвязей (Майкрософт)
Технический справочник по алгоритму взаимосвязей (Майкрософт)