Диаграмма точности предсказаний

На вкладках Диаграмма точности прогнозов и Диаграмма точности интеллектуального анализа данных в конструкторе интеллектуального анализа данных можно просмотреть два типа диаграмм: диаграмму точности предсказаний и диаграмму роста прибыли. Диаграмма точности предсказаний сравнивает точность прогнозирования каждой модели, в то время как диаграмма роста прибыли отображает теоретическое повышение прибыли, связанное с использованием каждой модели.

Используйте список Тип диаграммы, чтобы выбрать необходимый тип диаграммы. Если из списка выбрать Диаграмма роста прибыли, то автоматически откроется диалоговое окно Настройки диаграммы роста прибыли. (Это диалоговое окно также открывается, если нажать кнопку Настройки.) Это диалоговое окно можно использовать для задания параметров, определяющих диаграмму роста прибыли.

Только модели интеллектуального анализа данных, содержащие дискретные прогнозируемые атрибуты, можно сравнивать на диаграмме точности предсказаний. Вкладку Диаграмма точности интеллектуального анализа данных нельзя использовать с другими моделями временных рядов или с моделями, имеющими непрерывные прогнозируемые атрибуты.

Дополнительные сведения см. в разделах Раздел руководства по вкладке «Диаграмма точности интеллектуального анализа», Сопоставления столбцов (диаграмма точности предсказаний), Проверка моделей интеллектуального анализа данных

Типы диаграмм

В следующих разделах приведено более подробное описание каждого типа диаграммы.

  • Диаграмма точности прогнозов
  • Диаграмма роста прибыли

Диаграмма точности прогнозов

На вкладке Диаграмма точности прогнозов отображается графическое представление изменения точности, обеспечиваемое моделью интеллектуального анализа данных. Например, рассмотрим случай, в котором отдел маркетинга компании Adventure Works Cycles хочет разработать кампанию целевой рассылки. На основе предыдущих кампаний известно, что процент ответивших, равный 10, является типичным. В таблице базы данных хранится список, содержащий 10 000 потенциальных заказчиков. На основании типового процента ответивших они могут ожидать, что ответит 1 000 заказчиков.

Примем также во внимание, что бюджет проекта меньше, чем сумма денег, необходимая, чтобы связаться со всеми 10 000 заказчиков в базе данных. На основе бюджета они могут позволить себе выслать рекламу только 5 000 заказчикам. Отдел маркетинга имеет два варианта.

  • Случайно выбрать 5 000 целевых заказчиков.
  • Использовать модель интеллектуального анализа данных, чтобы выбрать 5 000 целевых заказчиков, вероятность ответа которых наиболее велика.

Если компания случайно выбирает 5 000 заказчиков, то они могут ожидать получить только 500 из оцененных 1 000 положительных ответов, поскольку обычно отвечают только 10 процентов целевых заказчиков. Этот сценарий представлен случайной линией на диаграмме точности предсказаний. Однако если отдел маркетинга использует модель интеллектуального анализа данных для целевой рассылки, то они могут ожидать более высокого процента ответивших, поскольку они могут связаться только с теми заказчиками, вероятность ответа которых наиболее высока. Если бы модель была совершенной, то есть могла создавать прогнозы, которые бы сбывались всегда, то компания могла бы ожидать получить все 1 000 оцененных ответов, послав сообщения 1 000 потенциальных заказчиков, рекомендуемых моделью. Этот сценарий представлен идеальной линией на диаграмме точности предсказаний. В реальности модель интеллектуального анализа данных наиболее вероятно лежит между этими крайними случаями: между случайным предположением и идеальным прогнозом. Любое повышение процента ответивших по сравнению со случайным предположением считается повышением точности прогнозирования.

Можно создавать два типа диаграммы, в одном указывая состояние прогнозируемого столбца, а в другом не указывая этого состояния.

Если указано состояние прогнозируемого столбца, то можно создать тип диаграммы, показанный на следующей диаграмме.

Диаграмма точности предсказаний целевой и общей совокупностей

Ось X диаграммы представляет процент тестируемого набора данных, используемого для сравнения прогнозов. Ось Y диаграммы представляет процент значений, которые прогнозируются в указанном состоянии. На диаграмме красная линия представляет случайную линию, а желтая линия — идеальную модель.

Если не указано состояние прогнозируемого столбца, то можно создать диаграмму следующего типа, показанного на следующей диаграмме.

Диаграмма точности предсказаний с правильными прогнозами

Ось X такая же, как и на диаграмме с заданным прогнозируемым столбцом, но ось Y теперь представляет процент прогнозов, являющихся правильными. На этой диаграмме красная линия представляет идеальную модель.

При переключении между вкладкой Сопоставление столбцов и вкладкой Диаграмма точности прогнозов диаграмма обновляется, отражая любые изменения, внесенные в сопоставления столбцов.

В начало

Диаграмма роста прибыли

На диаграмме роста прибыли отображается оцененное увеличение прибыли, связанное с использованием модели интеллектуального анализа данных для определения, с какими заказчиками должна связаться компания в соответствии со сценарием. Ось Y на диаграмме представляет прибыль, в то время как ось X — процент совокупности, с которым связалась компания. На типичной диаграмме роста прибыли отображается увеличение прибыли до определенной точки, после которой прибыль уменьшается при связи с еще большей совокупностью.

Используйте список Тип диаграммы, чтобы отобразить диаграмму роста прибыли. После выбора варианта Диаграмма роста прибыли открывается диалоговое окно Настройки диаграммы роста прибыли. Это диалоговое окно можно использовать для задания параметров, определяющих диаграмму роста прибыли. В следующем списке содержится описание параметров, которые можно установить.

  • Совокупность
    Количество вариантов в наборе данных, используемое для создания диаграммы точности предсказаний. Например, количество потенциальных заказчиков.
  • Постоянные расходы
    Постоянные расходы, связанные с проблемой. При оценке решения целевой рассылки эти расходы не будут зависеть от таких переменных, как количество телефонных звонков или количество рекламных писем.
  • Личные расходы
    Расходы, добавляющиеся к постоянным расходам, которые могут быть связаны с обращением к каждому заказчику. Например, рекламные письма или телефонные звонки.
  • Прибыль от одного заказчика
    Количество прибыли, связанное с каждой успешной продажей.

Можно также открыть диалоговое окно Настройки диаграммы роста прибыли, нажав кнопку Настройки на вкладке Диаграмма точности прогнозов.

Диаграмма роста прибыли содержит серую вертикальную линию, которую можно перемещать, щелкая в разных местах диаграммы. В пункте Обозначения интеллектуального анализа данных отображается коэффициент, коррекция совокупности и вероятность прогноза, связанные с местоположением серой линии на диаграмме. Если с использованием этой серой линии выбрать точку максимальной прибыли, то можно использовать значение вероятности прогнозирования, чтобы определить порог вероятности для связи с заказчиком.

Например, пик кривой прибыли лежит на 55 процентах совокупности, а соответствующая вероятность прогнозирования равна 20 процентам, это указывает на то, что для достижения максимальной прибыли необходимо связаться только с заказчиками, чья вероятность ответа равна 20 процентам или выше.

В начало

См. также

Основные понятия

Сопоставления столбцов (диаграмма точности предсказаний)
Основные понятия интеллектуального анализа данных
Работа с интеллектуальным анализом данных
Проверка моделей интеллектуального анализа данных

Другие ресурсы

Раздел руководства по вкладке «Диаграмма точности интеллектуального анализа»

Справка и поддержка

Получение помощи по SQL Server 2005