Поделиться через


Указание столбца, который будет использоваться в модели в качестве регрессора

Модель линейной регрессии представляет значение прогнозируемого атрибута как результат формулы, в которой входные данные комбинируются таким образом, чтобы они как можно ближе соответствовали предполагаемой линии регрессии. Этот алгоритм принимает только числовые значения и автоматически обнаруживает входные данные, которые обеспечивают наиболее близкое соответствие.

Однако можно указать, что столбец включается в качестве регрессора добавлением в модель параметра FORCE_REGRESSOR и указанием использования регрессоров. Это может понадобиться, когда атрибут имеет значение даже в том случае, если эффект слишком мал и не может быть обнаружен моделью либо когда необходимо обеспечить включение атрибута в формулу.

В следующей процедуре показано, как создать простую модель линейной регрессии с помощью образцов данных, использованных в учебнике по нейронным сетям. Модель не обязательно будет надежной, однако она демонстрирует, как использовать конструктор интеллектуального анализа данных для настройки модели линейной регрессии.

Как создать простую модель линейной регрессии

  1. В среде SQL Server Data Tools (SSDT), в обозревателе решений разверните узел Структуры интеллектуального анализа данных.

  2. Дважды щелкните Call Center.dmm, чтобы открыть его в конструкторе.

  3. В меню Модель интеллектуального анализа данных выберите пункт Создать модель интеллектуального анализа данных.

  4. В качестве алгоритма выберите Алгоритм линейной регрессии (Майкрософт). В качестве имени введите «Call Center Regression».

  5. На вкладке Модели интеллектуального анализа данных измените использование столбца следующим образом. Все столбцы, отсутствующие в следующем списке, должны быть установлены в значение Пропустить.

    FactCallCenterID Ключ

    ServiceGrade PredictOnly

    Total Operators Вход.

    AverageTimePerIssue Вход.

  6. В меню Модель интеллектуального анализа данных выберите команду Задать параметры модели.

  7. Для параметра FORCE_REGRESSOR в столбце Значение перечислите через запятую имена столбцов, заключенные в квадратные скобки, следующим образом.

    [Average Time Per Issue],[Total Operators]
    
    ПримечаниеПримечание

    Алгоритм автоматически обнаруживает столбцы, являющиеся лучшими регрессорами. Нужно только при необходимости принудительно использовать регрессоры, чтобы обеспечить включение столбца в конечную формулу.

  8. В меню Модель интеллектуального анализа данных выберите пункт Обработать модель.

    В средстве просмотра модель представляется единственным узлом, содержащим формулу регрессии. Можно просмотреть формулу в окне Обозначения интеллектуального анализа данных или получить коэффициенты для формулы с помощью запросов.

См. также

Справочник

Технический справочник по алгоритму линейной регрессии (Майкрософт)

Содержимое моделей интеллектуального анализа данных для моделей линейной регрессии (службы Analysis Services — интеллектуальный анализ данных)

Основные понятия

Алгоритм линейной регрессии (Майкрософт)

Запросы интеллектуального анализа данных