Share via


Consultar un modelo de regresión lineal (Analysis Services - Minería de datos)

Cuando se crea una consulta en un modelo de minería de datos, puede tratarse de una consulta de contenido, que proporciona detalles de los patrones detectados durante el análisis, o de una consulta de predicción, que utiliza los patrones del modelo para realizar predicciones de los nuevos datos. Por ejemplo, una consulta de contenido podría proporcionar detalles adicionales sobre la fórmula de regresión, mientras que una consulta de predicción podría indicar si un nuevo punto de datos se ajusta al modelo. También se pueden recuperar metadatos sobre el modelo mediante una consulta.

En esta sección se explica cómo crear consultas para los modelos que se basan en el algoritmo de regresión lineal de Microsoft. Para obtener más información acerca de la estructura de un modelo de regresión lineal, vea Contenido del modelo de minería de datos para los modelos de regresión lineal (Analysis Services - Minería de datos).

[!NOTA]

Dado que la regresión lineal está basada en un caso especial del algoritmo de árboles de decisión de Microsoft, algunos modelos de árbol de decisión que utilizan atributos de predicción continuos pueden contener fórmulas de regresión. Para obtener más información, vea Referencia técnica del algoritmo de árboles de decisión de Microsoft.

  • Consultas de contenido

    Devolver parámetros para el modelo mediante el conjunto de filas de esquema de minería de datos

    Devolver la fórmula de regresión para el modelo mediante el uso de DMX

    Devolver el coeficiente para el modelo

  • Consultas de predicción

    Realizar predicciones utilizando una consulta singleton

    Devolver las estadísticas descriptivas de un modelo de regresión

Volver al principio

Para reproducir los resultados de las consultas de ejemplo, puede crear un modelo de regresión lineal tal como se describe en el tema siguiente. El modelo es muy simple, pero muestra conceptos básicos sobre el uso del Diseñador de minería de datos para personalizar un modelo de regresión lineal.

Cómo forzar el uso de regresores en un modelo

Obtener información sobre el modelo de regresión lineal

La estructura de un modelo de regresión lineal es sumamente simple: el modelo de minería de datos representa los datos como un nodo único y ese nodo define la fórmula de regresión.

En esta sección se proporcionan ejemplos de cómo obtener más información sobre el modelo en sí, incluidas la fórmula de regresión y las estadísticas descriptivas de los datos.

Ejemplo de consulta 1: devolver parámetros para el modelo mediante el conjunto de filas de esquema de minería de datos

Al consultar el conjunto de filas de esquema de minería de datos, puede buscar los metadatos acerca del modelo. Podría incluirse cuándo se creó el modelo, cuándo se procesó en último lugar, el nombre de la estructura de minería de datos en la que se basa y el nombre de la columna que se usa como atributo de predicción. También se pueden devolver los parámetros que se utilizaron cuando se creó el modelo por primera vez.

SELECT MINING_PARAMETERS 
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Regression'

Resultados del ejemplo:

MINING_PARAMETERS

MINING_PARAMETERS

MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, FORCE_REGRESSOR=[Average Time Per Issue],[Total Operators]

[!NOTA]

Si no se han especificado regresores, el parámetro FORCE_REGRESSOR tiene el valor "FORCE_REGRESSOR =".

Volver al principio

Ejemplo de consulta 2: devolver la fórmula de regresión para el modelo mediante el uso de DMX

La consulta siguiente devuelve el contenido del modelo de minería de datos para el modelo de regresión lineal. La consulta devuelve el contenido del nodo que contiene la fórmula de regresión. También puede usar esta consulta en un modelo de árboles de decisión si uno de los nodos contiene una fórmula de regresión.

Cada variable y coeficiente están almacenados en una fila independiente de la tabla NODE_DISTRIBUTION anidada. Si desea ver la fórmula de regresión completa, utilice el Visor de árboles de Microsoft, haga clic en el nodo (Todos) y abra la Leyenda de minería de datos.

SELECT FLATTENED NODE_DISTRIBUTION as t
FROM [Call Center Regression].CONTENT

[!NOTA]

Si hace referencia a columnas individuales de la tabla anidada utilizando una consulta como SELECT <column name> from NODE_DISTRIBUTION, algunas columnas, como SUPPORT o PROBABILITY, se deben incluir entre corchetes para distinguirlas de las palabras clave reservadas del mismo nombre.

Resultados esperados:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Service Grade

Missing

0

0

0

1

Service Grade

0.09875

120

1

0.00157927083333334

3

Average Time Per Issue

0.00136989326310586

0

0

187.866597222222

7

Average Time Per Issue

12.0822151449249

0

0

0

8

Average Time Per Issue

79.8416666666667

0

0

187.866597222222

9

Total Operators

-0.000426156789860463

0

0

24.0799305555556

7

Total Operators

-3.19762422385219

0

0

0

8

Total Operators

10.6916666666667

0

0

24.0799305555556

9

-0.00606823493688524

0

0

0.00121526993847281

11

En la comparación, en la Leyenda de minería de datos, la fórmula de regresión aparece como sigue:

Service Grade = 0.070+0.001*(Average Time Per Issue-79.842)-0.0004*(Total Operators-10.692)

En la Leyenda de minería de datos, algunos números pueden aparecer redondeados; sin embargo, la tabla NODE_DISTRIBUTION y la Leyenda de minería de datos contienen esencialmente los mismos valores.

Los valores de la columna VALUETYPE indican qué tipo de información contiene cada fila, lo que resulta útil si los resultados se procesan mediante programación. En la tabla siguiente se muestran los tipos de valores que se generan para una fórmula de regresión lineal.

VALUETYPE

1 (ausente)

3 (continuo)

7 (coeficiente)

8 (ganancia de puntuación)

9 (estadísticas)

7 (coeficiente)

8 (ganancia de puntuación)

9 (estadísticas)

11 (intersección)

Para obtener más información sobre el significado de cada tipo de valor para los modelos de regresión, vea Contenido del modelo de minería de datos para los modelos de regresión lineal (Analysis Services - Minería de datos).

Volver al principio

Ejemplo de consulta 3: devolver el coeficiente para el modelo

Al utilizar la enumeración VALUETYPE, puede devolver solamente el coeficiente para la ecuación de regresión, como se muestra en la consulta siguiente:

SELECT FLATTENED MODEL_NAME,
    (SELECT ATTRIBUTE_VALUE, VALUETYPE
     FROM NODE_DISTRIBUTION
     WHERE VALUETYPE = 11) 
AS t
FROM [Call Center Regression].CONTENT

Esta consulta devuelve dos filas, una del contenido del modelo de minería de datos y la fila de la tabla anidada que contiene el coeficiente. La columna ATTRIBUTE_NAME no está incluida aquí porque siempre está en blanco para el coeficiente.

MODEL_NAME

t.ATTRIBUTE_VALUE

t.VALUETYPE

Call Center Regressors2

-0.00606823493688524

11

Realizar predicciones utilizando el modelo

Puede crear consultas de predicción en modelos de regresión lineal utilizando la ficha Predicción de modelo de minería de datos del Diseñador de minería de datos. El generador de consultas de predicción está disponible en SQL Server Management Studio y Business Intelligence Development Studio.

[!NOTA]

También puede crear consultas en modelos de regresión utilizando los Complementos de minería de datos de SQL Server 2005 para Excel o los Complementos de minería de datos de SQL Server 2008 para Excel. Aunque los complementos de minería de datos para Excel no crean modelos de regresión, puede examinar y consultar cualquier modelo de minería de datos que esté almacenado en una instancia de Analysis Services.

Volver al principio

Ejemplo de consulta 4: realizar predicciones utilizando una consulta singleton

La manera más fácil de crear una consulta singleton en un modelo de regresión es usar el cuadro de diálogo Entrada de consulta singleton. Por ejemplo, puede crear la consulta DMX siguiente seleccionando el modelo de regresión adecuado, eligiendo Consulta singleton y escribiendo a continuación 10 como valor para Total Operators.

SELECT
  Predict([Call Center Regression].[Service Grade])
FROM
  [Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t

Resultados del ejemplo:

Yearly Income

0.0992841946529471

Volver al principio

Ejemplo de consulta 5: devolver las estadísticas descriptivas de un modelo de regresión

Puede utilizar muchas de las funciones de predicción estándar con modelos de regresión lineal. En el ejemplo siguiente se muestra cómo agregar algunas estadísticas descriptivas a los resultados de las consultas de predicción.

SELECT
  Predict([Call Center Regression].[Service Grade]) as [Predicted Service],
  PredictStdev([Call Center Regression].[Service Grade]) as [Standard Deviation]
FROM
  [Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t

Resultados del ejemplo:

Predicted Service

Standard Deviation

0.0990447584463201

0.0348607220015996

Volver al principio

Lista de funciones de predicción

Todos los algoritmos de Microsoft son compatibles con un conjunto común de funciones. No obstante, el algoritmo de regresión lineal de Microsoft admite las funciones adicionales que se enumeran en la siguiente tabla.

Para consultar una lista de las funciones comunes a todos los algoritmos de Microsoft, vea Algoritmos de minería de datos (Analysis Services: Minería de datos). Para obtener más información acerca del modo de utilizar estas funciones, vea Referencia de funciones de Extensiones de minería de datos (DMX).

Historial de cambios

Contenido actualizado

Se han agregado vínculos de cada tema para facilitar la revisión de los ejemplos de consultas.

Se ha cambiado el ejemplo para usar un modelo con un ajuste mejor. Se ha agregado un vínculo al nuevo tema que describe la forma de crear el modelo de regresión lineal de ejemplo.