Contenido del modelo de minería de datos para los modelos de regresión logística (Analysis Services - Minería de datos)

En este tema se describe el contenido del modelo de minería de datos específico de los modelos que utilizan el algoritmo de regresión logística de Microsoft. Para obtener una explicación de cómo interpretar las estadísticas y estructura compartidas por todos los tipos de modelos, y las definiciones generales de las condiciones relacionadas con el contenido del modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

Descripción de la estructura de un modelo de regresión logística

Un modelo de regresión logística se crea utilizando el algoritmo de red neuronal de Microsoft con parámetros que restringen el modelo para eliminar el nodo oculto. Por consiguiente, la estructura global de un modelo de regresión logística es casi idéntica a la de una red neuronal: cada modelo tiene un único nodo primario que representa el modelo y sus metadatos, y un nodo de estadísticas marginal especial (NODE_TYPE = 24) que proporciona estadísticas descriptivas sobre las entradas que se usan en el modelo.

Además, el modelo contiene una subred (NODE_TYPE = 17) para cada atributo de predicción. Al igual que en un modelo de red neuronal, cada subred siempre contiene dos bifurcaciones: una para el nivel de entrada y otra que contiene el nivel oculto (NODE_TYPE = 19) y el nivel de salida (NODE_TYPE = 20) para la red. La misma subred se puede utilizar para varios atributos si se especifican como de sólo predicción. Los atributos de predicción que también sean entradas pueden no aparecer en la misma subred.

Sin embargo, en un modelo de regresión logística, el nodo que representa el nivel oculto está vacío y no tiene ningún elemento secundario. Por consiguiente, el modelo contiene nodos que representan salidas individuales (NODE_TYPE = 23) y entradas individuales (NODE_TYPE = 21) pero ningún nodo oculto individual.

estructura del contenido del modelo de regresión logística

De forma predeterminada, un modelo de regresión logística se muestra en el Visor de redes neuronales de Microsoft. Con este visor personalizado, puede filtrar los atributos de entrada y sus valores, y ver gráficamente cómo afectan a las salidas. La información sobre herramientas del visor muestra la probabilidad y la mejora respecto al modelo predictivo asociados a cada par de valores de entrada y de salida. Para obtener más información, vea Ver un modelo de minería de datos con el Visor de redes neuronales de Microsoft.

Para explorar la estructura de entradas y subredes, y ver estadísticas detalladas, puede utilizar el Visor de árbol de contenido genérico de Microsoft. Puede hacer clic en cualquier nodo para expandirlo y ver los nodos secundarios, o ver los pesos y otras estadísticas contenidas en el nodo.

Contenido del modelo de minería de datos para un modelo de regresión logística

En esta sección sólo se proporcionan detalles y ejemplos de las columnas del contenido del modelo de minería de datos que tienen una relevancia especial para la regresión logística. El contenido del modelo es casi idéntico al de un modelo de red neuronal, pero las descripciones que se aplican a los modelos de red neuronal se pueden repetir en esta tabla por comodidad.

Para obtener información sobre las columnas de uso general en el conjunto de filas de esquema, como MODEL_CATALOG y MODEL_NAME, que no se describen aquí, o para obtener una explicación de la terminología del modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

  • MODEL_CATALOG
    Nombre de la base de datos en la que se almacena el modelo.

  • MODEL_NAME
    Nombre del modelo.

  • ATTRIBUTE_NAME
    Nombres de los atributos que corresponden a este nodo.

    Nodo

    Contenido

    Raíz del modelo

    En blanco

    Estadísticas marginales

    En blanco

    Nivel de entrada

    En blanco

    Nodo de entrada

    Nombre del atributo de entrada

    Nivel oculto

    En blanco

    Nivel de salida

    En blanco

    Nodo de salida

    Nombre del atributo de salida

  • NODE_NAME
    Nombre del nodo. Actualmente, esta columna contiene el mismo valor que NODE_UNIQUE_NAME, aunque esto podría cambiar en versiones futuras.

  • NODE_UNIQUE_NAME
    Nombre único del nodo.

    Para obtener más información sobre cómo proporcionan los nombres e identificadores información estructural sobre el modelo, consulte la sección Usar nombres de nodo e identificadores.

  • NODE_TYPE
    Un modelo de regresión logística genera los tipos de nodos siguientes:

    Identificador del tipo de nodo

    Descripción

    1

    Modelo.

    17

    Nodo de organizador para la subred.

    18

    Nodo de organizador para el nivel de entrada.

    19

    Nodo de organizador para el nivel oculto. El nivel oculto está vacío.

    20

    Nodo de organizador para el nivel de salida.

    21

    Nombre del atributo de entrada.

    23

    Nodo del atributo de salida.

    24

    Nodo de estadísticas marginales.

  • NODE_CAPTION
    Etiqueta o título asociado al nodo. En los modelos de regresión logística, siempre está en blanco.

  • CHILDREN_CARDINALITY
    Cálculo del número de elementos secundarios que tiene el nodo.

    Nodo

    Contenido

    Raíz del modelo

    Indica el recuento de nodos secundarios, que incluye por lo menos una red, un nodo marginal necesario y un nivel de entrada necesaria. Por ejemplo, si el valor es 5, hay tres subredes.

    Estadísticas marginales

    Siempre es 0.

    Nivel de entrada

    Indica el número de pares de valores de atributos entrada que usó el modelo.

    Nodo de entrada

    Siempre es 0.

    Nivel oculto

    En un modelo de regresión logística, siempre es 0.

    Nivel de salida

    Indica el número de valores de salida.

    Nodo de salida

    Siempre es 0.

  • PARENT_UNIQUE_NAME
    Nombre único del nodo primario del nodo. Se devuelve NULL para todos los nodos del nivel raíz.

    Para obtener más información sobre cómo proporcionan los nombres e identificadores información estructural sobre el modelo, consulte la sección Usar nombres de nodo e identificadores.

  • NODE_DESCRIPTION
    Descripción fácil de comprender del nodo.

    Nodo

    Contenido

    Raíz del modelo

    En blanco

    Estadísticas marginales

    En blanco

    Nivel de entrada

    En blanco

    Nodo de entrada

    Nombre del atributo de entrada

    Nivel oculto

    En blanco

    Nivel de salida

    En blanco

    Nodo de salida

    Si el atributo de salida es continuo, contiene su nombre.

    Si el atributo de salida es discreto, contiene el nombre del atributo y el valor.

  • NODE_RULE
    Descripción XML de la regla que está incrustada en el nodo.

    Nodo

    Contenido

    Raíz del modelo

    En blanco

    Estadísticas marginales

    En blanco

    Nivel de entrada

    En blanco

    Nodo de entrada

    Fragmento XML que contiene la misma información que la columna NODE_DESCRIPTION.

    Nivel oculto

    En blanco

    Nivel de salida

    En blanco

    Nodo de salida

    Fragmento XML que contiene la misma información que la columna NODE_DESCRIPTION.

  • MARGINAL_RULE
    En los modelos de regresión logística, siempre está en blanco.

  • NODE_PROBABILITY
    Probabilidad asociada a este nodo. En los modelos de regresión logística, siempre es 0.

  • MARGINAL_PROBABILITY
    Probabilidad de alcanzar el nodo desde el nodo primario. En los modelos de regresión logística, siempre es 0.

  • NODE_DISTRIBUTION
    Tabla anidada que contiene la información estadística para el nodo. Para obtener información detallada sobre el contenido de esta tabla para cada tipo de nodo, consulte la sección Descripción de la tabla NODE_DISTRIBUTION, en Contenido del modelo de minería de datos para los modelos de red neuronal (Analysis Services - Minería de datos).

  • NODE_SUPPORT
    En los modelos de regresión logística, siempre es 0.

    Nota

    Las probabilidades de compatibilidad siempre son 0 porque la salida de este tipo de modelo no es probabilística. Lo único significativo para el algoritmo son los pesos; por consiguiente, el algoritmo no calcula la probabilidad, la compatibilidad ni la varianza.

    Para obtener información sobre la compatibilidad en los casos de entrenamiento para valores concretos, vea el nodo de estadísticas marginales.

  • MSOLAP_MODEL_COLUMN

    Nodo

    Contenido

    Raíz del modelo

    En blanco

    Estadísticas marginales

    En blanco

    Nivel de entrada

    En blanco

    Nodo de entrada

    Nombre del atributo de entrada.

    Nivel oculto

    En blanco

    Nivel de salida

    En blanco

    Nodo de salida

    Nombre del atributo de entrada.

  • MSOLAP_NODE_SCORE
    En los modelos de regresión logística, siempre es 0.

  • MSOLAP_NODE_SHORT_CAPTION
    En modelos de regresión logística, siempre está en blanco.

Usar nombres de nodo e identificadores

La denominación de los nodos en un modelo de regresión logística proporciona información adicional sobre las relaciones entre los nodos del modelo. En la tabla siguiente se muestran las convenciones para los identificadores que están asignados a los nodos de cada nivel.

Tipo de nodo

Convención para el identificador de nodo

Raíz del modelo (1)

00000000000000000.

Nodo de estadísticas marginales (24)

10000000000000000

Nivel de entrada (18)

30000000000000000

Nodo de entrada (21)

Comienza en 60000000000000000

Subred (17)

20000000000000000

Nivel oculto (19)

40000000000000000

Nivel de salida (20)

50000000000000000

Nodo de salida (23)

Comienza en 80000000000000000

Puede utilizar estos identificadores para determinar cómo se relacionan los atributos de salida con atributos concretos del nivel de entrada, viendo la tabla NODE_DISTRIBUTION del nodo de salida. Cada fila de esa tabla contiene un identificador que apunta a un nodo de atributo de entrada concreto. La tabla NODE_DISTRIBUTION también contiene el coeficiente para ese par de entrada-salida.