Ver un modelo de minería de datos con el Visor de árboles de Microsoft

El Visor de árboles de Microsoft en Microsoft SQL Server Analysis Services muestra árboles de decisión que se generan con el algoritmo de árboles de decisión de Microsoft. El algoritmo de árboles de decisión de Microsoft es un algoritmo del árbol de decisión híbrido que admite clasificación y regresión. Por consiguiente, también puede usar este visor para ver modelos basados en el algoritmo de regresión lineal de Microsoft. El algoritmo de árboles de decisión de Microsoft se usa para el modelo de predicción de los atributos discretos y continuos. Para obtener más información acerca de este algoritmo, vea Algoritmo de árboles de decisión de Microsoft.

Nota

Para ver información detallada acerca de las ecuaciones que se usan en el modelo y los patrones detectados, use el Visor de árbol de contenido genérico de Microsoft. Para obtener más información, vea Ver los detalles del modelo con el Visor de árbol de contenido genérico de Microsoft o Visor de árbol de contenido genérico de Microsoft (Diseñador de minería de datos).

Visor de árboles (fichas y paneles)

Cuando se examina un modelo de minería de datos en Analysis Services, el modelo aparece en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos en el visor apropiado para el modelo. El Visor de árboles de Microsoft incluye los siguientes paneles y fichas:

  • Árbol de decisión

  • Red de dependencias

  • Leyenda de minería de datos

Árbol de decisión

Cuando se genera un modelo de árbol de decisión, Analysis Services genera un árbol independiente por cada atributo de predicción. Puede ver un árbol individual seleccionándolo en la lista Árbol de la ficha Árbol de decisión del visor.

Un árbol de decisión se compone de una serie de divisiones, con la división más importante, determinada por el algoritmo, a la izquierda del visor en el nodo Todos. Las divisiones adicionales se muestran a la derecha. La división del nodo Todos es la más importante porque contiene la condición más determinante de división del conjunto de datos y, por tanto, la que ocasiona la primera división.

Puede expandir o contraer nodos individuales en el árbol para mostrar u ocultar las divisiones que se producen en cada nodo. También puede usar las opciones de la ficha Árbol de decisión para cambiar la forma en que aparece el árbol. Use el control deslizante Mostrar nivel para ajustar el número de niveles que muestra el árbol. Utilice Expansión predeterminada para establecer el número predeterminado de niveles que se muestran en todos los árboles del modelo.

Predecir atributos discretos

Cuando un árbol se genera con un atributo de predicción discreto, el visor muestra lo siguiente en cada nodo del árbol:

  • La condición que provocó la división.

  • Un histograma que representa la distribución de los estados del atributo de predicción, ordenados por popularidad.

Puede utilizar la opción Histograma para cambiar el número de estados que aparecen en los histogramas del árbol. Esto resulta útil si el atributo de predicción tiene muchos estados. Los estados aparecen en un histograma por orden de popularidad de izquierda a derecha; si el número de estados que elige que se muestren es menor que el número total de estados del atributo, los estados menos populares se muestran de forma conjunta en color gris. Para ver el recuento exacto de cada estado de un nodo, sitúe el puntero sobre el nodo para ver un recuadro informativo o seleccione el nodo para ver sus detalles en la Leyenda de minería de datos.

El color de fondo de cada nodo representa la concentración de casos del estado del atributo concreto que selecciona utilizando la opción Fondo. Puede utilizar esta opción para resaltar los nodos que contengan un destino concreto en el que esté interesado.

Predecir atributos continuos

Cuando un árbol se genera con un atributo de predicción continuo, el visor muestra un gráfico en forma de rombo, en lugar de un histograma, por cada nodo del árbol. El gráfico en forma de rombo tiene una línea que representa el intervalo del atributo. El rombo está ubicado en la media del nodo y su ancho representa la varianza del atributo en ese nodo. Un rombo más estrecho indica que el nodo puede crear una predicción más exacta. El visor también muestra la ecuación de regresión, que se utiliza para determinar la división del nodo.

Opciones de presentación adicionales del árbol de decisión

Cuando la obtención de detalles está habilitada para un modelo de árbol de decisión, puede obtener acceso a los casos de entrenamiento compatibles con un nodo haciendo clic con el botón secundario en el nodo en el árbol y seleccionando Obtener detalles. Puede habilitar la obtención de detalles en el Asistente para minería de datos o ajustando la propiedad de obtención de detalles del modelo de minería de datos en la ficha Modelos de minería de datos.

Puede utilizar las opciones de zoom de la ficha Árbol de decisión para acercar o alejar el árbol, o utilizar Ajustar tamaño al contenido para que en la pantalla del visor se muestre el modelo completo. Si el árbol es demasiado grande para ajustar su contenido al tamaño de la pantalla, puede utilizar la opción Navegación para navegar por el árbol. Al hacer clic en Navegación se abre una ventana de navegación independiente que se puede utilizar para seleccionar secciones del modelo que se muestra.

También puede copiar la imagen de la vista del árbol en el Portapapeles, de modo que pueda pegarla en documentos o en programas de manipulación de imágenes. Utilice Copiar vista del gráfico para copiar solo la sección del árbol que se muestra en el visor o Copiar todo el gráfico para copiar todos los nodos expandidos del árbol.

Volver al principio

Red de dependencias

La Red de dependencias muestra las dependencias entre los atributos de entrada y los atributos de predicción del modelo. El control deslizante de la izquierda del visor se comporta como un filtro que está asociado a la importancia de las dependencias. Si desplaza el control deslizante hacia abajo, solamente se muestran en el visor los vínculos de mayor importancia.

Cuando se selecciona un nodo, el visor resalta las dependencias que son específicas de ese nodo. Por ejemplo, si elige un nodo de predicción, el visor también resalta cada uno de los nodos que ayudan a predecir el nodo de predicción.

Si el visor contiene numerosos nodos, puede buscar nodos específicos mediante el botón Buscar nodo. Al hacer clic en Buscar nodo se abre el cuadro de diálogo Buscar nodo, en el que puede utilizar un filtro para buscar y seleccionar nodos específicos.

La leyenda de la parte inferior del visor vincula los códigos de color con el tipo de dependencia en el gráfico. Por ejemplo, cuando selecciona un nodo de predicción, este aparece sombreado en color turquesa y los nodos que predicen el nodo seleccionado aparecen sombreados en color naranja.

Volver al principio

Leyenda de minería de datos

La Leyenda de minería de datos muestra la siguiente información al seleccionar un nodo en el modelo de árbol de decisión:

  • El número de casos del nodo, dividido en los estados del atributo de predicción.

  • La probabilidad de cada caso del atributo de predicción del nodo.

  • Un histograma que incluye un recuento de cada estado del atributo de predicción.

  • Las condiciones que se requieren para alcanzar un nodo específico, que también se conocen como ruta del nodo.

  • Para los modelos de regresión lineal, la fórmula de la regresión.

Puede acoplar la Leyenda de minería de datos y trabajar con ella de manera similar a como se hace con el Explorador de soluciones.

Volver al principio