Share via


Probar la exactitud con gráficos de mejora respecto al modelo predictivo (Tutorial básico de minería de datos)

En la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos, puede calcular la precisión de las predicciones de sus modelos y comparar los resultados de diferentes modelos. Este método de comparación se conoce como gráfico de mejora respecto al modelo predictivo. Normalmente, la exactitud de la predicción de un modelo de minería de datos se cuantifica mediante la mejora respecto al modelo predictivo o la exactitud de la clasificación. En este tutorial utilizaremos solamente el gráfico de mejora respecto al modelo predictivo. Para obtener más información acerca de cómo usar estos y otros gráficos de precisión, vea Herramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos).

En este tema, realizará las tareas siguientes:

  • Elegir datos de entrada

  • Seleccionar modelos, columnas de predicción y valores

Elegir los datos de entrada

El primer paso a la hora de probar la precisión de los modelos de minería de datos consiste en seleccionar el origen de datos que usará para realizar las pruebas. Probará la exactitud de los modelos con sus datos de prueba y, a continuación, los utilizará con datos externos.

Para seleccionar el conjunto de datos

  1. Cambie a la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos de Business Intelligence Development Studio y seleccione la ficha Selección de entrada.

  2. En el cuadro de grupo Seleccionar un conjunto de datos para usarlo en un gráfico de precisión, seleccione Usar casos de prueba de estructura de minería de datos para probar los modelos utilizando los datos de prueba que apartó cuando creó la estructura de minería de datos.

    Para obtener más información de las otras opciones, vea Medir la precisión del modelo de minería de datos (Analysis Services - Minería de datos).

Seleccionar modelos, columnas de predicción y valores

El siguiente paso consiste en seleccionar los modelos que desea incluir en el gráfico de mejora respecto al modelo predictivo, la columna de predicción con la que va a comparar los modelos y el valor que se va a predecir.

Nota

Las columnas del modelo de minería de datos que se enumeran en la lista Nombre de columna de predicción se limitan a las columnas cuyo tipo de uso se ha establecido en Predict o Predict Only, y su tipo de contenido es Discrete o Discretized.

Para mostrar la elevación de los modelos

  1. En la ficha Selección de entrada del Diseñador de minería de datos, en Seleccione las columnas del modelo de minería de datos de predicción que se mostrarán en el gráfico de elevación, active la casilla correspondiente a Sincronizar valores y columnas de predicción.

  2. En la columna Nombre de columna de predicción, compruebe que Bike Buyer está seleccionado para cada modelo.

  3. En la columna Mostrar, seleccione cada uno de los modelos.

    De forma predeterminada, todos los modelos de la estructura de minería de datos aparecen seleccionados. Puede decidir no incluir un modelo específico, pero para este tutorial deje todos los modelos seleccionados.

  4. En la columna Valor de predicción, seleccione 1. El mismo valor se rellena automáticamente para cada modelo que tiene la misma columna de predicción.

  5. Seleccione la ficha Gráfico de mejora respecto al modelo predictivo para mostrar el gráfico de mejora.

    Cuando haga clic en la ficha, se ejecutará una consulta de predicción en el servidor y en la base de datos para la estructura de minería de datos y la tabla de entrada o los datos de prueba. Los resultados se trazan en el gráfico.

    Al escribir un Valor de predicción, el gráfico de mejora respecto al modelo predictivo traza un modelo de suposición aleatorio así como un modelo ideal. Los modelos de minería de datos que creó se situarán entre estos dos extremos, entre una suposición aleatoria y una predicción perfecta. Cualquier mejora en la suposición aleatoria se considera una mejora respecto al modelo predictivo.

  6. Utilice la leyenda para buscar las líneas coloreadas que representan el modelo ideal y el modelo de suposición aleatoria.

    Observará que el modelo TM_Decision_Tree proporciona la mayor mejora respecto al modelo predictivo, superando tanto al modelo de agrupación en clústeres como al de Bayes naive.

Para obtener una explicación detallada de un gráfico de mejora respecto al modelo predictivo similar al creado en esta lección, vea Gráfico de elevación (Analysis Services - Minería de datos).