Cómo crear un informe de validación cruzada

Para crear un informe de validación cruzada en SQL Server Analysis Services, debe completar pasos que son ligeramente diferentes de los procedimientos para otros tipos de gráficos de precisión. Esto se debe a que un informe de validación cruzada no utiliza datos externos, sino que sólo usa los datos originales que se utilizaron para entrenar el modelo. Por lo tanto, no tiene que seleccionar un origen de datos o asignar columnas del origen de datos a las columnas del modelo de minería de datos.

El procedimiento siguiente describe los pasos para configurar y generar un informe de validación cruzada. Para obtener información general sobre la validación cruzada, vea Validación cruzada (Analysis Services - Minería de datos).

Para obtener información sobre cómo crear otros tipos de gráficos de precisión, vea Cómo crear un gráfico de precisión para un modelo de minería de datos.

Nota

Sólo los modelos que se relacionan con la estructura seleccionada actualmente están disponibles para la validación cruzada. Si la estructura admite modelos que tienen atributos de predicción diferentes o una combinación de modelos clúster y no clúster, se deben crear informes independientes para cada resultado de predicción o para los modelos clúster y no clúster.

Para seleccionar una estructura de minería de datos para la validación cruzada

  1. Abra el Diseñador de minería de datos de Business Intelligence Development Studio.

  2. En el Explorador de soluciones, abra la base de datos que contiene la estructura o el modelo para el que desea crear un informe.

  3. Haga doble clic en la estructura de minería de datos para abrir la estructura y sus modelos relacionados en el Diseñador de minería de datos.

  4. Haga clic en la ficha Gráfico de precisión de minería de datos.

  5. Haga clic en la ficha Validación cruzada.

Para establecer opciones de validación cruzada

  1. En la ficha Validación cruzada, en Recuento de subconjuntos, haga clic en la flecha abajo para seleccionar un número entre 1 y 10. El valor predeterminado es 10.

    El Recuento de plegamientos representa el número de particiones que se creará dentro del conjunto de datos original. Si establece Recuento de plegamientos en 1, el conjunto de entrenamiento se utilizará sin particiones.

  2. En Atributo de destino, haga clic en la flecha abajo y seleccione una columna en la lista. Si el modelo es un modelo clúster, seleccione #Cluster para indicar que el modelo no tiene un atributo de predicción.

    Puede seleccionar sólo un atributo de predicción para cada informe. De forma predeterminada, todos los modelos relacionados que tienen el mismo atributo de predicción se incluyen en el informe.

  3. En Máximo de casos, escriba un número que sea suficientemente grande para proporcionar una muestra representativa de datos cuando los datos se dividen entre el número especificado de plegamientos. Si el número es mayor que el recuento de casos en el conjunto de entrenamiento del modelo, se utilizarán todos los casos.

    Si el conjunto de datos de entrenamiento es muy grande, al establecer el valor de Máximo de casos se limita el número total de casos procesados y se permite que el informe finalice más rápidamente. Sin embargo, no debe establecer Máximo de casos en un valor demasiado bajo porque puede que no haya datos suficientes para la validación cruzada.

  4. Si lo desea, en Estado de destino, escriba el valor del atributo de predicción que desea modelar. Por ejemplo, si la columna Bike Buyer tiene dos valores posibles, 1 (Sí) y 2 (No), puede especificar el valor 1 para evaluar la exactitud del modelo para los compradores de bicicletas.

    Nota

    Si no especifica un valor, la opción Umbral de destino no está disponible y el modelo se evalúa para todos los valores posibles del atributo de predicción.

  5. Opcionalmente, en Umbral de destino, escriba un número decimal comprendido entre 0 y 1 para especificar la probabilidad mínima que una predicción debe tener para ser considerada precisa.

    Para obtener más información acerca de cómo establecer umbrales de probabilidad, vea Informe de validación cruzada (Analysis Services - Minería de datos).

  6. Haga clic en Obtener resultados.

Para imprimir el informe

  1. Haga clic con el botón secundario en el informe completado en la ficha Validación cruzada.

  2. En el menú contextual, seleccione Imprimir o Vista previa de impresión para revisar el informe primero.

Para crear una copia del informe en Microsoft Excel

  1. Haga clic con el botón secundario en el informe completado en la ficha Validación cruzada.

  2. En el menú contextual, seleccione Seleccionar todo.

  3. Haga clic con el botón secundario en el texto seleccionado y, a continuación, haga clic en Copiar.

  4. Pegue la selección en un libro de Excel abierto. Si utiliza la opción Pegar, el informe se pega en Excel como HTML, con lo que se conserva el formato de filas y columnas. Si pega el informe usando las opciones Pegado especial para texto o texto Unicode, el informe se pega en formato delimitado por filas.