Tutorial de vídeo Cálculo de predicción (Herramienta de análisis de tabla de minería de datos)

Se aplica a: Microsoft SQL Server Analysis Services

Autora: Michele Hart, Microsoft Corporation

Narradora: Mary Brennan, Microsoft Corporation

Duración: 00:7:11

Tamaño: 15.799 KB

Tipo: archivo WMV

Ver este vídeo

Temas de ayuda relacionados:

Algoritmos de minería de datos (Analysis Services: Minería de datos)

Otros vídeos:

Introducción a las Herramientas de análisis de tabla (Vídeo de SQL Server)

Tutorial de vídeo Analizar influenciadores clave (Herramienta de análisis de tabla de minería de datos)

Tutorial de vídeo Detectar categorías (Herramienta de análisis de tabla de minería de datos)

Tutorial de vídeo Rellenar desde ejemplo (Herramienta de análisis de tabla de minería de datos)

Tutorial de vídeo Pronóstico (Herramienta de análisis de tabla de minería de datos)

Tutorial de vídeo Resaltar excepciones (Herramienta de análisis de tabla de minería de datos)

Tutorial de vídeo sobre Buscar objetivo de Análisis de escenario (Complemento de minería de datos para Excel)

Tutorial de vídeo sobre la herramienta Y si (What If) de Análisis de escenario (Complemento de minería de datos para Excel)

Tutorial de vídeo Análisis de la cesta de compras (Herramienta de análisis de tabla de minería de datos)

Resumen del vídeo

En este tutorial aprenderemos a utilizar la herramienta de análisis de tabla Cálculo de predicción para Excel 2007.

Transcripción del vídeo

Introducción

Hola, me llamo Mary Brennan y soy redactora técnica para Microsoft SQL Server. Este vídeo le ayudará a empezar a usar la herramienta Cálculo de predicción. Esta herramienta genera cálculos interactivos e imprimibles para puntuar los datos nuevos frente a un resultado deseado. Por ejemplo, se puede usar para determinar si una solicitud de préstamo debería aprobarse o no de acuerdo con las puntuaciones que anota según los atributos del cliente, como la ocupación y los ingresos.

Además de generar cálculos, la herramienta Cálculo de predicción también crea una hoja de cálculo que puntúa todos los cálculos subyacentes, para que pueda interactuar con el modelo y ver de qué manera diferente afectan los valores de entrada a la puntuación final.

Básicamente, la herramienta Cálculo de predicción predice un resultado basándose en los datos.

El asistente

  1. Para empezar, seleccione la ficha Ejemplo de Herramientas de análisis de tabla (Table Analysis Tools Sample) y haga clic dentro de la tabla para activar las Herramientas de análisis de tabla.
  2. En el menú Herramientas de tabla (Table Tools), seleccione la ficha Analizar (Analyze) para abrir la cinta de opciones Herramientas de análisis de tabla (Table Analysis Tools).
  3. Haga doble clic en Cálculo de predicción (Prediction Calculator) para iniciar el asistente.
  4. Identifique el Destino (Target) para predecir. En este caso, seleccionamos Purchased Bike.
    Eso creará una puntuación relativa a la probabilidad de que un determinado cliente vaya a comprar una bicicleta
  5. Como Purchased Bike es discreta, seleccione Exactamente (Exactly) y elija Yes.
    Si la columna que seleccionó como destino contiene valores discretos, esa es la única opción disponible.
    Si la columna que seleccionó como destino contiene valores numéricos continuos, debería seleccionar esta opción y escribir un número en el cuadro para especificar un solo número como el valor de destino.
    Tenga en cuenta que la opción Destino: En el intervalo (Target: In Range) solamente está disponible si la columna que seleccionó como destino contiene un valor numérico.
  6. Haga clic en Elija las columnas que desea usar en el análisis (Choose columns to be used for analysis).
  7. Seleccione las columnas que son más útiles para su análisis. Para no sesgar los resultados, debería quitar también las columnas que tengan información duplicada. Por ejemplo, si tiene una columna Income que contiene datos numéricos y una columna Income Group que contiene las etiquetas High, Medium y Low, no debería incluir las dos columnas en el mismo modelo. En cambio, podría crear un modelo diferente para cada columna. Para este tutorial, aceptaremos la selección predeterminada y haremos clic en Aceptar (OK).
  8. Seleccione las casillas Cálculos operativos (Operational Calculator) y Cálculos listos para impresión (Printer-ready Calculator).
    Cálculos operativos es interactivo. Contiene los resultados de los análisis, junto con las celdas en las que puede escribir valores y ver las puntuaciones predichas.
    Cálculos listos para impresión lleva un formato para imprimir en el estilo predeterminado de Excel. El informe contiene la misma información básica que Cálculos operativos, con casillas que puede rellenar y usar como una lista de comprobación para evaluar los casos individuales.
  9. Cuando haga clic en Ejecutar (Run), los informes se mostrarán en tres hojas de cálculo nuevas.

Los informes

Informe de predicción para Purchased Bike

Abra el informe llamado Informe de predicción para Purchased Bike (Prediction Report for Purchased Bike). Este informe contiene los resultados del análisis, completo con los gráficos y tablas interactivas que le ayudarán a experimentar con las interacciones y los beneficios. Las herramientas de este informe le ayudan a valorar el impacto financiero de un análisis particular.

Este informe contiene una tabla en la que puede especificar los costos y beneficios asociados con la predicción correcta o incorrecta de un valor. Estos costos y beneficios son necesarios para calcular el umbral óptimo de puntuación para el cálculo. Por ejemplo, este informe muestra que el coste de una predicción positiva incorrecta es de 10 $ y el beneficio de predecir correctamente una compra de bicicleta es de 10 $.

Al incluir valores en la tabla, los gráficos relacionados se actualizan automáticamente para mostrarle el mejor punto para maximizar el beneficio. Por ejemplo, nuestro Umbral sugerido para maximizar beneficios (Suggested Threshold to maximize profit) muestra 559. Por tanto, el gráfico de la derecha mostrará 559 como el punto más elevado del gráfico de línea. Para maximizar los beneficios, deberíamos usar las recomendaciones 559 superiores del modelo de minería de datos, ordenadas por probabilidades.

La herramienta es interactiva, por lo que vamos a hacer algunos ajustes en los costos. Voy a cambiar el costo de una predicción positiva falsa a 15 y el costo de una predicción positiva correcta a 25. Observe que el nuevo número de umbral es 499. Con estos nuevos datos, deberíamos usar las recomendaciones 499 superiores para maximizar el beneficio.

La tabla Desglose de puntuación (Score Breakdown) de la parte inferior izquierda del informe muestra un desglose detallado de los valores que fueron detectados, así como el modo en que cada valor afecta al resultado. No puede cambiar los valores de esta tabla; se muestran para ayudarle a entender la predicción. Podrá cambiar estos valores en la hoja de cálculo Cálculo de predicción (Prediction Calculator). Por ejemplo, esta tabla enumera cada columna de entrada que se usó en el modelo, con independencia de si afectó al modelo. Los valores de la columna Impacto relativo (Relative Impact) son probabilidades representadas como porcentajes. La celda está sombreada para representar visualmente el impacto de este valor en los resultados.

Puede ver que estar casado no afecta a la probabilidad de comprar una bicicleta. Sin embargo, ser soltero es un indicador importante de que es probable que un cliente compre una bicicleta.

Finalmente, el gráfico de abajo muestra el costo de una predicción errónea. Este gráfico es especialmente útil en escenarios en los que el costo de tomar la decisión errónea sobrepasa con mucho el costo de predecir correctamente.

Informe Cálculo de predicción para Purchased Bike

Abra el informe Cálculo de predicción para Purchased Bike (Prediction Calculator for Purchased Bike). Este informe es similar al anterior, salvo que también le permite asignar nuevos valores a los atributos para puntuar su impacto sobre la compra de bicicletas.

En este ejemplo, el umbral sugerido es 561 y la predicción para Bike Purchase es True. Veamos lo que sucede si cambiamos los valores correspondientes a Home Owner y Commute Distance. El cálculo asigna una puntuación a cada valor; en este ejemplo, cuando cambiamos Homeowner de No a Yes, la puntuación cambia de 5 a 0 y una Commute Distance de 5-10 miles cambia la puntuación de 105 a 25. Nuestra predicción de compra de bicicleta es ahora False.

Tenga en cuenta que las puntuaciones asignadas a cada valor variarán de acuerdo con los datos y el modelo específico.

Con estos dos informes, ya no tiene que mantener una conexión con SQL Server 2008 para realizar las predicciones. Un vendedor, por ejemplo, puede llevar este informe en su PC e incluir los datos del perfil de cliente para hacer las predicciones.

Informe Cálculo imprimible para Purchased Bike

Abra el informe Cálculo imprimible para Purchased Bike.

El asistente puede crear una versión impresa de la hoja de cálculo que puede usar para la puntuación sin conexión. No puede interactuar con el modelo del modo en que lo puede hacer con un libro de Excel en conexión, pero puede imprimir la hoja y escribir las puntuaciones a mano. La versión impresa proporciona todos los cálculos que necesita para incluir valores y calcular una puntuación final. Esto es útil cuando no tiene un equipo disponible.

Conclusión

Esto concluye el tutorial de vídeo Cálculo de predicción. Para obtener ayuda adicional con las Herramientas de análisis de tabla, recomiendo ver los demás tutoriales de vídeo de Herramientas de análisis de tabla y la documentación de Ayuda incluida con los Complementos de minería de datos. Gracias por su atención.