Comparar las predicciones de los modelos de predicción (Tutorial intermedio de minería de datos)

En los pasos anteriores de esta lección, creó los tres modelos siguientes:

  • Predicciones para cada combinación de región y modelo, basadas únicamente en los datos del modelo individual y región.

  • Predicciones para todos los modelos en un ámbito mundial, basadas en datos agregados.

  • Predicciones para el modelo M200 de la región de Norteamérica, basado en el modelo agregado.

En esta tarea final, contrastará las predicciones de cada modelo con el fin de saber cómo afecta el uso del modelo generalizado a los resultados.

Comparar los resultados de la predicción

El análisis de los resultados del modelo de minería de datos original reveló un gran intervalo entre ciertas regiones y líneas de modelo. La línea de tendencia para el modelo M200 era particularmente alta, mientras que las líneas de tendencia para el modelo T1000 eran bajas y relativamente planas.

Serie que predice la cantidad de M200 y T1000Serie que predice la cantidad de M200 y T1000

Puede crear un gráfico que incluya todas las predicciones exportando los resultados y los datos originales a Microsoft Excel, que proporciona herramientas más sofisticadas para representar y administrar varias series de datos. El diagrama siguiente muestra las líneas de tendencia solo para los modelos del producto M200 y compara las predicciones del primer modelo de minería de datos con las predicciones que usan el modelo de minería de datos agregado.

Gráfico de Excel que compara las prediccionesGráfico de Excel que compara las predicciones

En el gráfico anterior, se puede ver que el modelo de minería agregado conserva las tendencias generales mientas reduce las fluctuaciones de la serie de datos individual. La tabla siguiente proporciona una parte de la serie de datos que se usa para crear el gráfico como ayuda comparativa.

Serie y modelo de minería de datos

7/25/2008

8/25/2008

9/25/2008

10/25/2008

11/25/2008

M200 Europa — agregado

143

126

115

119

94

M200 Europa — específico

121

142

152

149

154

M200 Norteamérica — agregado

208

150

149

151

172

M200 Norteamérica — específico

163

178

156

173

203

M200 Pacífico — agregado

89

80

71

77

57

M200 Pacífico — específico

46

44

42

42

38

T1000 Europa — agregado

65

51

54

53

48

T1000 Europa — específico

42

41

43

42

43

T1000 Norteamérica — agregado

103

84

79

85

68

T1000 Norteamérica — específico

82

78

78

83

83

T1000 Pacífico — agregado

68

52

48

56

44

T1000 Pacífico — específico

38

39

37

38

36

Conclusión

Ha aprendido cómo crear un modelo de serie temporal que se puede usar para la predicción y un modelo generalizado que se puede aplicar a una serie de datos diferente.