Personnalisation et traitement du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

L'algorithme MTS (Microsoft Time Series) fournit des paramètres qui affectent la façon dont un modèle est créé et la façon dont les données chronologiques sont analysées. Vous pouvez modifier ces propriétés pour contrôler la façon dont le modèle d'exploration de données élabore des prédictions.

Au cours de cette tâche du didacticiel, vous allez apporter la modification suivante aux paramètres :

  • Vous allez modifier la valeur du paramètre PERIODICITY_HINT pour le modèle Prévision. Ce paramètre transmet à l'algorithme des informations déterminant la fréquence à laquelle le modèle défini dans les données se répète. Les données incluses dans Adventure Works DW2008R2 sont modélisées chaque mois et la périodicité est annuelle. Par conséquent, vous devez affecter la valeur 12 au paramètre PERIODICITY_HINT pour indiquer qu'un modèle se répète toutes les 12 valeurs.

Vous allez également examiner les valeurs de deux paramètres importants présentés dans SQL Server 2008 dans le cadre des améliorations apportées à l'algorithme MTS (Microsoft Time Series).

  • Le paramètre FORECAST_METHOD détermine si l'algorithme de série chronologique est optimisé pour les prédictions à court terme ou à long terme. Par défaut, le paramètre FORECAST_METHOD est défini sur MIXED, ce qui signifie que deux algorithmes de prédiction différents sont fusionnés et équilibrés pour élaborer une prédiction à la fois à court terme et à long terme.

  • Le paramètre PREDICTION_SMOOTHING contrôle le mélange des prédictions à long terme et à court terme. Par défaut, ce paramètre est défini sur 0,5, ce qui fournit généralement le meilleur équilibre pour une précision globale.

Après avoir apporté les modifications, vous allez traiter le modèle.

Pour changer les paramètres d'algorithme

  1. Sous l'onglet Modèles d'exploration de données, cliquez avec le bouton droit sur Prévision et sélectionnez Définir les paramètres d'algorithme.

  2. Dans la ligne PERIODICITY_HINT de la boîte de dialogue Paramètres d'algorithme, cliquez sur la colonne Valeur, puis tapez {12}, en incluant les accolades.

  3. Dans la ligne FORECAST_METHOD, vérifiez que la zone de texte Valeur est vide ou définie sur MIXED. Si une valeur différente a été entrée, remplacez-la par MIXED pour rétablir la valeur par défaut du paramètre.

  4. Dans la ligne PREDICTION_SMOOTHING, vérifiez que la zone de texte Valeur est vide ou définie sur 0,5. Si une valeur différente a été entrée, cliquez sur Valeur et tapez 0,5 pour rétablir la valeur par défaut du paramètre.

    Notes

    Le paramètre PREDICTION_SMOOTHING est uniquement disponible dans SQL Server Enterprise. Par conséquent, vous ne pouvez pas afficher ni modifier la valeur du paramètre PREDICTION_SMOOTHING dans SQL Server Standard. Toutefois, le comportement par défaut est le même.

  5. Cliquez sur OK.

Pour traiter le modèle de prévision

  1. Dans le menu Modèle d'exploration de données de BI Development Studio, sélectionnez Traiter l'exploration de données et tous les modèles.

  2. Cliquez sur Oui pour répondre à l'avertissement qui vous invite à indiquer si vous souhaitez générer et déployer le projet.

  3. Dans la boîte de dialogue Traiter la structure d'exploration de données - Prévision, cliquez sur Exécuter.

    La boîte de dialogue État d'avancement du traitement s'affiche et présente les informations relatives au traitement du modèle. Le traitement du modèle peut nécessiter quelques minutes.

  4. Une fois le traitement terminé, cliquez sur Fermer pour quitter la boîte de dialogue État d'avancement du traitement.

  5. Cliquez de nouveau sur Fermer pour quitter la boîte de dialogue Traiter la structure d'exploration de données - Prévision.

Gestion des données manquantes (facultatif)

Dans de nombreux cas, vos données de ventes peuvent comporter des vides comblés par des valeurs NULL, ou un magasin peut ne pas avoir respecté la date limite du signalement des données, ce qui laisse une cellule vide à la fin d'une série. Dans de tels scénarios, Analysis Services déclenche l'erreur suivante et ne traite pas le modèle.

« Erreur (Exploration de données) : Horodatages non synchronisés à partir de la série <nom de la série> du modèle d'exploration de données <nom du modèle>. Toutes les séries chronologiques doivent se terminer à la même marque de temps et ne peuvent pas comporter des points de données arbitrairement absents. L'attribution de la valeur Previous ou de la valeur d'une constante numérique au paramètre MISSING_VALUE_SUBSTITUTION fournit automatiquement les points de données absents lorsque cela est possible. »

Pour éviter cette erreur, vous pouvez spécifier qu'Analysis Services doit automatiquement fournir de nouvelles valeurs pour remplir les vides à l'aide des méthodes suivantes :

  • Utilisation d'une valeur moyenne. La moyenne est calculée à l'aide de toutes les valeurs valides comprises dans la même série de données.

  • Utilisation de la valeur précédente. Vous pouvez substituer des valeurs précédentes à plusieurs cellules manquantes, mais vous ne pouvez pas remplir les valeurs de début.

  • Utilisation d'une valeur constante que vous fournissez.

Pour spécifier le remplissage des vides par des valeurs moyennes

  1. Sous l'onglet Modèles d'exploration de données, cliquez avec le bouton droit sur la colonne Prévision et sélectionnez Définir les paramètres d'algorithme.

  2. Dans la boîte de dialogue Paramètres d'algorithme, dans la ligne MISSING_VALUE_SUBSTITUTION, cliquez sur la colonne Valeur et tapez Moyenne.