Partager via


Personnalisation et traitement du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

L'algorithme MTS (Microsoft) fournit des paramètres qui affectent la façon dont un modèle est créé et la façon dont les données chronologiques sont analysées. La modification de ces propriétés peuvent affecter de manière importante la manière dont le modèle d'exploration de données élabore des prédictions.

Pour cette tâche du didacticiel, vous effectuerez les tâches suivantes pour modifier le modèle :

  1. Vous personnaliserez la manière dont votre modèle gère les périodes en ajoutant une nouvelle valeur pour le paramètre PERIODICITY_HINT.

  2. Vous découvrirez deux autres paramètres importants pour l'algorithme MTS : FORECAST_METHOD qui vous permet de contrôler la méthode utilisée pour les prédictions, et PREDICTION_SMOOTHING, qui vous permet de personnaliser le mélange des prédictions à long terme et à court terme.

  3. Vous pouvez également dire à l'algorithme la manière dont vous souhaitez imputer les valeurs manquantes.

  4. Après avoir apporté toutes les modifications, vous allez déployer et traiter le modèle.

Définition des paramètres de série chronologique

Indications de périodicité

Le paramètre PERIODICITY_HINT fournit à l'algorithme des informations sur les périodes supplémentaires que vous pensez voir dans les données. Par défaut, les modèles de série chronologique essayeront de détecter automatiquement un modèle dans les données. Toutefois, si vous connaissez déjà le cycle de temps estimé, fournir un indicateur de périodicité peut potentiellement améliorer la précision du modèle. Toutefois, si vous fournissez le mauvais indicateur de périodicité, celui-ci peut diminuer la précision ; par conséquent, si vous ne savez pas précisément quelle valeur doit être utilisée, il est préférable d'utiliser la valeur par défaut.

Par exemple, la vue utilisée pour ce modèle regroupe les données de ventes Adventure Works DW Multidimensional 2012 mensuellement. Par conséquent, chaque tranche de temps utilisée par le modèle représente un mois et toutes les prédictions se feront également en termes de mois. Puisqu'une année est composée de 12 mois et que vous vous attendez à ce que les modèles de ventes se répètent plus ou moins annuellement, vous définirez le paramètre PERIODICITY_HINT sur 12 pour indiquer que 12 tranches de temps (mois) constituent un cycle de ventes complet.

Méthode de prévisions

Le paramètre FORECAST_METHOD détermine si l'algorithme de série chronologique est optimisé pour les prédictions à court terme ou à long terme. Par défaut, le paramètre FORECAST_METHOD est défini sur MIXED, ce qui signifie que deux algorithmes de prédiction différents sont fusionnés et équilibrés pour fournir de bon résultats à la fois à court terme et à long terme.

Toutefois, si vous savez que vous souhaitez utiliser un algorithme particulier, vous pouvez modifier la valeur sur ARIMA ou ARTXP.

Pondération à long terme contre prédictions à court terme

Vous pouvez également personnaliser la manière dont les prédictions à long terme et à court terme sont combinées à l'aide du paramètre PREDICTION_SMOOTHING. Par défaut, ce paramètre est défini sur 0,5, ce qui fournit généralement le meilleur équilibre pour une précision globale.

Pour changer les paramètres d'algorithme

  1. Sous l'onglet Modèles d'exploration de données, cliquez avec le bouton droit sur Prévision et sélectionnez Définir les paramètres d'algorithme.

  2. Dans la ligne PERIODICITY_HINT de la boîte de dialogue Paramètres d'algorithme, cliquez sur la colonne Valeur, puis tapez {12}, en incluant les accolades.

    Par défaut, l'algorithme ajoute également la valeur {1}.

  3. Dans la ligne FORECAST_METHOD, vérifiez que la zone de texte Valeur est vide ou définie sur MIXED. Si une valeur différente a été entrée, remplacez-la par MIXED pour rétablir la valeur par défaut du paramètre.

  4. Dans la ligne PREDICTION_SMOOTHING, vérifiez que la zone de texte Valeur est vide ou définie sur 0,5. Si une valeur différente a été entrée, cliquez sur Valeur et tapez 0,5 pour rétablir la valeur par défaut du paramètre.

    [!REMARQUE]

    Le paramètre PREDICTION_SMOOTHING est uniquement disponible dans SQL Server Enterprise. Par conséquent, vous ne pouvez ni afficher ni modifier la valeur du paramètre PREDICTION_SMOOTHING dans SQL Server Standard. Toutefois, le comportement par défaut consiste à utiliser les deux algorithmes et à les pondérer de manière égale.

  5. Cliquez sur OK.

Gestion des données manquantes (facultatif)

Dans de nombreux cas, vos données de ventes peuvent comporter des vides comblés par des valeurs NULL, ou un magasin peut ne pas avoir respecté la date limite du signalement des données, ce qui laisse une cellule vide à la fin d'une série. Dans de tels scénarios, Analysis Services déclenche l'erreur suivante et ne traite pas le modèle.

« Erreur (Exploration de données) : Horodatages non synchronisés à partir de la série <nom de la série> du modèle d'exploration de données <nom du modèle>. Toutes les séries chronologiques doivent se terminer à la même marque de temps et ne peuvent pas comporter des points de données arbitrairement absents. L'attribution de la valeur Previous ou de la valeur d'une constante numérique au paramètre MISSING_VALUE_SUBSTITUTION fournit automatiquement les points de données absents lorsque cela est possible. »

Pour éviter cette erreur, vous pouvez spécifier Analysis Services doit automatiquement fournir de nouvelles valeurs pour remplir les écarts à l'aide d'une des méthodes suivantes :

  • Utilisation d'une valeur moyenne. La moyenne est calculée à l'aide de toutes les valeurs valides comprises dans la même série de données.

  • Utilisation de la valeur précédente. Vous pouvez substituer des valeurs précédentes à plusieurs cellules manquantes, mais vous ne pouvez pas remplir les valeurs de début.

  • Utilisation d'une valeur constante que vous fournissez.

Pour spécifier le remplissage des vides par des valeurs moyennes

  1. Sous l'onglet Modèles d'exploration de données, cliquez avec le bouton droit sur la colonne Prévision et sélectionnez Définir les paramètres d'algorithme.

  2. Dans la boîte de dialogue Paramètres d'algorithme, dans la ligne MISSING_VALUE_SUBSTITUTION, cliquez sur la colonne Valeur et tapez Moyenne.

Générer le modèle

Pour utiliser le modèle, vous devez le déployer sur un serveur et traiter le modèle en exécutant les données d'apprentissage par l'algorithme.

Pour traiter le modèle de prévision

  1. Dans le menu Modèle d'exploration de données de Outils de données SQL Server, sélectionnez Traiter l'exploration de données et tous les modèles.

  2. Cliquez sur Oui pour répondre à l'avertissement qui vous invite à indiquer si vous souhaitez générer et déployer le projet.

  3. Dans la boîte de dialogue Traiter la structure d'exploration de données - Prévision, cliquez sur Exécuter.

    La boîte de dialogue État d'avancement du traitement s'affiche et présente les informations relatives au traitement du modèle. Le traitement du modèle peut nécessiter quelques minutes.

  4. Une fois le traitement terminé, cliquez sur Fermer pour quitter la boîte de dialogue État d'avancement du traitement.

  5. Cliquez de nouveau sur Fermer pour quitter la boîte de dialogue Traiter la structure d'exploration de données - Prévision.

Tâche suivante de la leçon

Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

Voir aussi

Référence

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

Concepts

Algorithme MTS (Microsoft Time Series)

Exigences et considérations concernant le traitement (exploration de données)