Personnalisation et traitement du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

 

S’applique à : SQL Server 2016 Preview

L'algorithme MTS (Microsoft) fournit des paramètres qui affectent la façon dont un modèle est créé et la façon dont les données chronologiques sont analysées. La modification de ces propriétés peuvent affecter de manière importante la manière dont le modèle d'exploration de données élabore des prédictions.

Pour cette tâche du didacticiel, vous effectuerez les tâches suivantes pour modifier le modèle :

  1. Vous allez personnaliser la manière dont votre modèle gère les périodes de temps en ajoutant une nouvelle valeur pour le PERIODICITY_HINT paramètre.

  2. Vous découvrirez deux autres paramètres importants pour l'algorithme MTS : FORECAST_METHOD qui vous permet de contrôler la méthode utilisée pour les prédictions, et PREDICTION_SMOOTHING, qui vous permet de personnaliser le mélange des prédictions à long terme et à court terme.

  3. Vous pouvez également dire à l'algorithme la manière dont vous souhaitez imputer les valeurs manquantes.

  4. Après avoir apporté toutes les modifications, vous allez déployer et traiter le modèle.

Définition des paramètres de série chronologique

Indications de périodicité

Le PERIODICITY_HINT paramètre fournit l’algorithme des informations sur les périodes supplémentaires que vous attendez à voir dans les données. Par défaut, les modèles de série chronologique essayeront de détecter automatiquement un modèle dans les données. Toutefois, si vous connaissez déjà le cycle de temps estimé, fournir un indicateur de périodicité peut potentiellement améliorer la précision du modèle. Toutefois, si vous fournissez le mauvais indicateur de périodicité, celui-ci peut diminuer la précision ; par conséquent, si vous ne savez pas précisément quelle valeur doit être utilisée, il est préférable d'utiliser la valeur par défaut.

Par exemple, la vue utilisée pour ce modèle regroupe les données de ventes Adventure Works DW Multidimensional 2012 mensuellement. Par conséquent, chaque tranche de temps utilisée par le modèle représente un mois et toutes les prédictions se feront également en termes de mois. Dans la mesure où il existe des 12 mois par an, et que vous prévoyez que modèles de ventes plus ou moins répéter sur une base annuelle, vous allez définir la PERIODICITY_HINT paramètre 12, pour indiquer que 12 tranches de temps (mois) constituent un cycle de ventes complet.

Méthode de prévisions

Le FORECAST_METHOD paramètre contrôle si l’algorithme de série chronologique est optimisé pour les prédictions à court terme ou à long terme. Par défaut, le FORECAST_METHOD paramètre a la valeur MIXED, ce qui signifie que les deux algorithmes différents sont fusionnés et équilibrés pour fournir de bons résultats pour la prédiction à court terme et à long terme.

Toutefois, si vous savez que vous souhaitez utiliser un algorithme particulier, vous pouvez modifier la valeur sur ARIMA ou ARTXP.

Pondération à long terme contre prédictions à court terme

Vous pouvez également personnaliser la manière dont les prédictions à long terme et à court terme sont combinées à l'aide du paramètre PREDICTION_SMOOTHING. Par défaut, ce paramètre est défini sur 0,5, ce qui fournit généralement le meilleur équilibre pour une précision globale.

Pour changer les paramètres d'algorithme

  1. Sur le des modèles d’exploration de données droit prévision, puis sélectionnez définir les paramètres d’algorithme.

  2. Dans la PERIODICITY_HINT ligne de la paramètres d’algorithme boîte de dialogue, cliquez sur le valeur colonne, puis tapez {12}, y compris les accolades.

    Par défaut, l’algorithme ajoute également la valeur {1}.

  3. Dans le FORECAST_METHOD ligne, vérifiez que le valeur zone de texte est vide ou définie à mixte. Si une valeur différente a été entrée, tapez mixte pour modifier le paramètre à la valeur par défaut.

  4. Dans le PREDICTION_SMOOTHING ligne, vérifiez que le valeur zone de texte est vide ou définie sur 0,5. Si une valeur différente a été entrée, cliquez sur valeur et le type 0,5 pour modifier le paramètre à la valeur par défaut.

    Notes


    Le paramètre PREDICTION_SMOOTHING est uniquement disponible dans SQL Server Enterprise. Par conséquent, vous ne pouvez ni afficher ni modifier la valeur du paramètre PREDICTION_SMOOTHING dans SQL Server Standard. Toutefois, le comportement par défaut consiste à utiliser les deux algorithmes et à les pondérer de manière égale.

  5. Cliquez sur OK.

Gestion des données manquantes (facultatif)

Dans de nombreux cas, vos données de ventes peuvent comporter des vides comblés par des valeurs NULL, ou un magasin peut ne pas avoir respecté la date limite du signalement des données, ce qui laisse une cellule vide à la fin d'une série. Dans de tels scénarios, Analysis Services déclenche l'erreur suivante et ne traite pas le modèle.

« Erreur (exploration de données) : horodatages non synchronisés commençant par série , du modèle d’exploration de données, . Toutes les séries chronologiques doivent se terminer à la même marque de temps et ne peuvent pas comporter des points de données arbitrairement absents. L'attribution de la valeur Previous ou de la valeur d'une constante numérique au paramètre MISSING_VALUE_SUBSTITUTION fournit automatiquement les points de données absents lorsque cela est possible. »

Pour éviter cette erreur, vous pouvez spécifier Analysis Services doit automatiquement fournir de nouvelles valeurs pour remplir les écarts à l'aide d'une des méthodes suivantes :

  • Utilisation d'une valeur moyenne. La moyenne est calculée à l'aide de toutes les valeurs valides comprises dans la même série de données.

  • Utilisation de la valeur précédente. Vous pouvez substituer des valeurs précédentes à plusieurs cellules manquantes, mais vous ne pouvez pas remplir les valeurs de début.

  • Utilisation d'une valeur constante que vous fournissez.

Pour spécifier le remplissage des vides par des valeurs moyennes

  1. Sur le des modèles d’exploration de données droit le prévision colonne, puis sélectionnez définir les paramètres d’algorithme.

  2. Dans le paramètres d’algorithme boîte de dialogue du MISSING_VALUE_SUBSTITUTION cliquez sur le valeur colonne et tapez signifie.

Générer le modèle

Pour utiliser le modèle, vous devez le déployer sur un serveur et traiter le modèle en exécutant les données d'apprentissage par l'algorithme.

Pour traiter le modèle de prévision

  1. Sur le le modèle de Mining menu de Outils de données SQL Server, sélectionnez traiter la Structure d’exploration de données et tous les modèles.

  2. Cliquez sur Ouipour répondre à l'avertissement qui vous invite à indiquer si vous souhaitez générer et déployer le projet.

  3. Dans la traiter la Structure d’exploration de données - prévision boîte de dialogue, cliquez sur exécuter.

    La boîte de dialogue État d'avancement du traitement s'affiche et présente les informations relatives au traitement du modèle. Le traitement du modèle peut nécessiter quelques minutes.

  4. Une fois le traitement terminé, cliquez sur Fermer pour quitter la boîte de dialogue État d'avancement du traitement .

  5. Cliquez sur Fermer pour quitter le traiter la Structure d’exploration de données - prévision boîte de dialogue.

Tâche suivante de la leçon

Exploration du modèle de prévision &#40 ; didacticiel d’exploration de données intermédiaires &#41 ;

Voir aussi

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
Algorithme MTS (Microsoft Time Series)
Exigences et considérations concernant le traitement (exploration de données)