Création de prédictions sur un modèle Sequence Clustering (Didacticiel intermédiaire sur l'exploration de données)

Une fois que vous connaissez mieux le modèle Sequence Clustering après l'avoir parcouru dans la visionneuse, vous pouvez créer des requêtes de prédiction à l'aide du Générateur de requêtes de prédiction sous l'onglet Prévision de modèle d'exploration de données du Concepteur d'exploration de données. Pour créer une prédiction, commencez par sélectionner le modèle Sequence Clustering, puis sélectionnez les données d'entrée. Pour les entrées, vous pouvez utiliser une source de données externe, ou vous pouvez générer une requête singleton et fournir des valeurs dans une boîte de dialogue.

Cette leçon suppose que vous savez comment utiliser le générateur de requêtes de prédiction et souhaitez apprendre à générer des requêtes qui sont spécifiques à un modèle Sequence Clustering. Pour des informations générales sur l'utilisation du Générateur de requêtes de prédiction, consultez Création de requêtes de prédiction DMX ou la section du didacticiel sur l'exploration de données de base, Création de prédictions (Didacticiel sur l'exploration de données de base).

Création de prédictions sur le modèle régional

Pour ce scénario, vous commencerez par créer des requêtes de prédiction singleton pour avoir une idée des différences entre les prédictions selon la région.

Pour créer une requête singleton sur un modèle Sequence Clustering

  1. Cliquez sur l'onglet Prévision de modèle d'exploration de données du Concepteur d'exploration de données.

  2. Dans le menu de colonne Modèle d'exploration de données, sélectionnez Requête singleton.

    Le volet Modèle d'exploration de données et le volet Entrée de requête singleton s'affichent.

  3. Cliquez sur Sélectionner un modèle dans le volet Modèle d'exploration de données. (Vous pouvez ignorer cette étape si le mode Sequence Clustering est déjà sélectionné.)

    La boîte de dialogue Sélectionnez un modèle d'exploration de données s'affiche.

  4. Développez le nœud qui représente le structure d'exploration de données Sequence Clustering with Region et sélectionnez le modèle Sequence Clustering with Region. Cliquez sur OK. Pour le moment, ignorez le volet d'entrée ; vous spécifierez les entrées après avoir configuré les fonctions de prédiction.

  5. Dans la grille, cliquez sur la cellule vide sous Source et sélectionnez Fonction de prédiction. Dans la cellule sous Champ, sélectionnez PredictSequence.

    Notes

    Vous pouvez utiliser également la fonction Predict. Dans ce cas, veillez à choisir la version de la fonction Predict qui prend une colonne de table comme argument.

  6. Dans le volet Modèle d'exploration de données, sélectionnez la table imbriquée v Assoc Seq Line Items et faites-la glisser dans la grille vers la zone Critères/Argument de la fonction PredictSequence.

    Le glisser-déplacer des noms de table et de colonne vous permet de générer des instructions complexes sans erreurs de syntaxe. Toutefois, cette opération remplace le contenu actuel de la cellule qui inclut d'autres arguments facultatifs pour la fonction PredictSequence. Pour consulter les autres arguments, vous pouvez ajouter temporairement une deuxième instance de la fonction à la grille pour référence.

  7. Cliquez sur le bouton Résultat dans le coin supérieur du Générateur de requêtes de prédiction.

Les résultats attendus contiennent une colonne unique avec l'en-tête Expression. La colonne Expression contient une table imbriquée avec trois colonnes comme suit :

$SEQUENCE

Numéro de ligne

Modèle

1

  

Mountain-200

Que signifient ces résultats ? N'oubliez pas que vous n'avez pas spécifié d'entrées. Par conséquent, la prédiction est élaborée par rapport à la population globale de cas, et Analysis Services retourne la prédiction la plus probable en général.

Ajout d'entrées à une requête de prédiction singleton

Jusqu'à maintenant, vous n'avez pas spécifié d'entrées. Dans la tâche suivante, vous utiliserez le volet Entrée de requête singleton pour spécifier des entrées à la requête. Vous utiliserez tout d'abord [Region] en tant qu'entrée du modèle Sequence Clustering régional, pour déterminer si les prédictions sur les séquences sont identiques pour toutes les régions. Vous apprendrez ensuite comment modifier la requête pour ajouter la probabilité pour chaque prédiction et aplatir les résultats pour faciliter leur affichage.

Pour générer des prédictions pour un groupe de client spécifique

  1. Cliquez sur le bouton Conception dans l'angle supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de création de la requête.

  2. Dans la boîte de dialogue Entrée de requête singleton, cliquez sur la zone Valeur pour Région et sélectionnez Europe.

  3. Cliquez sur le bouton Résultat pour consulter des prédictions sur les clients en Europe.

  4. Cliquez sur le bouton Conception dans l'angle supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de création de la requête.

  5. Dans la boîte de dialogue Entrée de requête singleton, cliquez sur la zone Valeur pour Région et sélectionnez North America.

  6. Cliquez sur le bouton Résultat pour consulter des prédictions sur les clients en Amérique du Nord.

Ajout des probabilités à l'aide d'une expression personnalisée

Générer la probabilité pour chaque prédiction est légèrement plus compliqué, parce que la probabilité est un attribut de la prédiction et est générée comme une table imbriquée. Si vous connaissez les extensions DMX, vous pouvez modifier facilement la requête pour ajouter une instruction de sous-sélection sur la table imbriquée. Toutefois, vous pouvez créer également une instruction de sous-sélection dans le Générateur de requêtes de prédiction en ajoutant une expression personnalisée.

Pour générer des probabilités pour une séquence prédite à l'aide d'une expression personnalisée

  1. Cliquez sur le bouton Conception dans l'angle supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de création de la requête.

  2. Dans la grille, sous Source, cliquez sur une nouvelle ligne et sélectionnez Expression personnalisée.

  3. Laissez la zone Champ vide.

  4. Pour Alias, tapez t.

  5. Dans la zone Critères/Argument, tapez l'instruction de sous-sélection complète indiquée dans l'exemple de code suivant. Veillez à inclure les parenthèses de début et de fin.

    (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))
    
  6. Cliquez sur le bouton Résultat pour consulter des prédictions sur les clients en Europe.

Les résultats contiennent maintenant deux tables imbriquées, une avec la prédiction, et une avec la probabilité pour la prédiction. Si la requête ne fonctionne pas, vous pouvez basculer en mode affichage de conception de requête et examiner l'instruction de requête complète, qui doit être comme suit :

SELECT
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
FROM
  [Sequence Clustering with Region]
NATURAL PREDICTION JOIN
(SELECT 'Europe' AS [Region]) AS t

Utilisation des résultats

En présence d'un grand nombre de tables imbriquées dans les résultats, vous pouvez aplatir les résultats pour faciliter leur affichage. Pour cela, vous pouvez modifier la requête manuellement et ajouter le mot clé FLATTENED.

Pour aplatir des ensembles de lignes imbriqués dans une requête de prédiction

  1. Cliquez sur le bouton Requête dans le coin du Générateur de requêtes de prédiction.

    La grille se transforme en un volet ouvert où vous pouvez afficher et modifier l'instruction DMX créée par le Générateur de requêtes de prédiction.

  2. Après le mot clé SELECT, tapez FLATTENED.

    Le texte complet de la requête doit être semblable aux éléments suivants :

    SELECT FLATTENED
      PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
      ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
    FROM
      [Sequence Clustering with Region]
    NATURAL PREDICTION JOIN
    (SELECT 'Europe' AS [Region]) AS t
    
  3. Cliquez sur le bouton Résultats dans le coin supérieur du Générateur de requêtes de prédiction.

Après avoir modifié une requête manuellement, vous ne pourrez pas revenir en mode Conception sans perdre les modifications. Toutefois, vous pouvez enregistrer sous un fichier texte l'instruction DMX que vous avez créée manuellement, puis repasser en mode Conception. Dans ce cas, la requête est restaurée à la dernière version qui était valide en mode Conception.

Création de prédictions sur le modèle connexe

Les exemples précédents ont utilisé une colonne de table de cas, Region, comme entrée à la requête de prédiction singleton, parce que vous souhaitiez savoir si le modèle avait trouvé des différences entre des régions. Toutefois, après avoir exploré le modèle, vous avez décidé que les différences ne sont pas assez significatives pour justifier de personnaliser des recommandations de produits par région. Ce que vous cherchez vraiment à prédire sont les éléments que choisissent les clients. Par conséquent, dans les requêtes qui suivent, vous utiliserez le modèle Sequence Clustering qui n'inclut pas Region, pour générer des recommandations pour tous les clients.

Utilisation de colonnes de table imbriquée comme entrée

En premier lieu, vous allez créer une requête de prédiction singleton qui prend un élément unique comme entrée et retourne l'élément suivant le plus probable. Pour obtenir une prédiction de ce type, vous devez utiliser une colonne de table imbriquée comme valeur d'entrée. En effet, l'attribut que vous prédisez, Model, fait partie d'une table imbriquée. Analysis Services fournit la boîte de dialogue Entrée de la table imbriquée pour vous aider à créer facilement des requêtes de prédiction sur les attributs de table imbriquée en utilisant le Générateur de requêtes de prédiction.

Pour utiliser une table imbriquée comme entrée à une prédiction

  1. Cliquez sur le bouton Conception dans l'angle supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de création de la requête.

  2. Dans la boîte de dialogue Entrée de requête singleton, cliquez sur la zone Valeur pour Région et sélectionnez la ligne vide pour effacer l'entrée pour ce champ.

  3. Dans la boîte de dialogue Entrée de requête singleton, cliquez sur la zone Valeur pour vAssocSeqLineItems, puis cliquez sur le bouton (…).

  4. Dans la boîte de dialogue Entrée de la table imbriquée, cliquez sur Ajouter.

  5. Dans la nouvelle ligne, cliquez sur la zone sous Modèle et sélectionnez Touring Tire dans la liste. Cliquez sur OK.

  6. Cliquez sur le bouton Résultat pour consulter les prédictions.

Le modèle recommande les éléments suivants pour tous les clients qui choisissent Touring Tire comme premier élément. L'exploration du modèle vous a déjà indiqué que les clients achètent fréquemment les produits Touring Tire et Touring Tire Tube en même temps, donc ces recommandations semblent correctes.

$SEQUENCE

Numéro de ligne

Modèle

1

  

Touring Tire Tube (Pneu pour vélo de tourisme)

2

  

Sport-100

3

  

Long-Sleeve Logo Jersey

Création d'une requête de prédiction de masse à l'aide des entrées de table imbriquée

Maintenant que vous avez établi que le modèle crée le type des prédictions que vous pouvez utiliser pour faire des recommandations, vous allez créer une requête de prédiction mappée à une source de données externe. Cette source de données fournit des valeurs qui représentent des produits actuels. Comme vous souhaitez créer une requête de prédiction qui fournit l'ID du client et une liste des produits comme entrée, vous ajouterez la table des clients comme table de cas, et la table des achats comme table imbriquée. Puis, vous ajouterez des fonctions de prédiction comme vous l'avez fait précédemment pour créer des recommandations.

Il s'agit de la même procédure que vous utilisez pour créer des prédictions pour le scénario d'analyse du panier d'achat de la Leçon 3 ; toutefois, dans un modèle Sequence Clustering, les prédictions font aussi appel à cet ordre comme entrée.

Pour créer une requête de prédiction à l'aide d'entrées de table imbriquée

  1. Dans le volet Modèle d'exploration de données, sélectionnez le modèle Sequence Clustering, s'il n'est pas déjà sélectionné.

  2. Dans la boîte de dialogue Sélectionner une ou plusieurs tables d'entrée, cliquez sur Sélectionner la table de cas.

  3. Dans la boîte de dialogue Sélectionner une table, pour Source de données, sélectionnez Orders. Dans la liste Nom de la table/vue, sélectionnez vAssocSeqOrders, puis cliquez sur OK.

  4. Dans la boîte de dialogue Sélectionner une ou plusieurs tables d'entrée, cliquez sur Sélectionner la table imbriquée.

  5. Dans la boîte de dialogue Sélectionner une table, pour Source de données, sélectionnez Orders. Dans la liste Nom de la table/vue, sélectionnez vAssocSeqLineItems, puis cliquez sur OK.

    Analysis Services va tenter de détecter des relations et de les créer automatiquement si les types de données correspondent et les noms de colonne sont similaires. Si les relations qu'ils créent sont incorrectes, vous pouvez cliquer avec le bouton droit sur la ligne de jointure et sélectionner Modifier les connexions pour modifier la colonne de mappage, ou vous pouvez cliquer avec le bouton droit sur la ligne de jointure et sélectionner Suppression pour supprimer complètement la relation. Dans ce cas, comme les tables ont déjà été jointes dans la vue de source de données, ces relations sont ajoutées automatiquement au volet de conception.

  6. Ajoutez une nouvelle ligne à la grille. Pour Source, vAssocSeqOrders, et pour Champ, sélectionnez CustomerKey.

  7. Ajoutez une nouvelle ligne à la grille. Pour Source, sélectionnez Fonction de prévision, et pour Champ, sélectionnez PredictSequence.

  8. Faites glisser vAssocSeqLineItems dans la zone Critères/Argument. Cliquez à la fin de la zone Critères/Argument puis tapez les arguments suivants : 2.

    Le texte complet dans la zone Critères/Argument doit être : [Sequence Clustering].[v Assoc Seq Line Items],2

  9. Cliquez sur le bouton Résultat pour consulter les prédictions pour chaque client.

Vous avez terminé le didacticiel sur les modèles Sequence Clustering.

Étapes suivantes

Si vous avez fini toutes les sections dans Didacticiel sur l'exploration de données intermédiaire (Analysis Services - Exploration de données), vous pouvez passer à l'étape suivante pour apprendre à utiliser des instructions DMX (Data Mining Extensions) pour générer des modèles et des prédictions. Pour plus d'informations, consultez Didacticiels : utilisation des extensions DMX.

Si vous maîtrisez les concepts de la programmation, vous pouvez utiliser également des objets AMO (Analysis Management Objects) pour utiliser par programme des objets d'exploration de données. Pour plus d'informations, consultez Classes d'exploration de données AMO.