Leçon 4 : Exécution de prédictions Market Basket

Nouveau : 5 décembre 2005

Dans cette leçon, vous allez utiliser le formulaire SELECT FROM <modèle> PREDICTION JOIN (DMX) de l'instruction SELECT pour créer des prédictions fondées sur les modèles Association que vous avez créés au cours de la Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Market Basket. Ces types de prédiction sont définis ci-dessous.

Le formulaire SELECT FROM <modèle> PREDICTION JOIN (DMX) de l'instruction SELECT est composé de trois parties :

  • Liste des colonnes du modèle d'exploration de données et des fonctions de prédiction renvoyées dans l'ensemble de résultats. Cette liste peut également contenir les colonnes d'entrée issues des données source.
  • Requête source définissant les données utilisées pour créer une prédiction. Par exemple, dans le cadre d'une requête par lots, il peut s'agir d'une liste de clients.
  • Mappage entre les colonnes du modèle d'exploration de données et les données source. Si les noms correspondent, vous pouvez alors adopter la syntaxe NATURAL et ignorer les mappages de colonnes.

Vous pouvez davantage affiner la requête à l'aide de fonctions de prédiction. Les fonctions de prédiction fournissent des informations supplémentaires, notamment la probabilité d'une prédiction, et offrent une prise en charge de la prédiction dans le dataset d'apprentissage. Pour plus d'informations sur les fonctions de prédiction, consultez Fonctions (DMX).

Vous pouvez également faire appel au générateur de requêtes de prédiction disponible dans Business Intelligence Development Studio pour créer des requêtes de prédiction. Pour plus d'informations, consultez Utilisation du Générateur de requêtes de prédictions pour créer des requêtes de prédictions DMX.

Tâches de la leçon

Au cours de cette leçon, vous allez effectuer les tâches suivantes :

  • créer une requête pour déterminer quels autres articles un client est susceptible d'acheter en vous basant sur des articles déjà présents dans son panier d'achat. Vous utiliserez le modèle d'exploration de données avec le paramètre MINIMUM_PROBABILITY par défaut pour créer cette requête.
  • créer une requête pour déterminer quels autres articles un client est susceptible d'acheter en vous basant sur des articles déjà présents dans son panier d'achat. Vous utiliserez le modèle d'exploration de données avec un paramètre MINIMUM_PROBABILITY de 0.01 pour créer cette requête.

Instruction singleton PREDICTION JOIN

La première étape consiste à utiliser le formulaire SELECT FROM <modèle> PREDICTION JOIN (DMX) dans une requête de prédiction singleton. L'exemple générique suivant utilise l'instruction singleton :

SELECT <select list>
    FROM [<mining model>] NATURAL PREDICTION JOIN
(SELECT '<value>' AS [<column>], 
    (SELECT 'value' AS [<nested column>] UNION
        SELECT 'value' AS [<nested column>] ...) 
    AS [<nested table>])
AS [<input alias>]

La première ligne du code définit les colonnes du modèle d'exploration de données que retourne la requête, ainsi que le modèle d'exploration utilisé pour générer la prédiction :

SELECT <select list> FROM [<mining model>] 

Les lignes suivantes du code définissent les produits du panier d'achat à utiliser pour prédire d'autres produits ajoutés par un client :

(SELECT '<value>' AS [<column>], 
    (SELECT 'value' AS [<nested column>] UNION
        SELECT 'value' AS [<nested column>] ...) 
    AS [<nested table>])

Création d'une prédiction à l'aide d'un modèle avec le paramètre MINIMUM_PROBABILITY par défaut

Pour créer une requête Association

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction PREDICTION JOIN dans la requête vide.

  3. Remplacez le code suivant :

    <select list> 
    

    par :

    PREDICT([Association].[Products],INCLUDE_STATISTICS,3)
    

    Vous pourriez choisir d'inclure simplement le nom de colonne [Products] mais la fonction Predict vous donne la possibilité de limiter à trois le nombre de produits retournés par l'algorithme. Vous pouvez également utiliser l'instruction INCLUDE_STATISTICS pour vous procurer des informations supplémentaires sur chaque produit, notamment sur la prise en charge, la probabilité et la probabilité ajustée. Ces statistiques vous aident à évaluer la précision de la prédiction.

  4. Remplacez le code suivant :

    [<mining model>] 
    

    par :

    [Association]
    
  5. Remplacez le code suivant :

    (SELECT '<value>' AS [<column>], 
        (SELECT 'value' AS [<nested column>] UNION
            SELECT 'value' AS [<nested column>] ...) 
        AS [<nested table>])
    

    par :

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    

    Cette instruction utilise l'instruction UNION pour spécifier trois produits à inclure dans le panier d'achat avec les produits prédits. La colonne Model dans l'instruction SELECT correspond à la colonne de modèle figurant dans la table imbriquée des produits.

    L'instruction tout entière doit se présenter comme suit :

    SELECT
      PREDICT([Association].[Products],INCLUDE_STATISTICS,3)
    From
      [Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    
  6. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  7. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Association Prediction.dmx.

  8. Dans la barre d'outils, cliquez sur le bouton Exécuter.

    La requête retourne une table contenant trois produits (HL Mountain Tire, Fender Set - Mountain et ML Mountain Tire) affichés par ordre de probabilité d'apparition dans le même panier d'achat que les trois produits spécifiés dans la requête. La table renferme également des statistiques indiquant la précision de la prédiction.

Création d'une prédiction à l'aide d'un modèle avec un paramètre MINIMUM_PROBABILITY de 0.01

Pour créer une requête Association

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction PREDICTION JOIN dans la requête vide.

  3. Remplacez le code suivant :

    <select list> 
    

    par :

    PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)
    
  4. Remplacez le code suivant :

    [<mining model>] 
    

    par :

    [Modified Association]
    
  5. Remplacez le code suivant :

    (SELECT '<value>' AS [<column>], 
        (SELECT 'value' AS [<nested column>] UNION
            SELECT 'value' AS [<nested column>] ...) 
        AS [<nested table>])
    

    par :

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    

    Cette instruction utilise l'instruction UNION pour spécifier trois produits à inclure dans le panier d'achat avec les produits prédits. La colonne Model dans l'instruction SELECT correspond à la colonne de modèle figurant dans la table imbriquée des produits.

    L'instruction tout entière doit se présenter comme suit :

    SELECT
      PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)
    From
      [Modified Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]
      UNION SELECT 'Mountain Tire Tube' AS [Model]
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t
    
  6. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  7. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Modified Association Prediction.dmx.

  8. Dans la barre d'outils, cliquez sur le bouton Exécuter.

    La requête retourne une table contenant trois produits (HL Mountain Tire, Water Bottle et Fender Set - Mountain) affichés par ordre de probabilité d'apparition dans le même panier d'achat que les trois produits spécifiés dans la requête. La table renferme également des statistiques indiquant la précision de la prédiction.

    Vous pouvez constater dans les résultats de cette requête que la valeur du paramètre MINIMUM_PROBABILITY affecte les résultats retournés par la requête.

C'est la dernière étape du didacticiel Market Basket. Vous disposez à présent d'un ensemble de modèles à l'aide desquels il vous est possible de prévoir les types de produits que les clients sont susceptibles d'acheter en même temps.

Pour savoir comment utiliser DMX dans un autre scénario prédictif, consultez Didacticiel DMX Bike Buyer.