Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Bike Buyer

Dans cette leçon, vous allez ajouter deux modèles d'exploration de données à la structure d'exploration de données Bike Buyer que vous avez créée Leçon 1 : Création de la structure d'exploration de données Bike Buyer. Vous pourrez utiliser ces modèles pour explorer des données avec l'un et créer des tâches de prédiction avec l'autre.

Pour découvrir comment classer des clients potentiels par catégories selon leurs caractéristiques, vous allez créer un modèle d'exploration de données fondé sur l'Algorithme Clusters Microsoft. Au cours d'une autre leçon, vous découvrirez comment cet algorithme recherche des clusters de clients partageant les mêmes caractéristiques. Par exemple, vous découvrirez peut-être que certains clients vivent proches les uns des autres, se déplacent à vélo et présentent le même parcours éducatif. Vous pouvez recourir à ces clusters pour mieux comprendre les relations entre différents clients et exploiter les informations recueillies pour mettre sur pied une stratégie marketing ciblant des clients spécifiques.

Pour déterminer si un client potentiel est susceptible d'acheter un vélo, vous allez créer un modèle d'exploration de données fondé sur l'Algorithme MDT (Microsoft Decision Trees). Cet algorithme examine les informations relatives à chaque client potentiel et recherche des caractéristiques à même de l'aider à prévoir et identifier d'éventuels acheteurs de vélos. Il compare alors les valeurs des caractéristiques de précédents acheteurs avec celles de potentiels nouveaux clients pour déterminer si ces derniers sont susceptibles d'acheter un vélo.

Instruction ALTER MINING STRUCTURE

Pour ajouter un modèle d'exploration de données à la structure d'exploration de données, vous devez utiliser l'instruction ALTER MINING STRUCTURE (DMX). Le code de cette instruction peut être divisé selon les sections suivantes :

  • Identification de la structure d'exploration de données

  • Attribution d'un nom au modèle d'exploration de données

  • Définition de la colonne clé

  • Définition des colonnes d'entrée et des colonnes prédictibles

  • Identification des modifications d'algorithme et de paramètre

L'exemple générique suivant utilise l'instruction ALTER MINING MODEL :

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

La première ligne du code identifie la structure d'exploration de données existante à laquelle les modèles d'exploration de données seront ajoutés :

ALTER MINING STRUCTURE [<mining structure name>]

La ligne suivante du code désigne le modèle d'exploration de données qui sera ajouté à la structure d'exploration de données :

ADD MINING MODEL [<mining model name>]

Pour plus d'informations sur l'attribution d'un nom à un objet dans DMX, consultez Identificateurs (DMX).

Les lignes suivantes du code définissent les colonnes de la structure d'exploration de données employées dans le modèle d'exploration de données :

[<key column>],
<mining model columns>

Vous pouvez uniquement utiliser les colonnes déjà existantes dans la structure d'exploration de données ; de même, la première colonne de la liste doit correspondre à la colonne clé issue de la structure d'exploration de données.

La ligne suivante du code définit l'algorithme d'exploration de données chargé de générer le modèle d'exploration de données ainsi que les paramètres d'algorithme que vous pouvez définir dans l'algorithme :

) USING <algorithm name>( <algorithm parameters> )

Pour plus d'informations sur les paramètres d'algorithme que vous pouvez régler, consultez Algorithme MDT (Microsoft Decision Trees) et Algorithme Clusters Microsoft.

Vous pouvez spécifier l'utilisation d'une colonne du modèle d'exploration de données à des fins de prédiction en utilisant la syntaxe suivante :

<mining model column> PREDICT

La dernière ligne du code, qui est facultative, définit un filtre appliqué lors de l'apprentissage du modèle et de son test. Pour plus d'informations sur l'application de filtres à des modèles d'exploration de données, consultez Création de filtres pour les modèles d'exploration de données (Analysis Services - Exploration de données).

Tâches de la leçon

Au cours de cette leçon, vous allez effectuer les tâches suivantes :

  • ajouter un modèle d'exploration de données d'arbre de décision à la structure Bike Buyer à l'aide de l'algorithme Microsoft Decision Trees (MDT) ;

  • ajouter un modèle d'exploration de données clustering à la structure Bike Buyer à l'aide de l'algorithme Microsoft Clustering.

  • Puisque vous souhaitez consulter des résultats pour tous les cas, n'ajoutez pas encore de filtre aux modèles.

Ajout d'un modèle d'exploration de données d'arbre de décision à la structure

La première étape consiste à ajouter un modèle d'exploration de données à l'aide de l'algorithme Microsoft Decision Trees (MDT)

Pour ajouter un modèle d'exploration de données d'arbre de décision

  1. Dans Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX pour ouvrir l'Éditeur de requête et une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name> 
    

    par :

    [Bike Buyer]
    
  4. Remplacez le code suivant :

    <mining model name> 
    

    par :

    Decision Tree
    
  5. Remplacez le code suivant :

    <mining model columns>,
    

    par :

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    Dans ce cas, la colonne [Bike Buyer] est désignée en tant que colonne PREDICT.

  6. Remplacez le code suivant :

    USING <algorithm name>( <algorithm parameters> ) 
    

    par :

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    L'instruction WITH DRILLTHROUGH vous permet d'explorer les cas utilisés pour la création du modèle d'exploration de données.

    L'instruction obtenue doit se présenter comme suit :

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier DT_Model.dmx.

  9. Dans la barre d'outils, cliquez sur le bouton Exécuter.

Ajout d'un modèle d'exploration de données clustering à une structure

Vous pouvez maintenant ajouter un modèle d'exploration de données à la structure d'exploration de données Bike Buyer fondé sur l'algorithme Microsoft Clustering. Du fait que le modèle d'exploration de données clustering exploite l'ensemble des colonnes définies dans la structure d'exploration de données, vous pouvez utiliser un raccourci pour ajouter le modèle à la structure en omettant la définition des colonnes d'exploration de données.

Pour ajouter un modèle d'exploration de données clustering

  1. Dans Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX pour ouvrir l'Éditeur de requête et une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction ALTER MINING STRUCTURE dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name> 
    

    par :

    [Bike Buyer]
    
  4. Remplacez le code suivant :

    <mining model> 
    

    par :

    Clustering Model
    
  5. Supprimez le code suivant :

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. Remplacez le code suivant :

    USING <algorithm name>( <algorithm parameters> )
    

    par :

    USING Microsoft_Clustering
    

    L'instruction tout entière doit se présenter comme suit :

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Clustering_Model.dmx.

  9. Dans la barre d'outils, cliquez sur le bouton Exécuter.

Dans la leçon suivante, vous allez traiter les modèles et la structure d'exploration de données.