Leçon 4 : Exploration des modèles d'exploration de données Bike Buyer

Nouveau : 5 décembre 2005

Dans cette leçon, vous allez utiliser l'instruction SELECT (DMX) pour explorer le contenu des modèles d'exploration de données d'arbre de décision et clustering que vous avez créés dans le cadre de la Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Bike Buyer.

Les colonnes figurant dans un modèle d'exploration de données ne sont pas les colonnes définies par la structure d'exploration de données ; elles forment plutôt un ensemble spécifique de colonnes décrivant des tendances et des modèles identifiés par l'algorithme. Ces colonnes de modèle d'exploration de données sont décrites dans l'ensemble de lignes de schéma DMSCHEMA_MINING_MODEL_CONTENT. Par exemple, la colonne MODEL_NAME située dans l'ensemble de lignes du schéma contient le nom du modèle d'exploration de données. Dans le cadre d'un modèle d'exploration de données clustering, la colonne NODE_CAPTION renferme le nom de chaque cluster et la colonne NODE_DESCRIPTION contient une description des caractéristiques de chacun de ces clusters. Vous pouvez parcourir ces colonnes à l'aide de l'instruction SELECT FROM <modèle>.CONTENT dans DMX. Le recours à cette instruction est également possible si vous souhaitez explorer les données utilisées pour la création du modèle d'exploration de données. Pour utiliser cette instruction, vous devez activer la fonction d'extraction dans la structure d'exploration de données. Pour plus d'informations sur cette instruction, consultez SELECT FROM <modèle>.CASES (DMX).

Vous pouvez également afficher tous les états d'une colonne discrète par le biais de l'instruction SELECT DISTINCT. Par exemple, si vous effectuez cette opération sur une colonne Sexe, la requête retourne les valeurs male et female.

Tâches de la leçon

Au cours de cette leçon, vous allez effectuer les tâches suivantes :

  • explorer le contenu des modèles d'exploration de données ;
  • retourner les cas des données source utilisées pour l'apprentissage des modèles d'exploration de données ;
  • explorer les différents états disponibles pour une colonne discrète donnée.

Retour du contenu d'un modèle d'exploration de données

Dans cette leçon, vous allez utiliser l'instruction SELECT FROM <modèle>.CONTENT (DMX) pour retourner le contenu du modèle clustering.

L'exemple générique suivant utilise l'instruction SELECT FROM <modèle>.CONTENT :

SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>

La première ligne du code définit les colonnes à retourner à partir du contenu du modèle d'exploration de données et le modèle d'exploration de données auquel elles sont associées :

SELECT <select list> FROM [<mining model].CONTENT

La clause .CONTENT en regard du nom du modèle d'exploration de données précise que le contenu est retourné à partir du modèle d'exploration de données. Pour plus d'informations sur les colonnes que contient le modèle d'exploration de données, consultez DMSCHEMA_MINING_MODEL_CONTENT Rowset.

Vous pouvez éventuellement exploiter la dernière ligne du code pour filtrer les résultats retournés par l'instruction :

WHERE <where clause>

Par exemple, si vous souhaitez restreindre les résultats de la requête uniquement aux clusters abritant un grand nombre de cas, vous pouvez ajouter la clause WHERE suivante à l'instruction SELECT :

WHERE NODE_SUPPORT > 100

Pour plus d'informations sur l'instruction WHERE, consultez SELECT (DMX).

Pour retourner le contenu du modèle d'exploration de données clustering

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction SELECT FROM <modèle>.CONTENT dans la requête vide.

  3. Remplacez le code suivant :

    <select list> 
    

    par :

    Vous pouvez également remplacer * par une liste de colonnes figurant dans l'ensemble de lignes DMSCHEMA_MINING_MODEL_CONTENT.

  4. Remplacez le code suivant :

    [<mining model>] 
    

    par :

    [Clustering]
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT * FROM [Clustering].CONTENT
    
  5. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_CONTENT.dmx.

  7. Dans la barre d'outils, cliquez sur le bouton Exécuter.

    La requête retourne le contenu du modèle d'exploration de données.

Utilisation de la fonction d'extraction

L'étape suivante consiste à utiliser l'instruction d'extraction pour retourner un éventail de cas utilisés pour l'apprentissage du modèle d'exploration de données d'arbre de décision. Dans cette leçon, vous allez utiliser l'instruction SELECT FROM <modèle>.CASES (DMX) pour retourner le contenu du modèle d'arbre de décision.

L'exemple générique suivant utilise l'instruction SELECT FROM <modèle>.CASES :

SELECT <select list> 
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')

La première ligne du code définit les colonnes à retourner depuis les données source et le modèle d'exploration de données qui les contient :

SELECT <select list> FROM [<mining model>].CASES

La clause .CASES indique que vous exécutez une requête d'extraction. Pour recourir à l'extraction, vous devez l'activer au moment de créer la structure d'exploration de données.

La dernière ligne de code est facultative et spécifie le nœud du modèle d'exploration de données duquel vous souhaitez obtenir les cas :

WHERE IsInNode('<node id>')

Pour plus d'informations sur l'utilisation de l'instruction WHERE avec IsInNode, consultez SELECT FROM <modèle>.CASES (DMX).

Pour retourner les cas utilisés pour l'apprentissage du modèle d'exploration de données

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction SELECT FROM <modèle>.CASES dans la requête vide.

  3. Remplacez le code suivant :

    <select list> 
    

    par :

    Vous pouvez remplacer * par une liste de colonnes issues des sources de données (par exemple, [Bike Buyer]).

  4. Remplacez le code suivant :

    [<mining model>] 
    

    par :

    [Decision Tree]
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT * 
    FROM [Decision Tree].CASES
    
  5. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_DRILLTHROUGH.dmx.

  7. Dans la barre d'outils, cliquez sur le bouton Exécuter.

    La requête retourne les données source utilisées pour l'apprentissage du modèle d'exploration de données d'arbre de décision.

Retour des états d'une colonne discrète du modèle d'exploration de données

L'étape suivante consiste à utiliser l'instruction SELECT DISTINCT pour retourner les différents états possibles dans la colonne de modèle d'exploration de données spécifiée.

L'exemple générique suivant utilise l'instruction SELECT DISTINCT :

SELECT DISTINCT [<colonne>]

FROM [<mining model>]

La première ligne du code définit les colonnes du modèle d'exploration de données pour lesquelles les états sont retournés :

SELECT DISTINCT [<column>] 

Vous devez inclure l'instruction DISTINCT pour être en mesure de retourner tous les états de la colonne. Si vous l'excluez, l'instruction DISTINCT complète se transforme en un raccourci de création de prédiction et retourne l'état le plus probable de la colonne spécifiée. Pour plus d'informations, consultez SELECT (DMX).

Pour retourner les états d'une colonne discrète

  1. Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction SELECT DISTINCT dans la requête vide.

  3. Remplacez le code suivant :

    [<column,name> 
    

    par :

    [Bike Buyer]
    
  4. Remplacez le code suivant :

    [<mining model>] 
    

    par :

    [Decision Tree]
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT DISTINCT [Bike Buyer] 
    FROM [Decision Tree]
    
  5. Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_DISCRETE.dmx.

  7. Dans la barre d'outils, cliquez sur le bouton Exécuter.

    La requête retourne les états possibles de la colonne Bike Buyer.

Au cours de la leçon suivante, vous allez évaluer si des clients potentiels sont des acheteurs de vélos à l'aide du modèle d'exploration de données d'arbre de décision.

Leçon suivante

Leçon 5 : Exécution des requêtes de prédiction