Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Market Basket

 

S’applique à : SQL Server 2016 Preview

Dans cette leçon, vous allez ajouter deux modèles d’exploration de données à la structure d’exploration de données de panier d’achat que vous avez créé dans leçon 1 : création de la Structure d’exploration de données de panier d’achat. Ces modèles d'exploration de données vous permettent de créer des prédictions.

Pour prédire les types de produits que les clients sont susceptibles d’acheter en même temps, vous allez créer deux modèles d’exploration de données à l’aide de la algorithme Microsoft Association et deux valeurs différentes pour les MINIMUM_PROBABILTY paramètre.

MINIMUM_PROBABILTY est un Microsoft paramètre d’algorithme Association qui permet de déterminer le nombre de règles qui contient un modèle d’exploration de données en spécifiant la probabilité minimale qu’une règle doit comporter. Par exemple, la valeur 0,4 spécifie qu'une règle peut être générée uniquement si la combinaison des produits que la règle décrit présente une probabilité d'occurrence d'au moins quarante pour cent.

Vous allez afficher l’effet de la modification de la MINIMUM_PROBABILTY paramètre dans une leçon ultérieure.

Instruction ALTER MINING STRUCTURE

Pour ajouter un modèle d’exploration de données qui contient une table imbriquée à une structure d’exploration de données, vous utilisez la ALTER MINING STRUCTURE &#40 ; DMX &#41 ; instruction. Le code dans l’instruction peut être divisé selon les sections suivantes :

  • Identification de la structure d'exploration de données

  • Attribution d'un nom au modèle d'exploration de données

  • Définition de la colonne clé

  • Définition des colonnes d'entrée et des colonnes prédictibles

  • Définition des colonnes de la table imbriquée

  • Identification des modifications d'algorithme et de paramètre

Voici un exemple de la ALTER MINING STRUCTURE instruction qui ajoute un modèle d’exploration de données à une structure qui inclut des colonnes de table imbriquée :

ALTER MINING STRUCTURE [<Mining Structure Name>]  
ADD MINING MODEL [<Mining Model Name>]  
(  
    [<key column>],  
    <mining model column> <usage>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
) USING <algorithm>( <algorithm parameters> )  

La première ligne du code identifie la structure d'exploration de données existante à laquelle le modèle d'exploration de données sera ajouté :

ALTER MINING STRUCTURE [<mining structure name>]  

La ligne suivante du code désigne le modèle d'exploration de données qui sera ajouté à la structure d'exploration de données :

ADD MINING MODEL [<mining model name>]  

Pour plus d’informations sur l’appellation d’un objet dans les Extensions DMX (Data Mining), consultez identificateurs &#40 ; DMX &#41 ;.

Les lignes suivantes du code définissent les colonnes de la structure d’exploration de données qui sera utilisée par le modèle d’exploration de données :

[<key column>],  
<mining model columns> <usage>,  

Vous pouvez utiliser uniquement des colonnes qui existent déjà dans la structure d'exploration de données.

La première colonne dans la liste de colonnes de modèle d'exploration de données doit être la colonne clé dans la structure d'exploration de données. Toutefois, vous n’avez pas vers le type clé après la colonne clé pour spécifier l’utilisation. En effet, vous avez déjà défini la colonne en tant que clé lorsque vous avez créé la structure d'exploration de données.

Les lignes restantes spécifient l'utilisation des colonnes dans le nouveau modèle d'exploration de données. Vous pouvez spécifier qu’une colonne dans le modèle d’exploration de données sera utilisée pour la prédiction à l’aide de la syntaxe suivante :

<column name> PREDICT,  

Si vous ne spécifiez pas d'utilisation, vous n'avez pas besoin d'inclure une colonne de structure d'exploration de données dans la liste. Toutes les colonnes utilisées par la structure d'exploration de données référencée sont automatiquement mises à la disposition des modèles d'exploration de données basés sur cette structure. Toutefois, le modèle n'utilisera pas les colonnes pour la formation à moins que vous ne spécifiiez l'utilisation.

La dernière ligne du code définit l'algorithme et les paramètres d'algorithme employés pour générer le modèle d'exploration de données.

) USING <algorithm>( <algorithm parameters> )  

Tâches de la leçon

Vous allez effectuer les tâches suivantes dans cette leçon :

  • ajouter un modèle d'exploration de données Association à la structure à l'aide de la probabilité par défaut ;

  • ajouter un modèle d'exploration de données Association à la structure à l'aide d'une probabilité modifiée.

Ajout d'un modèle d'exploration de données Association à la structure en utilisant le paramètre MINIMUM_PROBABILITY par défaut

La première tâche consiste à ajouter un nouveau modèle d’exploration de données à la structure d’exploration de données de panier d’achat basé sur le Microsoft algorithme d’Association à l’aide de la valeur par défaut MINIMUM_PROBABILITY.

Pour ajouter un modèle d'exploration de données Association

  1. Dans Explorateur d’objets, cliquez sur l’instance de Analysis Services, pointez sur nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

    Notes


    Pour créer une requête DMX sur une base de données Analysis Services spécifique, cliquez avec le bouton droit sur la base de données au lieu de l'instance.

  2. Copiez l’exemple générique de le ALTER MINING STRUCTURE instruction dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name>   
    

    par :

    [Market Basket]  
    
  4. Remplacez le code suivant :

    <mining model name>   
    

    par :

    [Default Association]  
    
  5. Remplacez le code suivant :

    [<key column>],  
    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    par :

    OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    

    Dans ce cas, le [Products] table a été désignée comme colonne prévisible**.** En outre, les [Model] colonne est incluse dans la liste des colonnes de table imbriquée, car il s’agit de la colonne clé de la table imbriquée.

    Notes


    N'oubliez pas qu'une clé imbriquée est différente d'une clé de cas. Une clé de cas est un identificateur unique du cas, alors que la clé imbriquée est un attribut que vous souhaitez modéliser.

  6. Remplacez le code suivant :

    USING <algorithm>( <algorithm parameters> )  
    

    par :

    Using Microsoft_Association_Rules  
    

    L'instruction obtenue doit se présenter comme suit :

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Default Association]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    Using Microsoft_Association_Rules  
    
  7. Sur le fichier menu, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la Enregistrer sous boîte de dialogue, recherchez le dossier approprié et nommez le fichier Default_Association_Model.dmx.

  9. Dans la barre d’outils, cliquez sur le Execute bouton.

Ajout d'un modèle d'exploration de données Association à la structure en modifiant le paramètre MINIMUM_PROBABILITY par défaut

La tâche suivante consiste à ajouter un nouveau modèle d'exploration de données à la structure d'exploration de données Market Basket en partant de l'algorithme Microsoft Association, puis en attribuant la valeur par défaut 0,01 au paramètre MINIMUM_PROBABILITY. La modification du paramètre force alors l'algorithme Microsoft Association à créer d'autres règles.

Pour ajouter un modèle d'exploration de données Association

  1. Dans Explorateur d’objets, cliquez sur l’instance de Analysis Services, pointez sur nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l’exemple générique de le ALTER MINING STRUCTURE instruction dans la requête vide.

  3. Remplacez le code suivant :

    <mining structure name>   
    

    par :

    Market Basket  
    
  4. Remplacez le code suivant :

    <mining model name>   
    

    par :

    [Modified Association]  
    
  5. Remplacez le code suivant :

    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    par :

    OrderNumber,  
    [Products] PREDICT (  
            [Model]  
        )  
    

    Dans ce cas, la table [Products] est désignée en tant que colonne prédictible. Par ailleurs, la colonne [MODEL] est incluse dans la liste car il s'agit de la colonne clé dans la table imbriquée.

  6. Remplacez le code suivant :

    USING <algorithm>( <algorithm parameters> )  
    

    par :

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    

    L'instruction obtenue doit se présenter comme suit :

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Modified Assocation]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    
  7. Sur le fichier menu, cliquez sur Enregistrer DMXQuery1.dmx sous.

  8. Dans la Enregistrer sous boîte de dialogue, recherchez le dossier approprié et nommez le fichier Modified Association_Model.dmx.

  9. Dans la barre d’outils, cliquez sur le Execute bouton.

Dans la leçon suivante, vous allez traiter la structure d'exploration de données Market Basket et ses modèles d'exploration de données associés.

Leçon suivante

Leçon 3 : traitement de la structure d'exploration de données Market Basket