Leçon 3 : traitement de la structure d'exploration de données Market Basket

 

S’applique à : SQL Server 2016 Preview

Dans cette leçon, vous allez utiliser le INSERT INTO &#40 ; DMX &#41 ; instruction et vAssocSeqLineItems et vAssocSeqOrders de la AdventureWorksDW2012 base de données pour traiter les structures et les modèles d’exploration de données que vous avez créé dans leçon 1 : création de la Structure d’exploration de données de panier d’achat et leçon 2 : ajout de modèles d’exploration de données à la Structure d’exploration de données de panier.

Lorsque vous traitez une structure d'exploration de données, Analysis Services lit les données sources et génère les structures qui soutiennent les modèles d'exploration de données. Lorsque vous traitez un modèle d’exploration de données, les données définies par la structure d’exploration de données sont passées de l’algorithme d’exploration de données que vous avez choisi. L'algorithme recherche des tendances et des modèles, puis stocke les informations recueillies dans le modèle d'exploration de données. Par conséquent, le modèle d'exploration de données ne contient pas les données source réelles mais plutôt les informations recueillies par l'algorithme. Pour plus d’informations sur le traitement des modèles d’exploration de données, consultez la page traitement des exigences et considérations &#40 ; l’exploration de données &#41 ;.

Si vous modifiez une colonne de structure ou les données source, vous devez simplement retraiter la structure d'exploration de données. Si vous ajoutez un modèle d’exploration de données vers une structure d’exploration de données qui a déjà été traitée, vous pouvez utiliser la INSERT INTO MINING MODEL instruction pour former le nouveau modèle d’exploration de données sur les données existantes.

Étant donné que la structure d’exploration de données de panier d’achat contient une table imbriquée, vous devez définir les colonnes d’exploration de données pour être formé à l’aide de la structure de table imbriquée et utiliser le forme commande pour définir les requêtes qui extraient les données d’apprentissage à partir des tables source.

Instruction INSERT INTO

Pour l’apprentissage de la structure d’exploration de données de panier d’achat et ses modèles d’exploration de données associé, utilisez la INSERT INTO &#40 ; DMX &#41 ; instruction. Le code de cette instruction peut être divisé selon les sections suivantes :

  • Identification de la structure d'exploration de données

  • Liste des colonnes de la structure d'exploration de données

  • Définir les données d’apprentissage à l’aide de forme

Voici un exemple de la INSERT INTO instruction :

INSERT INTO MINING STRUCTURE [<mining structure name>]  
(  
   <mining structure columns>  
   [<nested table>]  
   ( SKIP, <skipped column> )  
)  
SHAPE {  
  OPENQUERY([<datasource>],'<SELECT statement>') }  
APPEND  
(   
  {OPENQUERY([<datasource>],'<nested SELECT statement>')  
}  
RELATE [<case key>] TO [<foreign key>]  
) AS [<nested table>]  

La première ligne du code identifie la structure d'exploration de données à apprendre :

INSERT INTO MINING STRUCTURE [<mining structure name>]  

Les lignes suivantes du code précisent les colonnes définies par la structure d'exploration de données. Vous devez répertorier chaque colonne dans la structure d'exploration de données et chaque colonne doit mapper une colonne figurant dans les données de la requête source. Vous pouvez utiliser SKIP pour ignorer les colonnes qui existent dans la source de données, mais n’existent pas dans la structure d’exploration de données. Pour plus d’informations sur l’utilisation de SKIP, consultez INSERT INTO &#40 ; DMX &#41 ;.

(  
   <mining structure columns>  
   [<nested table>]  
   ( SKIP, <skipped column> )  
)  

Les dernières lignes du code précisent les données à utiliser pour l'apprentissage de la structure d'exploration de données. Étant donné que les données source sont contenues dans deux tables, vous allez utiliser forme pour relier les tables.

SHAPE {  
  OPENQUERY([<datasource>],'<SELECT statement>') }  
APPEND  
(   
  {OPENQUERY([<datasource>],''<nested SELECT statement>'')  
}  
RELATE [<case key>] TO [<foreign key>]  
) AS [<nested table>]  

Dans cette leçon, vous utilisez OPENQUERY pour définir la source de données. Pour plus d’informations sur les autres méthodes de définition d’une requête sur la source de données, consultez &#60 ; requête de source de données &#62 ;.

Tâches de la leçon

Au cours de cette leçon, vous allez effectuer la tâche suivante :

  • traiter la structure d'exploration de données Market Basket.

Traitement de la structure d'exploration de données Market Basket

Pour traiter la structure d'exploration de données à l'aide de l'instruction INSERT INTO

  1. Dans Explorateur d’objets, cliquez sur l’instance de Analysis Services, pointez sur nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction INSERT INTO dans la requête vide.

  3. Remplacez le code suivant :

    [<mining structure>]  
    

    par :

    Market Basket  
    
  4. Remplacez le code suivant :

    <mining structure columns>  
    [<nested table>]  
    ( SKIP, <skipped column> )  
    

    par :

    [OrderNumber],  
    [Products]   
    (SKIP, [Model])  
    

    Dans l’instruction, produits fait référence à la table Products définie par l’instruction SHAPE. Ignorer est utilisé pour ignorer la colonne de modèle qui existe dans les données source en tant que clé, mais n’est pas utilisée par la structure d’exploration de données.

  5. Remplacez le code suivant :

    SHAPE {  
      OPENQUERY([<datasource>],'<SELECT statement>') }  
    APPEND  
    (   
      {OPENQUERY([<datasource>],'<nested SELECT statement>')  
    }  
    RELATE [<case key>] TO [<foreign key>]  
    ) AS [<nested table>]  
    

    par :

    SHAPE {  
      OPENQUERY([Adventure Works DW],'SELECT OrderNumber  
                FROM vAssocSeqOrders ORDER BY OrderNumber')}  
    APPEND  
    (   
      {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM   
        dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model')  
    }  
    RELATE OrderNumber to OrderNumber   
    ) AS [Products]  
    

    La requête source fait référence à la AdventureWorksDW2012 source de données définie dans le AdventureWorksDW2012 exemple de projet. Elle utilise la source de données pour accéder aux vues vAssocSeqLineItems et vAssocSeqOrders. Ces vues renferment les données source à utiliser pour effectuer l'apprentissage du modèle d'exploration de données. Si vous n’avez pas créé ce projet ou ces vues, consultez la page didacticiel d’exploration de données de base.

    Dans la forme de commande, vous allez utiliser OPENQUERY pour définir les deux requêtes. La première requête définit la table parente, la deuxième définit la table imbriquée. Les deux tables sont associées par le biais de la colonne OrderNumber présente dans les deux tables.

    L'instruction tout entière doit se présenter comme suit :

    INSERT INTO MINING STRUCTURE [Market Basket]  
    (  
       [OrderNumber],[Products] (SKIP, [Model])  
    )  
    SHAPE {  
      OPENQUERY([Adventure Works DW],'SELECT OrderNumber  
                FROM vAssocSeqOrders ORDER BY OrderNumber')}  
    APPEND  
    (   
      {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM   
        dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model')  
    }  
    RELATE OrderNumber to OrderNumber   
    ) AS [Products]  
    
  6. Sur le fichier menu, cliquez sur Enregistrer DMXQuery1.dmx sous.

  7. Dans la Enregistrer sous boîte de dialogue, recherchez le dossier approprié et nommez le fichier Process Market Basket.dmx.

  8. Dans la barre d’outils, cliquez sur le Execute bouton.

Après avoir terminé d'exécuter la requête, vous pouvez consulter les modèles et les jeux d'éléments trouvés, consulter les associations ou filtrer par jeu d'éléments, probabilité ou importance. Pour afficher ces informations, dans SQL Server Management Studio, cliquez sur le nom du modèle de données, puis cliquez sur Parcourir.

Dans la leçon suivante, vous allez créer plusieurs prédictions fondées sur les modèles d'exploration de données que vous avez ajoutés à la structure Market Basket.

Leçon suivante

Leçon 4 : Exécution de prédictions Market Basket