Lezione 4: Esplorazione dei modelli di data mining Bike Buyer

 

Si applica a: SQL Server 2016 Preview

In questa lezione si utilizzerà il SELECT (DMX) create in modelli di istruzione per esplorare il contenuto nell'albero delle decisioni e di data mining di clustering Lezione 2: aggiunta di modelli di Data Mining alla struttura di Data Mining predittiva.

Le colonne contenute in un modello di data mining non sono quelle definite dalla struttura di data mining ma sono un set specifico di colonne che descrivono le tendenze e gli schemi individuati dall'algoritmo. Queste colonne del modello di data mining sono descritte nel set di righe DMSCHEMA_MINING_MODEL_CONTENT set di righe dello schema. La colonna MODEL_NAME nel set di righe dello schema del contenuto, ad esempio, contiene il nome del modello di data mining. Per un modello di data mining di clustering, la colonna NODE_CAPTION contiene il nome di ogni cluster e la colonna NODE_DESCRIPTION contiene una descrizione delle caratteristiche di ogni cluster. È possibile esplorare queste colonne tramite SELECT FROM . CONTENUTO istruzione DMX. Questa istruzione consente anche di esplorare i dati utilizzati per creare il modello di data mining. Per utilizzare questa istruzione è necessario che sia abilitato il drill-through nella struttura di data mining. Per ulteriori informazioni sull'istruzione, vedere modello selezionare da < >. CASE ( DMX ).

È inoltre possibile ottenere tutti gli stati di una colonna discreta utilizzando l'istruzione SELECT DISTINCT. Ad esempio, se si esegue questa operazione in una colonna relativa al sesso, la query restituirà maschio e femmina.

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Esplorazione del contenuto dei modelli di data mining

  • Restituzione dei case dall'origine dei dati utilizzata per il training dei modelli di data mining

  • Esplorazione dei vari stati disponibili per una determinata colonna discreta

Restituzione del contenuto di un modello di data mining

In questa lezione si utilizzerà il modello selezionare da < >. CONTENUTO ( DMX ) istruzione per restituire il contenuto del modello di clustering.

Ecco un esempio generico del SELECT FROM . Istruzione del contenuto:

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

La prima riga del codice definisce le colonne da restituire dal contenuto del modello di data mining, nonché il modello di data mining a cui sono associate:

SELECT <select list> FROM [<mining model].CONTENT  

La clausola .CONTENT accanto al nome del modello di data mining specifica che il contenuto restituito proviene dal modello di data mining. Per ulteriori informazioni sulle colonne contenute nel modello di data mining, vedere set di righe DMSCHEMA_MINING_MODEL_CONTENT.

È possibile utilizzare facoltativamente la riga finale del codice per filtrare i risultati restituiti dall'istruzione:

WHERE <where clause>  

Se ad esempio si desidera limitare i risultati della query ai soli cluster contenenti un numero elevato di case, è possibile aggiungere all'istruzione SELECT la clausola WHERE seguente:

WHERE NODE_SUPPORT > 100  

Per ulteriori informazioni sull'utilizzo dell'istruzione WHERE, vedere Selezionare ( DMX ).

Per ottenere la restituzione del contenuto del modello di data mining di clustering

  1. In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico del SELECT FROM . Istruzione contenuto nella query vuota.

  3. Sostituire quanto segue:

    <select list>   
    

    con:

    È inoltre possibile sostituire * con un elenco delle colonne contenute all'interno di set di righe DMSCHEMA_MINING_MODEL_CONTENT.

  4. Sostituire quanto segue:

    [<mining model>]   
    

    con:

    [Clustering]  
    

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    SELECT * FROM [Clustering].CONTENT  
    
  5. Nel File menu, fare clic su Salva Dmxquery1.

  6. Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file select_content.

  7. Sulla barra degli strumenti, fare clic sui Execute pulsante.

    La query restituisce il contenuto del modello di data mining.

Utilizzo del drill-through

Il passaggio successivo consiste nell'utilizzo dell'istruzione di drill-through per ottenere un campionamento dei case utilizzati per il training del modello di data mining dell'albero delle decisioni. In questa lezione si utilizzerà il modello selezionare da < >. CASE ( DMX ) istruzione per restituire il contenuto del modello di struttura ad albero delle decisioni.

Ecco un esempio generico del SELECT FROM . Istruzione case:

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

La prima riga del codice definisce le colonne da restituire dall'origine dei dati, nonché il modello di data mining in cui sono contenute:

SELECT <select list> FROM [<mining model>].CASES  

La clausola .CASES specifica l'esecuzione di una query drill-through. Per utilizzare il drill-through è necessario che venga attivato durante la creazione del modello di data mining.

L'ultima riga del codice è facoltativa e specifica il nodo nel modello di data mining da cui si desidera ottenere i case:

WHERE IsInNode
('<node id>')  

Per ulteriori informazioni sull'utilizzo dell'istruzione WHERE con IsInNode, vedere modello selezionare da < >. CASE ( DMX ).

Per ottenere la restituzione dei case utilizzati per il training del modello di data mining

  1. In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico del SELECT FROM . Istruzione case nella query vuota.

  3. Sostituire quanto segue:

    <select list>   
    

    con:

    È inoltre possibile sostituire * con un elenco di colonne contenute nell'origine dei dati, ad esempio [Bike Buyer]

  4. Sostituire quanto segue:

    [<mining model>]   
    

    con:

    [Decision Tree]  
    

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    SELECT *   
    FROM [Decision Tree].CASES  
    
  5. Nel File menu, fare clic su Salva Dmxquery1.

  6. Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file select_drillthrough.

  7. Sulla barra degli strumenti, fare clic sui Execute pulsante.

    La query restituisce i dati di origine utilizzati per il training del modello di data mining dell'albero delle decisioni.

Restituzione degli stati di una colonna discreta del modello di data mining

Il passaggio successivo consiste nell'utilizzo dell'istruzione SELECT DISTINCT per ottenere i vari stati possibili nella colonna specificata del modello di data mining.

Di seguito è riportato un esempio generico dell'istruzione SELECT DISTINCT:

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

La prima riga del codice definisce le colonne del modello di data mining per cui vengono restituiti gli stati:

SELECT DISTINCT [<column>]   

È necessario includere DISTINCT affinché vengano restituiti tutti gli stati della colonna. Se si esclude DISTINCT, l'istruzione completa diventa una forma abbreviata di una stima e restituisce lo stato più probabile della colonna selezionata. Per altre informazioni, vedere SELECT (DMX).

Per ottenere la restituzione degli stati di una colonna discreta

  1. In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico dell'istruzione SELECT DISTINCT nella query vuota.

  3. Sostituire quanto segue:

    [<column,name>   
    

    con:

    [Bike Buyer]  
    
  4. Sostituire quanto segue:

    [<mining model>]   
    

    con:

    [Decision Tree]  
    

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  5. Nel File menu, fare clic su Salva Dmxquery1.

  6. Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file select_discrete.

  7. Sulla barra degli strumenti, fare clic sui Execute pulsante.

    La query restituisce gli stati possibili della colonna Bike Buyer.

Nella lezione successiva verrà utilizzato il modello di data mining dell'albero delle decisioni per stimare se i clienti potenziali diventeranno acquirenti di biciclette.

Lezione successiva

Lezione 5: Esecuzione di query di stima