Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Bike Buyer

In questa lezione verranno aggiunti due modelli di data mining alla struttura di data mining Bike Buyer creata in Lezione 1: Creazione della struttura di data mining Bike Buyer. Uno di questi modelli consentirà di esplorare i dati e l'altro di creare stime.

Per esaminare le possibili modalità di suddivisione dei clienti potenziali in base alle rispettive caratteristiche, verrà creato un modello di data mining basato sull'Algoritmo Microsoft Clustering. In una lezione successiva verrà esaminato il modo in cui questo algoritmo individua cluster di clienti che condividono caratteristiche simili. È possibile riscontrare, ad esempio, che determinati clienti tendono a vivere nelle stesse aree, a usare la bicicletta per recarsi al lavoro e ad avere una formazione scolastica analoga. Questi cluster possono essere utilizzati per comprendere più a fondo la correlazione tra vari clienti e queste informazioni possono essere utilizzate come base per una strategia di marketing rivolta a un particolare segmento di clientela.

Per stimare la probabilità che un potenziale cliente acquisti una bicicletta, verrà creato un modello di data mining basato sull'Algoritmo Microsoft Decision Trees. Questo algoritmo esamina le informazioni associate a ogni potenziale cliente e individua le caratteristiche utili per stimare se acquisterà una bicicletta, quindi confronta i valori delle caratteristiche dei precedenti acquirenti di biciclette con quelli dei nuovi potenziali clienti per stabilire se è probabile che questi ultimi acquistino una bicicletta.

Istruzione ALTER MINING STRUCTURE

Per aggiungere un modello di data mining alla struttura di data mining viene utilizzata l'istruzione ALTER MINING STRUCTURE (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Identificazione della struttura di data mining

  • Denominazione del modello di data mining

  • Definizione della colonna chiave

  • Definizione della colonna di input e della colonna stimabile

  • Identificazione delle modifiche a livello di algoritmo e parametri

Di seguito è riportato un esempio generico dell'istruzione ALTER MINING MODEL:

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

La prima riga del codice identifica la struttura di data mining esistente a cui verranno aggiunti i modelli di data mining:

ALTER MINING STRUCTURE [<mining structure name>]

La riga successiva del codice indica il nome del modello di data mining che verrà aggiunto alla struttura di data mining:

ADD MINING MODEL [<mining model name>]

Per informazioni sulla denominazione di un oggetto in DMX, vedere Identificatori (DMX).

Le successive righe del codice definiscono le colonne della struttura di data mining che verranno utilizzate dal modello di data mining:

[<key column>],
<mining model columns>

È possibile utilizzare solo colonne già esistenti nella struttura di data mining e la prima colonna nell'elenco deve essere la colonna chiave dalla struttura di data mining.

La riga successiva del codice definisce l'algoritmo di data mining che genera il modello di data mining e i parametri che è possibile impostare nell'algoritmo:

) USING <algorithm name>( <algorithm parameters> )

Per ulteriori informazioni sui parametri dell'algoritmo che è possibile impostare, vedere Algoritmo Microsoft Decision Trees e Algoritmo Microsoft Clustering.

Per specificare che una colonna nel modello di data mining deve essere utilizzata per la stima, è possibile utilizzare la sintassi seguente:

<mining model column> PREDICT

L'ultima riga del codice, che è facoltativa, definisce un filtro che viene applicato durante il training e il test del modello. Per ulteriori informazioni su come applicare filtri ai modelli di data mining, vedere Creazione di filtri per i modelli di data mining (Analysis Services - Data mining).

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Aggiunta di un modello di data mining dell'albero delle decisioni alla struttura Bike Buyer mediante l'algoritmo Microsoft Decision Trees

  • Aggiunta di un modello di data mining di clustering alla struttura Bike Buyer mediante l'algoritmo Microsoft Clustering

  • Poiché si desidera visualizzare i risultati per tutti i casi, non verrà ancora aggiunto un filtro ai modelli.

Aggiunta di un modello di data mining dell'albero delle decisioni alla struttura

Il primo passaggio consiste nell'aggiunta di un modello di data mining basato sull'algoritmo Microsoft Decision Trees.

Per aggiungere un modello di data mining dell'albero delle decisioni

  1. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query, quindi fare clic su DMX per aprire l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.

  3. Sostituire quanto segue:

    <mining structure name> 
    

    con:

    [Bike Buyer]
    
  4. Sostituire quanto segue:

    <mining model name> 
    

    con:

    Decision Tree
    
  5. Sostituire quanto segue:

    <mining model columns>,
    

    con:

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    In questo caso, la colonna [Bike Buyer] è stata designata come colonna PREDICT.

  6. Sostituire quanto segue:

    USING <algorithm name>( <algorithm parameters> ) 
    

    con:

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    L'istruzione WITH DRILLTHROUGH consente di esplorare i case utilizzati per creare il modello di data mining.

    L'istruzione risultante dovrebbe essere la seguente:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. Scegliere Salva DMXQuery1.dmx con nome dal menu File.

  8. Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome DT_Model.dmx.

  9. Fare clic sul pulsante Esegui sulla barra degli strumenti.

Aggiunta di un modello di data mining di clustering alla struttura

A questo punto è possibile aggiungere un modello di data mining alla struttura Bike Buyer mediante l'algoritmo Microsoft Clustering. Dato che il modello di data mining di clustering utilizzerà tutte le colonne definite nella struttura di data mining, è possibile utilizzare una procedura abbreviata per aggiungere il modello alla struttura omettendo la definizione delle colonne di data mining.

Per aggiungere un modello di data mining di clustering

  1. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query, quindi fare clic su DMX per aprire l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.

  3. Sostituire quanto segue:

    <mining structure name> 
    

    con:

    [Bike Buyer]
    
  4. Sostituire quanto segue:

    <mining model> 
    

    con:

    Clustering Model
    
  5. Eliminare quanto segue:

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. Sostituire quanto segue:

    USING <algorithm name>( <algorithm parameters> )
    

    con:

    USING Microsoft_Clustering
    

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. Scegliere Salva DMXQuery1.dmx con nome dal menu File.

  8. Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome Clustering_Model.dmx.

  9. Fare clic sul pulsante Esegui sulla barra degli strumenti.

Nella lezione successiva verranno elaborati i modelli e la struttura di data mining.