Condividi tramite


Test di un modello filtrato (Esercitazione di base sul data mining)

Dopo avere stabilito che il modello TM_Decision_Tree è il più accurato, è necessario valutare il modello nel contesto della campagna di mailing diretto di Adventure Works Cycles. Il reparto Marketing di desidera sapere se esistono differenze nelle caratteristiche degli acquirenti di biciclette di sesso maschile e femminile. Queste informazioni li aiuteranno a decidere quali riviste utilizzare per la pubblicità e quali prodotti includere nei mailing.

In questa lezione verrà creato un modello filtrato in base al sesso. Sarà quindi possibile creare facilmente una copia del modello e modificare solo la condizione di filtro per generare un nuovo modello basato su un sesso diverso.

Per ulteriori informazioni sui filtri, vedere Creazione di filtri per i modelli di data mining (Analysis Services - Data mining).

Utilizzo dei filtri

I filtri consentono di creare facilmente modelli basati su subset dei dati. Il filtro viene applicato solo al modello e non modifica l'origine dati sottostante. Per informazioni sull'applicazione di filtri a tabelle nidificate, vedere Esercitazione intermedia sul data mining (Analysis Services - Data mining).

Filtri sulle tabelle dei case

Verrà innanzitutto creata una copia del modello TM_Decision_Tree.

Per copiare il modello Decision Trees

  1. In Esplora soluzioni di Business Intelligence Development Studio selezionare ASDataMining2008.

  2. Fare clic sulla scheda Modelli di data mining.

  3. Fare clic con il pulsante destro del mouse sul modello TM_Decision_Tree e scegliere Nuovo modello di data mining.

  4. Nel campo Nome modello digitare TM_Decision_Tree_Male.

  5. Scegliere OK.

Creare quindi un filtro per selezionare i clienti per il modello in base al sesso.

Per creare un filtro di case su un modello di data mining

  1. Fare clic con il pulsante destro del mouse sul modello di data mining TM_Decision_Tree_Male per aprire il menu di scelta rapida.

    -oppure-

    Selezionare il modello. Scegliere Imposta filtro modello dal menu Modello di data mining.

  2. Nella finestra di dialogo Filtro modello fare clic sulla riga superiore nella griglia della casella di testo Colonna struttura di data mining.

    Nell'elenco a discesa verranno visualizzati solo i nomi delle colonne della tabella.

  3. Nella casella di testo Colonna struttura di data mining selezionareSesso.

    L'icona a sinistra della casella di testo cambierà per indicare che l'elemento selezionato è una tabella o una colonna.

  4. Fare clic sulla casella di testo Operatore e selezionare l'operatore di uguaglianza (=) dall'elenco.

  5. Fare clic sulla casella di testo Valore, quindi digitare M.

  6. Fare clic sulla riga successiva nella griglia.

  7. Scegliere OK per chiudere la finestra di dialogo Filtro modello.

    Il filtro verrà visualizzato nella finestra Proprietà. In alternativa, è possibile aprire la finestra di dialogo Filtro modello dalla finestra Proprietà.

  8. Ripetere i passaggi sopra riportati, assegnando al modello il nome TM_Decision_Tree_Female e digitando F nella casella di testo Valore.

Nella scheda Modelli di data mining sono ora visualizzati due nuovi modelli.

Elaborazione dei modelli filtrati

Per utilizzare i modelli, è innanzitutto necessario distribuirli ed elaborarli. Per ulteriori informazioni sull'elaborazione dei modelli, vedere Elaborazione di modelli nella struttura di mailing diretto (Esercitazione di base sul data mining).

Per elaborare i modello filtrati

  1. Fare clic con il pulsante destro del mouse sul modello TM_Decision_Tree_Male e scegliere Elabora struttura di data mining e tutti i modelli.

  2. Fare clic su Esegui per elaborare i nuovi modelli.

  3. Al termine dell'elaborazione, fare clic su Chiudi in entrambe le finestre di elaborazione.

Valutazione dei risultati

Visualizzare i risultati e stimare l'accuratezza dei modelli filtrati seguendo gli stessi passaggi effettuati per i tre modelli precedenti. Per ulteriori informazioni, vedere:

Esplorazione del modello Decision Trees (Esercitazione di base sul data mining)

Test dell'accuratezza con i grafici di accuratezza (Esercitazione di base sul data mining)

Per esplorare i modelli filtrati

  1. Selezionare la scheda Visualizzatore modello di data mining in Progettazione modelli di data mining.

  2. Nella casella Modello di data mining selezionare TM_Decision_Tree_Male.

  3. Impostare Mostra livello su 3.

  4. Cambiare il valore di Sfondo in 1.

  5. Posizionare il cursore sul nodo identificato dall'etichetta Tutti per visualizzare il numero dei clienti che hanno e non hanno acquistato una bicicletta.

  6. Ripetere i passaggi da 1 a 5 per il modello TM_Decision_Tree_Female.

  7. Esplorare i risultati relativi a TM_Decision_Tree e i modelli filtrati in base al sesso. Dal confronto fra tutti gli acquirenti di biciclette risulta che gli acquirenti di biciclette di sesso maschile e femminile condividono alcune caratteristiche con gli acquirenti di biciclette non filtrati, ma con alcune differenze interessanti. Queste utili informazioni possono essere utilizzate da Adventure Works Cycles per sviluppare la campagna di marketing.

Per testare l'accuratezza dei modelli filtrati

  1. In Business Intelligence Development Studio passare alla scheda Grafico di accuratezza modello di data mining di Progettazione modelli di data mining e selezionare la scheda Selezione input.

  2. Nella casella di gruppo Seleziona set di dati da utilizzare per il grafico di accuratezza selezionare Utilizza test case della struttura di data mining.

  3. Nella scheda Selezione input di Progettazione modelli di data mining, in Selezionare le colonne stimabili del modello di data mining da visualizzare nel grafico di accuratezza, selezionare la casella di controllo Sincronizza colonne e valori di stima.

  4. Nella colonna Nome colonna stimabile verificare che Bike Buyer sia selezionato per ogni modello.

  5. Nella colonna Mostra selezionare ciascun modello.

  6. Nella colonna Valore stima selezionare 1.

  7. Selezionare la scheda Grafico di accuratezza per visualizzare il grafico di accuratezza.

    Si noterà ora che tutti e tre i modelli Decision Trees offrono un livello di accuratezza considerevole rispetto al modello di ipotesi casuale e prestazioni superiori rispetto ai modelli di clustering e Naive Bayes.