Esplorazione dei modelli Market Basket (Esercitazione intermedia sul data mining)

 

Si applica a: SQL Server 2016 Preview

Dopo aver creato il associazione modello, è possibile esaminarlo utilizzando il Microsoft Visualizzatore Microsoft Association nel Visualizzatore modello di Data Mining scheda Progettazione modelli di Data Mining. In questa esercitazione viene descritto l'utilizzo del visualizzatore per esplorare le relazioni tra elementi. Il visualizzatore consente di visualizzare immediatamente i prodotti che tendono a comparire insieme e di ottenere un'idea generale degli schemi risultanti.

Il Microsoft Association Rules contiene tre schede: regole, set di elementi, e rete di dipendenze. Poiché ogni scheda rivela una vista leggermente diversa dei dati, quando si esplora un modello, in genere si passa diverse volte da un riquadro all'altro man mano che si ottengono le informazioni.

  • Scheda Rete di dipendenze

  • Scheda Set di elementi

  • Scheda Regole

  • Generic Content Tree Viewer

Per questa esercitazione, verrà avviato sulla rete di dipendenze tasto tab e quindi utilizzare il regole scheda e set di elementi tab per approfondire la comprensione delle relazioni rivelate nel Visualizzatore. Si utilizzerà inoltre il Microsoft Generic Content Tree Viewer per recuperare statistiche dettagliate per le singole regole o set di elementi.

Scheda Rete di dipendenze

Con la rete di dipendenze scheda, è possibile esaminare l'interazione tra diversi elementi del modello. Ogni nodo nel visualizzatore rappresenta un elemento, mentre le linee tra i nodi rappresentano regole. Selezionando un nodo, è possibile visualizzare gli altri nodi che stimano l'elemento selezionato oppure gli elementi stimati dall'elemento corrente. In alcuni casi, è presente un'associazione bidirezionale tra gli elementi, ovvero che compaiono spesso nella stessa transazione. È possibile fare riferimento alla legenda dei colori nella parte inferiore della scheda per determinare la direzione dell'associazione.

Una linea che collega due elementi indica che è probabile che questi elementi compaiano insieme in una transazione. In altre parole, è probabile che i clienti acquistino insieme questi elementi. Il dispositivo di scorrimento è associato alla probabilità della regola. Spostare il dispositivo di scorrimento verso l'alto o verso il basso per escludere le associazioni deboli, ovvero le regole con una bassa probabilità.

Il grafico della rete di dipendenza mostra coppie di regole che possono essere rappresentate logicamente come A->B, nel senso che se viene acquistato il prodotto A, il prodotto B è probabile. Il grafico non può mostrare regole del tipo AB->C. Se si sposta il dispositivo di scorrimento per mostrare tutte le regole ma non è comunque visibile alcuna linea nel grafico, ciò significa che non vi sono coppie di regole che soddisfano i criteri dei parametri dell'algoritmo.

È anche possibile trovare i nodi in base al nome, digitando le prime lettere del nome di attributo. Per altre informazioni, vedere Finestra di dialogo Trova nodo (Visualizzatore modello di data mining).

Per aprire il modello Association nel Visualizzatore Microsoft Association Rules

  1. In Esplora, fare doppio clic sulla struttura di associazione.

  2. In Progettazione modelli di data mining fare clic sulla scheda Visualizzatore modello di data mining .

  3. Selezionare Association dall'elenco dei modelli di data mining di modello di Data Mining dall'elenco a discesa.

Per navigare nel grafico delle dipendenze e individuare nodi specifici

  1. Nel Visualizzatore modello di Data Mining selezionare il rete di dipendenze scheda.

  2. Fare clic su Zoom avanti più volte, fino a quando non è possibile visualizzare facilmente le etichette per ogni nodo.

    Per impostazione predefinita, il grafico viene visualizzato con tutti i nodi visibili. In un modello complesso possono esservi molti nodi, ognuno dei quali risulta piuttosto piccolo.

  3. Fare clic su di + Accedi nell'angolo inferiore destro del visualizzatore e tenere premuto il pulsante del mouse per eseguire la traslazione intorno al grafico.

  4. Sul lato sinistro del visualizzatore, trascinare il dispositivo di scorrimento verso il basso, spostandolo da tutti i collegamenti (predefinito) alla fine del controllo dispositivo di scorrimento.

  5. Il visualizzatore aggiornerà il grafico in modo da mostrare solo l'associazione più forte, tra gli elementi Touring Tire e Touring Tire Tube.

  6. Fare clic sul nodo con etichettato Touring Tire Tube = esistente.

    Il grafico viene aggiornato in modo da evidenziare solo gli elementi che sono fortemente correlati a questo elemento. Si noti la direzione della freccia tra i due elementi.

  7. Sul lato sinistro del visualizzatore trascinare nuovamente il dispositivo di scorrimento verso l'alto, spostandolo dalla parte inferiore fino alla parte centrale.

    Si notino le modifiche nella freccia che connette i due elementi.

  8. Selezionare Mostra solo nome dell'attributo nell'elenco a discesa nella parte superiore del riquadro rete di dipendenze.

    Le etichette di testo nel grafico verranno aggiornate per mostrare solo il nome del modello.

Torna all'inizio

Scheda Set di elementi

Il passaggio successivo consiste nell'ottenere maggiori informazioni sulle regole e sui set di elementi generati dal modello per i prodotti Touring Tire e Touring Tire Tube. Il set di elementi scheda vengono visualizzate tre importanti tipi di informazioni relative ai set di elementi che la Microsoft algoritmo di associazione consente di individuare:

  • **Supporto:**il numero di transazioni in cui si verifica il set di elementi.

  • **Dimensioni:**il numero di elementi al suo interno.

  • **Elementi:**un elenco di elementi inclusi in ogni set di elementi.

L'algoritmo consente di generare molti set di elementi a seconda della modalità di impostazione dei parametri. Ciascun set di elementi visualizzato rappresenta transazioni relative alla vendita dell'elemento. Tramite i controlli nella parte superiore di set di elementi scheda, è possibile filtrare il visualizzatore per visualizzare solo i set di elementi che contengono un set di elementi e supporto dimensioni specificate.

Se si utilizza un diverso modello di data mining e non vengono elencati set di elementi, questo avviene perché nessun set di elementi soddisfa il criterio dei parametri dell'algoritmo. In tale scenario, è possibile modificare i parametri dell'algoritmo per consentire set di elementi che dispongono di un supporto inferiore.

Per filtrare i set di elementi mostrati nel visualizzatore per nome

  1. Fare clic su di set di elementi scheda del visualizzatore.

  2. Nel Filtra set di elementi digitare Touring Tire, e quindi fare clic all'esterno della casella.

    Il filtro restituirà tutti gli elementi che contengono questa stringa.

  3. Nel Mostra elenco, selezionare Mostra solo nome dell'attributo.

  4. Selezionare il Mostra nomi lunghi casella di controllo.

    L'elenco dei set di elementi verrà aggiornato per mostrare solo i set di elementi che contengono la stringa Touring Tire. Il nome lungo del set di elementi include il nome della tabella che contiene l'attributo e il valore per ogni elemento.

  5. Cancella il Mostra nomi lunghi casella di controllo.

    L'elenco dei set di elementi verrà aggiornato per mostrare solo il nome breve.

I valori di supporto colonna indicano il numero di transazioni per ogni set di elementi. Una transazione per un set di elementi indica un acquisto in cui erano inclusi tutti gli elementi nel set di elementi.

Per impostazione predefinita, il visualizzatore elenca i set di elementi per supporto in ordine decrescente. È possibile fare clic sulle intestazioni di colonna per eseguire l'ordinamento in base a una colonna diversa, ad esempio il nome o la dimensione del set di elementi. Se si è interessati a ottenere maggiori informazioni sulle singole transazioni incluse in un set di elementi, è possibile eseguire il drill-through dai set di elementi ai singoli case. Le colonne della struttura nei risultati del drill-through sono il livello di reddito del cliente e l'ID cliente, che non sono stati utilizzati nel modello.

Per visualizzare i dettagli per un set di elementi

  1. Nell'elenco dei set di elementi, fare clic su di set di elementi sull'intestazione di colonna per ordinare in base al nome.

  2. Individuare l'elemento Touring Tire (con senza il secondo elemento).

  3. L'elemento Touring Tire, selezionare drill-Through, quindi selezionare colonne struttura e modello.

    Il drill-Through la finestra di dialogo consente di visualizzare le singole transazioni utilizzate come supporto per questo set di elementi.

  4. Espandere la tabella nidificata vAssocSeqLineItems per visualizzare l'elenco effettivo di acquisti nella transazione.

Per filtrare i set di elementi per supporto o per dimensione

  1. Cancellare qualsiasi testo che potrebbe essere presenti i Filtra set di elementi casella. Non è possibile utilizzare un filtro basato su testo insieme con un filtro numerico.

  2. Nel supporto minimo casella, digitare 100 e quindi fare clic sull'icona del visualizzatore.

    L'elenco dei set di elementi verrà aggiornato in modo da mostrare solo i set di elementi con supporto di almeno 100.

Torna all'inizio

Scheda Regole

Il regole scheda vengono visualizzate le informazioni seguenti relative alle regole individuate dall'algoritmo.

  • **Probabilità:**il probabilità di una regola, definita come la probabilità dell'elemento di destra in base all'elemento lato sinistro.

  • **Importanza:**una misura dell'utilità di una regola. Un valore superiore indica una regola migliore.

    L'importanza viene fornita per aiutare a misurare l'utilità di una regola, perché la probabilità da sola può essere fuorviante. Ad esempio, se ogni transazione contenesse una bottiglia d'acqua (si supponga che la bottiglia d'acqua venga aggiunta automaticamente agli acquisti di ogni cliente nell'ambito di una promozione), il modello creerebbe una regola che stima che la bottiglia di acqua dispone di una probabilità pari a 1. Sulla base della sola probabilità, questa regola è molto accurata, ma non fornisce informazioni utili.

  • **Regola:**la definizione della regola. Per un modello Market Basket, una regola descrive una specifica combinazione di elementi.

Ogni regola può essere utilizzata per fare previsioni sulla presenza di un elemento in una transazione in base alla presenza di altri elementi. Analogamente il set di elementi scheda, è possibile filtrare le regole in modo che siano visualizzate solo le regole più interessanti. Se si utilizza un modello di data mining che non dispone di regole, potrebbe essere necessario modificare i parametri dell'algoritmo per abbassare la soglia di probabilità per le regole.

Per visualizzare solo le regole che includono la bicicletta Mountain-200

  1. Nel Visualizzatore modello di Data Mining scheda, fare clic sui regole scheda.

  2. Nel regola di filtro immettere Mountain-200.

    Cancella il Mostra nomi lunghi casella di controllo.

  3. Dal Mostra elenco, selezionare Mostra solo nome dell'attributo.

    Il Visualizzatore visualizzerà solo le regole che contengono le parole "Mountain-200". La probabilità della regola indica quanto è probabile che acquista un Mountain-200 bicicletta, quella persona acquisti anche l'altro prodotto elencato.

Le regole vengono ordinate per probabilità in ordine decrescente, ma è possibile fare clic sulle intestazioni di colonna per modificare l'ordinamento. Se si è interessati a ottenere maggiori dettagli su una particolare regola, è possibile utilizzare il drill-through per visualizzare i case di supporto.

Per visualizzare i case che supportano una particolare regola

  1. Nel regole fare clic su regola che si desidera visualizzare.

  2. Selezionare drill-Through, quindi selezionare solo colonne modello, o colonne struttura e modello.

    Il drill-Through la finestra di dialogo viene fornito un riepilogo della regola nella parte superiore del riquadro e un elenco di tutti i casi che sono stati utilizzati come dati di supporto per la regola.

Torna all'inizio

Generic Content Tree Viewer

Questo visualizzatore può essere utilizzato per tutti i modelli, indipendentemente dall'algoritmo o dal tipo di modello. Il Microsoft Generic Content Tree Viewer è disponibile il Visualizzatore elenco a discesa.

Un albero del contenuto è una rappresentazione di un modello di data mining sotto forma di una serie di nodi, dove ogni nodo rappresenta le informazioni relative a un subset di dati. Il nodo può contenere un modello, un set di regole, un cluster o la definizione di un intervallo di date che condividono le stesse caratteristiche. Il contenuto esatto del nodo differisce a seconda dell'algoritmo e del tipo di attributo stimabile, ma la rappresentazione generale del contenuto è la stessa. È possibile espandere ogni nodo per aumentare il livello di dettaglio e copiare il contenuto di qualsiasi nodo negli Appunti.

Per visualizzare i dettagli sulla regola tramite Generic Content Tree Viewer

  1. Nel Visualizzatore modello di Data Mining selezionare Microsoft Generic Content Tree Viewer dal Visualizzatore elenco.

  2. Nel riquadro Didascalia nodo scorrere fino alla fine dell'elenco, quindi fare clic sull'ultimo nodo.

    Il visualizzatore mostra prima i set di elementi e quindi le regole, ma non li raggruppa. Il modo più semplice per individuare un nodo specifico è creare una query contenuto. Per altre informazioni, vedere Esempi di query sul modello di associazione.

  3. Nel riquadro Dettagli nodo esaminare il valore di NODE_TYPE e NODE_DESCRIPTION.

    Un tipo di nodo 8 è una regola e un tipo di nodo 7 è un set di elementi. Per una regola, il valore di NODE_DESCRIPTION indica le condizioni che costituiscono la regola. Per un set di elementi, il valore di NODE_DESCRIPTION indica gli elementi inclusi nel set di elementi.

È anche possibile creare una query contenuto per ottenere statistiche dettagliate sulle regole. Per ulteriori informazioni sul contenuto del modello di data mining e su come interpretarle, vedere contenuto del modello di Data Mining per i modelli di associazione ( Analysis Services - Data Mining e 41 #;.

Torna all'inizio

Attività successiva della lezione

Il filtro di una tabella nidificata in un modello di Data Mining ( esercitazione intermedia di Data Mining )

Vedere anche

Lezione 3: Compilazione di uno scenario Market Basket (Esercitazione intermedia sul data mining)
Lezione 4: Compilazione di uno Scenario di Clustering sequenza ( esercitazione intermedia di Data Mining )
Algoritmo Microsoft Association Rules
Riferimento tecnico per l'algoritmo Microsoft Association Rules