Esercitazione di base sul data mining

 

Si applica a: SQL Server 2016 Preview

Benvenuti il Microsoft Analysis Services esercitazione di base di Data Mining. Microsoft SQL Server fornisce un ambiente integrato per la creazione di modelli di data mining e l'esecuzione di stime. In questa esercitazione, si verrà completato uno scenario per una campagna di mailing diretto in cui viene utilizzato l'apprendimento automatico per analizzare e stimare il comportamento di acquisto cliente. Verrà illustrato come utilizzare tre degli algoritmi di data mining più importanti: clustering, alberi delle decisioni e Naive Bayes. Si apprenderà inoltre come analizzare i risultati mediante visualizzatori dei modelli di data mining e creare stime e grafici di accuratezza utilizzando strumenti di data mining inclusi in Microsoft SQL Server Analysis Services. La società fittizia Adventure Works Cycles verrà utilizzata per tutti gli esempi.

Se si ha familiarità con gli strumenti di data mining, si consiglia di completare anche il esercitazione intermedia sul Data Mining ( Analysis Services - Data Mining e 41 #;. Nelle lezioni viene illustrato come utilizzare le previsioni, l'analisi Market basket, la serie temporale, i modelli di associazione, le tabelle nidificate e il clustering delle sequenze.

Scenario dell'esercitazione

In questa esercitazione si è un dipendente di Adventure Works Cycles cui è stata l'incarico di acquisire ulteriori informazioni sui clienti dell'azienda in base a cronologia degli acquisti e quindi utilizzare tali dati per eseguire stime che possono essere utilizzate nelle iniziative di marketing. L'azienda non ha mai eseguito operazioni di data mining, quindi è necessario creare un nuovo database specifico e impostare diversi modelli di data mining.

Lezioni dell'esercitazione

Questa esercitazione spiega come creare e utilizzare diversi tipi di metodi di apprendimento automatici. Verrà inoltre illustrato come creare la copia di un modello di data mining e come applicare un filtro ai dati di input per ottenere risultati diversi. Successivamente, sarà possibile confrontare i risultati di entrambi i modelli utilizzando un grafico di accuratezza. Infine, verrà utilizzata la funzione di drill-through per recuperare dati aggiuntivi dalla struttura di data mining sottostante.

Microsoft Analysis Services Data Mining include le seguenti funzionalità che consentono di sviluppare e confrontare più modelli predittivi e intraprendere le azioni sui risultati:

  • Set di Test -quando si crea una struttura di data mining, è ora possibile dividere i dati nella struttura di data mining in set di training e di testing. Ciò consente di testare i modelli in base a set di dati simili e di confrontare l'accuratezza di modelli correlati.

  • -Filtri dei modelli di data miningè ora possibile associare filtri a un modello di data mining e applicarli durante il training e il testing. Ciò consente di compilare facilmente modelli correlati in base a subset di dati diversi.

  • Drill-through ai case della struttura e le colonne della struttura - è possibile ora spostarsi facilmente dagli schemi generali del modello di data mining ai dettagli utilizzabili nell'origine dati.

L'esercitazione è suddivisa nelle lezioni seguenti:

Lezione 1: Preparare il Database di Analysis Services ( Esercitazione di base di Data Mining )
In questa lezione verranno illustrate le procedure per la creazione di un nuovo database Analysis Services, l'aggiunta di un'origine dei dati a una vista origine dati e la preparazione del nuovo database per l'utilizzo con il data mining.

Lezione 2: Creazione di una struttura di Mailing diretto ( Esercitazione di base di Data Mining )
In questa lezione verranno illustrate le procedure per la creazione di una struttura di modello di data mining che può essere utilizzata nello scenario relativo al mailing diretto.

Lezione 3: Aggiunta ed elaborazione di modelli
In questa lezione verranno illustrate le procedure per l'aggiunta di modelli a una struttura. I modelli creati verranno compilati con gli algoritmi seguenti:

  • Microsoft Decision Trees

  • Microsoft Clustering

  • Microsoft Naive Bayes

Lezione 4: Esplorazione dei modelli di Mailing ( Esercitazione di base di Data Mining )
In questa lezione verranno illustrate le procedure per l'esplorazione e l'interpretazione dei risultati di ogni modello mediante i visualizzatori.

Lezione 5: Test di modelli ( Esercitazione di base di Data Mining )
In questa lezione verranno illustrate le procedure per creare una copia di uno dei modelli di mailing diretto, aggiungere un filtro del modello di data mining per limitare i dati di training a un particolare set di clienti e valutare l'affidabilità del modello.

Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)
In questa lezione finale dell'esercitazione di base sul data mining si utilizzerà il modello per individuare i clienti che con maggiore probabilità acquisteranno una bicicletta. Verrà quindi eseguito il drill-through nei case sottostanti per ottenere informazioni di contatto.

Requisiti

Verificare che sia installato quanto segue:

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services in modalità multidimensionale

  • Database AdventureWorksDW2012.

Per garantire una maggiore sicurezza, i database di esempio non vengono installati con SQL Server. Per installare i database ufficiali per Microsoft SQL Server, visitare il Microsoft SQL Sample Databases pagina e selezionare SQL Server 2016.

Vedere anche

Soluzioni di data mining
Attività e procedure relative al modello di data mining
Creazione ed esecuzione di query sui modelli di data mining con DMX: esercitazioni (Analysis Services - Data mining)