Esercitazione su DMX per Bike Buyer

In questa esercitazione vengono descritte le procedure per la creazione, il training e l'esplorazione di modelli di data mining utilizzando il linguaggio di query DMX (Data Mining Extensions). Questi modelli di data mining verranno quindi utilizzati per la creazione di stime relative alla probabilità che un cliente acquisti una bicicletta.

I modelli di data mining verranno creati a partire dai dati contenuti nel database di esempio AdventureWorksDW2008R2, in cui sono memorizzati i dati relativi alla società fittizia Adventure Works Cycles. Adventure Works Cycles è una grande società multinazionale che produce e vende biciclette in metallo e a struttura mista per i mercati di America del nord, Europa e Asia. La sede operativa si trova a Bothell, nello stato di Washington, in cui lavorano 290 dipendenti, e la società dispone di numerosi reparti vendite dislocati nelle diverse aree di mercato a livello internazionale. Per ulteriori informazioni sul database di esempio AdventureWorksDW2008R2, vedere Data warehouse di esempio Adventure Works.

Scenario dell'esercitazione

Adventure Works Cycles ha deciso di espandere la propria struttura di analisi dei dati creando un'applicazione personalizzata dotata di funzionalità di data mining. Gli obiettivi dell'applicazione personalizzata sono i seguenti:

  • Utilizzare come input determinate caratteristiche di un potenziale cliente e stimare se tale cliente acquisterà una bicicletta.

  • Utilizzare come input un elenco di potenziali clienti con le relative caratteristiche e stimare quali di essi acquisteranno una bicicletta.

Nel primo caso i dati dei clienti sono tratti da una pagina di registrazione dei clienti, mentre nel secondo caso l'elenco dei potenziali clienti viene fornito dal reparto marketing di Adventure Works Cycles.

Il reparto marketing ha inoltre l'esigenza di raggruppare i clienti esistenti in categorie sulla base di caratteristiche quali il luogo di residenza, il numero di figli e la distanza dal luogo di lavoro per stabilire se tali gruppi possono essere utilizzati per la definizione di offerte mirate a specifiche tipologie di clientela. Questo richiederà un ulteriore modello di data mining.

In Microsoft SQL Server Analysis Services sono disponibili numerosi strumenti che possono essere utilizzati per eseguire queste attività:

DMX (Data Mining Extensions) è un linguaggio di query incluso in Analysis Services che è possibile utilizzare per creare e gestire modelli di data mining. L'algoritmo Microsoft Decision Trees consente di creare modelli che possono essere utilizzati per stimare se una persona acquisterà una bicicletta. Il modello risultante può utilizzare un singolo cliente o una tabella di clienti come input. L'algoritmo Microsoft Clustering consente di creare raggruppamenti di clienti in base a caratteristiche condivise. Lo scopo di questa esercitazione consiste nel fornire gli script DMX che verranno utilizzati nell'applicazione personalizzata.

Per ulteriori informazioni:Progetti di data mining (Analysis Services - Data mining)

Struttura e modelli di data mining

Prima di iniziare a creare istruzioni DMX, è importante comprendere gli oggetti principali utilizzati da Analysis Services per creare i modelli di data mining. Per struttura di data mining si intende una struttura di dati che definisce il dominio da cui vengono compilati i modelli di data mining. Una singola struttura di data mining può contenere più modelli di data mining che condividono lo stesso dominio. Un modello di data mining applica un algoritmo specifico ai dati rappresentati da una struttura di data mining.

Gli elementi di compilazione della struttura di data mining sono le relative colonne, che descrivono le informazioni contenute nell'origine dei dati. Tali colonne includono informazioni quali il tipo di dati, il tipo di contenuto e la modalità di distribuzione dei dati.

I modelli di data mining devono contenere la colonna chiave descritta nella struttura di data mining, nonché un subset delle colonne restanti. Il modello di data mining definisce l'utilizzo di ogni colonna e l'algoritmo utilizzato per creare il modello stesso. Ad esempio, in DMX è possibile specificare una colonna come colonna chiave o colonna PREDICT. Le colonne non specificate vengono considerate come colonne di input.

In DMX è possibile creare modelli di data mining in due modi, ovvero creando contemporaneamente una struttura di data mining e il modello di data mining associato mediante l'istruzione CREATE MINING MODEL oppure creando prima una struttura di data mining con l'istruzione CREATE MINING STRUCTURE e quindi aggiungendo un modello di data mining alla struttura mediante l'istruzione ALTER STRUCTURE. Questi metodi sono descritti nella tabella seguente.

  • CREATE MINING MODEL
    Questa istruzione consente di creare contemporaneamente una struttura di data mining e il modello di data mining associato utilizzando lo stesso nome. Al nome del modello di data mining viene aggiunto il suffisso "Structure" per differenziarlo dalla struttura di data mining. Questa istruzione è utile quando si crea una struttura di data mining che conterrà un unico modello di data mining.

    Per ulteriori informazioni, vedere CREATE MINING MODEL (DMX).

  • ALTER MINING STRUCTURE
    Questa istruzione consente di aggiungere un modello di data mining a una struttura di data mining già esistente sul server. È utile se si desidera creare una struttura di data mining contenente più modelli di data mining. L'esigenza di aggiungere più modelli di data mining in un'unica struttura di data mining può essere dettata da numerose ragioni. È possibile ad esempio creare più modelli di data mining che utilizzano algoritmi diversi per stabilire quale algoritmo funziona meglio oppure creare più modelli di data mining che utilizzano lo stesso algoritmo, ma impostando un parametro in modo diverso in ogni modello per individuare l'impostazione ottimale per il parametro.

    Per ulteriori informazioni, vedere ALTER MINING STRUCTURE (DMX).

In questa esercitazione si utilizzerà il secondo metodo poiché si creerà una struttura di data mining contenente diversi modelli di data mining.

Ulteriori informazioni

Guida di riferimento a DMX (Data Mining Extensions), Informazioni sull'istruzione Select (DMX), Query di stima (DMX)

Lezioni dell'esercitazione

L'esercitazione è suddivisa nelle lezioni seguenti:

Requisiti

Prima di eseguire l'esercitazione, verificare che sia installato quanto segue:

  • Microsoft SQL Server 

  • Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS) o SQL Server Analysis Services 

  • Il database AdventureWorksDW2008R2. Per una maggiore sicurezza, i database di esempio non vengono installati per impostazione predefinita. Per installare i database di esempio ufficiali per Microsoft SQL Server, visitare la pagina Web Microsoft SQL Sample Databases e selezionare i database da installare. Per ulteriori informazioni sull'installazione dei database di esempio, vedere Installazione iniziale (Analysis Services).

Nota

Per la consultazione delle esercitazioni è consigliabile aggiungere i pulsanti Argomento precedente e Argomento successivo alla barra degli strumenti dell'applicazione utilizzata per visualizzare i documenti. Per ulteriori informazioni, vedere Aggiunta dei pulsanti Argomento precedente e Argomento successivo alla Guida.