Lezione 1: Creazione della struttura di data mining Bike Buyer

Articolo
03/03/2017

Si applica a: SQL Server 2016 Preview

In questa lezione verrà creata una struttura di data mining che consente di stimare se un potenziale cliente di Adventure Works Cycles acquisterà una bicicletta. Se non si ha familiarità con strutture di data mining e il relativo ruolo nel data mining, vedere strutture di Data Mining ( Analysis Services - Data Mining e 41 #;.

Struttura di data mining Bike Buyer che verrà creato in questa lezione supporta l'aggiunta di modelli di data mining in base il algoritmo Microsoft Clustering algoritmo Microsoft Decision Trees. Nelle lezioni successive si utilizzeranno i modelli di data mining di clustering per esaminare le diverse modalità di raggruppamento dei clienti e si utilizzeranno modelli di data mining di albero delle decisioni per stimare se un potenziale cliente acquisterà una bicicletta.

Istruzione CREATE MINING STRUCTURE

Per creare una struttura di data mining, utilizzare il DMX CREATE MINING STRUCTURE ( ) istruzione. Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

Denominazione della struttura.
Definizione della colonna chiave.
Definizione delle colonne di data mining.
Definizione di un set di dati di testing facoltativo.

Di seguito è riportato un esempio generico dell'istruzione CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)

La prima riga del codice definisce il nome della struttura:

CREATE MINING STRUCTURE [<mining structure name>]

Per informazioni sulla denominazione di un oggetto in DMX Data Mining Extensions (), vedere identificatori ( DMX ).

La riga successiva del codice definisce la colonna chiave per la struttura di data mining, che identifica in modo univoco un'entità nei dati di origine:

<key column>,

In questa struttura di data mining creata, l'identificatore del cliente, CustomerKey, definisce un'entità nei dati di origine.

La riga successiva del codice è utilizzata per definire le colonne di data mining che verranno utilizzate dai modelli di data mining associati alla struttura di data mining:

<mining structure columns>

È possibile utilizzare la funzione DISCRETIZE in discretizzare colonne continue utilizzando la sintassi seguente:

DISCRETIZE(<method>,<number of buckets>)

Per ulteriori informazioni sulla discretizzazione delle colonne, vedere metodi di discretizzazione ( Data Mining ). Per ulteriori informazioni sui tipi di che è possibile definire le colonne della struttura di data mining, vedere colonne della struttura di Data Mining.

L'ultima riga del codice definisce una partizione facoltativa nella struttura di data mining:

WITH HOLDOUT (<holdout specifier>)

Specificare alcuni dati da utilizzare per testare i modelli di data mining correlati alla struttura e i rimanenti dati da utilizzare per il training dei modelli. Per impostazione predefinita, in Analysis Services viene creato un set di dati di test che contiene il 30% di tutti i dati dei case. È necessario aggiungere la specifica che i set di dati di test devono contenere il 30% dei case fino a un massimo di 1000 case. Se il 30% dei case è minore di 1000, il set di dati di test conterrà la quantità inferiore.

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

Creazione di una nuova query vuota.
Modifica della query per creare la struttura di data mining.
Esecuzione della query.

Creazione della query

Il primo passaggio consiste nella connessione a un'istanza di Analysis Services e nella creazione di una nuova query DMX in SQL Server Management Studio.

Per creare una nuova query DMX in SQL Server Management Studio

Aprire SQL Server Management Studio.
Nel Connetti al Server nella finestra di dialogo per tipo di Server, selezionare Analysis Services. In nome Server, tipo LocalHost, oppure digitare il nome dell'istanza di Analysis Services che si desidera connettersi a fini di questa lezione. Fare clic su Connetti.
In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, e quindi fare clic su DMX per aprire il dell'Editor di Query e una nuova query vuota.

Modifica della query

Il passaggio successivo consiste nella modifica dell'istruzione CREATE MINING STRUCTURE descritta in precedenza per creare la struttura di data mining Bike Buyer.

Per personalizzare l'istruzione CREATE MINING STRUCTURE

Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING STRUCTURE nella query vuota.
Sostituire quanto segue:
```
[<mining structure>]   
```
con:
```
[Bike Buyer]  
```
Sostituire quanto segue:
```
<key column>   
```
con:
```
CustomerKey LONG KEY  
```

Sostituire quanto segue:

<mining structure columns>

con:

[Age] LONG DISCRETIZED(Automatic,10),  
[Bike Buyer] LONG DISCRETE,  
[Commute Distance] TEXT DISCRETE,  
[Education] TEXT DISCRETE,  
[Gender] TEXT DISCRETE,  
[House Owner Flag] TEXT DISCRETE,  
[Marital Status] TEXT DISCRETE,  
[Number Cars Owned] LONG DISCRETE,  
[Number Children At Home] LONG DISCRETE,  
[Occupation] TEXT DISCRETE,  
[Region] TEXT DISCRETE,  
[Total Children]LONG DISCRETE,  
[Yearly Income] DOUBLE CONTINUOUS

Sostituire quanto segue:

WITH HOLDOUT (holdout specifier>)

con:

WITH HOLDOUT (30 PERCENT or 1000 CASES)

L'istruzione della struttura di data mining completa dovrebbe essere la seguente:

CREATE MINING STRUCTURE [Bike Buyer]  
(  
   [Customer Key] LONG KEY,  
   [Age]LONG DISCRETIZED(Automatic,10),  
   [Bike Buyer] LONG DISCRETE,  
   [Commute Distance] TEXT DISCRETE,  
   [Education] TEXT DISCRETE,  
   [Gender] TEXT DISCRETE,  
   [House Owner Flag] TEXT DISCRETE,  
   [Marital Status] TEXT DISCRETE,  
   [Number Cars Owned]LONG DISCRETE,  
   [Number Children At Home]LONG DISCRETE,  
   [Occupation] TEXT DISCRETE,  
   [Region] TEXT DISCRETE,  
   [Total Children]LONG DISCRETE,  
   [Yearly Income] DOUBLE CONTINUOUS  
)  
WITH HOLDOUT (30 PERCENT or 1000 CASES)

Nel File menu, fare clic su Salva Dmxquery1.
Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file Bike Buyer Structure.

Esecuzione della query

Il passaggio conclusivo consiste nell'esecuzione della query. Dopo la creazione e il salvataggio di una query, è necessario eseguirla. Ovvero, l'istruzione deve essere eseguita per creare la struttura di data mining nel server. Per ulteriori informazioni sull'esecuzione di query nell'Editor di Query, vedere Editor di Query del motore di Database ( SQL Server Management Studio ).

Per eseguire la query

Nell'Editor di Query, sulla barra degli strumenti, fare clic su Execute.

Lo stato della query viene visualizzato nel messaggi scheda nella parte inferiore dell'Editor di Query al termine dell'esecuzione dell'istruzione. Dovrebbero essere visualizzati i messaggi seguenti:
```
Executing the query   
Execution complete  
```
Una nuova struttura denominata Bike Buyer ora esistente nel server.

Nella lezione successiva verranno aggiunti modelli di data mining alla struttura appena creata.

Lezione successiva

Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Bike Buyer