Esercitazione su DMX per Market Basket

Data creazione: 5 dicembre 2005

In questa esercitazione vengono descritte le procedure per la creazione, il training e l'esplorazione dei modelli di data mining utilizzando il linguaggio di query DMX (Data Mining Extensions). Questi modelli di data mining verranno quindi utilizzati per la creazione di stime che indicano quali prodotti tendono a essere acquistati contemporaneamente.

I modelli di data mining verranno creati a partire dai dati contenuti nel database di esempio AdventureWorksDW, in cui sono memorizzati i dati relativi alla società fittizia Adventure Works Cycles. Adventure Works Cycles è una grande società multinazionale che produce e vende biciclette in metallo e a struttura mista per i mercati di America del nord, Europa e Asia. La sede operativa si trova a Bothell, nello stato di Washington, in cui lavorano 290 dipendenti, e la società dispone di numerosi reparti vendite dislocati nelle diverse aree di mercato a livello internazionale. Per ulteriori informazioni sul database di esempio AdventureWorksDW, vedere Data warehouse di esempio AdventureWorks.

Scenario dell'esercitazione

Adventure Works Cycles ha deciso di creare un'applicazione personalizzata dotata di funzionalità di data mining per stimare quali tipi di prodotti i clienti tendono ad acquistare contemporaneamente. L'obiettivo dell'applicazione personalizzata consiste nella possibilità di specificare un set di prodotti e di stimare quali prodotti aggiuntivi verranno acquistati insieme a quelli specificati. Queste informazioni verranno quindi utilizzate da Adventure Works Cycles per aggiungere una funzionalità di suggerimento nel sito Web e ottimizzare la presentazione delle informazioni alla clientela.

Microsoft SQL Server 2005 Analysis Services (SSAS) include numerosi strumenti che possono essere utilizzati per questa attività:

DMX (Data Mining Extensions) è un linguaggio di query incluso in Analysis Services che è possibile utilizzare per creare e gestire modelli di data mining. L'algoritmo Microsoft Association crea modelli in grado di stimare quali prodotti è probabile che vengano acquistati congiuntamente.

Lo scopo di questa esercitazione consiste nel fornire le query DMX che verranno utilizzate nell'applicazione personalizzata.

Per ulteriori informazioni:Utilizzo del data mining

Struttura e modelli di data mining

Prima di iniziare a creare istruzioni DMX, è importante comprendere gli oggetti principali utilizzati da Analysis Services per creare i modelli di data mining. Per struttura di data mining si intende una struttura di dati che definisce il dominio da cui vengono generati i modelli di data mining. Una singola struttura di data mining può contenere più modelli di data mining che condividono lo stesso dominio. Un modello di data mining applica un algoritmo specifico ai dati rappresentati da una struttura di data mining.

Gli elementi fondamentali della struttura di data mining sono le relative colonne, che descrivono le informazioni contenute nell'origine dei dati. Tali colonne includono informazioni quali il tipo di dati, il tipo di contenuto e la modalità di distribuzione dei dati.

I modelli di data mining devono contenere la colonna chiave descritta nella struttura di data mining, nonché un subset delle colonne restanti. Il modello di data mining definisce l'utilizzo di ogni colonna e l'algoritmo utilizzato per creare il modello stesso. Ad esempio, in DMX è possibile specificare una colonna come colonna chiave o colonna PREDICT. Le colonne non specificate vengono considerate come colonne di input.

In DMX è possibile creare modelli di data mining in due modi, ovvero creando contemporaneamente una struttura di data mining e il modello di data mining associato mediante l'istruzione CREATE MINING MODEL oppure creando prima una struttura di data mining con l'istruzione CREATE MINING STRUCTURE e quindi aggiungendo un modello di data mining alla struttura mediante l'istruzione ALTER STRUCTURE. Questi metodi sono descritti di seguito.

  • CREATE MINING MODEL
    Questa istruzione consente di creare contemporaneamente una struttura di data mining e il modello di data mining associato utilizzando lo stesso nome. Al nome del modello di data mining viene aggiunto il suffisso "Structure" per differenziarlo dalla struttura di data mining. Questa istruzione è utile quando si crea una struttura di data mining che conterrà un unico modello di data mining.

    Per ulteriori informazioni, vedere CREATE MINING MODEL (DMX).

  • ALTER MINING STRUCTURE
    Questa istruzione consente di aggiungere un modello di data mining a una struttura di data mining già esistente sul server. È utile se si desidera creare una struttura di data mining contenente più modelli di data mining. L'esigenza di aggiungere più modelli di data mining in un'unica struttura di data mining può essere dettata da numerose ragioni. È possibile ad esempio creare più modelli di data mining con algoritmi diversi per stabilire quale di essi funziona meglio oppure creare più modelli di data mining con lo stesso algoritmo, ma impostando un parametro in modo diverso in ogni modello per individuare l'impostazione ottimale per il parametro.

    Per ulteriori informazioni, vedere ALTER MINING STRUCTURE (DMX).

In questa esercitazione si utilizzerà il secondo metodo poiché si creerà una struttura di data mining contenente diversi modelli di data mining.

Ulteriori informazioni

Guida di riferimento a DMX (Data Mining Extensions), Informazioni sull'istruzione Select (DMX), Query di stima (DMX)

Lezioni dell'esercitazione

L'esercitazione è suddivisa nelle lezioni seguenti:

Requisiti

Prima di eseguire l'esercitazione, verificare che sia installato quanto segue:

[!NOTA] Per la consultazione delle esercitazioni è consigliabile aggiungere i pulsanti Argomento precedente e Argomento successivo alla barra degli strumenti dell'applicazione utilizzata per visualizzare i documenti. Per ulteriori informazioni, vedere Aggiunta dei pulsanti Argomento precedente e Argomento successivo alla Guida in linea.

Vedere anche

Concetti

Esercitazione su DMX per Bike Buyer
Esercitazione sul data mining

Altre risorse

Concetti di base sul data mining

Guida in linea e informazioni

Assistenza su SQL Server 2005