Esercitazione su DMX per Market Basket

In questa esercitazione vengono descritte le procedure per la creazione, il training e l'esplorazione dei modelli di data mining utilizzando il linguaggio di query DMX (Data Mining Extensions). Questi modelli di data mining verranno quindi utilizzati per la creazione di stime che indicano quali prodotti tendono a essere acquistati contemporaneamente.

I modelli di data mining verranno creati a partire dai dati contenuti nel database di esempio AdventureWorksDW2008, in cui sono memorizzati i dati relativi alla società fittizia Adventure Works Cycles. Adventure Works Cycles è una grande società multinazionale che produce e vende biciclette in metallo e a struttura mista per i mercati di America del nord, Europa e Asia. La sede operativa si trova a Bothell, nello stato di Washington, in cui lavorano 290 dipendenti, e la società dispone di numerosi reparti vendite dislocati nelle diverse aree di mercato a livello internazionale.

Scenario dell'esercitazione

Adventure Works Cycles ha deciso di creare un'applicazione personalizzata dotata di funzionalità di data mining per stimare quali tipi di prodotti i clienti tendono ad acquistare contemporaneamente. L'obiettivo dell'applicazione personalizzata consiste nella possibilità di specificare un set di prodotti e di stimare quali prodotti aggiuntivi verranno acquistati insieme a quelli specificati. Queste informazioni verranno quindi utilizzate da Adventure Works Cycles per aggiungere una funzionalità di suggerimento nel sito Web e ottimizzare la presentazione delle informazioni alla clientela.

MicrosoftSQL ServerAnalysis Services include numerosi strumenti che possono essere utilizzati per questa attività:

DMX (Data Mining Extensions) è un linguaggio di query incluso in Analysis Services che è possibile utilizzare per creare e gestire modelli di data mining. L'algoritmo Microsoft Association crea modelli in grado di stimare quali prodotti è probabile che vengano acquistati congiuntamente.

Lo scopo di questa esercitazione consiste nel fornire le query DMX che verranno utilizzate nell'applicazione personalizzata.

Per ulteriori informazioni, vedereProgetti di data mining (Analysis Services - Data mining)

Struttura e modelli di data mining

Prima di iniziare a creare istruzioni DMX, è importante comprendere gli oggetti principali utilizzati da Analysis Services per creare i modelli di data mining. Per struttura di data mining si intende una struttura di dati che definisce il dominio da cui vengono generati i modelli di data mining. Un'unica struttura di data mining può contenere più modelli di data mining che condividono lo stesso dominio. Un modello di data mining applica un algoritmo specifico ai dati rappresentati da una struttura di data mining.

Gli elementi fondamentali della struttura di data mining sono le relative colonne, che descrivono le informazioni contenute nell'origine dei dati. Tali colonne includono informazioni quali il tipo di dati, il tipo di contenuto e la modalità di distribuzione dei dati.

I modelli di data mining devono contenere la colonna chiave descritta nella struttura di data mining, nonché un subset delle colonne restanti. Il modello di data mining definisce l'utilizzo di ogni colonna e l'algoritmo utilizzato per creare il modello stesso. Ad esempio, in DMX è possibile specificare una colonna come colonna chiave o colonna PREDICT. Le colonne non specificate vengono considerate come colonne di input.

In DMX è possibile creare modelli di data mining in due modi, ovvero creando contemporaneamente una struttura di data mining e il modello di data mining associato mediante l'istruzione CREATE MINING MODEL oppure creando prima una struttura di data mining con l'istruzione CREATE MINING STRUCTURE e quindi aggiungendo un modello di data mining alla struttura mediante l'istruzione ALTER STRUCTURE. Questi metodi sono descritti di seguito.

  • CREATE MINING MODEL
    Questa istruzione consente di creare contemporaneamente una struttura di data mining e il modello di data mining associato utilizzando lo stesso nome. Al nome del modello di data mining viene aggiunto il suffisso "Structure" per differenziarlo dalla struttura di data mining.

    Questa istruzione è utile quando si crea una struttura di data mining che conterrà un unico modello di data mining.

    Per ulteriori informazioni, vedere CREATE MINING MODEL (DMX).

  • CREATE MINING STRUCTURE
    Utilizzare questa istruzione per creare una nuova struttura di data mining senza modelli.

    Quando si utilizza CREATE MINING STRUCTURE, è inoltre possibile creare un set di dati di controllo che può essere utilizzato per il testing dei modelli basati sulla stessa struttura di data mining.

    Per ulteriori informazioni, vedere CREATE MINING STRUCTURE (DMX).

  • ALTER MINING STRUCTURE
    Questa istruzione consente di aggiungere un modello di data mining a una struttura di data mining già esistente sul server.

    L'esigenza di aggiungere più modelli di data mining in un'unica struttura di data mining può essere dettata da numerose ragioni. È possibile ad esempio creare più modelli di data mining con algoritmi diversi per stabilire quale di essi funziona meglio oppure creare più modelli di data mining che utilizzano lo stesso algoritmo, ma impostando un parametro in modo diverso in ogni modello per individuare l'impostazione ottimale per il parametro.

    Per ulteriori informazioni, vedere ALTER MINING STRUCTURE (DMX).

In questa esercitazione si utilizzerà il secondo metodo poiché si creerà una struttura di data mining contenente diversi modelli di data mining.

Ulteriori informazioni

Guida di riferimento a DMX (Data Mining Extensions), Informazioni sull'istruzione Select (DMX), Query di stima (DMX)

Lezioni dell'esercitazione

L'esercitazione è suddivisa nelle lezioni seguenti:

Requisiti

Prima di eseguire l'esercitazione, verificare che sia installato quanto segue:

  • MicrosoftSQL Server

  • MicrosoftSQL ServerAnalysis Services

  • Database AdventureWorks2008.

Per una maggiore protezione, i database di esempio non vengono installati per impostazione predefinita. Per installare i database di esempio ufficiali per MicrosoftSQL Server, visualizzare la pagina https://www.CodePlex.com/MSFTDBProdSamples o nella sezione Microsoft SQL Server Product Samples della home page di Microsoft SQL Server Samples and Community Projects. Fare clic su Database, quindi fare clic sulla scheda Releases e selezionare i database desiderati.

[!NOTA]

Per la consultazione delle esercitazioni è consigliabile aggiungere i pulsanti Argomento precedente e Argomento successivo alla barra degli strumenti dell'applicazione utilizzata per visualizzare i documenti. Per ulteriori informazioni, vedere Aggiunta dei pulsanti Argomento precedente e Argomento successivo alla Guida.