Query di stima (DMX)

In Microsoft SQL Server Analysis Services è possibile utilizzare query di stima DMX (Data Mining Extensions) per ottenere una stima dei valori di colonna sconosciuti in un nuovo set di dati, in base ai risultati di un modello di data mining.

Tipi di stima

È possibile utilizzare DMX per creare i tipi di stima seguenti:

  • Prediction join
    Consente di creare stime sui dati di input in base ai modelli esistenti nel modello di data mining. Questa istruzione di query deve essere seguita da una clausola ON che specifica le condizioni di join tra le colonne del modello di data mining e le colonne di input.

  • Natural prediction join
    Consente di creare stime basate sui nomi di colonna del modello di data mining che corrispondono esattamente a quelli nella tabella su cui si esegue la query. Questa istruzione di query non richiede la clausola ON perché la condizione di join viene generata automaticamente in base alle corrispondenze tra i nomi delle colonne di input e di quelle del modello di data mining.

  • Prediction join vuoto
    Consente di individuare le stime più probabili, senza che sia necessario specificare dati di input. Viene così restituita una stima basata unicamente sul contenuto del modello di data mining.

  • Query singleton
    Consente di creare una stima inviando i dati direttamente alla query. Questa istruzione è utile perché consente di inviare un singolo case alla query, per ottenere i risultati più rapidamente. È ad esempio possibile utilizzare questa query per stimare la probabilità che una donna sposata di 35 anni acquisti una bicicletta. Questa query non richiede un'origine dei dati esterna.

Il tipo di query da utilizzare dipende dal tipi di informazioni che si desidera ottenere dal modello. Per creare semplici stime in tempo reale, ad esempio per sapere se il profilo di un potenziale cliente su un sito Web è quello di un acquirente di biciclette, è necessario utilizzare una query singleton. Se si desidera creare un batch di stime da un set di case contenuti in un'origine dei dati, utilizzare una query di stima regolare.

Struttura della query

Per creare una query di stima in DMX è necessario combinare gli elementi seguenti:

  • SELECT [FLATTENED]

  • TOP

  • FROM <model> PREDICTION JOIN

  • ON

  • WHERE

  • ORDER BY

L'elemento SELECT di una query di stima definisce le colonne e le espressioni da includere nel set di risultati e può comprendere i dati seguenti:

  • Colonne Predict o PredictOnly del modello di data mining.

  • Qualsiasi colonna dei dati di input utilizzata per creare le stime.

  • Funzioni che restituiscono una colonna di dati.

L'elemento FROM <model> PREDICTION JOIN definisce l'origine dei dati utilizzata per creare la stima. Per una query singleton tale origine è costituita da una serie di valori assegnati alle colonne. Per un prediction join vuoto l'origine dei dati viene lasciata vuota.

L'elemento ON esegue il mapping delle colonne definite nel modello di data mining alle colonne di un set di dati esterno. Questo elemento non è necessario per la creazione di una query con prediction join vuoto o natural prediction join.

Per filtrare i risultati di una query di stima è possibile utilizzare la clausola WHERE. Per selezionare le stime con probabilità più alta è possibile utilizzare una clausola TOP o ORDER BY. Per ulteriori informazioni sull'utilizzo di queste clausole, vedere SELECT (DMX).

Per ulteriori informazioni sulla sintassi di un'istruzione di stima, vedere SELECT FROM <model> PREDICTION JOIN (DMX) e SELECT FROM <model> (DMX).