SELECT (DMX)

Nel data mining l'istruzione DMX (Data Mining Extensions) SELECT viene utilizzata per le attività seguenti:

  • Visualizzazione del contenuto di un modello di data mining esistente

  • Creazione di stime da un modello di data mining esistente.

  • Creazione di una copia di un modello di data mining esistente.

  • Visualizzazione della struttura di data mining

Sebbene la sintassi completa di questa istruzione sia complessa, le principali clausole utilizzate per la visualizzazione di un modello e della struttura sottostante possono essere riepilogate come segue:

SELECT [FLATTENED] [TOP <n>] <select list>
FROM <model/structure>[.aspect]
[WHERE <condition expression>]
[ORDER BY <expression>[DESC|ASC]]

FLATTENED

Alcuni client di data mining non possono accettare set di risultati in formato gerarchico da un provider di data mining. Il client potrebbe non essere in grado di gestire una gerarchia o potrebbe essere necessario archiviare i risultati in una singola tabella denormalizzata. Per convertire i dati da tabelle nidificate in tabelle in formato flat, è necessario richiedere che i risultati della query siano convertiti in formato flat.

Per convertire i risultati della query in formato flat, utilizzare la sintassi SELECT con l'opzione FLATTENED, come mostrato nell'esempio seguente:

SELECT FLATTENED <select list> FROM ...

TOP &lt;n&gt; e ORDER BY

È possibile ordinare i risultati di una query utilizzando un'espressione e quindi restituire un subset dei risultati utilizzando una combinazione delle clausole ORDER BY e TOP. Questo è utile ad esempio in uno scenario di mailing diretto in cui si desidera inviare i risultati solo ai destinatari che hanno la maggiore probabilità di rispondere. È possibile ordinare per probabilità i risultati di una query di stima per il mailing diretto e quindi restituire solo i primi <n> risultati.

Elenco di selezione

<select list> può includere riferimenti a colonne scalari, funzioni di stima ed espressioni. Le opzioni disponibili variano in base all'algoritmo e ai contesti seguenti:

  • È in corso l'esecuzione di una query su una struttura di data mining o su un modello di data mining

  • È in corso l'esecuzione di una query sul contenuto o sui case

  • L'origine dati è una tabella relazionale o un cubo

  • È in corso l'esecuzione di stime

In molti casi, è possibile utilizzare alias o creare espressioni semplici basate sugli elementi nell'elenco di selezione. Nell'esempio seguente viene illustrata un'espressione nelle colonne del modello:

SELECT [CustomerID], [Last Name] + ', ' + [FirstName] AS FullName
FROM <model>.CASES

Nell'esempio seguente viene creato un alias per una colonna che contiene i risultati di una funzione di stima:

SELECT Predict([Column1], 'Value') as Column1Prediction
FROM MyModel
JOIN <source data query>

WHERE

È possibile limitare i case restituiti dalla query utilizzando una clausola WHERE. La clausola WHERE specifica che i riferimenti a colonne nell'espressione WHERE devono avere la stessa semantica di quelli presenti nell'argomento <select list> dell'istruzione SELECT e possono restituire solo un'espressione booleana. La sintassi della clausola WHERE è la seguente:

WHERE < condition expression >

L'elenco di selezione e la clausola WHERE di un'istruzione SELECT devono rispettare le seguenti regole:

  • L'elenco di selezione deve contenere un'espressione che non restituisce un risultato booleano. L'espressione può essere modificata, ma deve comunque restituire risultati non booleani.

  • La clausola WHERE deve contenere un'espressione che restituisce un risultato booleano. La clausola può essere modificata, ma deve comunque restituire un risultato booleano.

Stime

Esistono due tipi di sintassi che è possibile utilizzare per la creazione di stime:

Il primo tipo consente di creare stime complesse in tempo reale o in batch.

Il secondo consente di creare un prediction join vuoto su una colonna stimabile in un modello di data mining e restituisce lo stato più probabile della colonna. I risultati di questa query sono completamente basati sul contenuto del modello di data mining.

È possibile inserire un'istruzione SELECT nella query di origine di un'istruzione SELECT FROM PREDICTION JOIN utilizzando la sintassi riportata di seguito.

SELECT FROM PREDICTION JOIN (<SELECT statement>) AS t, WHERE <SELECT statement>

Per ulteriori informazioni sulla creazione di query di stima, vedere Query di stima (DMX).

Sintassi delle clausole

A causa della complessità della visualizzazione tramite l'istruzione SELECT, gli elementi della sintassi e gli argomenti sono descritti in dettaglio in base alla clausola. Per ulteriori informazioni su ciascuna clausola, fare clic su un argomento indicato nell'elenco seguente:

SELECT DISTINCT FROM <model > (DMX)

SELECT FROM <model>.CONTENT (DMX)

SELECT FROM <model>.CASES (DMX)

SELECT FROM <model>.SAMPLE_CASES (DMX)

SELECT FROM <model>.DIMENSION_CONTENT (DMX)

SELECT FROM <model> PREDICTION JOIN (DMX)

SELECT FROM <model> (DMX)

SELECT FROM <structure>.CASES