<source data query>

Per eseguire il training di un modello di data mining e creare stime basate su un modello di data mining, è necessario accedere a dati esterni al database di Microsoft SQL Server Analysis Services. In DMX (Data Mining Extensions) si utilizza la clausola <source data query> per definire i dati esterni. Le istruzioni INSERT INTO (DMX), SELECT FROM <model> PREDICTION JOIN (DMX) e SELECT FROM NATURAL PREDICTION JOIN utilizzano tutte <source data query>.

Tipi di query

I tre modi più comuni per specificare i dati di origine sono i seguenti:

  • OPENQUERY (DMX)
    Questa istruzione consente di eseguire una query su dati esterni a un'istanza di Analysis Services, utilizzando un'origine dei dati esistente.

    Anche se OPENQUERY svolge funzioni analoghe a quelle di OPENROWSET, OPENQUERY offre i vantaggi seguenti:

    • La creazione di una query DMX con OPENQUERY è molto più semplice. Anziché creare una nuova stringa di connessione ogni volta che si scrive una query, è possibile avvalersi della stringa di connessione esistente nell'origine dei dati. L'oggetto origine dei dati consente inoltre di controllare l'accesso ai dati per i singoli utenti.

    • L'amministratore dispone di un maggiore controllo sulla modalità di accesso ai dati sul server. Può ad esempio stabilire quali provider caricare nel server e a quali dati esterni è possibile accedere.

  • OPENROWSET (DMX)
    Questa istruzione consente di eseguire una query su dati esterni a un'istanza di Analysis Services, utilizzando un'origine dei dati esistente.

  • SHAPE (DMX)
    Questa istruzione consente di eseguire query su più origini dei dati per creare una tabella nidificata. Tramite SHAPE è possibile combinare dati da più origini in una singola tabella gerarchica. In questo modo è possibile avvalersi della capacità di Analysis Services di nidificare tabelle incorporando una tabella in un'altra tabella.

Per specificare i dati di origine è inoltre possibile utilizzare uno degli elementi seguenti:

  • Qualsiasi istruzione DMX valida

  • Qualsiasi istruzione MDX (Multidimensional Expressions) valida

  • Una tabella che restituisce una stored procedure

  • Un set di righe di XML for Analysis (XMLA)

  • Un parametro di set di righe