Share via


Personalizzazione ed elaborazione del modello di previsione (Esercitazione intermedia sul data mining)

 

Si applica a: SQL Server 2016 Preview

L'algoritmo Microsoft Time Series fornisce parametri che influiscono sulle modalità di creazione di un modello e di analisi dei dati temporali. La modifica di queste proprietà può influire in modo significativo sul modo in cui il modello di data mining esegue le stime.

In questa attività dell'esercitazione si modificherà il modello nel modo seguente:

  1. Si personalizzerà il modo in cui il modello gestisce i periodi di tempo aggiungendo un nuovo valore per il PERIODICITY_HINT parametro.

  2. Si conosceranno altri due importanti parametri per l'algoritmo Microsoft Time Series: FORECAST_METHOD che consente di controllare il metodo utilizzato per la previsione e PREDICTION_SMOOTHING che consente di personalizzare la combinazione di stime a lungo e breve termine.

  3. Facoltativamente, si indicherà in che modo si desidera che l'algoritmo attribuisca i valori mancanti.

  4. Dopo avere apportato tutte le modifiche, si procederà alla distribuzione e all'elaborazione del modello.

Impostazione dei parametri di Time Series

Hint di periodicità

Il PERIODICITY_HINT parametro fornisce all'algoritmo informazioni sui periodi di tempo aggiuntivi previsti nei dati. Per impostazione predefinita, i modelli Time Series tenteranno di rilevare automaticamente un modello nei dati. Se tuttavia si conosce già il ciclo temporale previsto, l'indicazione di un hint di periodicità può migliorare potenzialmente l'accuratezza del modello. Se si fornisce tuttavia l'hint di periodicità errato, l'accuratezza può diminuire. Di conseguenza, in caso di dubbi sul valore da utilizzare, è preferibile utilizzare il valore predefinito.

Ad esempio, la vista utilizzata per questo modello aggrega dati di vendita da Adventure Works DW Multidimensional 2012 su base mensile. Ogni intervallo di tempo utilizzato dal modello rappresenta pertanto un mese e tutte le stime saranno anch'esse indicate in termini di mesi. Poiché ci sono 12 mesi in un anno e si prevede che modelli di vendita ripetano più o meno su base annuale, si imposterà il PERIODICITY_HINT parametro 12, per indicare che 12 intervalli di tempo (mesi) costituiscono un ciclo di vendite completo.

Metodo di previsione

Il FORECAST_METHOD parametro controlla se l'algoritmo time series è ottimizzato per le stime a breve termine o a lungo termine. Per impostazione predefinita, il FORECAST_METHOD parametro è impostato su MIXED, il che significa che due diversi algoritmi vengono combinati e bilanciati per fornire risultati ottimali per la stima sia a breve termine e a lungo termine.

Se tuttavia si desidera utilizzare un algoritmo particolare, è possibile modificare il valore in ARIMA o ARTXP.

Ponderazione tra stime a lungo termine rispetto a stime a breve termine

È inoltre possibile personalizzare la modalità di combinazione delle stime a lungo e a breve termine tramite il parametro PREDICTION_SMOOTHING. Per impostazione predefinita, questo parametro è impostato su 0,5, che generalmente fornisce il miglior bilanciamento per l'accuratezza complessiva.

Per modificare i parametri dell'algoritmo

  1. Nel modelli di Data Mining scheda, fare doppio clic su Forecasting, e selezionare Imposta parametri algoritmo.

  2. Nel PERIODICITY_HINT riga del i parametri dell'algoritmo nella finestra di dialogo fare clic su di valore colonna, quindi digitare {12}, incluse le parentesi graffe.

    Per impostazione predefinita, l'algoritmo verrà inoltre aggiunto \ {1 valore.

  3. Nel FORECAST_METHOD di riga, verificare che il valore casella di testo è vuota o impostata per MIXED. Se è stato inserito un valore diverso, digitare MIXED per modificare il parametro con il valore predefinito.

  4. Nel PREDICTION_SMOOTHING di riga, verificare che il valore casella di testo è vuota o impostata su 0,5. Se è stato inserito un valore diverso, fare clic su valore e il tipo 0,5 per modificare il parametro con il valore predefinito.

    Nota


    Il parametro PREDICTION_SMOOTHING è disponibile solo in SQL Server Enterprise. Non è pertanto possibile visualizzare o modificare il valore di tale parametro in SQL Server Standard. Il comportamento predefinito consiste tuttavia nell'utilizzare entrambi gli algoritmi con un fattore di ponderazione equivalente.

  5. Scegliere OK.

Gestione di dati mancanti (facoltativo)

In diversi casi, è possibile che nei dati di vendita siano presenti gap riempiti con valori Null oppure che un negozio non sia stato in grado di inviare il report prima della scadenza, lasciando una cella vuota alla fine della serie. In questi scenari, in Analysis Services viene generato l'errore seguente e il modello non viene elaborato.

"Errore (Data mining): timestamp non sincronizzati a partire dalla serie , del modello di data mining, . Tutte le serie temporali devono terminare allo stesso contrassegno temporale e i punti dati non possono essere omessi arbitrariamente. Se si imposta il parametro MISSING_VALUE_SUBSTITUTION su Previous o su una costante numerica, i punti dati mancanti verranno aggiunti automaticamente ove possibile."

Per evitare l'errore, è possibile impostare Analysis Services in modo da fornire automaticamente nuovi valori per riempire i gap tramite i metodi seguenti:

  • Utilizzo di un valore medio. La media viene calcolata utilizzando tutti i valori validi nella stessa serie di dati.

  • Utilizzo del valore precedente. È possibile sostituire i valori precedenti di più celle mancanti, ma non è possibile riempire i valori iniziali.

  • Utilizzo di un valore costante fornito dall'utente.

Per specificare che le lacune vengano colmate tramite valori medi

  1. Nel modelli di Data Mining scheda, fare doppio clic sui Forecasting colonna e selezionare Imposta parametri algoritmo.

  2. Nel i parametri dell'algoritmo della finestra di dialogo di MISSING_VALUE_SUBSTITUTION riga, fare clic sul valore colonna e digitare significa.

Compilare il modello

Per utilizzare il modello, è necessario distribuirlo a un server ed elaborarlo mediante l'esecuzione di dati di training tramite l'algoritmo.

Per elaborare il modello di previsione

  1. Nel modello di Data Mining dal menu di SQL Server Data Tools, selezionare Elabora struttura di Data Mining e tutti i modelli.

  2. Nella finestra di avviso in cui viene chiesto se si desidera compilare e distribuire il progetto, fare clic su .

  3. Nel Elabora struttura di Data Mining - Forecasting nella finestra di dialogo fare clic su eseguire.

    Il Stato elaborazione viene visualizzata la finestra di dialogo per visualizzare le informazioni sull'elaborazione del modello. L'elaborazione del modello può richiedere alcuni minuti.

  4. Al termine dell'elaborazione, fare clic su Chiudi per chiudere la Stato elaborazione la finestra di dialogo.

  5. Fare clic su Chiudi per uscire dal Elabora struttura di Data Mining - Forecasting la finestra di dialogo.

Attività successiva della lezione

Esplorazione del modello di previsione ( esercitazione intermedia di Data Mining )

Vedere anche

Riferimento tecnico per l'algoritmo Microsoft Time Series
Algoritmo Microsoft Time Series
Requisiti e considerazioni sull'elaborazione (data mining)