Condividi tramite


Creazione di stime (Esercitazione di base sul data mining)

Dopo aver verificato il grado di accuratezza dei modelli di data mining, è possibile creare query di stima DMX (Data Mining Extensions) utilizzando il generatore delle query di stima nella scheda Stima modello di data mining di Progettazione modelli di data mining.

Nel generatore delle query di stima sono disponibili tre viste. È possibile creare ed esaminare la query utilizzando le visualizzazioni Progettazione e Query. È quindi possibile eseguire la query e visualizzare i risultati nella visualizzazione Risultato.

Per ulteriori informazioni sull'utilizzo del generatore delle query di stima, vedere Creazione di query di stima DMX.

Creazione della query

Il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input.

Per selezionare un modello e una tabella di input

  1. Nella scheda Stima modello di data mining di Progettazione modelli di data mining, nella casella Modello di data mining fare clic su Seleziona modello.

  2. Nella finestra di dialogo Seleziona modello di data mining esplorare l'albero e individuare la struttura Targeted Mailing, espanderla, selezionare TM_Decision_Tree e quindi fare clic su OK.

  3. Nella casella Seleziona tabella/e di input fare clic su Seleziona tabella del case.

  4. Nella finestra di dialogo Seleziona tabella selezionare Adventure Works DW2008 nell'elenco Origine dati.

  5. In Nome tabella/vista selezionare la tabella ProspectiveBuyer (dbo) e quindi fare clic su OK.

    La tabella ProspectiveBuyer è quella che assomiglia maggiormente alla tabella del case vTargetMail.

Mapping delle colonne

Dopo aver selezionato la tabella di input, il generatore delle query di stima crea un mapping predefinito tra il modello di data mining e la tabella di input in base ai nomi delle colonne. Almeno una colonna della struttura deve corrispondere a una colonna dei dati esterni.

Nota importanteImportante

I dati utilizzati per determinare l'accuratezza dei modelli devono contenere una colonna della quale è possibile eseguire il mapping alla colonna stimabile.

Per eseguire il mapping tra le colonne della struttura e le colonne della tabella di input

  1. Fare clic con il pulsante destro del mouse sulle linee che connettono la finestra Modello di data mining alla finestra Seleziona tabella di input e scegliere Modifica connessioni.

    Si noti che non tutte le colonne sono mappate. In questo esempio verrà eseguito il mapping di diverse colonne di Colonne tabella.

  2. In Colonna tabella fare clic sulla cella Bike Buyer e selezionare ProspectiveBuyer.Unknown dall'elenco a discesa.

    Verrà eseguito il mapping della colonna stimabile [Bike Buyer]] a una colonna della tabella di input.

  3. Fare clic su OK.

  4. In Esplora soluzioni fare clic con il pulsante destro del mouse sulla vista origine dati Targeted Mailing, quindi scegliere Visualizza finestra di progettazione.

  5. Fare clic con il pulsante destro del mouse sulla tabella ProspectiveBuyer e scegliere Nuovo calcolo denominato.

  6. Nella casella Nome colonna digitare calcAge.

  7. Nella casella Espressione digitare DATEDIFF (YYYY, [BirthDate], getdate ()) e fare clic su OK.

    La tabella di input non ha una colonna Età corrispondente. Questa espressione calcolerà l'età del cliente dalla colonna BirthDate della tabella di input. Poiché la colonna Età è stata identificata come la colonna più influente per la stima dell'acquisto di biciclette, deve esistere sia nel modello che nella tabella di input.

  8. In Progettazione modelli di data mining selezionare la scheda Stima modello di data mining e aprire nuovamente la finestra Modifica connessioni.

  9. In Colonna tabella fare clic sulla cella Età e selezionare ProspectiveBuyer.calcAge dall'elenco a discesa.

  10. Fare clic su OK.

Progettazione della query di stima

Per progettare la query di stima

  1. Il primo pulsante della barra degli strumenti della scheda Stima modello di data mining è il pulsante Passa alla visualizzazione della struttura della query / Passa alla visualizzazione dei risultati della query. Fare clic sulla freccia in giù di questo pulsante e selezionare Progettazione.

  2. Nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota della colonna Origine, quindi selezionare Funzione di stima .

    In questo modo viene specificata la colonna di destinazione per la funzione PredictProbability. Per ulteriori informazioni sulle funzioni, vedere Guida di riferimento alle funzioni DMX (Data Mining Extensions).

  3. Nella riga Funzione di stima, nella colonna Field selezionare PredictProbability.

  4. Nella finestra Modello di data mining selezionare e trascinare [Bike Buyer] nella cella Criteri/Argomento.

    Rilasciando la selezione, nella cella Criteri/Argomento verrà visualizzato [TM_Decision_Tree].[Bike Buyer] .

  5. Fare clic sulla riga vuota successiva nella colonna Origine e selezionare TM_Decision_Tree**.**

  6. Nella riga TM_Decision_Tree della colonna Campo selezionare Bike Buyer.

  7. Nella riga TM_Decision_Tree della colonna Criteri/Argomento digitare = 1.

  8. Fare clic sulla riga vuota successiva nella colonna Origine e selezionare ProspectiveBuyer.

  9. Nella riga ProspectiveBuyer della colonna Campo selezionare ProspectiveBuyerKey.

    Verrà aggiunto un identificatore univoco alla query di stima che consente di identificare la probabilità di acquisto di una bicicletta da parte dei singoli clienti.

  10. Aggiungere altre cinque righe alla griglia. Per ogni riga selezionare ProspectiveBuyer come Origine, quindi aggiungere le colonne seguenti nelle celle Campo:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Eseguire infine la query e visualizzare i risultati.

Per eseguire la query e visualizzare i risultati

  1. Nella scheda Stima modello di data mining selezionare il pulsante Risultato.

  2. Dopo l'esecuzione della query e la visualizzazione dei risultati, è possibile rivedere i risultati.

    Nella scheda Stima modello di data mining vengono visualizzate le informazioni di contatto dei potenziali clienti che saranno probabilmente acquirenti di biciclette. La colonna Espressione indica la probabilità che la stima sia corretta. È possibile utilizzare questi risultati per determinare quali tra i clienti potenziali sono da considerare come potenziali destinatari di messaggi promozionali.

  3. Fare clic sul pulsante Salva per salvare i risultati.