Concetti di Data Quality Services
In questo argomento viene fornito un breve riepilogo dei concetti di Data Quality Services (DQS) nell'ambito della gestione delle informazioni, dei progetti Data Quality e dell'amministrazione della qualità dei dati.
Contenuto dell'argomento
Concetti relativi alla gestione delle informazioni
Concetti relativi ai progetti Data Quality
Concetti relativi all'amministrazione della qualità dei dati
Concetti relativi alla gestione delle informazioni
La Knowledge Base DQS è un repository di metadati creati dall'amministratore dei dati o dal personale IT da utilizzare per migliorare la qualità dei dati tramite la pulizia e la corrispondenza dei dati. La gestione delle informazioni DQS include i processi utilizzati per creare e gestire la Knowledge Base, sia in modo computerizzato che in modo interattivo.
Individuazione informazioni
L'individuazione delle informazioni è un processo computerizzato che analizza esempi di dati dell'organizzazione per compilare le informazioni sui dati. Una volta ottenuti i risultati dell'analisi, è possibile convalidare e migliorare le informazioni, quindi applicarle per eseguire la pulizia dei dati, la corrispondenza e il profiling. Per ulteriori informazioni, vedere Knowledge Base e domini DQS.
Gestione dominio
Il processo di gestione del dominio consente di modificare o aumentare le informazioni generate dal processo di individuazione delle informazioni. È possibile modificare, aggiornare e rivedere in modo interattivo le informazioni in una Knowledge Base. Una Knowledge Base è costituita da domini di dati che contengono i valori di dominio e il relativo stato, le regole di dominio, le relazioni basate su termini e i dati di riferimento. Nella gestione del dominio è possibile modificare le proprietà del dominio, associare i dati di riferimento a un dominio, gestire le regole di dominio, gestire i valori di dominio e immettere le relazioni di dati nonché creare, eliminare, importare o esportare i domini. È inoltre possibile utilizzare domini compositi che aggregano più domini singoli. Per ulteriori informazioni, vedere Knowledge Base e domini DQS.
Criteri di corrispondenza
I criteri di corrispondenza contengono le regole di corrispondenza utilizzate per eseguire la deduplicazione dei dati. Il processo dei criteri di corrispondenza consente di creare le regole di corrispondenza, di ottimizzarle in base ai risultati corrispondenti e ai dati di profiling e di aggiungere i criteri alla Knowledge Base. Per ulteriori informazioni, vedere Corrispondenza di dati.
Servizi dati di riferimento
È possibile utilizzare i dati di riferimento per convalidare, correggere e migliorare i dati, sfruttando i servizi di società che garantiscono la qualità dei dati di riferimento. È possibile utilizzare i servizi di Windows Azure MarketPlace per connettersi ai provider di dati di riferimento. In alternativa, è possibile utilizzare una connessione diretta a un provider. Per ulteriori informazioni, vedere Servizi dati di riferimento in DQS.
Per ulteriori informazioni sulla gestione delle informazioni in DQS, vedere Knowledge Base e domini DQS.
[Inizio pagina]
Concetti relativi ai progetti Data Quality
L'amministratore dei dati esegue le operazioni di qualità dei dati (pulizia e corrispondenza) utilizzando un progetto Data Quality nell'applicazione Client Data Quality.
Pulizia dei dati
La pulizia dei dati in DQS viene effettuata in base alle informazioni incluse nella Knowledge Base DQS e prevede un processo in due passaggi:
Pulizia assistita da computer: in DQS vengono utilizzate le informazioni disponibili nella Knowledge Base selezionata per la pulizia di un progetto, al fine di proporre correzioni e suggerimenti relativi ai valori in un'origine dati.
Pulizia interattiva: l'amministratore dei dati può eseguire il processo di pulizia interattiva per modificare o aumentare le correzioni dei dati proposte dal processo di pulizia dei dati computerizzato. L'amministratore dei dati esegue questa operazione utilizzando livelli di confidenza e statistiche identificati dal processo di pulizia dei dati o immettendo manualmente le proprie modifiche nel progetto.
In seguito al processo di pulizia, l'amministratore può esportare i dati elaborati in un database di SQL Server, un file con estensione csv o un file di Excel. Per ulteriori informazioni, vedere Pulizia dei dati.
Corrispondenza di dati
Con il processo di corrispondenza l'amministratore dei dati può confrontare i dati in modo da poter allineare quelli simili tramite il processo di deduplicazione. La deduplicazione in DQS viene eseguita in base alle regole di corrispondenza contenute nella Knowledge Base. L'amministratore dei dati specifica i parametri per il processo di corrispondenza all'interno di un progetto Data Quality. Per ulteriori informazioni, vedere Corrispondenza di dati.
Profiling e notifiche
Con il profiling dei dati, agli amministratori dei dati vengono fornite statistiche e informazioni in tempo reale sui dati elaborati da DQS per le attività di pulizia e di corrispondenza durante l'esecuzione di un progetto Data Quality. Viene inoltre valutata l'efficacia delle attività di pulizia e di corrispondenza in un progetto Data Quality e, con le notifiche, l'utente può scegliere le azioni che possono essere eseguite per migliorare le attività di pulizia e di corrispondenza dei dati. Per ulteriori informazioni, vedere Profiling di dati e notifiche in DQS.
Per ulteriori informazioni sui progetti Data Quality in DQS, vedere Progetti Data Quality (DQS).
[Inizio pagina]
Concetti relativi all'amministrazione della qualità dei dati
Un amministratore DQS può eseguire numerose attività amministrative mediante l'applicazione Client Data Quality.
Monitoraggio attività
Tramite il monitoraggio delle attività viene visualizzato lo stato di ogni attività eseguita all'interno di un intervallo di dati, vengono forniti i dati per ogni attività e viene consentito agli amministratori DQS di controllare un'attività. Per ulteriori informazioni, vedere Monitorare le attività DQS.
Configurazione
Con l'opzione Configurazione è possibile effettuare le operazioni seguenti:
Configurare le impostazioni del servizio dati di riferimento. Per ulteriori informazioni, vedere Configurazione di DQS per l'utilizzo di dati di riferimento.
Impostare i valori soglia per le attività di pulizia e di corrispondenza. Per ulteriori informazioni, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.
Abilitare o disabilitare le notifiche di profiling Per ulteriori informazioni, vedere Abilitare o disabilitare le notifiche di profiling in DQS.
Configurare i livelli di gravità per i file di log DQS a livello di attività o a livello di modulo, che rappresenta la modalità più avanzata. Per ulteriori informazioni, vedere Configurare livelli di gravità per i file di log DQS.
Sicurezza relativa a DQS
È possibile utilizzare i ruoli all'interno del meccanismo di sicurezza di SQL Server per proteggere DQS. Sono disponibili tre ruoli DQS tramite cui viene determinato il livello di accesso per un utente nell'applicazione Client Data Quality, cioè dqs_administrator, dqs_kb_editor e dqs_kb_operator. Non è possibile concedere ruoli agli utenti utilizzando l'applicazione Client Data Quality, bensì mediante SQL Server Management Studio. Per ulteriori informazioni, vedere Sicurezza relativa a DQS.
Per ulteriori informazioni sull'amministrazione DQS, vedere Amministrazione DQS.
[Inizio pagina]