Condividi tramite


Concetti di Data Quality Services

In questo argomento viene fornito un breve riepilogo dei concetti di Data Quality Services (DQS) nell'ambito della gestione delle informazioni, dei progetti Data Quality e dell'amministrazione della qualità dei dati.

Contenuto dell'argomento

  • Concetti relativi alla gestione delle informazioni

  • Concetti relativi ai progetti Data Quality

  • Concetti relativi all'amministrazione della qualità dei dati

Concetti relativi alla gestione delle informazioni

La Knowledge Base DQS è un repository di metadati creati dall'amministratore dei dati o dal personale IT da utilizzare per migliorare la qualità dei dati tramite la pulizia e la corrispondenza dei dati. La gestione delle informazioni DQS include i processi utilizzati per creare e gestire la Knowledge Base, sia in modo computerizzato che in modo interattivo.

Individuazione informazioni

L'individuazione delle informazioni è un processo computerizzato che analizza esempi di dati dell'organizzazione per compilare le informazioni sui dati. Una volta ottenuti i risultati dell'analisi, è possibile convalidare e migliorare le informazioni, quindi applicarle per eseguire la pulizia dei dati, la corrispondenza e il profiling. Per ulteriori informazioni, vedere Knowledge Base e domini DQS.

Gestione dominio

Il processo di gestione del dominio consente di modificare o aumentare le informazioni generate dal processo di individuazione delle informazioni. È possibile modificare, aggiornare e rivedere in modo interattivo le informazioni in una Knowledge Base. Una Knowledge Base è costituita da domini di dati che contengono i valori di dominio e il relativo stato, le regole di dominio, le relazioni basate su termini e i dati di riferimento. Nella gestione del dominio è possibile modificare le proprietà del dominio, associare i dati di riferimento a un dominio, gestire le regole di dominio, gestire i valori di dominio e immettere le relazioni di dati nonché creare, eliminare, importare o esportare i domini. È inoltre possibile utilizzare domini compositi che aggregano più domini singoli. Per ulteriori informazioni, vedere Knowledge Base e domini DQS.

Criteri di corrispondenza

I criteri di corrispondenza contengono le regole di corrispondenza utilizzate per eseguire la deduplicazione dei dati. Il processo dei criteri di corrispondenza consente di creare le regole di corrispondenza, di ottimizzarle in base ai risultati corrispondenti e ai dati di profiling e di aggiungere i criteri alla Knowledge Base. Per ulteriori informazioni, vedere Corrispondenza di dati.

Servizi dati di riferimento

È possibile utilizzare i dati di riferimento per convalidare, correggere e migliorare i dati, sfruttando i servizi di società che garantiscono la qualità dei dati di riferimento. È possibile utilizzare i servizi di Windows Azure MarketPlace per connettersi ai provider di dati di riferimento. In alternativa, è possibile utilizzare una connessione diretta a un provider. Per ulteriori informazioni, vedere Servizi dati di riferimento in DQS.

Per ulteriori informazioni sulla gestione delle informazioni in DQS, vedere Knowledge Base e domini DQS.

Icona freccia utilizzata con il collegamento Torna all'inizio[Inizio pagina]

Concetti relativi ai progetti Data Quality

L'amministratore dei dati esegue le operazioni di qualità dei dati (pulizia e corrispondenza) utilizzando un progetto Data Quality nell'applicazione Client Data Quality.

Pulizia dei dati

La pulizia dei dati in DQS viene effettuata in base alle informazioni incluse nella Knowledge Base DQS e prevede un processo in due passaggi:

  • Pulizia assistita da computer: in DQS vengono utilizzate le informazioni disponibili nella Knowledge Base selezionata per la pulizia di un progetto, al fine di proporre correzioni e suggerimenti relativi ai valori in un'origine dati.

  • Pulizia interattiva: l'amministratore dei dati può eseguire il processo di pulizia interattiva per modificare o aumentare le correzioni dei dati proposte dal processo di pulizia dei dati computerizzato. L'amministratore dei dati esegue questa operazione utilizzando livelli di confidenza e statistiche identificati dal processo di pulizia dei dati o immettendo manualmente le proprie modifiche nel progetto.

In seguito al processo di pulizia, l'amministratore può esportare i dati elaborati in un database di SQL Server, un file con estensione csv o un file di Excel. Per ulteriori informazioni, vedere Pulizia dei dati.

Corrispondenza di dati

Con il processo di corrispondenza l'amministratore dei dati può confrontare i dati in modo da poter allineare quelli simili tramite il processo di deduplicazione. La deduplicazione in DQS viene eseguita in base alle regole di corrispondenza contenute nella Knowledge Base. L'amministratore dei dati specifica i parametri per il processo di corrispondenza all'interno di un progetto Data Quality. Per ulteriori informazioni, vedere Corrispondenza di dati.

Profiling e notifiche

Con il profiling dei dati, agli amministratori dei dati vengono fornite statistiche e informazioni in tempo reale sui dati elaborati da DQS per le attività di pulizia e di corrispondenza durante l'esecuzione di un progetto Data Quality. Viene inoltre valutata l'efficacia delle attività di pulizia e di corrispondenza in un progetto Data Quality e, con le notifiche, l'utente può scegliere le azioni che possono essere eseguite per migliorare le attività di pulizia e di corrispondenza dei dati. Per ulteriori informazioni, vedere Profiling di dati e notifiche in DQS.

Per ulteriori informazioni sui progetti Data Quality in DQS, vedere Progetti Data Quality (DQS).

Icona freccia utilizzata con il collegamento Torna all'inizio[Inizio pagina]

Concetti relativi all'amministrazione della qualità dei dati

Un amministratore DQS può eseguire numerose attività amministrative mediante l'applicazione Client Data Quality.

Monitoraggio attività

Tramite il monitoraggio delle attività viene visualizzato lo stato di ogni attività eseguita all'interno di un intervallo di dati, vengono forniti i dati per ogni attività e viene consentito agli amministratori DQS di controllare un'attività. Per ulteriori informazioni, vedere Monitorare le attività DQS.

Configurazione

Con l'opzione Configurazione è possibile effettuare le operazioni seguenti:

Sicurezza relativa a DQS

È possibile utilizzare i ruoli all'interno del meccanismo di sicurezza di SQL Server per proteggere DQS. Sono disponibili tre ruoli DQS tramite cui viene determinato il livello di accesso per un utente nell'applicazione Client Data Quality, cioè dqs_administrator, dqs_kb_editor e dqs_kb_operator. Non è possibile concedere ruoli agli utenti utilizzando l'applicazione Client Data Quality, bensì mediante SQL Server Management Studio. Per ulteriori informazioni, vedere Sicurezza relativa a DQS.

Per ulteriori informazioni sull'amministrazione DQS, vedere Amministrazione DQS.

Icona freccia utilizzata con il collegamento Torna all'inizio[Inizio pagina]

Vedere anche

Concetti

Data Quality Services