データ品質プロジェクト (DQS)

Data Quality Services (DQS) のデータ品質プロジェクトは、ナレッジ ベースを使用してソース データの品質を改善する手段になります。データ クレンジング アクティビティおよびデータ照合アクティビティを実行して、その結果データを SQL Server データベースや .csv ファイルにエクスポートします。 データ品質プロジェクトをクレンジング プロジェクトまたは照合プロジェクトとして作成し、それぞれのアクティビティを実行できます。 データ クレンジングと照合のナレッジは同じナレッジ ベースに組み込むことができるため、クレンジング プロジェクトと照合プロジェクトは同じナレッジ ベースを使用して実行できます。

データ品質プロジェクトには次の利点があります。

  • DQS ナレッジ ベースのナレッジを使用してソース データのデータ クレンジングを実行できます。

  • ナレッジ ベースの照合ポリシーを使用してソース データのデータ照合を実行できます。

  • クレンジング アクティビティや照合アクティビティの実施をガイドするウィザードが提供されているほか、データを必要により SQL Server データベースや .csv ファイルにエクスポートできます。 データ スチュワードはデータ品質プロジェクトを使用して、コンピューター支援型の、またはインタクラティブなクレンジングやデータ照合手順を実行および制御できます。

このトピックの内容

  • データ品質プロジェクト: クレンジング アクティビティ

  • データ品質プロジェクト: 照合アクティビティ

  • データ プロファイルと通知

データ品質プロジェクト: クレンジング アクティビティ

クレンジング データ品質プロジェクトでは、ナレッジ ベースに基づいてソース データのクレンジングを行うことができます。 DQS のデータ クレンジング アクティビティは、2 段階のプロセスから成ります。

  1. コンピューター支援型のデータ クレンジング プロセス。ナレッジ ベース内のナレッジと照らし合わせてソース データを分析し、変更を提示します。 処理後のデータは DQS によって分類 (提案、新規、無効、修正済み、および修正) されたうえでユーザーに表示され、さらに処理が行われます。

  2. インタラクティブなクレンジング プロセス。データ スチュワードがコンピューター支援型のデータ クレンジング プロセスによって提案されたデータを承認、拒否、または変更します。

データ品質プロジェクトのクレンジング アクティビティの詳細については、「データ クレンジング」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[Top]

データ品質プロジェクト: 照合アクティビティ

データ品質プロジェクトの照合では、ナレッジ ベース内の照合ポリシーに基づいて照合アクティビティを実行します。完全一致やあいまい一致を特定することによってデータの重複を防ぎ、重複データをユーザーが削除できます。 データをクレンジングしてから照合を実行することをお勧めします。 そのためには次を行います。

  1. データ品質プロジェクトを作成し、[クレンジング] アクティビティを選択してソース データのデータ クレンジング アクティビティを完了し、その後 SQL Server データベースのテーブルにエクスポートします。

  2. 照合ポリシーを含んだナレッジ ベースを使用して別のデータ品質プロジェクトを作成し、[照合] アクティビティを選択し、手順 1. でクレンジングしたデータをエクスポートしたデータベースとテーブルを [マップ] ページで選択します。

  3. クレンジングされたデータに対して照合アクティビティを完了させます。

データ品質プロジェクトの照合アクティビティの詳細については、「データ照合」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[Top]

データ プロファイルと通知

データ品質プロジェクトでクレンジングおよび照合アクティビティを実行しながら、DQS で処理中のデータに関する統計と情報をリアルタイムに表示できます。 クレンジングおよび照合プロセスの有効性を評価したり、データ クレンジングまたは照合によりデータ品質がどの程度向上したかを計測したりするのに、データ プロファイルが役立ちます。 DQS プロファイルでは、完全性 (データがどの程度存在するか) と正確性 (データがどの程度意図されたとおりに使用できるか) の 2 つのデータ品質ディメンションを提供します。 さらに、データ プロファイル情報に基づいて、データ クレンジングおよびデータ照合操作を向上させるために取ることができるアクションをユーザーに通知します。 データ プロファイルと通知の詳細については、「DQS でのデータ プロファイルと通知」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[Top]

関連タスク

タスクの説明

トピック

データ品質プロジェクトの作成方法について説明します。

データ品質プロジェクトの作成

データ品質プロジェクトの管理方法 (開く、ロック解除、名前の変更、および削除) について説明します。

データ品質プロジェクトの管理 (開く、ロック解除、名前の変更、および削除)

Data Quality クライアント で Integration Services プロジェクトを開く方法について説明します。

Data Quality Client で Integration Services プロジェクトを開く

関連項目

概念

DQS のナレッジ ベースとドメイン