Share via


Lição 3: Correspondendo dados para remover duplicatas da lista de fornecedores

Você prepara a base de dados de conhecimento para executar uma atividade de correspondência criando uma política de correspondência na base de dados de conhecimento. Pode haver apenas uma política de correspondência em uma base de dados de conhecimento. Uma política de correspondência consiste em uma ou mais regras de correspondência. Uma regra identifica os domínios envolvidos no processo de correspondência e especifica o peso que cada valor de domínio tem na avaliação de correspondência. Você especifica na regra se os valores do domínio precisam ser uma correspondência exata ou se podem ser semelhantes, e com que grau de semelhança. Você também especifica se a correspondência de domínio é um pré-requisito para o processo de correspondência. Você pode testar cada regra separadamente e testar toda a política em relação aos dados de exemplo. O processo de teste exibe os registros cujas pontuações correspondentes são maiores do que o limite de Pontuação mínima de registro especificado na configuração do DQS em um cluster (grupo). Você poderá continuar ajustando as regras na política até ficar satisfeito.

Depois de definir a política, crie um Projeto de Qualidade de Dados para executar a atividade de correspondência. O projeto de correspondência aplica as regras de correspondência da política de correspondência à fonte de dados a ser avaliada. Esse processo avalia a probabilidade de quaisquer duas linhas serem correspondências. Quando o DQS executa a análise de correspondência, cria clusters de registros considerados como correspondências pelo DQS. O DQS identifica aleatoriamente um dos registros como um registro dinâmico. Você pode verificar e rejeitar qualquer registro que não seja uma correspondência apropriada para o cluster. Consulte o tópico Criar uma política de correspondência para obter mais detalhes.

Nesta lição, você realizará uma atividade de correspondência para remover duplicatas na lista de fornecedores. Primeiro, crie uma política de correspondência com uma regra para identificar duplicatas na lista de fornecedores e publicar a política para a base de dados de conhecimento. Em seguida, crie e execute um projeto de qualidade de dados para correspondência. Finalmente, exporte os resultados da atividade de correspondência para um arquivo do Excel que você usará posteriormente no carregamento de dados para o MDS (Master Data Services).

Próxima etapa

Tarefa 1: Definindo uma política de correspondência