Share via


Lição 5: Automatizando a limpeza e a correspondência usando o SSIS

Na Lição 1, você criou a base de dados de conhecimento Fornecedores, e a utilizou para limpar dados na Lição 2 e fazer a correspondência dos dados na lição 3 usando a ferramenta Cliente DQS. Em um cenário do mundo real, você talvez precise receber dados de uma fonte sem suporte no DQS ou queira automatizar o processo de limpeza e de correspondência sem precisar usar a ferramenta Cliente DQS. O SQL Server Integration Services (SSIS) tem componentes que você pode usar para integrar dados de várias fontes heterogêneas, além do componente Transformação de Limpeza DQS que você pode usar para chamar a funcionalidade de limpeza exposta pelo DQS. Atualmente, o DQS não expõe a funcionalidade de correspondência para uso do SSIS, mas você pode usar a Transformação Agrupamento Difuso para identificar duplicatas nos dados.

Você pode carregar dados no MDS usando o recurso Preparação baseada em entidade. Quando você cria uma entidade no MDS, os procedimentos armazenados e as tabelas de preparo correspondentes são criados automaticamente. Por exemplo, quando você criou a entidade Fornecedor, a tabela stg.supplier_Leaf e o procedimento armazenado stg.udp_Supplier_Leaf foram criados automaticamente. Use os procedimentos e as tabelas de preparo para criar, atualizar e excluir membros de entidade. Nesta lição, você criará novos membros de entidade para a Entidade Fornecedor. Para carregar dados no servidor MDS, o pacote SSIS primeiro carrega os dados na tabela de preparação stg.supplier_Leaf e, em seguida, dispara o procedimento armazenado stg.udp_Supplier_Leaf associado. Consulte Importando dados para obter mais detalhes.

Nesta lição, você executará as seguintes tarefas:

  1. Remover dados do fornecedor no MDS (se você tiver feito as quatro lições anteriores). O pacote SSIS criado nessa lição carrega automaticamente os dados no MDS. Antigamente, você carregava manualmente os dados limpos e correspondentes do fornecedor no servidor MDS usando o Cliente DQS.

  2. Criar uma exibição de assinatura na entidade Fornecedor para expor os dados da entidade a outros aplicativos. Essa ação cria uma exibição SQL que você verificará usando o SQL Server Management Studio. Você não utilizará essa exibição nesta versão do tutorial.

  3. Criar e executar um projeto do SSIS usando o SQL Server Data Tools. O projeto usa a transformação de Limpeza de Dados para enviar uma solicitação de limpeza ao servidor DQS. O DQS ainda não expõe a funcionalidade de correspondência; portanto, você usará a transformação Agrupamento Difuso para identificar duplicatas.

  4. Verificar se os dados foram criados no MDS usando o Master Data Manager.

  5. Examinar os resultados do projeto de limpeza DQS criado pelo pacote SSIS e, se desejar, executar a limpeza interativa para criar a base de dados de conhecimento posteriormente.

Próxima etapa

Tarefa 1 (pré-requisito): Removendo os dados do fornecedor no MDS