Partilhar via


Lição 1: Criando a base de conhecimento do DQS para fornecedores

Nesta lição, você criará uma base de dados de conhecimento DQS chamada Fornecedores com o conhecimento (metadados) sobre os dados do fornecedor. Você usa a base de conhecimento para executar as atividades de limpeza e correspondência nos dados de entrada do fornecedor. A atividade de limpeza identifica dados incorretos/inválidos, corrige os dados incorretos, propõe correções/sugestões, padroniza os dados e enriquece os dados com mais informações. A atividade correspondente compara dados e identifica registros semelhantes (mas ligeiramente diferentes) nos dados que ajudam a remover duplicatas nos dados.

Você pode usar processos interativos e assistidos por computador para criar, compilar e gerenciar uma base de dados de conhecimento. O conhecimento em uma base de conhecimento é mantido em domínios, cada um deles específico para um campo de dados nos dados que você deseja limpar e/ou associar.

Nesta lição, você executará as seguintes tarefas para criar a base de dados de conhecimento fornecedores :

  • Crie uma base de dados de conhecimento DQS chamada Fornecedores. Você pode criar uma base de dados de conhecimento de várias maneiras. Você pode criar uma base de dados de conhecimento do zero ou compilá-la com base em uma base de dados de conhecimento existente ou importando um arquivo DQS (.dqs) que contenha uma base de dados de conhecimento predefinida e exportada ou executando uma atividade de descoberta de conhecimento em dados de exemplo. Neste tutorial, você criará a base de dados de conhecimento do zero.

  • Crie domínios na base de conhecimento Fornecedores que você usa para limpar dados e para correspondência de dados para identificar duplicatas. crie domínios para campos de dados que você deseja usar em atividades de limpeza e reconciliação, e não para todos os campos de dados existentes.

  • Adicione valores a um domínio adicionando valores manualmente, importando valores de um arquivo do Excel, executando uma atividade de descoberta de conhecimento em dados de exemplo e importando valores de projeto de um projeto de limpeza. Você também pode importar valores de domínio importando um arquivo DQS que contém propriedades e valores de domínio, que você não executa no tutorial.

  • Defina regras para um domínio. Uma regra de domínio é uma condição usada pelo DQS para validar, corrigir e padronizar valores de domínio.

  • Defina relações baseadas em termos para um domínio. Uma relação baseada em termos permite que você faça uma correção para um termo que faz parte de um valor em um domínio. Por exemplo, no valor Contoso Inc., Inc. é um termo que pode ser definido como Incorporated. Isso ajuda na padronização dos dados, bem como na identificação de duplicatas. Por exemplo, a Contoso Inc. e a Contoso Incorporated podem ser consideradas duplicatas.

  • Especifique sinônimos em valores de domínio. Você pode definir dois ou mais valores como sinônimos e definir um deles como um valor principal, que substitui seus valores de sinônimo durante uma atividade de limpeza para padronizar os dados.

  • Crie um domínio composto chamado Validação de Endereço que inclua domínios de linha de endereço, Cidade, Estado e Zip. Um domínio composto é um domínio que consiste em um ou mais domínios individuais. Ele permite que você crie uma regra que envolva vários domínios. Por exemplo, você pode definir uma regra: se Cidade for Los Angeles, Estado deverá ser CA, onde Cidade e Estado são dois domínios separados.

  • Configure e use um serviço de dados de referência. O recurso Serviço de Dados de Referência no DQS (Data Quality Services) permite que você assine provedores de dados de referência de terceiros e depure e enriqueça seus dados empresariais comparando-os com seus dados de alta qualidade. Você pode usar serviços dos principais provedores de DQS de dentro do DQS para padronizar, corrigir ou enriquecer seus dados durante o processo de limpeza. Neste tutorial, você aprenderá a configurar seu ambiente DQS para usar um serviço de dados de referência no Azure Marketplace e usar o serviço associado ao domínio composto validação de endereço para limpar dados de endereço.

  • Publique a base de dados de conhecimento para que a base de dados de conhecimento possa ser usada em atividades de limpeza e correspondência.

Próxima Etapa

Tarefa 1: Criando uma base de dados de conhecimento e domínios