Partilhar via


Lição 2: Limpar dados do fornecedor usando a Base de Dados de Conhecimento de Fornecedores

Nesta lição, você limpa os dados do fornecedor em um arquivo do Excel usando a base de dados de conhecimento Fornecedores que você criou na primeira lição. A limpeza de dados no DQS inclui um processo assistido por computador que analisa como os dados estão em conformidade com o conhecimento em uma base de dados de conhecimento e um processo interativo que permite que você examine e modifique os resultados do processo assistido pelo computador. O recurso de limpeza de dados identifica dados incorretos na fonte de dados e, em seguida, corrige ou sugere correções para os dados incorretos. Ele também padroniza e enriquece os dados do cliente usando valores de domínio, valores principais para sinônimos, regras de domínio, relações baseadas em termos e dados de referência. Você pode aprovar ou rejeitar interativamente as alterações propostas pelo processo assistido pelo computador. Consulte a Limpeza de Dados para obter mais detalhes.

O processo assistido por computador usa os seguintes valores de limite que você pode configurar usando a opção Configuração na página principal do Cliente DQS.

  • Pontuação mínima para sugestões: A pontuação mínima ou o nível de confiança usado pelo DQS para sugerir a substituição de um valor.

  • Pontuação mínima para correções automáticas: A pontuação mínima ou o nível de confiança usado pelo DQS para corrigir automaticamente um valor.

Consulte Configurar valores de limite para limpeza e correspondência para obter detalhes sobre como definir essas configurações.

Nesta lição, você executa as seguintes tarefas para limpar os dados de entrada usando a base de conhecimento dos fornecedores.

  1. Crie um Projeto de Qualidade de Dados para Limpeza, selecione a base de conhecimento Fornecedores como a base de conhecimento a ser usada para analisar e sanear os dados de origem em um arquivo do Excel e selecione a atividade de Limpeza.

  2. Mapeie as colunas do Excel que você deseja limpar para domínios DQS apropriados/domínios compostos na base de dados de conhecimento.

  3. Execute a atividade de limpeza assistida por computador. O processo assistido por computador exibe informações de qualidade de dados no Cliente de Qualidade de Dados que você pode usar para limpar os dados interativamente.

  4. Exiba e gerencie os resultados da atividade de limpeza. Você pode examinar os valores que o processo assistido pelo computador considera corretos, incorretos, mas corrigidos, incorretos com uma alteração sugerida ou inválidos. Você pode aprovar ou rejeitar alterações interativamente, corrigindo ou substituindo a sugestão do processo assistido pelo computador usando o campo Corrigir para.

  5. Exporte os resultados do processo de limpeza para um arquivo do Excel.

  6. Importe os valores do projeto de limpeza para domínios para aumentar o conhecimento na base de dados de conhecimento com novas regras, valores, correções etc...

Próxima Etapa

Tarefa 1: Criando um projeto de qualidade de dados