Usar modelos predefinidos

Concluído

Dica

Consulte a guia Texto e imagens para obter mais detalhes!

Modelos predefinidos no Azure Document Intelligence permitem extrair dados de tipos de formulário comuns sem treinar seus próprios modelos. A Microsoft treina esses modelos em um grande número de documentos de exemplo, para que você possa esperar resultados precisos e confiáveis para tipos de documento padrão.

Modelos de análise de documentos

Antes de examinar os modelos predefinidos específicos do domínio, é importante entender os modelos de análise de documentos que os sustentam.

Modelo de leitura

O modelo de leitura extrai texto impresso e manuscrito de documentos e imagens. Ele detecta o idioma de cada linha de texto e classifica se o texto é manuscrito ou impresso. O modelo de leitura é usado como base para extração de texto em todos os outros modelos de Inteligência de Documento.

Para arquivos PDF ou TIFF de várias páginas, você pode usar o pages parâmetro em sua solicitação para especificar um intervalo de páginas para análise.

O modelo de leitura é ideal quando você deseja extrair palavras e linhas de documentos sem estrutura fixa ou previsível.

Captura de tela mostrando o modelo de leitura analisando um documento de exemplo no Document Intelligence Studio.

Modelo de layout

O modelo de layout estende a extração de texto do modelo de leitura com a detecção de marcas de seleção, tabelas e informações de estrutura do documento. Ele também dá suporte a um recurso opcional keyValuePairs para extrair pares chave-valor.

Quando você digitaliza um documento, ele pode ser angulado ou as tabelas podem ter estruturas complexas com células mescladas ou linhas incompletas. O modelo de layout pode lidar com essas dificuldades. Cada célula de tabela é extraída com seu conteúdo, posição da caixa delimitadora e índices de linha/coluna.

As marcas de seleção (caixas de seleção e botões de opção) são extraídas com suas caixas delimitadoras, nível de confiança e se estão selecionadas.

Captura de tela mostrando o modelo de layout extraindo tabelas e estrutura de um documento de exemplo no Document Intelligence Studio.

Observação

O modelo de documento geral estava disponível em versões anteriores do Document Intelligence, mas foi preterido na 2023-10-31-preview versão. Sua funcionalidade de par chave-valor e extração de entidade foi incorporada ao modelo de layout e a outros recursos.

Modelos predefinidos para tipos de documento específicos

O Azure Document Intelligence inclui modelos predefinidos treinados em tipos de documento específicos. Os seguintes modelos predefinidos são alguns exemplos disponíveis para extrair campos de documentos comerciais comuns:

Modelo Descrição
Fatura Extrai nome do cliente, detalhes do fornecedor, número do pedido de compra, fatura e datas de conclusão, endereços de cobrança e envio, itens de linha e totais.
Recibo Extrai detalhes do comerciante, data e hora da transação, itens de linha e totais. Dá suporte ao processamento de recibo de hotel de página única.
Extrato bancário Extrai informações da conta, saldos iniciais e finais e detalhes da transação.
Verificação Extrai o destinatário, o valor, a data e outras informações relevantes.
Holerite Extrai salários, horas, deduções, pagamento líquido e outros campos de pagamento comuns.
Cartão de crédito Extrai informações do cartão de pagamento.
Contrato Extrai detalhes do contrato e da parte.

Documentos de impostos dos EUA

Modelo Descrição
Imposto unificado dos EUA Um único modelo que extrai informações de qualquer tipo de formulário fiscal dos EUA compatível.
W-2 Extrai os detalhes da compensação tributável.
1098 e variações Extrai juros da hipoteca e detalhes relacionados.
1099 e variações Extrai renda de várias fontes.
1040 e variações Extrai detalhes da declaração de imposto de renda individual.

Documentos de hipoteca dos EUA

Modelo Descrição
1003 (URLA) Extrai detalhes da solicitação de empréstimo.
1004 (URAR) Extrai informações de avaliações de propriedades.
1005 Extrai informações de verificação de emprego.
1008 Extrai detalhes de remessa de empréstimo.
Divulgação de fechamento Extrai os termos de fechamento final do empréstimo.

Documentos de identificação pessoal

Modelo Descrição
Documento de identificação Extrai detalhes de carteiras de motorista dos EUA, IDs da União Europeia e carteiras de motorista e passaportes internacionais. Inclui nomes, datas de nascimento, números de documentos e endossos ou restrições.
cartão do seguro de saúde Extrai campos comuns de cartões de seguro de saúde dos EUA.
Certidão de casamento Extrai informações de casamento com certidão.

Importante

O modelo de documento de ID extrai informações pessoais cobertas pelas leis de proteção de dados na maioria das jurisdições. Verifique se você tem a permissão do indivíduo para armazenar seus dados e se está em conformidade com todos os requisitos legais aplicáveis.

Recursos dos modelos pré-construídos

Os modelos predefinidos são projetados para extrair diferentes tipos de dados de documentos. Esses recursos incluem:

  • Extração de texto: todos os modelos predefinidos extraem linhas e palavras de texto manuscrito e impresso.
  • Pares chave-valor: trechos de texto que identificam um rótulo e sua respectiva resposta. Por exemplo, Peso e 31 kg.
  • Marcas de seleção: caixas de seleção e botões de rádio, incluindo se estão selecionados ou não.
  • Tabelas: dados em células, incluindo o número de colunas e linhas, títulos de coluna e linha e células mescladas.
  • Campos: modelos treinados para um tipo de formulário específico identificam um conjunto fixo de campos. Por exemplo, o modelo de fatura extrai CustomerName e InvoiceTotal.

Quando usar modelos predefinidos versus personalizados

Os modelos predefinidos abrangem os tipos de documento mais comuns. Se você tiver um tipo de formulário específico ou exclusivo do setor, poderá obter resultados mais precisos com um modelo personalizado. No entanto, modelos personalizados exigem tempo e dados de exemplo para treinar. Sempre verifique se existe um modelo predefinido para seu cenário antes de investir no desenvolvimento de modelo personalizado.

Saiba mais