Modelo de fatura do Document Intelligence

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)red-checkmarkv2.1 (desativação)

::: moniker-end

Este conteúdo se aplica a:checkmarkv3.1 (GA) | Versão mais recente:purple-checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este conteúdo se aplica a:red-checkmarkv3.0 (desativação) | Versões mais recentes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versão anterior:blue-checkmarkv2.1 (desativação)

Esse conteúdo se aplica a:red-checkmarkv2.1 | Versão mais recente:blue-checkmarkv4.0 (GA)

O modelo de fatura do Document Intelligence usa recursos avançados de OCR (Reconhecimento Óptico de Caracteres) para analisar e extrair campos de chave e itens de linha de faturas de vendas, contas de serviços públicos e pedidos de compra. As faturas podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. A API analisa o texto da fatura; extrai informações importantes, como nome do cliente, endereço de cobrança, data de conclusão e valor devido; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo dá suporte a faturas em 27 idiomas.

Tipos de documento com suporte:

  • Facturas
  • Contas de serviços públicos
  • Pedidos de vendas
  • Pedidos de Compra

Processamento automatizado de faturas

O processamento automatizado de faturas é o processo de extração de campos de chave accounts payable de documentos de conta de cobrança. Os dados extraídos incluem itens de linha de faturas integradas aos fluxos de trabalho ap (contas a pagar) para revisões e pagamentos. Historicamente, o processo de pagamento de contas é executado manualmente e, portanto, muito demorado. A extração precisa de dados importantes de faturas normalmente é a primeira e uma das etapas mais críticas no processo de automação da fatura.

Exemplo de fatura processada com o Document Intelligence Studio:

Captura de tela de uma fatura de exemplo analisada no Document Intelligence Studio.

Exemplo de fatura processada com a ferramenta de rotulagem de exemplo do Document Intelligence:

Captura de tela de uma fatura de exemplo.

Opções de desenvolvimento

O Document Intelligence v4.0: 2024-11-30 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do modelo
Modelo de fatura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fatura predefinida

O Document Intelligence v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do modelo
Modelo de fatura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fatura predefinida

O Document Intelligence v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do modelo
Modelo de fatura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fatura predefinida

O Document Intelligence v2.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo de fatura • Ferramenta de rotulagem do
REST API
• SDK da biblioteca cliente• Contêiner do Docker do Document Intelligence

Requisitos de entrada

Há suporte para os seguintes formatos de arquivo.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Ler
Layout
Documento geral
Pré-construídos
Extração personalizada
Classificação personalizada
  • Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
  • PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.
  • Formatos de arquivo com suporte: JPEG, PNG, PDF e TIFF.
  • Com suporte em PDF e TIFF, até 2.000 páginas são processadas. Para assinantes de camada gratuita, somente as duas primeiras páginas são processadas.
  • O tamanho do arquivo com suporte deve ter menos de 50 MB e dimensões de pelo menos 50 x 50 pixels e no máximo 10.000 x 10.000 pixels.

Extração de dados do modelo de fatura

Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos de faturas. Você precisa dos seguintes recursos:

  • Uma assinatura Azure– você pode criar uma gratuitamente.

  • Uma instância do Document Intelligence no portal Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Após a implantação do recurso, selecione Ir para o recurso para obter sua chave e ponto de extremidade.

Captura de tela de chaves e local do ponto de extremidade no portal do Azure.

  1. Na home page do Document Intelligence Studio, selecione Faturas.

  2. Você pode analisar a fatura de exemplo ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões Executar análise e analisar opções no Document Intelligence Studio.

Ferramenta de Rotulagem de Exemplos do Document Intelligence

  1. Navegue até a Ferramenta de Amostra de Inteligência Documental.

  2. Na home page da ferramenta de exemplo, selecione Usar modelo predefinido para obter o bloco de dados.

    Captura de tela do processo de análise de resultados do modelo de layout.

  3. Selecione o Tipo de Formulário a ser analisado no menu dropdown.

  4. Escolha uma URL para o arquivo que você deseja analisar nas opções abaixo:

  5. No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar .

    Captura de tela do menu suspenso local de origem.

  6. No campo de endpoint do serviço Document Intelligence, cole o endpoint obtido com sua assinatura do Document Intelligence.

  7. No campo chave, cole a chave obtida no recurso de Inteligência de Documento.

    Captura de tela mostrando o menu suspenso select-form-type.

  8. Selecione Executar análise. A ferramenta de Rotulagem de Exemplo para Inteligência de Documentos chama a API Predefinida de Análise e analisa o documento.

  9. Exibir os resultados – consulte os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detectadas.

    Captura de tela da operação de resultados da análise de modelo de layout.

Nota

A ferramenta de rotulagem de amostra não dá suporte ao formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documento.

Idiomas e localidades com suporte

Para obter uma lista completa de idiomas com suporte, consulte nossa página de suporte à linguagem de modelo predefinida .

Extração de campo

  • Para campos de extração de documentos com suporte, consulte a página invoice model schema no nosso repositório de exemplos no GitHub.

  • Os pares chave-valor da fatura e os itens de linha extraídos estão na documentResults seção da saída JSON.

Pares chave-valor

O modelo de fatura predefinido dá suporte ao retorno opcional de pares chave-valor. Por padrão, o retorno de pares chave-valor está desabilitado. Pares chave-valor são intervalos específicos na fatura que identificam um rótulo ou chave e sua resposta ou valor associados. Em uma fatura, esses pares podem ser o rótulo e o valor que o usuário inseriu para esse campo ou número de telefone. O modelo de IA é treinado para extrair chaves e valores identificáveis com base em uma ampla variedade de tipos de documentos, formatos e estruturas.

As chaves também podem existir isoladamente quando o modelo detecta que existe uma chave, sem valor associado ou ao processar campos opcionais. Por exemplo, um campo de nome do meio pode ser deixado em branco em um formulário em alguns casos. Pares chave-valor são sempre intervalos de texto contidos no documento. Para documentos em que o mesmo valor é descrito de maneiras diferentes, por exemplo, cliente/usuário, a chave associada é cliente ou usuário (com base no contexto).

Saída JSON

A saída JSON tem três partes:

  • "readResults" O nó contém todo o texto reconhecido e marcas de seleção. O texto é organizado por página, depois por linha e, em seguida, por palavras individuais.
  • "pageResults" O nó contém as tabelas e células extraídas com suas caixas delimitadoras, confiança, assim como uma referência às linhas e palavras em readResults.
  • "documentResults" O nó contém os valores específicos da fatura e os itens de linha que o modelo descobriu. É onde encontrar todos os campos da fatura, como ID da fatura, envio para, cobrança para, cliente, total, itens de linha e muito mais.

Guia de migração

::: moniker-end

Próximas etapas