Modelos de processamento de documentos

Este conteúdo se aplica a:v4.0 (GA) | Versões anteriores:v3.1 (GA)v3.0 (desativação)v2.1 (desativação)

Este conteúdo se aplica a:v3.1 (GA) | Versão mais recente:v4.0 (GA) | Versões anteriores:v3.0v2.1

Este conteúdo se aplica a:v3.0 (desativação) | Versões mais recentes:v4.0 (GA)v3.1 | Versão anterior:v2.1 (desativação)

Esse conteúdo se aplica a:v2.1 | Versão mais recente:v4.0 (GA)

Azure Document Intelligence nas Ferramentas Foundry dá suporte a vários modelos que podem ser usados para incorporar processamento inteligente de documentos aos seus aplicativos e fluxos. Você pode usar um modelo específico do domínio predefinido ou treinar um modelo personalizado adaptado às suas necessidades comerciais específicas e casos de uso. Você pode usar o Document Intelligence com a API REST ou bibliotecas de clientes Python, C#, Java e JavaScript.

Nota

Projetos de processamento de documentos que envolvem dados financeiros, dados de integridade protegidos, dados pessoais ou dados altamente confidenciais exigem atenção cuidadosa. Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.

Visão geral do modelo

A tabela a seguir mostra os modelos de GA (disponibilidade geral) para cada API estável.

Tipo de modelo	Modelo	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Modelos de análise de documentos	Ler	✔️	✔️	✔️	Não disponível
Modelos de análise de documentos	Layout	✔️	✔️	✔️	✔️
Modelos de análise de documentos	Documento geral**	Compatível com modelo de layout	✔️	✔️	Não disponível
Modelos predefinidos	Verificação bancária	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Extrato bancário	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	payStub	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Contrato	✔️	✔️	Não disponível	Não disponível
Modelos predefinidos	Cartão de seguro de saúde	✔️	✔️	✔️	Não disponível
Modelos predefinidos	Documento de ID	✔️	✔️	✔️	✔️
Modelos predefinidos	Factura	✔️	✔️	✔️	✔️
Modelos predefinidos	Recibo	✔️	✔️	✔️	✔️
Modelos predefinidos	Imposto unificado dos EUA*	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Imposto dos EUA 1040*	✔️	✔️	Não disponível	Não disponível
Modelos predefinidos	Imposto dos EUA 1095*	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Imposto dos EUA 1098*	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Imposto dos EUA 1099*	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Imposto do W2 dos EUA	✔️	✔️	✔️	Não disponível
Modelos predefinidos	Imposto do W4 dos EUA	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Formulário de Hipoteca 1003 URLA dos EUA	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	URAR da hipoteca 1004 dos EUA	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Hipoteca dos EUA 1005	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Resumo do empréstimo hipotecário 1008 dos EUA	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Declaração de fechamento de hipoteca nos EUA	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Certificado de casamento	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Cartão de crédito	✔️	Não disponível	Não disponível	Não disponível
Modelos predefinidos	Cartão de visita	preterido	✔️	✔️	✔️
Modelo de classificação personalizada	Classificador personalizado	✔️	✔️	Não disponível	Não disponível
Modelo de extração personalizado	Neural personalizado	✔️	✔️	✔️	Não disponível
Modelo de extração personalizado	Modelo personalizado	✔️	✔️	✔️	✔️
Modelo de extração personalizado	Composto personalizado	✔️	✔️	✔️	✔️
Todos os modelos	Funcionalidades de complementos	✔️	✔️	Não disponível	Não disponível

* Contém submodelos. Consulte as informações específicas do modelo para variações e subtipos com suporte.
** Todos os recursos para o modelo de documento geral estão disponíveis no modelo de layout. Não há mais suporte para o modelo geral.

Latência

Latência é o tempo necessário para um servidor de API manipular e processar uma solicitação de entrada e entregar a resposta de saída ao cliente. O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e do conteúdo associado em cada página. O Document Intelligence é um serviço assíncrono multilocatário em que a latência para documentos semelhantes é comparável, mas nem sempre idêntica. A variabilidade ocasional em latência e desempenho é inerente a qualquer serviço sem estado baseado em microsserviço que processa imagens e documentos grandes em escala. Embora estejamos aumentando continuamente os recursos de hardware, capacidade e dimensionamento, você ainda pode ter problemas de latência em runtime.

Funcionalidade de complemento

Os recursos de complemento a seguir estão disponíveis para o Document Intelligence. Para todos os modelos, exceto o modelo de cartão de visita, o Document Intelligence agora dá suporte a recursos de complemento para permitir uma análise mais sofisticada. Você pode habilitar e desabilitar esses recursos opcionais dependendo do cenário de extração de documentos. Os seguintes recursos de complemento estão disponíveis para o GA (2023-07-31) e a versão posterior da API:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
queryFields (não disponível com os modelos fiscais dos EUA)
searchablePDF (disponível apenas para o modelo de leitura)

Funcionalidade adicional	Complemento/Gratuito	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Extração de propriedade de fonte	Extensão	✔️	✔️	Não disponível	Não disponível
Extração de fórmulas	Complemento	✔️	✔️	Não disponível	Não disponível
Extração de alta resolução	Complemento	✔️	✔️	Não disponível	Não disponível
Extração de código de barras	Gratuito	✔️	✔️	Não disponível	Não disponível
Detecção de idioma	Gratuito	✔️	✔️	Não disponível	Não disponível
Pares chave/valor	Gratuito	✔️	Não disponível	Não disponível	Não disponível
Campos de consulta	Complemento*	✔️	Não disponível	Não disponível	Não disponível
PDF pesquisável	Complemento*	✔️	Não disponível	Não disponível	Não disponível

Recursos de análise de modelo

ID do modelo	Extração de conteúdo	Campos de consulta	Parágrafos	Funções de parágrafo	Marcas de seleção	Tabelas	Pares chave/valor	Idiomas	Códigos de barras	Análise de documentos	Fórmulas*	Fonte de estilo*	Alta resolução*	PDF pesquisável
`prebuilt-read`	✓		✓					O	O		O	O	O	O
`prebuilt-layout`	✓	✓	✓	✓	✓	✓	O	O	O		O	O	O
`prebuilt-contract`	✓	✓	✓	✓	✓			O	O	✓	O	O
`prebuilt-healthInsuranceCard.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-idDocument`	✓	✓						O	O	✓	O	O	O
`prebuilt-invoice`	✓	✓			✓	✓	O	O	O	✓	O	O	O
`prebuilt-receipt`	✓	✓						O	O	✓	O	O	O
`prebuilt-marriageCertificate.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-creditCard`	✓	✓						O	O	✓	O	O	O
`prebuilt-check.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-payStub.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-bankStatement`	✓	✓						O	O	✓	O	O	O
`prebuilt-mortgage.us.1003`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1004`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1005`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1008`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.closingDisclosure`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w2`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w4`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1040` (vários)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1095A`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1095C`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1098`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098E`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098T`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099` (vários)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099SSA`	✓	✓						O	O	✓	O	O	O
`{ customModelName }`	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ – Habilitado
O – Opcional
* – Os recursos Premium incorrem em custos extras

Os campos de consulta têm um preço diferente dos outros recursos de complemento. Para obter mais informações, consulte Preços.

Caixa delimitadora e coordenadas de polígono

Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que circunda elementos de texto em um documento. Uma caixa delimitadora é usada como um ponto de referência para detecção de objetos:

A caixa delimitadora especifica a posição usando um plano de coordenadas x e y, apresentado numa matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior esquerdo.
As coordenadas de imagem são apresentadas em pixels. Para um PDF, as coordenadas são apresentadas em polegadas.

Suporte ao idioma

Os modelos universais no Document Intelligence baseados no aprendizado profundo dão suporte a muitas linguagens. Os modelos podem extrair texto multilíngue de suas imagens e documentos, incluindo linhas de texto com idiomas mistos. O suporte ao idioma varia de acordo com a funcionalidade do serviço do Document Intelligence. Para obter uma lista completa, consulte os seguintes artigos:

Disponibilidade regional

O Document Intelligence geralmente está disponível em muitas das 60+ Azure regiões de infraestrutura global.

Para ajudar a escolher a região que é melhor para você e seus clientes, consulte Azure geographies.

Detalhes do modelo

Esta seção descreve a saída que você pode esperar de cada modelo. Você pode estender a saída da maioria dos modelos com funcionalidades adicionais.

Ler Reconhecimento Óptico de Caracteres

A API de Leitura usa o OCR (reconhecimento óptico de caracteres) para analisar e extrair linhas e palavras, seus locais, idiomas detectados e estilo de manuscrito, se detectado.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um documento de exemplo processado usando o Document Intelligence Studio Read.

Saiba mais: Modelo de leitura de dados

Análise de layout

O modelo de análise de layout analisa e extrai texto, tabelas, marcas de seleção e outros elementos de estrutura, como títulos, títulos de seção, cabeçalhos de página e rodapés de página.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma página de jornal de exemplo processada usando o Document Intelligence Studio.

Saiba mais: Modelo de layout

Cartão de seguro de saúde

O modelo de cartão de seguro de saúde combina recursos avançados de OCR com modelos de aprendizado profundo para analisar e extrair informações importantes de cartões de seguro de saúde dos EUA.

Este exemplo de cartão de seguro de saúde dos EUA foi processado usando o Document Intelligence Studio.

Saiba mais: Modelo de cartão de seguro de saúde

Documentos fiscais dos EUA

Os modelos de documento fiscal dos EUA analisam e extraem campos-chave e itens de linha de um grupo seleto de documentos fiscais. A API dá suporte à análise de documentos fiscais em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os seguintes modelos:

Modelo	Descrição	ID do modelo
Imposto dos EUA W-2	Extraia detalhes de compensação tributáveis.	`prebuilt-tax.us.w2`
Formulário de Imposto dos EUA W-4	Extraia detalhes de compensação tributáveis.	`prebuilt-tax.us.w4`
Imposto dos EUA 1040	Extraia os detalhes dos juros da hipoteca.	`prebuilt-tax.us.1040` (variações)
Imposto dos EUA 1095	Extraia detalhes do seguro de saúde.	`prebuilt-tax.us.1095` (variações)
Imposto dos EUA 1098	Extraia os detalhes dos juros da hipoteca.	`prebuilt-tax.us.1098` (variações)
Imposto dos EUA 1099	Extraia os rendimentos recebidos de fontes diferentes do empregador.	`prebuilt-tax.us.1099` (variações)

Este documento W-2 de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um documento W-2 de exemplo.

Saiba mais: Modelos de documentos fiscais

Documentos hipotecários dos EUA

Os modelos de documentos hipotecários dos EUA analisam e extraem campos-chave que incluem informações sobre mutuários, empréstimos e propriedades de um grupo seleto de documentos hipotecários. A API dá suporte à análise de documentos hipotecários em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os modelos a seguir.

Modelo	Descrição	ID do modelo
Contrato de Licença de Usuário Final 1003	Extrair detalhes do empréstimo, mutuário e propriedade.	`prebuilt-mortgage.us.1003`
1004 Relatório Uniforme de Avaliação Residencial (URAR)	Extrair detalhes sobre o empréstimo, o mutuário e a propriedade.	`prebuilt-mortgage.us.1004`
1005 Verificação do emprego	Extrair detalhes do empréstimo, do mutuário e da propriedade.	`prebuilt-mortgage.us.1005`
Documento de resumo 1008	Extraia os detalhes de mutuário, vendedor, propriedade, hipoteca e subscrição.	`prebuilt-mortgage.us.1008`
Divulgação de fechamento	Extraia detalhes de fechamento, custo de transação e detalhes de empréstimo.	`prebuilt-mortgage.us.closingDisclosure`

Este exemplo de documento de Divulgação de Fechamento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um exemplo de declaração de fechamento.

Saiba mais: Modelos de documentos hipotecários

Contrato

O modelo de contrato analisa e extrai os principais campos e itens de linha de contratos, incluindo partes, jurisdições, ID do contrato e título. Atualmente, o modelo dá suporte a documentos de contrato em inglês.

Este contrato de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração de modelo de contrato usando o Document Intelligence Studio.

Saiba mais: Modelo de contrato

Cheque bancário dos EUA

O modelo de análise de contratos analisa e extrai campos-chave de cheques bancários dos EUA, incluindo detalhes do cheque, detalhes da conta, valor e campo de observações.

Este exemplo de verificação bancária foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de verificação bancária usando o Document Intelligence Studio.

Saiba mais: Modelo de contrato

Extrato bancário dos EUA

O modelo de extrato bancário analisa e extrai campos-chave e itens de linha do número da conta de extratos bancários dos EUA, detalhes do banco, detalhes do extrato e detalhes da transação.

Este extrato bancário de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de extrato bancário usando o Document Intelligence Studio.

Saiba mais: Modelo de contrato

payStub

O modelo payStub analisa e extrai os principais campos e itens de linha de documentos e arquivos com informações relacionadas à folha de pagamento.

Este exemplo de pagamento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração de modelo payStub usando o Document Intelligence Studio.

Saiba mais: Modelo de contrato

Factura

O modelo de fatura automatiza o processamento de faturas para extrair o nome do cliente, o endereço de cobrança, a data de conclusão, o valor devido, os itens de linha e outros dados de chave.

Esta fatura de exemplo foi processada usando o Document Intelligence Studio.

Saiba mais: Modelo de fatura

Recibo

Use o modelo de recibo para escanear recibos de vendas e obter o nome do comerciante, datas, itens de linha, quantidades e totais de recibos impressos e manuscritos. A versão v3.0 também dá suporte ao processamento de recibo de hotel de página única.

Este recibo de exemplo foi processado usando o Document Intelligence Studio.

Saiba mais: Modelo de recibo

Documento de identidade

Use o modelo de documento de identidade (ID) para processar carteiras de motorista dos EUA (todos os 50 estados e o Distrito de Columbia) e páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem) para extrair campos-chave.

Este exemplo de carteira de motorista dos EUA foi processado usando o Document Intelligence Studio.

Saiba mais: Modelo de documento de identidade

Certificado de casamento

Use o modelo de certificado de casamento para processar os certificados de casamento dos EUA e extrair campos-chave, incluindo as pessoas, a data e o local.

Esta amostra de certificado de casamento dos EUA foi processada usando o Document Intelligence Studio.

Saiba mais: Modelo de documento de identidade

Cartão de crédito

Use o modelo de cartão de crédito para processar cartões de crédito e débito para extrair campos-chave.

Este cartão de crédito de exemplo foi processado usando o Document Intelligence Studio.

Saiba mais: Modelo de documento de identidade

Modelos personalizados

Os modelos personalizados são amplamente classificados em dois tipos. Modelos de classificação personalizados que dão suporte à classificação de um "tipo de documento" e modelos de extração personalizados que podem extrair um esquema definido de um tipo de documento específico.

Diagrama que mostra tipos de modelos personalizados e modos de build de modelo associados.

Modelos de documentos personalizados analisam e extraem dados de formulários e documentos específicos para sua empresa. Eles reconhecem campos de formulário dentro de seu conteúdo distinto e extraem pares chave/valor e dados de tabela. Você precisa apenas de um exemplo do tipo de formulário para começar.

A versão v3.0 e os modelos personalizados posteriores dão suporte à detecção de assinatura em modelo personalizado (formulário) e tabelas entre páginas em modelos e modelos neurais. A detecção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento. Se o modelo retornar sem sinal para detecção de assinatura, o modelo não encontrou uma assinatura no campo definido.

Este modelo personalizado de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra o Document Intelligence analisando um formulário personalizado.

Saiba mais: Modelo personalizado

Extração personalizada

O modelo de extração personalizado vem em dois tipos: modelo personalizado e neural personalizado. Para criar um modelo de extração personalizado, rotule um conjunto de dados de documentos com os valores que você deseja extrair e treine o modelo no conjunto de dados rotulado. Você precisa de apenas cinco exemplos do mesmo formulário ou tipo de documento para começar.

Esta extração personalizada de exemplo foi processada usando o Document Intelligence Studio.

Captura de tela que mostra a análise personalizada do modelo de extração no Document Intelligence Studio.

Saiba mais: Modelo personalizado

Saiba mais: Modelo neural personalizado

Classificador personalizado

Com o modelo de classificação personalizado, você pode identificar o tipo de documento antes de invocar o modelo de extração. O modelo de classificação está disponível a partir da API 2023-07-31 (GA). O treinamento de um modelo de classificação personalizada requer pelo menos duas classes distintas e um mínimo de cinco amostras por classe.

Saiba mais: Modelo de classificação personalizado

Modelos compostos

Um modelo composto é criado usando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 200 modelos personalizados treinados a um único modelo composto.

Este modelo composto de exemplo está no Document Intelligence Studio.

Captura de tela que mostra o painel de modelo personalizado do Document Intelligence Studio Compose.

Saiba mais: Modelo personalizado

Requisitos de entrada

Há suporte para os seguintes formatos de arquivo.

Modelo	PDF	Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Ler	✔	✔	✔
Layout	✔	✔	✔
Documento geral	✔	✔
Pré-construídos	✔	✔
Extração personalizada	✔	✔
Classificação personalizada	✔	✔	✔

Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.

Nota

A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. A limitação deriva da ferramenta e não do Serviço de Inteligência de Documento.

Migração de versão

Saiba como usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1.

Modelo	Descrição
Análise de documentos
Layout	Extraia informações de texto e layout de documentos.
Pré-construídos
Factura	Extraia informações importantes de faturas em inglês e espanhol.
Recibo	Extraia informações importantes de recibos em inglês.
Documento de ID	Extraia informações importantes de carteiras de motorista dos EUA e passaportes internacionais.
Cartão de visita	Extraia informações importantes de cartões de visita em inglês.
Personalizado
Personalizado	Extraia dados de formulários e documentos específicos para sua empresa. Modelos personalizados são treinados para seus dados distintos e casos de uso.
Composto	Redigir uma coleção de modelos personalizados e atribuí-los a um único modelo criado a partir de seus tipos de formulário.