Modelos de processamento de documentos

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)red-checkmarkv2.1 (desativação)

Este conteúdo se aplica a:checkmarkv3.1 (GA) | Versão mais recente:purple-checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este conteúdo se aplica a:red-checkmarkv3.0 (desativação) | Versões mais recentes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versão anterior:blue-checkmarkv2.1 (desativação)

Esse conteúdo se aplica a:red-checkmarkv2.1 | Versão mais recente:blue-checkmarkv4.0 (GA)

Azure Document Intelligence nas Ferramentas Foundry dá suporte a vários modelos que podem ser usados para incorporar processamento inteligente de documentos aos seus aplicativos e fluxos. Você pode usar um modelo específico do domínio predefinido ou treinar um modelo personalizado adaptado às suas necessidades comerciais específicas e casos de uso. Você pode usar o Document Intelligence com a API REST ou bibliotecas de clientes Python, C#, Java e JavaScript.

Nota

Projetos de processamento de documentos que envolvem dados financeiros, dados de integridade protegidos, dados pessoais ou dados altamente confidenciais exigem atenção cuidadosa. Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.

Visão geral do modelo

A tabela a seguir mostra os modelos de GA (disponibilidade geral) para cada API estável.

Tipo de modelo Modelo 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Modelos de análise de documentos Ler ✔️ ✔️ ✔️ Não disponível
Modelos de análise de documentos Layout ✔️ ✔️ ✔️ ✔️
Modelos de análise de documentos Documento geral** Compatível com
modelo de layout
✔️ ✔️ Não disponível
Modelos predefinidos Verificação bancária ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Extrato bancário ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos payStub ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Contrato ✔️ ✔️ Não disponível Não disponível
Modelos predefinidos Cartão de seguro de saúde ✔️ ✔️ ✔️ Não disponível
Modelos predefinidos Documento de ID ✔️ ✔️ ✔️ ✔️
Modelos predefinidos Factura ✔️ ✔️ ✔️ ✔️
Modelos predefinidos Recibo ✔️ ✔️ ✔️ ✔️
Modelos predefinidos Imposto unificado dos EUA* ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Imposto dos EUA 1040* ✔️ ✔️ Não disponível Não disponível
Modelos predefinidos Imposto dos EUA 1095* ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Imposto dos EUA 1098* ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Imposto dos EUA 1099* ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Imposto do W2 dos EUA ✔️ ✔️ ✔️ Não disponível
Modelos predefinidos Imposto do W4 dos EUA ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Formulário de Hipoteca 1003 URLA dos EUA ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos URAR da hipoteca 1004 dos EUA ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Hipoteca dos EUA 1005 ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Resumo do empréstimo hipotecário 1008 dos EUA ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Declaração de fechamento de hipoteca nos EUA ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Certificado de casamento ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Cartão de crédito ✔️ Não disponível Não disponível Não disponível
Modelos predefinidos Cartão de visita preterido ✔️ ✔️ ✔️
Modelo de classificação personalizada Classificador personalizado ✔️ ✔️ Não disponível Não disponível
Modelo de extração personalizado Neural personalizado ✔️ ✔️ ✔️ Não disponível
Modelo de extração personalizado Modelo personalizado ✔️ ✔️ ✔️ ✔️
Modelo de extração personalizado Composto personalizado ✔️ ✔️ ✔️ ✔️
Todos os modelos Funcionalidades de complementos ✔️ ✔️ Não disponível Não disponível

* Contém submodelos. Consulte as informações específicas do modelo para variações e subtipos com suporte.
** Todos os recursos para o modelo de documento geral estão disponíveis no modelo de layout. Não há mais suporte para o modelo geral.

Latência

Latência é o tempo necessário para um servidor de API manipular e processar uma solicitação de entrada e entregar a resposta de saída ao cliente. O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e do conteúdo associado em cada página. O Document Intelligence é um serviço assíncrono multilocatário em que a latência para documentos semelhantes é comparável, mas nem sempre idêntica. A variabilidade ocasional em latência e desempenho é inerente a qualquer serviço sem estado baseado em microsserviço que processa imagens e documentos grandes em escala. Embora estejamos aumentando continuamente os recursos de hardware, capacidade e dimensionamento, você ainda pode ter problemas de latência em runtime.

Funcionalidade de complemento

Os recursos de complemento a seguir estão disponíveis para o Document Intelligence. Para todos os modelos, exceto o modelo de cartão de visita, o Document Intelligence agora dá suporte a recursos de complemento para permitir uma análise mais sofisticada. Você pode habilitar e desabilitar esses recursos opcionais dependendo do cenário de extração de documentos. Os seguintes recursos de complemento estão disponíveis para o GA (2023-07-31) e a versão posterior da API:

Funcionalidade adicional Complemento/Gratuito 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Extração de propriedade de fonte Extensão ✔️ ✔️ Não disponível Não disponível
Extração de fórmulas Complemento ✔️ ✔️ Não disponível Não disponível
Extração de alta resolução Complemento ✔️ ✔️ Não disponível Não disponível
Extração de código de barras Gratuito ✔️ ✔️ Não disponível Não disponível
Detecção de idioma Gratuito ✔️ ✔️ Não disponível Não disponível
Pares chave/valor Gratuito ✔️ Não disponível Não disponível Não disponível
Campos de consulta Complemento* ✔️ Não disponível Não disponível Não disponível
PDF pesquisável Complemento* ✔️ Não disponível Não disponível Não disponível

Recursos de análise de modelo

ID do modelo Extração de conteúdo Campos de consulta Parágrafos Funções de parágrafo Marcas de seleção Tabelas Pares chave/valor Idiomas Códigos de barras Análise de documentos Fórmulas* Fonte de estilo* Alta resolução* PDF pesquisável
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (vários) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (vários) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ – Habilitado
O – Opcional
* – Os recursos Premium incorrem em custos extras

Os campos de consulta têm um preço diferente dos outros recursos de complemento. Para obter mais informações, consulte Preços.

Caixa delimitadora e coordenadas de polígono

Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que circunda elementos de texto em um documento. Uma caixa delimitadora é usada como um ponto de referência para detecção de objetos:

  • A caixa delimitadora especifica a posição usando um plano de coordenadas x e y, apresentado numa matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior esquerdo.
  • As coordenadas de imagem são apresentadas em pixels. Para um PDF, as coordenadas são apresentadas em polegadas.

Suporte ao idioma

Os modelos universais no Document Intelligence baseados no aprendizado profundo dão suporte a muitas linguagens. Os modelos podem extrair texto multilíngue de suas imagens e documentos, incluindo linhas de texto com idiomas mistos. O suporte ao idioma varia de acordo com a funcionalidade do serviço do Document Intelligence. Para obter uma lista completa, consulte os seguintes artigos:

Disponibilidade regional

O Document Intelligence geralmente está disponível em muitas das 60+ Azure regiões de infraestrutura global.

Para ajudar a escolher a região que é melhor para você e seus clientes, consulte Azure geographies.

Detalhes do modelo

Esta seção descreve a saída que você pode esperar de cada modelo. Você pode estender a saída da maioria dos modelos com funcionalidades adicionais.

Ler Reconhecimento Óptico de Caracteres

A API de Leitura usa o OCR (reconhecimento óptico de caracteres) para analisar e extrair linhas e palavras, seus locais, idiomas detectados e estilo de manuscrito, se detectado.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um documento de exemplo processado usando o Document Intelligence Studio Read.

Análise de layout

O modelo de análise de layout analisa e extrai texto, tabelas, marcas de seleção e outros elementos de estrutura, como títulos, títulos de seção, cabeçalhos de página e rodapés de página.

Este documento de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma página de jornal de exemplo processada usando o Document Intelligence Studio.

Cartão de seguro de saúde

O modelo de cartão de seguro de saúde combina recursos avançados de OCR com modelos de aprendizado profundo para analisar e extrair informações importantes de cartões de seguro de saúde dos EUA.

Este exemplo de cartão de seguro de saúde dos EUA foi processado usando o Document Intelligence Studio.

Captura de tela que mostra uma análise de cartão de seguro de saúde dos EUA de exemplo no Document Intelligence Studio.

Documentos fiscais dos EUA

Os modelos de documento fiscal dos EUA analisam e extraem campos-chave e itens de linha de um grupo seleto de documentos fiscais. A API dá suporte à análise de documentos fiscais em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os seguintes modelos:

Modelo Descrição ID do modelo
Imposto dos EUA W-2 Extraia detalhes de compensação tributáveis. prebuilt-tax.us.w2
Formulário de Imposto dos EUA W-4 Extraia detalhes de compensação tributáveis. prebuilt-tax.us.w4
Imposto dos EUA 1040 Extraia os detalhes dos juros da hipoteca. prebuilt-tax.us.1040 (variações)
Imposto dos EUA 1095 Extraia detalhes do seguro de saúde. prebuilt-tax.us.1095 (variações)
Imposto dos EUA 1098 Extraia os detalhes dos juros da hipoteca. prebuilt-tax.us.1098 (variações)
Imposto dos EUA 1099 Extraia os rendimentos recebidos de fontes diferentes do empregador. prebuilt-tax.us.1099 (variações)

Este documento W-2 de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um documento W-2 de exemplo.

Documentos hipotecários dos EUA

Os modelos de documentos hipotecários dos EUA analisam e extraem campos-chave que incluem informações sobre mutuários, empréstimos e propriedades de um grupo seleto de documentos hipotecários. A API dá suporte à análise de documentos hipotecários em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os modelos a seguir.

Modelo Descrição ID do modelo
Contrato de Licença de Usuário Final 1003 Extrair detalhes do empréstimo, mutuário e propriedade. prebuilt-mortgage.us.1003
1004 Relatório Uniforme de Avaliação Residencial (URAR) Extrair detalhes sobre o empréstimo, o mutuário e a propriedade. prebuilt-mortgage.us.1004
1005 Verificação do emprego Extrair detalhes do empréstimo, do mutuário e da propriedade. prebuilt-mortgage.us.1005
Documento de resumo 1008 Extraia os detalhes de mutuário, vendedor, propriedade, hipoteca e subscrição. prebuilt-mortgage.us.1008
Divulgação de fechamento Extraia detalhes de fechamento, custo de transação e detalhes de empréstimo. prebuilt-mortgage.us.closingDisclosure

Este exemplo de documento de Divulgação de Fechamento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um exemplo de declaração de fechamento.

Contrato

O modelo de contrato analisa e extrai os principais campos e itens de linha de contratos, incluindo partes, jurisdições, ID do contrato e título. Atualmente, o modelo dá suporte a documentos de contrato em inglês.

Este contrato de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração de modelo de contrato usando o Document Intelligence Studio.

Cheque bancário dos EUA

O modelo de análise de contratos analisa e extrai campos-chave de cheques bancários dos EUA, incluindo detalhes do cheque, detalhes da conta, valor e campo de observações.

Este exemplo de verificação bancária foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de verificação bancária usando o Document Intelligence Studio.

Extrato bancário dos EUA

O modelo de extrato bancário analisa e extrai campos-chave e itens de linha do número da conta de extratos bancários dos EUA, detalhes do banco, detalhes do extrato e detalhes da transação.

Este extrato bancário de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração do modelo de extrato bancário usando o Document Intelligence Studio.

payStub

O modelo payStub analisa e extrai os principais campos e itens de linha de documentos e arquivos com informações relacionadas à folha de pagamento.

Este exemplo de pagamento foi processado usando o Document Intelligence Studio.

Captura de tela que mostra a extração de modelo payStub usando o Document Intelligence Studio.

Factura

O modelo de fatura automatiza o processamento de faturas para extrair o nome do cliente, o endereço de cobrança, a data de conclusão, o valor devido, os itens de linha e outros dados de chave.

Esta fatura de exemplo foi processada usando o Document Intelligence Studio.

Captura de tela que mostra uma fatura de exemplo.

Recibo

Use o modelo de recibo para escanear recibos de vendas e obter o nome do comerciante, datas, itens de linha, quantidades e totais de recibos impressos e manuscritos. A versão v3.0 também dá suporte ao processamento de recibo de hotel de página única.

Este recibo de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um recibo de exemplo.

Documento de identidade

Use o modelo de documento de identidade (ID) para processar carteiras de motorista dos EUA (todos os 50 estados e o Distrito de Columbia) e páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem) para extrair campos-chave.

Este exemplo de carteira de motorista dos EUA foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um cartão de identificação de exemplo.

Certificado de casamento

Use o modelo de certificado de casamento para processar os certificados de casamento dos EUA e extrair campos-chave, incluindo as pessoas, a data e o local.

Esta amostra de certificado de casamento dos EUA foi processada usando o Document Intelligence Studio.

Captura de tela que mostra uma amostra de certificado de casamento.

Cartão de crédito

Use o modelo de cartão de crédito para processar cartões de crédito e débito para extrair campos-chave.

Este cartão de crédito de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra um cartão de crédito de exemplo.

Modelos personalizados

Os modelos personalizados são amplamente classificados em dois tipos. Modelos de classificação personalizados que dão suporte à classificação de um "tipo de documento" e modelos de extração personalizados que podem extrair um esquema definido de um tipo de documento específico.

Diagrama que mostra tipos de modelos personalizados e modos de build de modelo associados.

Modelos de documentos personalizados analisam e extraem dados de formulários e documentos específicos para sua empresa. Eles reconhecem campos de formulário dentro de seu conteúdo distinto e extraem pares chave/valor e dados de tabela. Você precisa apenas de um exemplo do tipo de formulário para começar.

A versão v3.0 e os modelos personalizados posteriores dão suporte à detecção de assinatura em modelo personalizado (formulário) e tabelas entre páginas em modelos e modelos neurais. A detecção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento. Se o modelo retornar sem sinal para detecção de assinatura, o modelo não encontrou uma assinatura no campo definido.

Este modelo personalizado de exemplo foi processado usando o Document Intelligence Studio.

Captura de tela que mostra o Document Intelligence analisando um formulário personalizado.

Extração personalizada

O modelo de extração personalizado vem em dois tipos: modelo personalizado e neural personalizado. Para criar um modelo de extração personalizado, rotule um conjunto de dados de documentos com os valores que você deseja extrair e treine o modelo no conjunto de dados rotulado. Você precisa de apenas cinco exemplos do mesmo formulário ou tipo de documento para começar.

Esta extração personalizada de exemplo foi processada usando o Document Intelligence Studio.

Captura de tela que mostra a análise personalizada do modelo de extração no Document Intelligence Studio.

Classificador personalizado

Com o modelo de classificação personalizado, você pode identificar o tipo de documento antes de invocar o modelo de extração. O modelo de classificação está disponível a partir da API 2023-07-31 (GA). O treinamento de um modelo de classificação personalizada requer pelo menos duas classes distintas e um mínimo de cinco amostras por classe.

Modelos compostos

Um modelo composto é criado usando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 200 modelos personalizados treinados a um único modelo composto.

Este modelo composto de exemplo está no Document Intelligence Studio.

Captura de tela que mostra o painel de modelo personalizado do Document Intelligence Studio Compose.

Requisitos de entrada

Há suporte para os seguintes formatos de arquivo.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Ler
Layout
Documento geral
Pré-construídos
Extração personalizada
Classificação personalizada
  • Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
  • PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.

Nota

A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. A limitação deriva da ferramenta e não do Serviço de Inteligência de Documento.

Migração de versão

Saiba como usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1.

Modelo Descrição
Análise de documentos
Layout Extraia informações de texto e layout de documentos.
Pré-construídos
Factura Extraia informações importantes de faturas em inglês e espanhol.
Recibo Extraia informações importantes de recibos em inglês.
Documento de ID Extraia informações importantes de carteiras de motorista dos EUA e passaportes internacionais.
Cartão de visita Extraia informações importantes de cartões de visita em inglês.
Personalizado
Personalizado Extraia dados de formulários e documentos específicos para sua empresa. Modelos personalizados são treinados para seus dados distintos e casos de uso.
Composto Redigir uma coleção de modelos personalizados e atribuí-los a um único modelo criado a partir de seus tipos de formulário.

Layout

A API de Layout analisa e extrai texto, tabelas e cabeçalhos, marcas de seleção e informações de estrutura de documentos.

Este documento de exemplo foi processado usando a ferramenta de rotulagem de amostra.

Captura de tela que mostra a análise de layout usando a Ferramenta de Rotulagem de Amostra.

Factura

O modelo de fatura analisa e extrai informações importantes de faturas de vendas. A API analisa faturas em vários formatos e extrai informações importantes, como nome do cliente, endereço de cobrança, data de conclusão e valor devido.

Esta fatura de exemplo foi processada usando a ferramenta de Rotulagem de Exemplo.

Captura de tela que mostra uma análise de fatura de exemplo usando a ferramenta de Rotulagem de Amostra.

Recibo

O modelo de recibo analisa e extrai informações importantes de recibos de vendas impressos e manuscritos.

Este recibo de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.

Captura de tela que mostra um recibo de exemplo.

Documento de ID

O modelo de documento de ID analisa e extrai informações importantes dos seguintes documentos:

  • Carteiras de motorista dos EUA (todos os 50 estados e Distrito de Columbia)
  • Páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem). A API analisa e extrai documentos de identidade.

Este exemplo de carteira de motorista dos EUA foi processado pela ferramenta Sample Labeling.

Captura de tela que mostra um cartão de identificação de exemplo.

Cartão de visita

O modelo de cartão de visita analisa e extrai informações importantes de imagens de cartão de visita.

Este cartão de visita de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.

Captura de tela que mostra um cartão de visita de exemplo.

Personalizado

Modelos personalizados analisam e extraem dados de formulários e documentos específicos para sua empresa. A API é um programa de machine learning treinado para reconhecer campos de formulário dentro de seu conteúdo distinto e extrair pares chave/valor e dados de tabela. Você precisa de apenas cinco exemplos do mesmo tipo de formulário para começar. Você pode treinar seu modelo personalizado com ou sem conjuntos de dados rotulados.

Este modelo personalizado de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.

Captura de tela que mostra a ferramenta Document Intelligence analisando um painel de formulário personalizado.

Modelo personalizado composto

Um modelo composto é criado usando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 100 modelos personalizados treinados a um único modelo composto.

Esse painel de modelo composto foi processado usando a ferramenta de etiquetagem de exemplo.

Captura de tela que mostra o painel de modelo personalizado do Document Intelligence Studio Compose.

Extração de dados do modelo

Modelo Extração de texto Detecção de idioma Marcas de seleção Tabelas Parágrafos Funções de parágrafo Pares chave/valor Campos
Layout
Factura
Recibo
Documento de ID
Cartão de Visita
Formulário Personalizado

Requisitos de entrada

Há suporte para os seguintes formatos de arquivo.

Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Ler
Layout
Documento geral
Pré-construídos
Extração personalizada
Classificação personalizada
  • Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
  • PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
  • Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
  • Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
  • Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
  • Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
  • Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
  • Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
  • Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
  • Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.

Nota

A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. A limitação deriva da ferramenta e não do Document Intelligence.

Migração de versão

Você pode aprender a usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1