Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este conteúdo se aplica a:
v4.0 (GA) | Versões anteriores:
v3.1 (GA)
v3.0 (desativação)
v2.1 (desativação)
Este conteúdo se aplica a:
v3.0 (desativação) | Versões mais recentes:
v4.0 (GA)
v3.1 | Versão anterior:
v2.1 (desativação)
Esse conteúdo se aplica a:
v2.1 | Versão mais recente:
v4.0 (GA)
Azure Document Intelligence nas Ferramentas Foundry dá suporte a vários modelos que podem ser usados para incorporar processamento inteligente de documentos aos seus aplicativos e fluxos. Você pode usar um modelo específico do domínio predefinido ou treinar um modelo personalizado adaptado às suas necessidades comerciais específicas e casos de uso. Você pode usar o Document Intelligence com a API REST ou bibliotecas de clientes Python, C#, Java e JavaScript.
Nota
Projetos de processamento de documentos que envolvem dados financeiros, dados de integridade protegidos, dados pessoais ou dados altamente confidenciais exigem atenção cuidadosa. Certifique-se de cumprir todos os requisitos nacionais/regionais e específicos do setor.
Visão geral do modelo
A tabela a seguir mostra os modelos de GA (disponibilidade geral) para cada API estável.
| Tipo de modelo | Modelo | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Modelos de análise de documentos | Ler | ✔️ | ✔️ | ✔️ | Não disponível |
| Modelos de análise de documentos | Layout | ✔️ | ✔️ | ✔️ | ✔️ |
| Modelos de análise de documentos | Documento geral** | Compatível com modelo de layout |
✔️ | ✔️ | Não disponível |
| Modelos predefinidos | Verificação bancária | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Extrato bancário | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | payStub | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Contrato | ✔️ | ✔️ | Não disponível | Não disponível |
| Modelos predefinidos | Cartão de seguro de saúde | ✔️ | ✔️ | ✔️ | Não disponível |
| Modelos predefinidos | Documento de ID | ✔️ | ✔️ | ✔️ | ✔️ |
| Modelos predefinidos | Factura | ✔️ | ✔️ | ✔️ | ✔️ |
| Modelos predefinidos | Recibo | ✔️ | ✔️ | ✔️ | ✔️ |
| Modelos predefinidos | Imposto unificado dos EUA* | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Imposto dos EUA 1040* | ✔️ | ✔️ | Não disponível | Não disponível |
| Modelos predefinidos | Imposto dos EUA 1095* | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Imposto dos EUA 1098* | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Imposto dos EUA 1099* | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Imposto do W2 dos EUA | ✔️ | ✔️ | ✔️ | Não disponível |
| Modelos predefinidos | Imposto do W4 dos EUA | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Formulário de Hipoteca 1003 URLA dos EUA | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | URAR da hipoteca 1004 dos EUA | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Hipoteca dos EUA 1005 | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Resumo do empréstimo hipotecário 1008 dos EUA | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Declaração de fechamento de hipoteca nos EUA | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Certificado de casamento | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Cartão de crédito | ✔️ | Não disponível | Não disponível | Não disponível |
| Modelos predefinidos | Cartão de visita | preterido | ✔️ | ✔️ | ✔️ |
| Modelo de classificação personalizada | Classificador personalizado | ✔️ | ✔️ | Não disponível | Não disponível |
| Modelo de extração personalizado | Neural personalizado | ✔️ | ✔️ | ✔️ | Não disponível |
| Modelo de extração personalizado | Modelo personalizado | ✔️ | ✔️ | ✔️ | ✔️ |
| Modelo de extração personalizado | Composto personalizado | ✔️ | ✔️ | ✔️ | ✔️ |
| Todos os modelos | Funcionalidades de complementos | ✔️ | ✔️ | Não disponível | Não disponível |
* Contém submodelos. Consulte as informações específicas do modelo para variações e subtipos com suporte.
** Todos os recursos para o modelo de documento geral estão disponíveis no modelo de layout. Não há mais suporte para o modelo geral.
Latência
Latência é o tempo necessário para um servidor de API manipular e processar uma solicitação de entrada e entregar a resposta de saída ao cliente. O tempo para analisar um documento depende do tamanho (por exemplo, número de páginas) e do conteúdo associado em cada página. O Document Intelligence é um serviço assíncrono multilocatário em que a latência para documentos semelhantes é comparável, mas nem sempre idêntica. A variabilidade ocasional em latência e desempenho é inerente a qualquer serviço sem estado baseado em microsserviço que processa imagens e documentos grandes em escala. Embora estejamos aumentando continuamente os recursos de hardware, capacidade e dimensionamento, você ainda pode ter problemas de latência em runtime.
Funcionalidade de complemento
Os recursos de complemento a seguir estão disponíveis para o Document Intelligence. Para todos os modelos, exceto o modelo de cartão de visita, o Document Intelligence agora dá suporte a recursos de complemento para permitir uma análise mais sofisticada. Você pode habilitar e desabilitar esses recursos opcionais dependendo do cenário de extração de documentos. Os seguintes recursos de complemento estão disponíveis para o GA (2023-07-31) e a versão posterior da API:
ocrHighResolutionformulasstyleFontbarcodeslanguageskeyValuePairs-
queryFields(não disponível com os modelos fiscais dos EUA) -
searchablePDF(disponível apenas para o modelo de leitura)
| Funcionalidade adicional | Complemento/Gratuito | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Extração de propriedade de fonte | Extensão | ✔️ | ✔️ | Não disponível | Não disponível |
| Extração de fórmulas | Complemento | ✔️ | ✔️ | Não disponível | Não disponível |
| Extração de alta resolução | Complemento | ✔️ | ✔️ | Não disponível | Não disponível |
| Extração de código de barras | Gratuito | ✔️ | ✔️ | Não disponível | Não disponível |
| Detecção de idioma | Gratuito | ✔️ | ✔️ | Não disponível | Não disponível |
| Pares chave/valor | Gratuito | ✔️ | Não disponível | Não disponível | Não disponível |
| Campos de consulta | Complemento* | ✔️ | Não disponível | Não disponível | Não disponível |
| PDF pesquisável | Complemento* | ✔️ | Não disponível | Não disponível | Não disponível |
Recursos de análise de modelo
| ID do modelo | Extração de conteúdo | Campos de consulta | Parágrafos | Funções de parágrafo | Marcas de seleção | Tabelas | Pares chave/valor | Idiomas | Códigos de barras | Análise de documentos | Fórmulas* | Fonte de estilo* | Alta resolução* | PDF pesquisável |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (vários) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (vários) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ – Habilitado
O – Opcional
* – Os recursos Premium incorrem em custos extras
Os campos de consulta têm um preço diferente dos outros recursos de complemento. Para obter mais informações, consulte Preços.
Caixa delimitadora e coordenadas de polígono
Uma caixa delimitadora (polygon na v3.0 e versões posteriores) é um retângulo abstrato que circunda elementos de texto em um documento. Uma caixa delimitadora é usada como um ponto de referência para detecção de objetos:
- A caixa delimitadora especifica a posição usando um plano de coordenadas x e y, apresentado numa matriz de quatro pares numéricos. Cada par representa um canto da caixa na seguinte ordem: superior esquerdo, superior direito, inferior direito, inferior esquerdo.
- As coordenadas de imagem são apresentadas em pixels. Para um PDF, as coordenadas são apresentadas em polegadas.
Suporte ao idioma
Os modelos universais no Document Intelligence baseados no aprendizado profundo dão suporte a muitas linguagens. Os modelos podem extrair texto multilíngue de suas imagens e documentos, incluindo linhas de texto com idiomas mistos. O suporte ao idioma varia de acordo com a funcionalidade do serviço do Document Intelligence. Para obter uma lista completa, consulte os seguintes artigos:
- Suporte ao idioma: modelos de análise de documentos
- Suporte à linguagem: modelos predefinidos
- Suporte ao idioma: modelos personalizados
Disponibilidade regional
O Document Intelligence geralmente está disponível em muitas das 60+ Azure regiões de infraestrutura global.
Para ajudar a escolher a região que é melhor para você e seus clientes, consulte Azure geographies.
Detalhes do modelo
Esta seção descreve a saída que você pode esperar de cada modelo. Você pode estender a saída da maioria dos modelos com funcionalidades adicionais.
Ler Reconhecimento Óptico de Caracteres
A API de Leitura usa o OCR (reconhecimento óptico de caracteres) para analisar e extrair linhas e palavras, seus locais, idiomas detectados e estilo de manuscrito, se detectado.
Este documento de exemplo foi processado usando o Document Intelligence Studio.
Análise de layout
O modelo de análise de layout analisa e extrai texto, tabelas, marcas de seleção e outros elementos de estrutura, como títulos, títulos de seção, cabeçalhos de página e rodapés de página.
Este documento de exemplo foi processado usando o Document Intelligence Studio.
Cartão de seguro de saúde
O modelo de cartão de seguro de saúde combina recursos avançados de OCR com modelos de aprendizado profundo para analisar e extrair informações importantes de cartões de seguro de saúde dos EUA.
Este exemplo de cartão de seguro de saúde dos EUA foi processado usando o Document Intelligence Studio.
Documentos fiscais dos EUA
Os modelos de documento fiscal dos EUA analisam e extraem campos-chave e itens de linha de um grupo seleto de documentos fiscais. A API dá suporte à análise de documentos fiscais em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os seguintes modelos:
| Modelo | Descrição | ID do modelo |
|---|---|---|
| Imposto dos EUA W-2 | Extraia detalhes de compensação tributáveis. | prebuilt-tax.us.w2 |
| Formulário de Imposto dos EUA W-4 | Extraia detalhes de compensação tributáveis. | prebuilt-tax.us.w4 |
| Imposto dos EUA 1040 | Extraia os detalhes dos juros da hipoteca. |
prebuilt-tax.us.1040 (variações) |
| Imposto dos EUA 1095 | Extraia detalhes do seguro de saúde. |
prebuilt-tax.us.1095 (variações) |
| Imposto dos EUA 1098 | Extraia os detalhes dos juros da hipoteca. |
prebuilt-tax.us.1098 (variações) |
| Imposto dos EUA 1099 | Extraia os rendimentos recebidos de fontes diferentes do empregador. |
prebuilt-tax.us.1099 (variações) |
Este documento W-2 de exemplo foi processado usando o Document Intelligence Studio.
Documentos hipotecários dos EUA
Os modelos de documentos hipotecários dos EUA analisam e extraem campos-chave que incluem informações sobre mutuários, empréstimos e propriedades de um grupo seleto de documentos hipotecários. A API dá suporte à análise de documentos hipotecários em inglês dos EUA de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos verificados e PDFs digitais. Atualmente, há suporte para os modelos a seguir.
| Modelo | Descrição | ID do modelo |
|---|---|---|
| Contrato de Licença de Usuário Final 1003 | Extrair detalhes do empréstimo, mutuário e propriedade. | prebuilt-mortgage.us.1003 |
| 1004 Relatório Uniforme de Avaliação Residencial (URAR) | Extrair detalhes sobre o empréstimo, o mutuário e a propriedade. | prebuilt-mortgage.us.1004 |
| 1005 Verificação do emprego | Extrair detalhes do empréstimo, do mutuário e da propriedade. | prebuilt-mortgage.us.1005 |
| Documento de resumo 1008 | Extraia os detalhes de mutuário, vendedor, propriedade, hipoteca e subscrição. | prebuilt-mortgage.us.1008 |
| Divulgação de fechamento | Extraia detalhes de fechamento, custo de transação e detalhes de empréstimo. | prebuilt-mortgage.us.closingDisclosure |
Este exemplo de documento de Divulgação de Fechamento foi processado usando o Document Intelligence Studio.
Contrato
O modelo de contrato analisa e extrai os principais campos e itens de linha de contratos, incluindo partes, jurisdições, ID do contrato e título. Atualmente, o modelo dá suporte a documentos de contrato em inglês.
Este contrato de exemplo foi processado usando o Document Intelligence Studio.
Cheque bancário dos EUA
O modelo de análise de contratos analisa e extrai campos-chave de cheques bancários dos EUA, incluindo detalhes do cheque, detalhes da conta, valor e campo de observações.
Este exemplo de verificação bancária foi processado usando o Document Intelligence Studio.
Extrato bancário dos EUA
O modelo de extrato bancário analisa e extrai campos-chave e itens de linha do número da conta de extratos bancários dos EUA, detalhes do banco, detalhes do extrato e detalhes da transação.
Este extrato bancário de exemplo foi processado usando o Document Intelligence Studio.
payStub
O modelo payStub analisa e extrai os principais campos e itens de linha de documentos e arquivos com informações relacionadas à folha de pagamento.
Este exemplo de pagamento foi processado usando o Document Intelligence Studio.
Factura
O modelo de fatura automatiza o processamento de faturas para extrair o nome do cliente, o endereço de cobrança, a data de conclusão, o valor devido, os itens de linha e outros dados de chave.
Esta fatura de exemplo foi processada usando o Document Intelligence Studio.
Recibo
Use o modelo de recibo para escanear recibos de vendas e obter o nome do comerciante, datas, itens de linha, quantidades e totais de recibos impressos e manuscritos. A versão v3.0 também dá suporte ao processamento de recibo de hotel de página única.
Este recibo de exemplo foi processado usando o Document Intelligence Studio.
Documento de identidade
Use o modelo de documento de identidade (ID) para processar carteiras de motorista dos EUA (todos os 50 estados e o Distrito de Columbia) e páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem) para extrair campos-chave.
Este exemplo de carteira de motorista dos EUA foi processado usando o Document Intelligence Studio.
Certificado de casamento
Use o modelo de certificado de casamento para processar os certificados de casamento dos EUA e extrair campos-chave, incluindo as pessoas, a data e o local.
Esta amostra de certificado de casamento dos EUA foi processada usando o Document Intelligence Studio.
Cartão de crédito
Use o modelo de cartão de crédito para processar cartões de crédito e débito para extrair campos-chave.
Este cartão de crédito de exemplo foi processado usando o Document Intelligence Studio.
Modelos personalizados
Os modelos personalizados são amplamente classificados em dois tipos. Modelos de classificação personalizados que dão suporte à classificação de um "tipo de documento" e modelos de extração personalizados que podem extrair um esquema definido de um tipo de documento específico.
Modelos de documentos personalizados analisam e extraem dados de formulários e documentos específicos para sua empresa. Eles reconhecem campos de formulário dentro de seu conteúdo distinto e extraem pares chave/valor e dados de tabela. Você precisa apenas de um exemplo do tipo de formulário para começar.
A versão v3.0 e os modelos personalizados posteriores dão suporte à detecção de assinatura em modelo personalizado (formulário) e tabelas entre páginas em modelos e modelos neurais. A detecção de assinatura procura a presença de uma assinatura, não a identidade da pessoa que assina o documento. Se o modelo retornar sem sinal para detecção de assinatura, o modelo não encontrou uma assinatura no campo definido.
Este modelo personalizado de exemplo foi processado usando o Document Intelligence Studio.
Extração personalizada
O modelo de extração personalizado vem em dois tipos: modelo personalizado e neural personalizado. Para criar um modelo de extração personalizado, rotule um conjunto de dados de documentos com os valores que você deseja extrair e treine o modelo no conjunto de dados rotulado. Você precisa de apenas cinco exemplos do mesmo formulário ou tipo de documento para começar.
Esta extração personalizada de exemplo foi processada usando o Document Intelligence Studio.
Classificador personalizado
Com o modelo de classificação personalizado, você pode identificar o tipo de documento antes de invocar o modelo de extração. O modelo de classificação está disponível a partir da API 2023-07-31 (GA). O treinamento de um modelo de classificação personalizada requer pelo menos duas classes distintas e um mínimo de cinco amostras por classe.
Modelos compostos
Um modelo composto é criado usando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 200 modelos personalizados treinados a um único modelo composto.
Este modelo composto de exemplo está no Document Intelligence Studio.
Requisitos de entrada
Há suporte para os seguintes formatos de arquivo.
| Modelo | Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Ler | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Documento geral | ✔ | ✔ | |
| Pré-construídos | ✔ | ✔ | |
| Extração personalizada | ✔ | ✔ | |
| Classificação personalizada | ✔ | ✔ | ✔ |
- Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
- PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
- Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
- Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
- Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
- Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
- Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
- Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.
Nota
A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. A limitação deriva da ferramenta e não do Serviço de Inteligência de Documento.
Migração de versão
Saiba como usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1.
| Modelo | Descrição |
|---|---|
| Análise de documentos | |
| Layout | Extraia informações de texto e layout de documentos. |
| Pré-construídos | |
| Factura | Extraia informações importantes de faturas em inglês e espanhol. |
| Recibo | Extraia informações importantes de recibos em inglês. |
| Documento de ID | Extraia informações importantes de carteiras de motorista dos EUA e passaportes internacionais. |
| Cartão de visita | Extraia informações importantes de cartões de visita em inglês. |
| Personalizado | |
| Personalizado | Extraia dados de formulários e documentos específicos para sua empresa. Modelos personalizados são treinados para seus dados distintos e casos de uso. |
| Composto | Redigir uma coleção de modelos personalizados e atribuí-los a um único modelo criado a partir de seus tipos de formulário. |
Layout
A API de Layout analisa e extrai texto, tabelas e cabeçalhos, marcas de seleção e informações de estrutura de documentos.
Este documento de exemplo foi processado usando a ferramenta de rotulagem de amostra.
Factura
O modelo de fatura analisa e extrai informações importantes de faturas de vendas. A API analisa faturas em vários formatos e extrai informações importantes, como nome do cliente, endereço de cobrança, data de conclusão e valor devido.
Esta fatura de exemplo foi processada usando a ferramenta de Rotulagem de Exemplo.
Recibo
O modelo de recibo analisa e extrai informações importantes de recibos de vendas impressos e manuscritos.
Este recibo de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.
Documento de ID
O modelo de documento de ID analisa e extrai informações importantes dos seguintes documentos:
- Carteiras de motorista dos EUA (todos os 50 estados e Distrito de Columbia)
- Páginas biográficas de passaportes internacionais (excluindo vistos e outros documentos de viagem). A API analisa e extrai documentos de identidade.
Este exemplo de carteira de motorista dos EUA foi processado pela ferramenta Sample Labeling.
Cartão de visita
O modelo de cartão de visita analisa e extrai informações importantes de imagens de cartão de visita.
Este cartão de visita de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.
Personalizado
Modelos personalizados analisam e extraem dados de formulários e documentos específicos para sua empresa. A API é um programa de machine learning treinado para reconhecer campos de formulário dentro de seu conteúdo distinto e extrair pares chave/valor e dados de tabela. Você precisa de apenas cinco exemplos do mesmo tipo de formulário para começar. Você pode treinar seu modelo personalizado com ou sem conjuntos de dados rotulados.
Este modelo personalizado de exemplo foi processado usando a ferramenta de Rotulagem de Exemplo.
Modelo personalizado composto
Um modelo composto é criado usando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Você pode atribuir vários modelos personalizados a um modelo composto que são chamados com uma única ID de modelo. Você pode atribuir até 100 modelos personalizados treinados a um único modelo composto.
Esse painel de modelo composto foi processado usando a ferramenta de etiquetagem de exemplo.
Extração de dados do modelo
| Modelo | Extração de texto | Detecção de idioma | Marcas de seleção | Tabelas | Parágrafos | Funções de parágrafo | Pares chave/valor | Campos |
|---|---|---|---|---|---|---|---|---|
| Layout | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| Factura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| Recibo | ✓ | ✓ | ✓ | |||||
| Documento de ID | ✓ | ✓ | ✓ | |||||
| Cartão de Visita | ✓ | ✓ | ✓ | |||||
| Formulário Personalizado | ✓ | ✓ | ✓ | ✓ | ✓ |
Requisitos de entrada
Há suporte para os seguintes formatos de arquivo.
| Modelo | Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Ler | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Documento geral | ✔ | ✔ | |
| Pré-construídos | ✔ | ✔ | |
| Extração personalizada | ✔ | ✔ | |
| Classificação personalizada | ✔ | ✔ | ✔ |
- Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
- PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura de camada livre, somente as duas primeiras páginas são processadas.)
- Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
- Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
- Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
- Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 pontos por polegada.
- Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
- Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.
Nota
A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. A limitação deriva da ferramenta e não do Document Intelligence.
Migração de versão
Você pode aprender a usar o Document Intelligence v3.0 em seus aplicativos seguindo as etapas no guia de migração do Document Intelligence v3.1
Conteúdo relacionado
- Processe seus próprios formulários e documentos com o Document Intelligence Studio.
- Conclua um início rápido do Document Intelligence e crie um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
- Processe seus próprios formulários e documentos com a ferramenta de rotulagem de exemplo do Document Intelligence.
- Conclua um início rápido do Document Intelligence e crie um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.