Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este conteúdo se aplica a:
v4.0 (GA) | Versões anteriores:
v3.1 (GA)
v3.0 (desativação)
v2.1 (desativação)
::: moniker-end
Este conteúdo se aplica a:
v3.0 (descontinuada) | Versões mais recentes:
v4.0 (GA)
v3.1 | Versão anterior:
v2.1 (descontinuada)
Esse conteúdo se aplica a:
v2.1 | Versão mais recente:
v4.0 (GA)
Nota
A API de Inteligência de Documentos v4.0 2024-11-30 (GA) para o modelo predefinido de documento de identidade agora dá suporte a documentos de identificação de todas as regiões do mundo, incluindo cobertura expandida na América do Norte, América do Sul, Ásia, Europa, África e Oceania.
O modelo de documento de identidade do Document Intelligence (ID) combina o OCR (Reconhecimento Óptico de Caracteres) com modelos de aprendizado profundo para analisar e extrair informações importantes de documentos de identidade. A API analisa documentos de identidade (incluindo os seguintes) e retorna uma representação de dados JSON estruturada.
| Região | Tipos de documento |
|---|---|
| Mundial | Livro de passaportes, cartão de passaporte |
| Estados Unidos | Carteira de Habilitação, Cartão de Identificação, Autorização de Residência (Green card), CPF, ID Militar |
| Índia | Carteira de Habilitação, Cartão PAN, Cartão Aadhaar |
| Austrália | Carteira de Habilitação, Cartão de Fotos, ID de passagem de chave (incluindo versão digital) |
| Outros | Carteira de Motorista, Cartão de Identificação, Autorização de Residência |
O Document Intelligence pode analisar e extrair informações de IDs (documentos de identificação) emitidos pelo governo usando seu modelo de IDs predefinidos. Ele combina nossos poderosos recursos de OCR (Reconhecimento Óptico de Caracteres) com recursos de reconhecimento de ID para extrair informações importantes de Passaportes Mundiais e Carteiras de Motorista dos EUA (todos os 50 estados e D.C.). A API de IDs extrai informações importantes desses documentos de identidade, como nome, sobrenome, data de nascimento, número do documento e muito mais. Essa API está disponível no Document Intelligence v2.1 como um serviço de nuvem.
Processamento de documento de identidade
O processamento de documentos de identidade envolve a extração de dados de documentos de identidade manualmente ou usando a tecnologia baseada em OCR. O processamento de documentos de ID é uma etapa importante em qualquer operação de negócios que exija prova de identidade. Exemplos incluem verificação de clientes em bancos e outras instituições financeiras, aplicativos hipotecários, visitas médicas, processamento de declarações, setor de hospitalidade e muito mais. Os indivíduos fornecem alguma prova de sua identidade por meio de carteiras de motorista, passaportes e outros documentos semelhantes para que a empresa possa verificá-los com eficiência antes de fornecer serviços e benefícios.
Exemplo de Carteira de Habilitação dos EUA processada com o Document Intelligence Studio
Extração de dados
O serviço de IDs predefinidas extrai os principais valores de passaportes de todo o mundo e carteiras de motorista dos EUA e os retorna em uma resposta JSON estruturada e organizada.
Exemplo de carteira de motorista
Exemplo de passaporte
Opções de desenvolvimento
O Document Intelligence v4.0: 2024-11-30 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
| Recurso | Recursos | ID do modelo |
|---|---|---|
| Modelo de documento de ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
O Document Intelligence v3.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
| Recurso | Recursos | ID do modelo |
|---|---|---|
| Modelo de documento de ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
O Document Intelligence v3.0 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
| Recurso | Recursos | ID do modelo |
|---|---|---|
| Modelo de documento de ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
O Document Intelligence v2.1 dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
| Recurso | Recursos |
|---|---|
| Modelo de documento de ID | • Ferramenta de rotulagem da Document Intelligence • API REST • SDK da biblioteca do cliente • Contêiner Docker do Document Intelligence |
Requisitos de entrada
Há suporte para os seguintes formatos de arquivo.
| Modelo | Imagem: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Ler | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Documento geral | ✔ | ✔ | |
| Pré-construídos | ✔ | ✔ | |
| Extração personalizada | ✔ | ✔ | |
| Classificação personalizada | ✔ | ✔ | ✔ |
- Fotos e verificações: para obter melhores resultados, forneça uma foto clara ou uma verificação de alta qualidade por documento.
- PDFs e TIFFs: para PDFs e TIFFs, até 2.000 páginas podem ser processadas. (Com uma assinatura gratuita, somente as duas primeiras páginas são processadas.)
- Tamanho do arquivo: o tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
- Dimensões da imagem: as dimensões devem ter entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
- Bloqueios de senha: se os PDFs estiverem bloqueados por senha, você deverá remover o bloqueio antes do envio.
- Altura do texto: a altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Essa dimensão corresponde a cerca de 8 pontos de texto a 150 dpi.
- Treinamento de modelo personalizado: o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Treinamento personalizado do modelo de extração: o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Treinamento de modelo de classificação personalizada: o tamanho total dos dados de treinamento é de 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.
- Tipos de arquivo do Office (DOCX, XLSX, PPTX): o limite máximo de comprimento da cadeia de caracteres é de 8 milhões de caracteres.
Formatos de arquivo com suporte: JPEG, PNG, PDF e TIFF.
Número de páginas com suporte para arquivos PDF e TIFF: até 2.000 páginas ou apenas as duas primeiras páginas para assinantes de camada livre.
Tamanho do arquivo com suporte: menor que 50 MB TOTAL; pixels mínimos: 50 x 50 px; pixels máximos de 10.000 x 10.000 px.
Extração de dados do modelo de documento de ID
Extraia dados, incluindo nome, data de nascimento e data de validade, de documentos de ID. Você precisa dos seguintes recursos:
Uma assinatura Azure– você pode criar uma gratuitamente.
Uma instância do Document Intelligence no portal Azure. Você pode usar o tipo de preço gratuito (
F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.
Nota
O Document Intelligence Studio está disponível com APIs v3.1 e v3.0 e versões posteriores.
Na home page do Document Intelligence Studio, selecione documentos de identidade.
Você pode analisar a fatura de exemplo ou carregar seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar:
Ferramenta de Rotulagem de Amostra da Informação de Documentos
Navegue até a Ferramenta de Amostra de Inteligência Documental.
Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.
Selecione o Tipo de Formulário a ser analisado no menu dropdown.
Escolha uma URL para o arquivo que você deseja analisar nas opções abaixo:
No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar .
No campo Ponto de extremidade de serviço da Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.
No campo chave, cole a chave obtida no recurso de Inteligência de Documento.
Selecione Executar análise. A ferramenta de etiquetagem de exemplo da Informação de Documentos chama a API predefinida para Analisar Layout e analisará o documento.
Exibir os resultados – consulte os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detectadas.
Baixe o arquivo de saída JSON para exibir os resultados detalhados.
- O nó "readResults" contém cada linha de texto com seu respectivo posicionamento de caixa delimitadora na página.
- O nó “selectionMarks” mostra cada marca de seleção (caixa de seleção, marca de opção) e indica se o status é marcado ou não marcado.
- A seção "pageResults" inclui as tabelas extraídas. Para cada tabela, a Informação de Documentos extrai o índice de texto, de linha e de coluna, abrangência de linha e coluna, caixa delimitadora e muito mais.
- O campo "documentResults" contém informações de pares chave/valor e informações de itens de linha para as partes mais relevantes do documento.
Nota
A ferramenta de rotulagem de exemplo não dá suporte ao formato de arquivo BMP. Essa restrição é uma limitação da ferramenta e não do Serviço de Inteligência de Documento.
Extrações de campo
Para campos de extração de documentos com suporte, consulte a página do esquema do modelo de documento de ID em nosso repositório de exemplo no GitHub.
Tipos de documento com suporte
Atualmente, o modelo de documento de ID dá suporte a carteiras de motorista dos EUA e à página biográfica de extração de passaportes internacionais (excluindo vistos e outros documentos de viagem).
Campos extraídos
| Nome | Tipo | Descrição | Valor |
|---|---|---|---|
| País | País | Código do país em conformidade com o padrão ISO 3166 | "EUA" |
| DataDeNascimento | Data | Data de Nascimento no formato YYYY-MM-DD | "1980-01-01" |
| DataDeExpiração | Data | Data de validade no formato YYYY-MM-DD | "2019-05-05" |
| Número do Documento | cadeia | Número relevante do passaporte, número da carteira de motorista etc. | "340020013" |
| FirstName | cadeia | O primeiro nome e nome do meio extraídos, se aplicável | "JENNIFER" |
| Sobrenome | cadeia | Sobrenome extraído | "BROOKS" |
| Nacionalidade | País | Código do país em conformidade com o padrão ISO 3166 | "EUA" |
| Sexo | Gênero | Os valores possíveis extraídos incluem "M" "F" "X" | "F" |
| Zona de Leitura por Máquina | objeto | Passaporte extraído MRZ incluindo duas linhas de 44 caracteres cada |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
| DocumentType | cadeia | Tipo de documento, por exemplo, Passport, Carteira de Habilitação | passaporte |
| Endereço | cadeia | Endereço extraído (somente carteira de motorista) | "ENDEREÇO Nº 123 SUA CIDADE WA 99999-1234" |
| Região | cadeia | Informações extraídas, como região, estado, província etc. (somente da carteira de motorista) | "Washington" |
Guia de migração
- Siga nosso guia de migração do Document Intelligence v3.1 para saber como usar a versão v3.0 em seus aplicativos e fluxos de trabalho.
Próximas etapas
Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Tente processar seus próprios formulários e documentos com a ferramenta de rotulagem de exemplo da Informação de Documentos.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.