Usar modelos predefinidos
Dica
Consulte a guia Texto e imagens para obter mais detalhes!
Modelos predefinidos no Azure Document Intelligence permitem extrair dados de tipos de formulário comuns sem treinar seus próprios modelos. A Microsoft treina esses modelos em um grande número de documentos de exemplo, para que você possa esperar resultados precisos e confiáveis para tipos de documento padrão.
Modelos de análise de documentos
Antes de examinar os modelos predefinidos específicos do domínio, é importante entender os modelos de análise de documentos que os sustentam.
Modelo de leitura
O modelo de leitura extrai texto impresso e manuscrito de documentos e imagens. Ele detecta o idioma de cada linha de texto e classifica se o texto é manuscrito ou impresso. O modelo de leitura é usado como base para extração de texto em todos os outros modelos de Inteligência de Documento.
Para arquivos PDF ou TIFF de várias páginas, você pode usar o pages parâmetro em sua solicitação para especificar um intervalo de páginas para análise.
O modelo de leitura é ideal quando você deseja extrair palavras e linhas de documentos sem estrutura fixa ou previsível.
Modelo de layout
O modelo de layout estende a extração de texto do modelo de leitura com a detecção de marcas de seleção, tabelas e informações de estrutura do documento. Ele também dá suporte a um recurso opcional keyValuePairs para extrair pares chave-valor.
Quando você digitaliza um documento, ele pode ser angulado ou as tabelas podem ter estruturas complexas com células mescladas ou linhas incompletas. O modelo de layout pode lidar com essas dificuldades. Cada célula de tabela é extraída com seu conteúdo, posição da caixa delimitadora e índices de linha/coluna.
As marcas de seleção (caixas de seleção e botões de opção) são extraídas com suas caixas delimitadoras, nível de confiança e se estão selecionadas.
Observação
O modelo de documento geral estava disponível em versões anteriores do Document Intelligence, mas foi preterido na 2023-10-31-preview versão. Sua funcionalidade de par chave-valor e extração de entidade foi incorporada ao modelo de layout e a outros recursos.
Modelos predefinidos para tipos de documento específicos
O Azure Document Intelligence inclui modelos predefinidos treinados em tipos de documento específicos. Os seguintes modelos predefinidos são alguns exemplos disponíveis para extrair campos de documentos comerciais comuns:
Documentos financeiros e legais
| Modelo | Descrição |
|---|---|
| Fatura | Extrai nome do cliente, detalhes do fornecedor, número do pedido de compra, fatura e datas de conclusão, endereços de cobrança e envio, itens de linha e totais. |
| Recibo | Extrai detalhes do comerciante, data e hora da transação, itens de linha e totais. Dá suporte ao processamento de recibo de hotel de página única. |
| Extrato bancário | Extrai informações da conta, saldos iniciais e finais e detalhes da transação. |
| Verificação | Extrai o destinatário, o valor, a data e outras informações relevantes. |
| Holerite | Extrai salários, horas, deduções, pagamento líquido e outros campos de pagamento comuns. |
| Cartão de crédito | Extrai informações do cartão de pagamento. |
| Contrato | Extrai detalhes do contrato e da parte. |
Documentos de impostos dos EUA
| Modelo | Descrição |
|---|---|
| Imposto unificado dos EUA | Um único modelo que extrai informações de qualquer tipo de formulário fiscal dos EUA compatível. |
| W-2 | Extrai os detalhes da compensação tributável. |
| 1098 e variações | Extrai juros da hipoteca e detalhes relacionados. |
| 1099 e variações | Extrai renda de várias fontes. |
| 1040 e variações | Extrai detalhes da declaração de imposto de renda individual. |
Documentos de hipoteca dos EUA
| Modelo | Descrição |
|---|---|
| 1003 (URLA) | Extrai detalhes da solicitação de empréstimo. |
| 1004 (URAR) | Extrai informações de avaliações de propriedades. |
| 1005 | Extrai informações de verificação de emprego. |
| 1008 | Extrai detalhes de remessa de empréstimo. |
| Divulgação de fechamento | Extrai os termos de fechamento final do empréstimo. |
Documentos de identificação pessoal
| Modelo | Descrição |
|---|---|
| Documento de identificação | Extrai detalhes de carteiras de motorista dos EUA, IDs da União Europeia e carteiras de motorista e passaportes internacionais. Inclui nomes, datas de nascimento, números de documentos e endossos ou restrições. |
| cartão do seguro de saúde | Extrai campos comuns de cartões de seguro de saúde dos EUA. |
| Certidão de casamento | Extrai informações de casamento com certidão. |
Importante
O modelo de documento de ID extrai informações pessoais cobertas pelas leis de proteção de dados na maioria das jurisdições. Verifique se você tem a permissão do indivíduo para armazenar seus dados e se está em conformidade com todos os requisitos legais aplicáveis.
Recursos dos modelos pré-construídos
Os modelos predefinidos são projetados para extrair diferentes tipos de dados de documentos. Esses recursos incluem:
- Extração de texto: todos os modelos predefinidos extraem linhas e palavras de texto manuscrito e impresso.
- Pares chave-valor: trechos de texto que identificam um rótulo e sua respectiva resposta. Por exemplo, Peso e 31 kg.
- Marcas de seleção: caixas de seleção e botões de rádio, incluindo se estão selecionados ou não.
- Tabelas: dados em células, incluindo o número de colunas e linhas, títulos de coluna e linha e células mescladas.
-
Campos: modelos treinados para um tipo de formulário específico identificam um conjunto fixo de campos. Por exemplo, o modelo de fatura extrai
CustomerNameeInvoiceTotal.
Quando usar modelos predefinidos versus personalizados
Os modelos predefinidos abrangem os tipos de documento mais comuns. Se você tiver um tipo de formulário específico ou exclusivo do setor, poderá obter resultados mais precisos com um modelo personalizado. No entanto, modelos personalizados exigem tempo e dados de exemplo para treinar. Sempre verifique se existe um modelo predefinido para seu cenário antes de investir no desenvolvimento de modelo personalizado.
Saiba mais
- Modelos predefinidos do Azure Document Intelligence
- Modelo de leitura do Azure Document Intelligence
- Modelo de layout do Azure Document Intelligence
- Modelo de fatura do Azure Document Intelligence
- Modelo de recibo do Azure Document Intelligence
- Modelo de documento de ID do Azure Document Intelligence