Usar o Estúdio da Informação de Documentos

Concluído

Dica

Consulte a guia Texto e imagens para obter mais detalhes!

O Azure Document Intelligence Studio é uma ferramenta online para explorar visualmente, entender e integrar recursos do serviço de Inteligência de Documento. Você pode usar o Studio para analisar layouts de formulário, extrair dados de modelos predefinidos e treinar modelos personalizados, tudo por meio de uma interface visual.

Você pode acessar o Studio em documentintelligence.ai.azure.com.

Captura de tela mostrando a home page do Document Intelligence Studio.

Funcionalidades do studio

O Document Intelligence Studio dá suporte aos seguintes tipos de projeto:

  • Modelos de análise de documentos: teste os modelos de leitura e layout em seus próprios documentos para ver texto, tabelas e estrutura extraídos.

  • Modelos predefinidos: analise documentos usando qualquer modelo predefinido disponível, como faturas, recibos, documentos de ID e formulários fiscais.

  • Modelos personalizados: criar, rotular, treinar e testar modelos de extração personalizados e classificadores personalizados.

Analisar documentos com modelos predefinidos

Para extrair dados de documentos usando modelos predefinidos no Studio:

  1. Crie um recurso do Azure Document Intelligence ou do Foundry Tools no portal do Azure.
  2. Abra o Document Intelligence Studio e selecione um modelo predefinido (por exemplo, Fatura, Recibo ou Documento de ID).
  3. Forneça o ponto de extremidade de recurso e a chave.
  4. Carregue ou forneça uma URL para o documento que você deseja analisar.
  5. Examine os campos extraídos e suas pontuações de confiança.

Criar projetos de modelo personalizado

Você pode usar o Studio para lidar com todo o processo de rotulagem, treinamento e teste de modelos personalizados sem criar manualmente arquivos JSON. O Studio gera automaticamente os arquivos necessários ocr.json, labels.json, e fields.json.

O fluxo de trabalho de alto nível é:

  1. Crie um recurso Azure Document Intelligence ou Foundry.
  2. Carregue pelo menos 5 a 6 formulários de exemplo em um contêiner do Armazenamento de Blobs do Azure.
  3. Configure o CORS (compartilhamento de recursos entre origens) para que o Studio possa acessar seu contêiner de armazenamento.
  4. Crie um projeto de modelo personalizado no Studio, vinculando seu contêiner de armazenamento e o recurso do Document Intelligence.
  5. Identifique campos em seus documentos de exemplo usando a interface visual do Studio.
  6. Treine o modelo e examine as métricas de precisão.
  7. Teste o modelo em relação a um novo documento que não foi usado durante o treinamento.

Você aprenderá mais sobre os tipos de modelo personalizados e o fluxo de trabalho de treinamento alternativo da API REST/SDK na unidade Treinar e usar modelos personalizados .

Funcionalidades de complemento

O Document Intelligence dá suporte a recursos opcionais que você pode habilitar dependendo do cenário de extração:

Capacidade Descrição
Extração de alta resolução Extraia texto de documentos de alta resolução com maior precisão.
Extração de fórmulas Detectar e extrair fórmulas matemáticas de documentos.
Extração de propriedade de fonte Extraia informações de fonte, como estilo, peso e cor.
Extração de código de barras Detectar e ler códigos de barras em documentos.
PDF pesquisável Converta documentos digitalizados em arquivos PDF pesquisáveis.
Campos de consulta Use consultas de linguagem natural para extrair campos específicos de documentos.
Pares chave-valor Extraia relações de pares chave-valor de documentos utilizando o modelo de layout.

Observação

Alguns recursos de complemento são recursos premium que incorrem em custos extras. Verifique a página de preços para obter detalhes.

Saiba mais