O que é o Azure Document Intelligence?

Concluído

Tip

Consulte a guia Texto e imagens para obter mais detalhes!

O Azure Document Intelligence é um serviço de IA baseado em nuvem no Microsoft Foundry que usa o OCR e modelos de aprendizado profundo para extrair texto, pares chave-valor, marcas de seleção e tabelas de documentos.

O OCR captura a estrutura do documento criando caixas delimitadoras em torno dos objetos detectados em uma imagem. As localizações das caixas delimitadores são registradas como coordenadas em relação ao restante da página. O Azure Document Intelligence retorna dados de caixa delimitadora e outras informações em um formato JSON estruturado que preserva as relações do documento original.

Captura de tela mostrando o Document Intelligence analisando um documento de exemplo com campos extraídos e caixas delimitadoras.

Para criar um modelo de extração de documentos de alta precisão do zero, é necessário conhecimento de aprendizado profundo, grandes quantidades de computação e longos tempos de treinamento. O Azure Document Intelligence fornece modelos subjacentes já treinados em milhares de exemplos de formulário, para que você possa obter extração de dados de alta precisão com esforço mínimo.

Componentes do serviço do Document Intelligence

O Azure Document Intelligence é composto por três categorias de modelos:

  • Modelos de análise de documento: extrair texto, estrutura, tabelas e marcas de seleção de documentos. O modelo read extrai texto e detecta idiomas, enquanto o modelo de layout adiciona a extração de tabela e estrutura. Você explorará esses modelos em detalhes na unidade Usar modelos predefinidos .

  • Modelos predefinidos: extraia informações de tipos comuns de documentos — como faturas, recibos, formulários fiscais, documentos de ID e muito mais — sem nenhum treinamento necessário. Você verá a lista completa de modelos predefinidos disponíveis na unidade Usar modelos predefinidos .

  • Modelos personalizados: extraia dados de formulários específicos para sua empresa usando seus próprios conjuntos de dados rotulados. As opções incluem modelos de modelo personalizados (rápidos e econômicos para layouts fixos), modelos neurais personalizados (maior precisão para layouts variados), modelos compostos e classificadores personalizados. Você aprenderá a treinar e usar modelos personalizados na unidade Treinar e usar modelos personalizados .

Acessar serviços do Document Intelligence

Você pode acessar o Azure Document Intelligence de várias maneiras:

  • API REST: chame o serviço diretamente usando solicitações HTTP.
  • SDKs da biblioteca de clientes: use os SDKs para Python, C#, Java e JavaScript.
  • Document Intelligence Studio: uma ferramenta online para explorar visualmente, testar e criar soluções de Document Intelligence.
  • Portal do Microsoft Foundry: integrar o Document Intelligence a outras ferramentas do Foundry.

Tip

O exercício deste módulo se concentra no SDK do Python. Os serviços REST subjacentes podem ser usados por qualquer linguagem.

Criar um recurso da Informação de Documentos

Para usar o Azure Document Intelligence, você precisa de um recurso do Azure. Você pode utilizar qualquer uma delas:

  • Um recurso do Foundry: uma assinatura multisserviço que fornece acesso a vários serviços de IA em um único ponto de extremidade e chave.
  • Um recurso do Azure Document Intelligence: um recurso de serviço único usado apenas com o Document Intelligence.

Observação

Crie um recurso do Foundry se você planeja acessar várias funcionalidades do Foundry em um único endpoint e chave. Para acesso exclusivo ao Document Intelligence, crie um recurso dedicado ao Document Intelligence.

Requisitos de entrada

O Azure Document Intelligence funciona em documentos de entrada que atendem a esses requisitos:

  • O formato deve ser JPEG, PNG, BMP, PDF (texto ou digitalizado) ou TIFF. O modelo de leitura também aceita formatos de arquivo do Microsoft Office.
  • O tamanho do arquivo deve ter menos de 500 MB para a camada padrão e 4 MB para a camada gratuita.
  • As dimensões das imagens devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
  • Os documentos PDF devem ter dimensões inferiores a 17 x 17 polegadas (tamanho do papel A3).
  • Os documentos PDF não devem ser protegidos por senha.

Saiba mais