Classifique e encaminhe os seus dados usando o Content Understanding

O Content Understanding permite-lhe criar fluxos de trabalho personalizados de classificação que categorizam o seu conteúdo e o encaminham para o analisador certo. Com o roteamento, pode enviar múltiplos fluxos de dados pelo mesmo pipeline e garantir que os seus dados sejam processados pelo melhor analisador para o seu tipo de dados.

Este guia guia-o por dois passos:

  1. Crie um classificador básico que categorize os documentos em categorias personalizadas.
  2. Classificar e encaminhar com analisadores personalizados que combinam classificação com extração em campo para cada categoria.

Pré-requisitos

Para começar, certifique-se de que possui os seguintes recursos e permissões:

  • Uma subscrição do Azure. Se não tiver uma subscrição Azure, crie uma conta gratuita.
  • Um recurso Microsoft Foundry no portal Azure, criado numa região suportada.
    • Este recurso está listado em Foundry>Foundry no portal.
  • Configure implementações de modelos padrão para o seu recurso de Compreensão de Conteúdo. Ao definir os valores predefinidos, cria uma conexão com os modelos do Microsoft Foundry que utiliza para pedidos de Compreensão de Conteúdo. Escolha um dos seguintes métodos:
    1. Vai à página de Definições de Compreensão de Conteúdo.

    2. Selecione o botão + Adicionar recurso no canto superior esquerdo.

    3. Seleciona o recurso Foundry que quer usar e depois seleciona Seguinte>Guardar.

      Certifique-se de que a opção Ativar autodeployment para modelos necessários caso não existam predefinidos esteja selecionada. Esta seleção garante que o seu recurso está totalmente configurado com os modelos necessários GPT-4.1, GPT-4.1-mini, e text-embedding-3-large . Diferentes analisadores pré-montados requerem modelos diferentes.

    Ao seguir estes passos, estabelece uma ligação entre Compreensão de Conteúdo e modelos Foundry no seu recurso Foundry.
  • cURL instalado para o teu ambiente de desenvolvimento (para o separador REST API).

Passo 1: Criar um classificador básico

Um classificador básico categoriza os documentos em categorias de conteúdo personalizadas. Defines as categorias com nomes e descrições, e o serviço usa essas definições para classificar os teus ficheiros de entrada. O enableSegment parâmetro controla se o classificador divide ficheiros multi-documento em segmentos ou trata o ficheiro inteiro como um único documento.

Iniciar sessão no Content Understanding Studio

Vai ao portal Content Understanding Studio e inicia sessão com as tuas credenciais. Se está familiarizado com a clássica experiência do Azure Document Intelligence no Foundry Tools Studio, o Content Understanding estende o mesmo conteúdo e extração de campos em todas as modalidades — documento, imagem, vídeo e áudio. Selecione a opção para experimentar a nova experiência de Compreensão de Conteúdo para aceder a capacidades multimodais.

Criar um projeto de classificador

  1. Comece com um novo projeto: Selecione Criar projeto na página inicial.

  2. Selecione o seu tipo de projeto: Selecione a opção para Classify and route with custom categories.

  3. Carregue os seus dados: Carregue um dado de exemplo para começar a classificar.

  4. Criar regras de encaminhamento: No separador Regras de Roteamento , selecione Add category. Dê um nome e uma descrição à categoria. Para um classificador básico, podes saltar a atribuição de um analisador específico a cada categoria.

  5. Teste o seu fluxo de trabalho de classificação: Quando as suas regras de encaminhamento personalizadas estiverem prontas para teste, selecione Executar análise para ver a saída das regras nos seus dados.

    Captura de ecrã do Content Understanding Studio com o botão de Teste destacado.

  6. Construa o seu analisador de classificação: Quando estiver satisfeito com o resultado, selecione o botão Construir analisador no topo da página. Dá um nome ao analisador e seleciona Guardar.

Passo 2: Classificar e encaminhar com analisadores personalizados

Para além da classificação básica, podes encaminhar cada categoria para um analisador específico para extração em campo. Esta abordagem combina classificação com extração de dados num único pipeline: o classificador identifica o tipo de documento e depois encaminha-o para o analisador correto, que extrai campos adaptados a essa categoria.

Para encaminhar com sucesso os seus dados, crie analisadores personalizados para cada categoria. Para mais informações sobre como construir analisadores personalizados, consulte Criar e melhorar o seu analisador personalizado no Content Understanding Studio.

  1. Crie analisadores personalizados primeiro: Crie analisadores personalizados para cada tipo de documento que pretende encaminhar. Por exemplo, crie um analisador personalizado para pedidos de empréstimo com um esquema de extração de campo específico para esse tipo de documento.

  2. Criar ou atualizar regras de encaminhamento: No separador Regras de Roteamento , selecione Add category. Dê à categoria um nome e uma descrição, e selecione um analisador que corresponda a essa rota. A ferramenta permite-lhe pré-visualizar o esquema de cada analisador para garantir que tem o modelo correto.

    Captura de ecrã da interface de utilizador das rotas para classificação.

  3. Teste o seu fluxo de trabalho de classificação: Selecione Executar análise para ver a saída das regras nos seus dados. Podes carregar dados de amostra adicionais para testar e ver como se comporta com várias regras diferentes.

    Captura de ecrã do Content Understanding Studio com o botão de Teste destacado.

  4. Construa o seu analisador de classificação: Quando estiver satisfeito com o resultado, selecione o botão Construir analisador no topo da página. Dá um nome ao analisador e seleciona Guardar.

  5. Utilize o seu classificador: Agora tem um endpoint de análise que pode usar na sua própria aplicação através da API REST.

Dica

Para um caderno completo de Python de ponta a ponta, veja a amostra do classificador em GitHub.

Próximos passos