O que é a Compreensão de Conteúdo do Azure nas Ferramentas Foundry?

Nota

O Content Understanding é agora um serviço disponível de forma geral (GA) com o lançamento da versão 2025-11-01 API. Para mais detalhes, consulte O que há de novo.

Azure Content Understanding in Foundry Tools é uma ferramenta Foundry Tool disponível como parte do Microsoft Foundry Resource no portal Azure. Utiliza IA generativa para processar e absorver muitos tipos de conteúdo, incluindo documentos, imagens, vídeos e áudio, num formato de saída definido pelo utilizador. A Compreensão de Conteúdos oferece um processo simplificado para raciocinar sobre grandes quantidades de dados não estruturados, acelerando o tempo até ao valor ao gerar um resultado que pode integrar em fluxos de trabalho de automação e análise.

Captura de ecrã da compreensão do conteúdo, visão geral, processo e fluxo de trabalho.

Porque usar Compreensão de Conteúdo?

A Compreensão de Conteúdos acelera o tempo até ao valor ao permitir o processamento direto de dados não estruturados com pontuações de confiança, minimizando a revisão manual e reduzindo os custos operacionais. Principais benefícios incluem:

  • Simplifique e simplifique os fluxos de trabalho. A Compreensão de Conteúdos padroniza a extração e classificação de conteúdo, estrutura e insights de vários tipos de conteúdo num processo unificado.

  • Simplificar a extração de campo. A extração de campo do Content Understanding facilita a geração de resultados estruturados a partir de conteúdos não estruturados. Defina um esquema para extrair, classificar ou gerar valores de campo sem engenharia complexa de prompts.

  • Melhorar a precisão. A Compreensão de Conteúdos utiliza múltiplos modelos de IA para analisar e validar a informação em simultâneo, resultando em resultados mais precisos e fiáveis.

  • Pontuações de confiança e fundamentação. A Compreensão do Conteúdo assegura a precisão dos valores extraídos, minimizando o custo da revisão humana.

  • Classifica os tipos de conteúdo. O Content Understanding permite-lhe classificar os tipos de documentos para simplificar a sua capacidade de processar conteúdos. Esta funcionalidade está agora disponível numa abordagem unificada na API Analyze.

  • Analisadores pré-construídos específicos de cada setor. O Content Understanding inclui analisadores pré-construídos, concebidos para cenários específicos do setor, incluindo preparação de impostos, processamento de documentos de aquisição, análise de contratos, análise de call centers, análise de media e muito mais.

Compreensão de Conteúdo para Casos de Uso

  • Processamento inteligente de documentos (IDP). A Compreensão de Conteúdos permite um processamento inteligente de documentos ao converter documentos não estruturados em dados estruturados com elevada precisão. As pontuações de confiança e as capacidades de grounding garantem a qualidade dos dados, minimizando a revisão manual e reduzindo os custos operacionais. Por exemplo, automatizar o processamento de faturas, a análise de contratos e a gestão de sinistros extraindo e validando campos de documentos complexos.

  • Aplicações de agentes. A Compreensão de Conteúdo transforma entradas de ficheiros multimodais e desordenadas em entradas previsíveis e padronizadas. Fornece representações claras de markdown para fluxos de trabalho de raciocínio e conhecimento, garantindo clareza e contexto para tarefas posteriores. Quando são necessários dados estruturados, estes fornecem campos chave-valor alinhados ao esquema com níveis de confiança e análise fundamentada, permitindo aos agentes automatizar decisões com precisão e auditoria.

  • Geração aumentada por pesquisa e recuperação (RAG). O Content Understanding permite a ingestão de conteúdos de qualquer modalidade num índice de pesquisa, com suporte extenso para descrição e análise de figuras para tornar os seus dados mais acessíveis. O serviço Content Understanding oferece múltiplos analisadores pré-construídos, afinados para lhe dar os melhores resultados para os seus cenários de pesquisa RAG.

  • Automação robótica de processos (RPA). A Compreensão de Conteúdos integra-se perfeitamente com os fluxos de trabalho da RPA, fornecendo dados estruturados extraídos de vários tipos de conteúdo. Esta capacidade permite a automação de ponta a ponta de processos empresariais que requerem compreensão de conteúdos, como processamento de encomendas, integração de clientes e fluxos de trabalho de conformidade regulamentar.

  • Análise e relatórios: Os resultados extraídos de campo da Content Understanding melhoram as análises e os relatórios, permitindo que as empresas obtenham insights valiosos, realizem análises mais profundas e tomem decisões informadas baseadas em relatórios precisos.

  • Otimize o fluxo de trabalho através da classificação: A funcionalidade de classificação do Content Understanding permite-lhe categorizar primeiro os documentos, antes de os encaminhar para o analisador associado para extração.

Aplicações específicas da indústria

Algumas aplicações comuns específicas da indústria para Compreensão de Conteúdos incluem:

Aplicação Descrição
Automação fiscal As empresas de preparação de impostos podem usar o Content Understanding para gerar uma visão unificada da informação a partir de vários documentos e criar declarações fiscais abrangentes.
Processamento de pedidos de hipoteca Analise a documentação suplementar de apoio e as candidaturas à hipoteca para determinar se um potencial comprador forneceu toda a documentação necessária para garantir a hipoteca.
Verificação de contrato de fatura Reveja cuidadosamente as faturas e os acordos contratuais com os clientes. Aplique um processo de raciocínio em várias etapas para analisar os dados. Certifique-se de que as conclusões, como a validação da consistência entre a fatura e o contrato, são precisas e detalhadas.
Ingestão de geração aumentada por recuperação (RAG) As organizações podem melhorar os seus fluxos de trabalho RAG extraindo informações abrangentes de documentos que, de outra forma, seriam perdidos. As descrições das figuras captam informação de gráficos, diagramas e visualizações, tornando-as pesquisáveis. A análise de layout preserva a estrutura do documento, incluindo tabelas, secções e hierarquias. A deteção de anotações capta notas manuscritas, sublinhados e rasurados.
Análise pós-chamada Empresas e centros de atendimento podem gerar insights a partir de gravações de chamadas para acompanhar indicadores-chave de desempenho (KPIs), melhorar a experiência do produto, gerar insights empresariais, criar experiências diferenciadas para o cliente e responder a questões de forma mais rápida e precisa.
Gestão de ativos mediáticos Os fornecedores de software e media podem usar o Content Understanding para extrair informação mais rica e direcionada de vídeos para soluções de gestão de ativos multimédia.
Apoio ao cliente reforçado As empresas com canais de suporte podem usar o Content Understanding para a pesquisa RAG para melhorar a qualidade das respostas com base em dados de problemas e feedback anteriores de clientes.

Componentes-chave da Compreensão de Conteúdos

O framework de Compreensão de Conteúdos processa conteúdos não estruturados através de múltiplas fases, transformando entradas em saídas estruturadas e acionáveis. A tabela seguinte descreve cada componente da esquerda para a direita, conforme mostrado no diagrama:

Diagrama que mostra o framework de Compreensão de Conteúdos, com entradas a fluir através de analisadores até à saída estruturada.

Componente Descrição
Entradas O conteúdo de origem que o Content Understanding processa. Suporta múltiplas modalidades, incluindo Documentos, Imagens, Vídeo e Áudio. Saiba mais sobre os tipos de ficheiros de entrada.
Analisador O componente central que define como o seu conteúdo é processado. Configura as definições de extração de conteúdo, o esquema de extração de campos e as implementações de modelos. Uma vez configurado, o analisador aplica consistentemente estas definições a todos os dados recebidos. A Content Understanding oferece analisadores pré-construídos para cenários comuns e suporta analisadores personalizados adaptados às suas necessidades. Saiba mais sobre analisadores, analisadores pré-construídos e analisadores personalizados.
Extração de conteúdo Transforma a entrada não estruturada em texto e metadados normalizados e estruturados. Extrai texto usando reconhecimento ótico de caracteres (OCR), identifica marcas de seleção e códigos de barras, deteta fórmulas e reconhece elementos de layout como parágrafos, secções e tabelas. Para áudio e vídeo, transcreve a fala e identifica os principais elementos visuais. Saiba mais sobre extração de conteúdos.
Segmentação Divide documentos ou vídeos em secções lógicas para processamento direcionado. Configurado usando a enableSegment propriedade no esquema do analisador. Permite fragmentar o conteúdo em partes significativas, como dividir um documento por tipo de documento ou dividir um vídeo em cenas. Saiba mais sobre segmentação e classificação.
Extração de campo Gera pares chave-valor estruturados com base no seu esquema definido. Consulte os limites de serviço para tipos de campo suportados. Os campos podem ser gerados por três métodos:

Extração: Extrair diretamente os valores à medida que aparecem no conteúdo de entrada (suportado apenas para documentos), como datas de recibos ou detalhes de itens de faturas.

Classificar: Classificar conteúdo a partir de um conjunto pré-definido de categorias, como sentimento de chamada ou tipo de gráfico, e encaminhá-lo para o analisador correto para análise.

Gerar: Gerar valores livremente a partir de dados de entrada, como resumir uma conversa áudio ou criar descrições de cenas a partir de vídeos.

Saiba mais sobre extração de campo.
Pontuações de confiança Fornece estimativas de fiabilidade de 0 a 1 para cada valor de campo extraído. Pontuações elevadas indicam extração precisa de dados, permitindo o processamento direto em fluxos de trabalho de automação. Ativado através da configuração estimateFieldSourceAndConfidence nos analisadores de documentos. Saiba mais sobre os índices de confiança.
Aterramento Identifica as regiões específicas no conteúdo onde cada valor foi extraído ou gerado. O aterramento da fonte permite aos utilizadores, em cenários de automação, verificar rapidamente a correção dos valores dos campos, rastreando-os até à sua origem no conteúdo de origem. Ativado através da configuração estimateFieldSourceAndConfidence nos analisadores de documentos. Saiba mais sobre o aterramento.
Contextualização A camada de contextualização prepara o contexto para modelos generativos e pós-processa a sua saída. Inclui normalização e formatação de saída, cálculo de aterramento de fonte, cálculo de pontuação de confiança e engenharia de contexto para otimizar o uso do modelo. Saiba mais sobre contextualização.
Modelos de fundição Os modelos de linguagem de grande escala (LLMs) e de embeddings da Foundry que alimentam capacidades generativas. Traz as suas próprias implementações de modelos generativos suportados e modelos de integração de texto para exemplos de treino. A Content Understanding utiliza estes modelos para extração de campo, análise de figuras e outras funcionalidades potenciadas por IA. Saiba mais sobre modelos e implementações.
Saída estruturada O resultado final é fornecido no formato escolhido. O conteúdo pode ser gerado como Markdown para cenários de pesquisa e recuperação, ou como JSON estruturado que corresponde ao seu esquema definido para fluxos de automação e análise.

Conteúdo: Compreender experiências

Content Understanding é um serviço da Foundry. Para usar o Content Understanding, deve criar um recurso Foundry Azure. O Content Understanding Studio complementa a experiência da Foundry se precisar de capacidades avançadas. Para uma análise mais detalhada de cada serviço, veja Comparação de Funcionalidades: Compreensão de Conteúdo na Foundry vs Estúdio de Compreensão de Conteúdos.

  • Compreensão de Conteúdos no portal Foundry (novo) (em breve): O portal Foundry NextGen permite-lhe construir fluxos de trabalho agentiais avançados e abrangentes com a Ferramenta de Compreensão de Conteúdos.
  • Content Understanding Studio: Uma experiência complementar de UX, o Content Understanding Studio permite uma transição suave se estiver a sair do Document Intelligence. Oferece uma experiência otimizada para a melhoria do desempenho dos analisadores, incluindo a melhoria de analisadores personalizados através de técnicas de rotulagem de dados. Também suporta a construção de analisadores personalizados baseados em classificação.

IA responsável

A Compreensão de Conteúdos foi concebida para proteger contra o processamento de conteúdos prejudiciais, como violência gráfica e gore, discurso de ódio e bullying, exploração, abuso e mais. O serviço utiliza a infraestrutura padrão do Foundry, incluindo o Segurança de conteúdo de IA do Azure, integrando os resultados de segurança de conteúdos na saída do Content Understanding. Para mais informações e uma lista completa de conteúdos proibidos, consulte a Nota de Transparência e o Código de Conduta.

Filtragem de conteúdos e Guardrails

A funcionalidade Content Understanding apresenta diretamente os resultados do filtro de conteúdo a partir da implementação do modelo Foundry que utiliza. Cada implementação do modelo Foundry tem uma instância Guardrails associada que avalia tanto os prompts enviados para o modelo como as completações devolvidas. Quando a instância Guardrails sinaliza conteúdo, o resultado é incluído na resposta de análise de Compreensão de Conteúdo como um array content_filters.

Para alterar o comportamento de filtragem de conteúdo dos seus analisadores, atualize a instância Guardrails associada à implementação do modelo no seu projeto Azure AI Foundry. Podes ajustar os limiares para cada categoria ou mudar do modo bloqueador para o modo de anotação. Para detalhes, consulte Filtragem de Conteúdo.

Pode modificar os filtros de conteúdo para ajustar a gravidade bloqueada ou anotada em vez de bloquear conteúdo, dando-lhe a capacidade de lidar com conteúdos potencialmente prejudiciais no seu próprio fluxo de trabalho.

Para mais informações sobre tipos de filtro de conteúdo, consulte Tipos de filtro de conteúdo.

Importante

Capacidades do rosto

O Content Understanding oferece capacidades de descrição de rostos que podem gerar descrições detalhadas de rostos em vídeo e em conteúdos de imagens. Quando ativado, o modelo generativo descreve atributos faciais como pelos faciais e expressões faciais, podendo identificar pessoas ou celebridades proeminentes. Saiba mais sobre a descrição de rostos em processamento de vídeo.

Privacidade e segurança dos dados

Consulte as políticas da Microsoft sobre dados de clientes ao utilizar o serviço Content Understanding. Para mais informações, visite a página de Dados, proteção e privacidade .

Importante

Se estiver a usar produtos ou serviços da Microsoft para processar Dados Biométricos, é responsável por: (i) notificar os titulares dos dados, incluindo no que diz respeito a períodos de retenção e destruição; (ii) obter consentimento dos titulares dos dados; e (iii) eliminar os Dados Biométricos, tudo conforme apropriado e exigido pelos Requisitos de Proteção de Dados aplicáveis. Para informações relacionadas, consulte Dados e privacidade para o Face.

Introdução

Use estes guias de início rápido para começar: