Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Nota
O Content Understanding é agora um serviço disponível de forma geral (GA) com o lançamento da versão 2025-11-01 API. Para mais detalhes, consulte O que há de novo.
Azure Content Understanding in Foundry Tools é uma ferramenta Foundry Tool disponível como parte do Microsoft Foundry Resource no portal Azure. Utiliza IA generativa para processar e absorver muitos tipos de conteúdo, incluindo documentos, imagens, vídeos e áudio, num formato de saída definido pelo utilizador. A Compreensão de Conteúdos oferece um processo simplificado para raciocinar sobre grandes quantidades de dados não estruturados, acelerando o tempo até ao valor ao gerar um resultado que pode integrar em fluxos de trabalho de automação e análise.
Porque usar Compreensão de Conteúdo?
A Compreensão de Conteúdos acelera o tempo até ao valor ao permitir o processamento direto de dados não estruturados com pontuações de confiança, minimizando a revisão manual e reduzindo os custos operacionais. Principais benefícios incluem:
Simplifique e simplifique os fluxos de trabalho. A Compreensão de Conteúdos padroniza a extração e classificação de conteúdo, estrutura e insights de vários tipos de conteúdo num processo unificado.
Simplificar a extração de campo. A extração de campo do Content Understanding facilita a geração de resultados estruturados a partir de conteúdos não estruturados. Defina um esquema para extrair, classificar ou gerar valores de campo sem engenharia complexa de prompts.
Melhorar a precisão. A Compreensão de Conteúdos utiliza múltiplos modelos de IA para analisar e validar a informação em simultâneo, resultando em resultados mais precisos e fiáveis.
Pontuações de confiança e fundamentação. A Compreensão do Conteúdo assegura a precisão dos valores extraídos, minimizando o custo da revisão humana.
Classifica os tipos de conteúdo. O Content Understanding permite-lhe classificar os tipos de documentos para simplificar a sua capacidade de processar conteúdos. Esta funcionalidade está agora disponível numa abordagem unificada na API Analyze.
Analisadores pré-construídos específicos de cada setor. O Content Understanding inclui analisadores pré-construídos, concebidos para cenários específicos do setor, incluindo preparação de impostos, processamento de documentos de aquisição, análise de contratos, análise de call centers, análise de media e muito mais.
Compreensão de Conteúdo para Casos de Uso
Processamento inteligente de documentos (IDP). A Compreensão de Conteúdos permite um processamento inteligente de documentos ao converter documentos não estruturados em dados estruturados com elevada precisão. As pontuações de confiança e as capacidades de grounding garantem a qualidade dos dados, minimizando a revisão manual e reduzindo os custos operacionais. Por exemplo, automatizar o processamento de faturas, a análise de contratos e a gestão de sinistros extraindo e validando campos de documentos complexos.
Aplicações de agentes. A Compreensão de Conteúdo transforma entradas de ficheiros multimodais e desordenadas em entradas previsíveis e padronizadas. Fornece representações claras de markdown para fluxos de trabalho de raciocínio e conhecimento, garantindo clareza e contexto para tarefas posteriores. Quando são necessários dados estruturados, estes fornecem campos chave-valor alinhados ao esquema com níveis de confiança e análise fundamentada, permitindo aos agentes automatizar decisões com precisão e auditoria.
Geração aumentada por pesquisa e recuperação (RAG). O Content Understanding permite a ingestão de conteúdos de qualquer modalidade num índice de pesquisa, com suporte extenso para descrição e análise de figuras para tornar os seus dados mais acessíveis. O serviço Content Understanding oferece múltiplos analisadores pré-construídos, afinados para lhe dar os melhores resultados para os seus cenários de pesquisa RAG.
Automação robótica de processos (RPA). A Compreensão de Conteúdos integra-se perfeitamente com os fluxos de trabalho da RPA, fornecendo dados estruturados extraídos de vários tipos de conteúdo. Esta capacidade permite a automação de ponta a ponta de processos empresariais que requerem compreensão de conteúdos, como processamento de encomendas, integração de clientes e fluxos de trabalho de conformidade regulamentar.
Análise e relatórios: Os resultados extraídos de campo da Content Understanding melhoram as análises e os relatórios, permitindo que as empresas obtenham insights valiosos, realizem análises mais profundas e tomem decisões informadas baseadas em relatórios precisos.
Otimize o fluxo de trabalho através da classificação: A funcionalidade de classificação do Content Understanding permite-lhe categorizar primeiro os documentos, antes de os encaminhar para o analisador associado para extração.
Aplicações específicas da indústria
Algumas aplicações comuns específicas da indústria para Compreensão de Conteúdos incluem:
| Aplicação | Descrição |
|---|---|
| Automação fiscal | As empresas de preparação de impostos podem usar o Content Understanding para gerar uma visão unificada da informação a partir de vários documentos e criar declarações fiscais abrangentes. |
| Processamento de pedidos de hipoteca | Analise a documentação suplementar de apoio e as candidaturas à hipoteca para determinar se um potencial comprador forneceu toda a documentação necessária para garantir a hipoteca. |
| Verificação de contrato de fatura | Reveja cuidadosamente as faturas e os acordos contratuais com os clientes. Aplique um processo de raciocínio em várias etapas para analisar os dados. Certifique-se de que as conclusões, como a validação da consistência entre a fatura e o contrato, são precisas e detalhadas. |
| Ingestão de geração aumentada por recuperação (RAG) | As organizações podem melhorar os seus fluxos de trabalho RAG extraindo informações abrangentes de documentos que, de outra forma, seriam perdidos. As descrições das figuras captam informação de gráficos, diagramas e visualizações, tornando-as pesquisáveis. A análise de layout preserva a estrutura do documento, incluindo tabelas, secções e hierarquias. A deteção de anotações capta notas manuscritas, sublinhados e rasurados. |
| Análise pós-chamada | Empresas e centros de atendimento podem gerar insights a partir de gravações de chamadas para acompanhar indicadores-chave de desempenho (KPIs), melhorar a experiência do produto, gerar insights empresariais, criar experiências diferenciadas para o cliente e responder a questões de forma mais rápida e precisa. |
| Gestão de ativos mediáticos | Os fornecedores de software e media podem usar o Content Understanding para extrair informação mais rica e direcionada de vídeos para soluções de gestão de ativos multimédia. |
| Apoio ao cliente reforçado | As empresas com canais de suporte podem usar o Content Understanding para a pesquisa RAG para melhorar a qualidade das respostas com base em dados de problemas e feedback anteriores de clientes. |
Componentes-chave da Compreensão de Conteúdos
O framework de Compreensão de Conteúdos processa conteúdos não estruturados através de múltiplas fases, transformando entradas em saídas estruturadas e acionáveis. A tabela seguinte descreve cada componente da esquerda para a direita, conforme mostrado no diagrama:
| Componente | Descrição |
|---|---|
| Entradas | O conteúdo de origem que o Content Understanding processa. Suporta múltiplas modalidades, incluindo Documentos, Imagens, Vídeo e Áudio. Saiba mais sobre os tipos de ficheiros de entrada. |
| Analisador | O componente central que define como o seu conteúdo é processado. Configura as definições de extração de conteúdo, o esquema de extração de campos e as implementações de modelos. Uma vez configurado, o analisador aplica consistentemente estas definições a todos os dados recebidos. A Content Understanding oferece analisadores pré-construídos para cenários comuns e suporta analisadores personalizados adaptados às suas necessidades. Saiba mais sobre analisadores, analisadores pré-construídos e analisadores personalizados. |
| Extração de conteúdo | Transforma a entrada não estruturada em texto e metadados normalizados e estruturados. Extrai texto usando reconhecimento ótico de caracteres (OCR), identifica marcas de seleção e códigos de barras, deteta fórmulas e reconhece elementos de layout como parágrafos, secções e tabelas. Para áudio e vídeo, transcreve a fala e identifica os principais elementos visuais. Saiba mais sobre extração de conteúdos. |
| Segmentação | Divide documentos ou vídeos em secções lógicas para processamento direcionado. Configurado usando a enableSegment propriedade no esquema do analisador. Permite fragmentar o conteúdo em partes significativas, como dividir um documento por tipo de documento ou dividir um vídeo em cenas. Saiba mais sobre segmentação e classificação. |
| Extração de campo | Gera pares chave-valor estruturados com base no seu esquema definido. Consulte os limites de serviço para tipos de campo suportados. Os campos podem ser gerados por três métodos: • Extração: Extrair diretamente os valores à medida que aparecem no conteúdo de entrada (suportado apenas para documentos), como datas de recibos ou detalhes de itens de faturas. • Classificar: Classificar conteúdo a partir de um conjunto pré-definido de categorias, como sentimento de chamada ou tipo de gráfico, e encaminhá-lo para o analisador correto para análise. • Gerar: Gerar valores livremente a partir de dados de entrada, como resumir uma conversa áudio ou criar descrições de cenas a partir de vídeos. Saiba mais sobre extração de campo. |
| Pontuações de confiança | Fornece estimativas de fiabilidade de 0 a 1 para cada valor de campo extraído. Pontuações elevadas indicam extração precisa de dados, permitindo o processamento direto em fluxos de trabalho de automação. Ativado através da configuração estimateFieldSourceAndConfidence nos analisadores de documentos. Saiba mais sobre os índices de confiança. |
| Aterramento | Identifica as regiões específicas no conteúdo onde cada valor foi extraído ou gerado. O aterramento da fonte permite aos utilizadores, em cenários de automação, verificar rapidamente a correção dos valores dos campos, rastreando-os até à sua origem no conteúdo de origem. Ativado através da configuração estimateFieldSourceAndConfidence nos analisadores de documentos. Saiba mais sobre o aterramento. |
| Contextualização | A camada de contextualização prepara o contexto para modelos generativos e pós-processa a sua saída. Inclui normalização e formatação de saída, cálculo de aterramento de fonte, cálculo de pontuação de confiança e engenharia de contexto para otimizar o uso do modelo. Saiba mais sobre contextualização. |
| Modelos de fundição | Os modelos de linguagem de grande escala (LLMs) e de embeddings da Foundry que alimentam capacidades generativas. Traz as suas próprias implementações de modelos generativos suportados e modelos de integração de texto para exemplos de treino. A Content Understanding utiliza estes modelos para extração de campo, análise de figuras e outras funcionalidades potenciadas por IA. Saiba mais sobre modelos e implementações. |
| Saída estruturada | O resultado final é fornecido no formato escolhido. O conteúdo pode ser gerado como Markdown para cenários de pesquisa e recuperação, ou como JSON estruturado que corresponde ao seu esquema definido para fluxos de automação e análise. |
Conteúdo: Compreender experiências
Content Understanding é um serviço da Foundry. Para usar o Content Understanding, deve criar um recurso Foundry Azure. O Content Understanding Studio complementa a experiência da Foundry se precisar de capacidades avançadas. Para uma análise mais detalhada de cada serviço, veja Comparação de Funcionalidades: Compreensão de Conteúdo na Foundry vs Estúdio de Compreensão de Conteúdos.
- Compreensão de Conteúdos no portal Foundry (novo) (em breve): O portal Foundry NextGen permite-lhe construir fluxos de trabalho agentiais avançados e abrangentes com a Ferramenta de Compreensão de Conteúdos.
- Content Understanding Studio: Uma experiência complementar de UX, o Content Understanding Studio permite uma transição suave se estiver a sair do Document Intelligence. Oferece uma experiência otimizada para a melhoria do desempenho dos analisadores, incluindo a melhoria de analisadores personalizados através de técnicas de rotulagem de dados. Também suporta a construção de analisadores personalizados baseados em classificação.
IA responsável
A Compreensão de Conteúdos foi concebida para proteger contra o processamento de conteúdos prejudiciais, como violência gráfica e gore, discurso de ódio e bullying, exploração, abuso e mais. O serviço utiliza a infraestrutura padrão do Foundry, incluindo o Segurança de conteúdo de IA do Azure, integrando os resultados de segurança de conteúdos na saída do Content Understanding. Para mais informações e uma lista completa de conteúdos proibidos, consulte a Nota de Transparência e o Código de Conduta.
Filtragem de conteúdos e Guardrails
A funcionalidade Content Understanding apresenta diretamente os resultados do filtro de conteúdo a partir da implementação do modelo Foundry que utiliza. Cada implementação do modelo Foundry tem uma instância Guardrails associada que avalia tanto os prompts enviados para o modelo como as completações devolvidas. Quando a instância Guardrails sinaliza conteúdo, o resultado é incluído na resposta de análise de Compreensão de Conteúdo como um array content_filters.
Para alterar o comportamento de filtragem de conteúdo dos seus analisadores, atualize a instância Guardrails associada à implementação do modelo no seu projeto Azure AI Foundry. Podes ajustar os limiares para cada categoria ou mudar do modo bloqueador para o modo de anotação. Para detalhes, consulte Filtragem de Conteúdo.
Pode modificar os filtros de conteúdo para ajustar a gravidade bloqueada ou anotada em vez de bloquear conteúdo, dando-lhe a capacidade de lidar com conteúdos potencialmente prejudiciais no seu próprio fluxo de trabalho.
Para mais informações sobre tipos de filtro de conteúdo, consulte Tipos de filtro de conteúdo.
Importante
- Candidate-se a filtros de conteúdo modificado utilizando este formulário: Azure Revisão de Acesso Limitado OpenAI: Filtros de Conteúdo Modificado.
- Para mais informações, consulte Filtragem de conteúdo.
Capacidades do rosto
O Content Understanding oferece capacidades de descrição de rostos que podem gerar descrições detalhadas de rostos em vídeo e em conteúdos de imagens. Quando ativado, o modelo generativo descreve atributos faciais como pelos faciais e expressões faciais, podendo identificar pessoas ou celebridades proeminentes. Saiba mais sobre a descrição de rostos em processamento de vídeo.
Privacidade e segurança dos dados
Consulte as políticas da Microsoft sobre dados de clientes ao utilizar o serviço Content Understanding. Para mais informações, visite a página de Dados, proteção e privacidade .
Importante
Se estiver a usar produtos ou serviços da Microsoft para processar Dados Biométricos, é responsável por: (i) notificar os titulares dos dados, incluindo no que diz respeito a períodos de retenção e destruição; (ii) obter consentimento dos titulares dos dados; e (iii) eliminar os Dados Biométricos, tudo conforme apropriado e exigido pelos Requisitos de Proteção de Dados aplicáveis. Para informações relacionadas, consulte Dados e privacidade para o Face.
Introdução
Use estes guias de início rápido para começar: