Filtro de deteção de aterramento

A deteção de fundamentação no segurança de conteúdo do Azure AI ajuda-o a garantir que as respostas dos modelos de linguagem de grande escala (LLM) se baseiam no material fonte fornecido, reduzindo o risco de respostas não factuais ou fabricadas.

Falta de fundamento refere-se a situações em que os LLMs produzem informação que é não factual ou imprecisa a partir do que estava presente nos materiais de origem.

A deteção de aterramento requer incorporação e formatação de documentos.

Para compreender a deteção de groundedness, é útil estar familiarizado com estes conceitos fundamentais:

Termos-chave

Geração Aumentada por Recuperação (RAG): O RAG é uma técnica para aumentar o conhecimento de LLM com outros dados. Os LLMs podem raciocinar sobre temas variados, mas o seu conhecimento limita-se aos dados públicos disponíveis na altura em que foram formados. Se quiser construir aplicações de IA que possam raciocinar sobre dados privados ou dados introduzidos após a data limite de um modelo, precisa de fornecer ao modelo essa informação específica. O processo de trazer a informação apropriada e inseri-la no prompt do modelo é conhecido como Geração Aumentada por Recuperação (RAG). Para mais informações, consulte Geração aumentada por recuperação (RAG).
Fundamentação e Falta de Fundamento em LLMs: Isto refere-se à medida em que os resultados do modelo se baseiam em informações fornecidas ou refletem fontes fiáveis com precisão. Uma resposta fundamentada segue de perto a informação dada, evitando especulações ou invenções. Nas medições de fundamentação, a informação de origem é crucial e serve como fonte de fundamentação.

Modos de deteção

A deteção de aterramento oferece dois modos para equilibrar velocidade com interpretabilidade:

Modo não-raciocínio: Deteção rápida para aplicações online. Devolve resultados binários fundamentados/não fundamentados sem explicações detalhadas.
Modo de raciocínio: Fornece explicações detalhadas para segmentos não fundamentados detectados. Melhor para compreender as causas profundas e estratégias de mitigação.

Escolha o modo Sem Raciocínio para aplicações em tempo real em que a latência é crucial. Use o modo Raciocínio durante o desenvolvimento e a depuração para perceber porque é que o conteúdo é sinalizado.

Seleção de domínio

Escolha um domínio para otimizar a deteção para o seu caso de uso:

Médico: Otimizado para conteúdos médicos, de saúde e científicos onde a precisão é crítica
Genérico: Adequado para conteúdos de uso geral, incluindo apoio ao cliente, documentação e comunicações empresariais

A seleção de domínio ajusta a sensibilidade e o comportamento de correção do modelo de deteção para terminologia e padrões específicos do domínio.

Especificação da tarefa

Especifique o tipo de tarefa para otimizar a deteção:

Sumarização: Para validar resumos gerados contra documentos fonte
QnA: Para validar respostas de perguntas contra bases de conhecimento

A seleção de tarefas ajusta a sensibilidade da deteção e a lógica de correção para padrões específicos da tarefa.

Correção de alicerçamento (visualização preliminar)

A API de deteção de enraizamento inclui uma funcionalidade opcional de correção que não só deteta conteúdo não enraizado, como o corrige automaticamente com base nas suas fontes de enraizamento. Isto é útil para:

Correção automática de erros factuais em resumos gerados
Garantir que as respostas da IA estejam alinhadas com o material de origem
Redução do tempo de revisão manual para conteúdos de alto volume

Cenários de utilizador

A deteção de fundamentação apoia tarefas de sumarização e perguntas e respostas baseadas em texto, para garantir que os resumos ou respostas gerados são precisos e fiáveis.

Tarefas de resumo:

Resumo médico: No contexto de artigos de notícias médicas, a deteção de fundamentação pode ser usada para garantir que o resumo não contém informações inventadas ou enganosas, garantindo que os leitores obtenham informações médicas precisas e confiáveis.
Resumo de trabalhos académicos: Quando o modelo gera resumos de artigos académicos ou de investigação, a função pode ajudar a garantir que o conteúdo resumido representa com precisão as principais conclusões e contribuições, sem introduzir alegações falsas.

Tarefas de QnA:

Chatbots de apoio ao cliente: No apoio ao cliente, a função pode ser usada para validar as respostas fornecidas pelos chatbots de IA, garantindo que os clientes recebem informações precisas e fiáveis quando colocam questões sobre produtos ou serviços.
Perguntas Médicas: Para as Respostas Médicas, a função ajuda a verificar a precisão das respostas e conselhos médicos fornecidos pelos sistemas de IA a profissionais de saúde e pacientes, reduzindo o risco de erros médicos.
Perguntas e Respostas Educativas: Em contextos educativos, a função pode ser aplicada a tarefas de Perguntas e Respostas para confirmar que as respostas a perguntas académicas ou a consultas de preparação para testes são factualmente precisas, apoiando o processo de aprendizagem.

Abaixo, veja vários cenários comuns que ilustram como e quando aplicar estas funcionalidades para alcançar os melhores resultados.

Resumo em contextos médicos

Estás a resumir documentos médicos, e é fundamental que os nomes dos pacientes nos resumos sejam precisos e consistentes com as fontes de base fornecidas.

Exemplo de Pedido de API:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Desfecho esperado:

A funcionalidade de correção deteta que Kevin não está aterrado porque entra em conflito com a fonte de aterramento Jane. A API devolve o texto corrigido: "The patient name is Jane."

Tarefa de perguntas e respostas (QnA) com dados de apoio ao cliente

Está a implementar um sistema de perguntas e respostas para um chatbot de apoio ao cliente. É essencial que as respostas fornecidas pela IA estejam alinhadas com a informação mais recente e precisa disponível.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Desfecho esperado:

A API deteta que 5% está sem terra porque não corresponde à fonte 4.5%de terra fornecida. A resposta inclui o texto da correção: "The interest rate is 4.5%."

Criação de conteúdo com dados históricos

Está a criar conteúdos que envolvem dados ou eventos históricos, onde a precisão é fundamental para manter a credibilidade e evitar desinformação.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Desfecho esperado:

A API deteta a data 1065 não aterrada e corrige-a com 1066 base na fonte de aterramento. A resposta inclui o texto corrigido: "The Battle of Hastings occurred in 1066."

Resumo interno da documentação

Está a resumir documentos internos onde nomes de produtos, números de versão ou outros dados específicos devem manter-se consistentes.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Desfecho esperado:

A funcionalidade de correção identifica SuperWidget v2.1 como não aterrada e atualiza-a para SuperWidget v2.2 na resposta. A resposta devolve o texto corrigido: "Our latest product is SuperWidget v2.2."

Limitações

Disponibilidade linguística

Atualmente, a deteção de fundamentação suporta apenas conteúdos em inglês. Embora a API não restrinja submissões em língua não inglesa, a precisão e a qualidade são otimizadas para o inglês.

Limitações do comprimento do texto

O comprimento máximo do texto varia consoante o modo. Consulte Requisitos de entrada para os limites de corrente.

Disponibilidade regional

A deteção de estabilidade está disponível em regiões específicas do Azure. Consulte Disponibilidade de Região para regiões suportadas.

Limitações de taxa

Aplicam-se limites padrão de taxa de consulta. Para requisitos mais elevados de rendimento, contacte o suporte à Segurança de Conteúdos.

Comentários

Esta página foi útil?

Last updated on 2026-04-30

Filtro de deteção de aterramento

Termos-chave

Modos de deteção

Seleção de domínio

Especificação da tarefa

Correção de alicerçamento (visualização preliminar)

Cenários de utilizador

Resumo em contextos médicos

Tarefa de perguntas e respostas (QnA) com dados de apoio ao cliente

Criação de conteúdo com dados históricos

Resumo interno da documentação

Limitações

Disponibilidade linguística

Limitações do comprimento do texto

Disponibilidade regional

Limitações de taxa

Comentários

Recursos adicionais