Filtro de deteção de aterramento

A deteção de fundamentação no segurança de conteúdo do Azure AI ajuda-o a garantir que as respostas dos modelos de linguagem de grande escala (LLM) se baseiam no material fonte fornecido, reduzindo o risco de respostas não factuais ou fabricadas.

Falta de fundamento refere-se a situações em que os LLMs produzem informação que é não factual ou imprecisa a partir do que estava presente nos materiais de origem.

A deteção de aterramento requer incorporação e formatação de documentos.

Para compreender a deteção de groundedness, é útil estar familiarizado com estes conceitos fundamentais:

Termos-chave

  • Geração Aumentada por Recuperação (RAG): O RAG é uma técnica para aumentar o conhecimento de LLM com outros dados. Os LLMs podem raciocinar sobre temas variados, mas o seu conhecimento limita-se aos dados públicos disponíveis na altura em que foram formados. Se quiser construir aplicações de IA que possam raciocinar sobre dados privados ou dados introduzidos após a data limite de um modelo, precisa de fornecer ao modelo essa informação específica. O processo de trazer a informação apropriada e inseri-la no prompt do modelo é conhecido como Geração Aumentada por Recuperação (RAG). Para mais informações, consulte Geração aumentada por recuperação (RAG).
  • Fundamentação e Falta de Fundamento em LLMs: Isto refere-se à medida em que os resultados do modelo se baseiam em informações fornecidas ou refletem fontes fiáveis com precisão. Uma resposta fundamentada segue de perto a informação dada, evitando especulações ou invenções. Nas medições de fundamentação, a informação de origem é crucial e serve como fonte de fundamentação.

Modos de deteção

A deteção de aterramento oferece dois modos para equilibrar velocidade com interpretabilidade:

  • Modo não-raciocínio: Deteção rápida para aplicações online. Devolve resultados binários fundamentados/não fundamentados sem explicações detalhadas.
  • Modo de raciocínio: Fornece explicações detalhadas para segmentos não fundamentados detectados. Melhor para compreender as causas profundas e estratégias de mitigação.

Escolha o modo Sem Raciocínio para aplicações em tempo real em que a latência é crucial. Use o modo Raciocínio durante o desenvolvimento e a depuração para perceber porque é que o conteúdo é sinalizado.

Seleção de domínio

Escolha um domínio para otimizar a deteção para o seu caso de uso:

  • Médico: Otimizado para conteúdos médicos, de saúde e científicos onde a precisão é crítica
  • Genérico: Adequado para conteúdos de uso geral, incluindo apoio ao cliente, documentação e comunicações empresariais

A seleção de domínio ajusta a sensibilidade e o comportamento de correção do modelo de deteção para terminologia e padrões específicos do domínio.

Especificação da tarefa

Especifique o tipo de tarefa para otimizar a deteção:

  • Sumarização: Para validar resumos gerados contra documentos fonte
  • QnA: Para validar respostas de perguntas contra bases de conhecimento

A seleção de tarefas ajusta a sensibilidade da deteção e a lógica de correção para padrões específicos da tarefa.

Correção de alicerçamento (visualização preliminar)

A API de deteção de enraizamento inclui uma funcionalidade opcional de correção que não só deteta conteúdo não enraizado, como o corrige automaticamente com base nas suas fontes de enraizamento. Isto é útil para:

  • Correção automática de erros factuais em resumos gerados
  • Garantir que as respostas da IA estejam alinhadas com o material de origem
  • Redução do tempo de revisão manual para conteúdos de alto volume

Cenários de utilizador

A deteção de fundamentação apoia tarefas de sumarização e perguntas e respostas baseadas em texto, para garantir que os resumos ou respostas gerados são precisos e fiáveis.

Tarefas de resumo:

  • Resumo médico: No contexto de artigos de notícias médicas, a deteção de fundamentação pode ser usada para garantir que o resumo não contém informações inventadas ou enganosas, garantindo que os leitores obtenham informações médicas precisas e confiáveis.
  • Resumo de trabalhos académicos: Quando o modelo gera resumos de artigos académicos ou de investigação, a função pode ajudar a garantir que o conteúdo resumido representa com precisão as principais conclusões e contribuições, sem introduzir alegações falsas.

Tarefas de QnA:

  • Chatbots de apoio ao cliente: No apoio ao cliente, a função pode ser usada para validar as respostas fornecidas pelos chatbots de IA, garantindo que os clientes recebem informações precisas e fiáveis quando colocam questões sobre produtos ou serviços.
  • Perguntas Médicas: Para as Respostas Médicas, a função ajuda a verificar a precisão das respostas e conselhos médicos fornecidos pelos sistemas de IA a profissionais de saúde e pacientes, reduzindo o risco de erros médicos.
  • Perguntas e Respostas Educativas: Em contextos educativos, a função pode ser aplicada a tarefas de Perguntas e Respostas para confirmar que as respostas a perguntas académicas ou a consultas de preparação para testes são factualmente precisas, apoiando o processo de aprendizagem.

Abaixo, veja vários cenários comuns que ilustram como e quando aplicar estas funcionalidades para alcançar os melhores resultados.

Resumo em contextos médicos

Estás a resumir documentos médicos, e é fundamental que os nomes dos pacientes nos resumos sejam precisos e consistentes com as fontes de base fornecidas.

Exemplo de Pedido de API:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Desfecho esperado:

A funcionalidade de correção deteta que Kevin não está aterrado porque entra em conflito com a fonte de aterramento Jane. A API devolve o texto corrigido: "The patient name is Jane."

Tarefa de perguntas e respostas (QnA) com dados de apoio ao cliente

Está a implementar um sistema de perguntas e respostas para um chatbot de apoio ao cliente. É essencial que as respostas fornecidas pela IA estejam alinhadas com a informação mais recente e precisa disponível.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Desfecho esperado:

A API deteta que 5% está sem terra porque não corresponde à fonte 4.5%de terra fornecida. A resposta inclui o texto da correção: "The interest rate is 4.5%."

Criação de conteúdo com dados históricos

Está a criar conteúdos que envolvem dados ou eventos históricos, onde a precisão é fundamental para manter a credibilidade e evitar desinformação.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Desfecho esperado:

A API deteta a data 1065 não aterrada e corrige-a com 1066 base na fonte de aterramento. A resposta inclui o texto corrigido: "The Battle of Hastings occurred in 1066."

Resumo interno da documentação

Está a resumir documentos internos onde nomes de produtos, números de versão ou outros dados específicos devem manter-se consistentes.

Exemplo de Pedido de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Desfecho esperado:

A funcionalidade de correção identifica SuperWidget v2.1 como não aterrada e atualiza-a para SuperWidget v2.2 na resposta. A resposta devolve o texto corrigido: "Our latest product is SuperWidget v2.2."

Limitações

Disponibilidade linguística

Atualmente, a deteção de fundamentação suporta apenas conteúdos em inglês. Embora a API não restrinja submissões em língua não inglesa, a precisão e a qualidade são otimizadas para o inglês.

Limitações do comprimento do texto

O comprimento máximo do texto varia consoante o modo. Consulte Requisitos de entrada para os limites de corrente.

Disponibilidade regional

A deteção de estabilidade está disponível em regiões específicas do Azure. Consulte Disponibilidade de Região para regiões suportadas.

Limitações de taxa

Aplicam-se limites padrão de taxa de consulta. Para requisitos mais elevados de rendimento, contacte o suporte à Segurança de Conteúdos.