Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A detecção de fundamentação no Segurança de Conteúdo de IA do Azure ajuda a garantir que as respostas de LLM (Modelos de Linguagem de Grande Porte) sejam baseadas no material de origem fornecido, reduzindo o risco de saídas não factuais ou fabricadas.
A falta de contextualização refere-se a casos em que os LLMs produzem informações que não são factuais ou que são imprecisas em relação ao que estava presente nos materiais de origem.
A detecção de ancoragem requer incorporação e formatação de documentos.
Para entender a detecção de fundamentação, é útil estar familiarizado com esses conceitos fundamentais:
Termos-chave
- Retrieval Augmented Generation (RAG): RAG é uma técnica para aumentar o conhecimento de LLM com outros dados. As LLMs podem raciocinar sobre tópicos abrangentes, mas seu conhecimento é limitado aos dados públicos que estavam disponíveis no momento em que foram treinados. Se você quiser criar aplicativos de IA que possam raciocinar sobre dados privados ou dados introduzidos após a data de corte de um modelo, você precisará fornecer ao modelo essas informações específicas. O processo de trazer as informações apropriadas e inseri-las no prompt do modelo é conhecido como RAG (Geração Aumentada de Recuperação). Para obter mais informações, consulte RAG (Geração aumentada de recuperação).
- Fundamentação e não fundamentação em LLMs: refere-se à medida em que as saídas do modelo são baseadas em informações fornecidas ou refletem fontes confiáveis com precisão. Uma resposta fundamentada adere de perto às informações fornecidas, evitando especulações ou fabricações. Nas medições de fundamentação, as informações da fonte são cruciais e servem como fonte de fundamento.
Modos de detecção
A detecção de aterramento oferece dois modos para equilibrar a velocidade com a interpretabilidade:
- Modo sem raciocínio: detecção rápida para aplicações online. Retorna resultados binários conectados/desconectados sem explicações detalhadas.
- Modo de raciocínio: fornece explicações detalhadas para segmentos não fundamentados detectados. Melhor para entender as causas raiz e as estratégias de mitigação.
Escolha o modo sem raciocínio para aplicações em tempo real onde a latência é importante. Use o modo de raciocínio durante o desenvolvimento e a depuração para entender por que o conteúdo é sinalizado.
Seleção de domínio
Escolha um domínio para otimizar a detecção para seu caso de uso:
- Médico: otimizado para conteúdo médico, de saúde e científico, onde a precisão é crítica
- Genérico: adequado para conteúdo de uso geral, incluindo suporte ao cliente, documentação e comunicações comerciais
A seleção de domínio ajusta a sensibilidade e o comportamento de correção do modelo de detecção para terminologia e padrões específicos do domínio.
Especificação da tarefa
Especifique o tipo de tarefa para otimizar a detecção:
- Resumo: para a validação de resumos gerados em relação a documentos de origem
- QnA: para validar respostas de perguntas e respostas em relação a bases de conhecimento.
A seleção de tarefas ajusta a sensibilidade de detecção e a lógica de correção para padrões específicos da tarefa.
Correção de fundamentação (versão prévia)
A API de detecção de contextualização inclui um recurso de correção opcional que não apenas detecta conteúdo sem contextualização, mas também o corrige automaticamente com base em suas fontes de contextualização. Isso é útil para:
- Corrigir erros factuais automaticamente em resumos gerados
- Garantir que as respostas de IA se alinhem com o material de origem
- Reduzindo o tempo de revisão manual para conteúdo de alto volume
Cenários de usuário
A detecção de fundamentação oferece suporte a tarefas de resumo e QnA baseadas em texto para garantir que os resumos ou respostas gerados sejam precisos e confiáveis.
Tarefas de resumo:
- Resumo médico: No contexto de artigos de notícias médicas, a detecção de fundamentação pode ser usada para garantir que o resumo não contenha informações fabricadas ou enganosas, garantindo que os leitores obtenham informações médicas precisas e confiáveis.
- Resumo de artigos acadêmicos: quando o modelo gera resumos de artigos acadêmicos ou artigos de pesquisa, a função pode ajudar a garantir que o conteúdo resumido represente com precisão as principais descobertas e contribuições sem introduzir declarações falsas.
Tarefas de QnA:
- Chatbots de suporte ao cliente: no suporte ao cliente, a função pode ser usada para validar as respostas fornecidas pelos chatbots de IA, garantindo que os clientes recebam informações precisas e confiáveis quando fizerem perguntas sobre produtos ou serviços.
- QnA Médico: Para o QnA médico, a função ajuda a verificar a precisão de respostas médicas e conselhos fornecidos pelos sistemas de IA para profissionais de saúde e pacientes, reduzindo o risco de erros médicos.
- QnA educacional: Em configurações educacionais, a função pode ser aplicada às tarefas de QnA para confirmar que as respostas a perguntas acadêmicas ou consultas de preparação de teste são factualmente precisas, dando suporte ao processo de aprendizagem.
Abaixo, confira vários cenários comuns que ilustram como e quando aplicar esses recursos para obter os melhores resultados.
Resumo em contextos médicos
Você está resumindo documentos médicos, e é fundamental que os nomes dos pacientes nos resumos sejam precisos e consistentes com as fontes de referência fornecidas.
Solicitação de API de exemplo:
{
"domain": "Medical",
"task": "Summarization",
"text": "The patient name is Kevin.",
"groundingSources": [
"The patient name is Jane."
],
}
Resultado esperado:
O recurso de correção detecta que o Kevin está infundado porque conflita com a fonte de fundamentação Jane. A API retorna o texto corrigido: "The patient name is Jane."
Tarefa de perguntas e respostas (QnA) com dados de suporte ao cliente
Você está implementando um sistema QnA para um chatbot de suporte ao cliente. É essencial que as respostas fornecidas pela IA se alinhem às informações mais recentes e precisas disponíveis.
Solicitação de API de exemplo:
{
"domain": "Generic",
"task": "QnA",
"qna": {
"query": "What is the current interest rate?"
},
"text": "The interest rate is 5%.",
"groundingSources": [
"As of July 2024, the interest rate is 4.5%."
],
}
Resultado esperado:
A API detecta que 5% não tem fundamento porque não corresponde à fonte de fundamentação fornecida 4.5%. A resposta inclui o texto de correção: "The interest rate is 4.5%."
Criação de conteúdo com dados históricos
Você está criando conteúdo que envolve dados históricos ou eventos, em que a precisão é fundamental para manter a credibilidade e evitar a desinformação.
Solicitação de API de exemplo:
{
"domain": "Generic",
"task": "Summarization",
"text": "The Battle of Hastings occurred in 1065.",
"groundingSources": [
"The Battle of Hastings occurred in 1066."
],
}
Resultado esperado:
A API detecta os dados sem fundamentação 1065 e os corrige para 1066 com base na fonte de fundamentação. A resposta inclui o texto corrigido: "The Battle of Hastings occurred in 1066."
Resumo da documentação interna
Você está resumindo documentos internos em que nomes de produtos, números de versão ou outros pontos de dados específicos devem permanecer consistentes.
Solicitação de API de exemplo:
{
"domain": "Generic",
"task": "Summarization",
"text": "Our latest product is SuperWidget v2.1.",
"groundingSources": [
"Our latest product is SuperWidget v2.2."
],
}
Resultado esperado:
O recurso de correção identifica SuperWidget v2.1 como sem fundamentação e o atualiza como SuperWidget v2.2 na resposta. A resposta retorna o texto corrigido: "Our latest product is SuperWidget v2.2."
Limitações
Disponibilidade de idioma
Atualmente, a detecção de aterramento dá suporte apenas ao conteúdo do idioma inglês . Embora a API não restrinja envios não em inglês, a precisão e a qualidade são otimizadas para inglês.
Limitações de comprimento do texto
O comprimento máximo do texto varia de acordo com o modo. Consulte os requisitos de entrada para os limites atuais.
Disponibilidade da região
A detecção de aterramento está disponível em regiões Azure específicas. Consulte disponibilidade de regiões para ver regiões com suporte.
Limitações de taxa
Os limites de taxa de consulta padrão se aplicam. Para obter requisitos de taxa de transferência mais altos, entre em contato com o suporte à Segurança de Conteúdo.