Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
A deteção de fundamentação no segurança de conteúdo do Azure AI ajuda-o a garantir que as respostas dos modelos de linguagem de grande escala (LLM) se baseiam no material fonte fornecido, reduzindo o risco de respostas não factuais ou fabricadas.
Falta de fundamento refere-se a situações em que os LLMs produzem informação que é não factual ou imprecisa a partir do que estava presente nos materiais de origem.
A deteção de aterramento requer incorporação e formatação de documentos.
Para compreender a deteção de groundedness, é útil estar familiarizado com estes conceitos fundamentais:
Termos-chave
- Geração Aumentada por Recuperação (RAG): O RAG é uma técnica para aumentar o conhecimento de LLM com outros dados. Os LLMs podem raciocinar sobre temas variados, mas o seu conhecimento limita-se aos dados públicos disponíveis na altura em que foram formados. Se quiser construir aplicações de IA que possam raciocinar sobre dados privados ou dados introduzidos após a data limite de um modelo, precisa de fornecer ao modelo essa informação específica. O processo de trazer a informação apropriada e inseri-la no prompt do modelo é conhecido como Geração Aumentada por Recuperação (RAG). Para mais informações, consulte Geração aumentada por recuperação (RAG).
- Fundamentação e Falta de Fundamento em LLMs: Isto refere-se à medida em que os resultados do modelo se baseiam em informações fornecidas ou refletem fontes fiáveis com precisão. Uma resposta fundamentada segue de perto a informação dada, evitando especulações ou invenções. Nas medições de fundamentação, a informação de origem é crucial e serve como fonte de fundamentação.
Modos de deteção
A deteção de aterramento oferece dois modos para equilibrar velocidade com interpretabilidade:
- Modo não-raciocínio: Deteção rápida para aplicações online. Devolve resultados binários fundamentados/não fundamentados sem explicações detalhadas.
- Modo de raciocínio: Fornece explicações detalhadas para segmentos não fundamentados detectados. Melhor para compreender as causas profundas e estratégias de mitigação.
Escolha o modo Sem Raciocínio para aplicações em tempo real em que a latência é crucial. Use o modo Raciocínio durante o desenvolvimento e a depuração para perceber porque é que o conteúdo é sinalizado.
Seleção de domínio
Escolha um domínio para otimizar a deteção para o seu caso de uso:
- Médico: Otimizado para conteúdos médicos, de saúde e científicos onde a precisão é crítica
- Genérico: Adequado para conteúdos de uso geral, incluindo apoio ao cliente, documentação e comunicações empresariais
A seleção de domínio ajusta a sensibilidade e o comportamento de correção do modelo de deteção para terminologia e padrões específicos do domínio.
Especificação da tarefa
Especifique o tipo de tarefa para otimizar a deteção:
- Sumarização: Para validar resumos gerados contra documentos fonte
- QnA: Para validar respostas de perguntas contra bases de conhecimento
A seleção de tarefas ajusta a sensibilidade da deteção e a lógica de correção para padrões específicos da tarefa.
Correção de alicerçamento (visualização preliminar)
A API de deteção de enraizamento inclui uma funcionalidade opcional de correção que não só deteta conteúdo não enraizado, como o corrige automaticamente com base nas suas fontes de enraizamento. Isto é útil para:
- Correção automática de erros factuais em resumos gerados
- Garantir que as respostas da IA estejam alinhadas com o material de origem
- Redução do tempo de revisão manual para conteúdos de alto volume
Cenários de utilizador
A deteção de fundamentação apoia tarefas de sumarização e perguntas e respostas baseadas em texto, para garantir que os resumos ou respostas gerados são precisos e fiáveis.
Tarefas de resumo:
- Resumo médico: No contexto de artigos de notícias médicas, a deteção de fundamentação pode ser usada para garantir que o resumo não contém informações inventadas ou enganosas, garantindo que os leitores obtenham informações médicas precisas e confiáveis.
- Resumo de trabalhos académicos: Quando o modelo gera resumos de artigos académicos ou de investigação, a função pode ajudar a garantir que o conteúdo resumido representa com precisão as principais conclusões e contribuições, sem introduzir alegações falsas.
Tarefas de QnA:
- Chatbots de apoio ao cliente: No apoio ao cliente, a função pode ser usada para validar as respostas fornecidas pelos chatbots de IA, garantindo que os clientes recebem informações precisas e fiáveis quando colocam questões sobre produtos ou serviços.
- Perguntas Médicas: Para as Respostas Médicas, a função ajuda a verificar a precisão das respostas e conselhos médicos fornecidos pelos sistemas de IA a profissionais de saúde e pacientes, reduzindo o risco de erros médicos.
- Perguntas e Respostas Educativas: Em contextos educativos, a função pode ser aplicada a tarefas de Perguntas e Respostas para confirmar que as respostas a perguntas académicas ou a consultas de preparação para testes são factualmente precisas, apoiando o processo de aprendizagem.
Abaixo, veja vários cenários comuns que ilustram como e quando aplicar estas funcionalidades para alcançar os melhores resultados.
Resumo em contextos médicos
Estás a resumir documentos médicos, e é fundamental que os nomes dos pacientes nos resumos sejam precisos e consistentes com as fontes de base fornecidas.
Exemplo de Pedido de API:
{
"domain": "Medical",
"task": "Summarization",
"text": "The patient name is Kevin.",
"groundingSources": [
"The patient name is Jane."
],
}
Desfecho esperado:
A funcionalidade de correção deteta que Kevin não está aterrado porque entra em conflito com a fonte de aterramento Jane. A API devolve o texto corrigido: "The patient name is Jane."
Tarefa de perguntas e respostas (QnA) com dados de apoio ao cliente
Está a implementar um sistema de perguntas e respostas para um chatbot de apoio ao cliente. É essencial que as respostas fornecidas pela IA estejam alinhadas com a informação mais recente e precisa disponível.
Exemplo de Pedido de API:
{
"domain": "Generic",
"task": "QnA",
"qna": {
"query": "What is the current interest rate?"
},
"text": "The interest rate is 5%.",
"groundingSources": [
"As of July 2024, the interest rate is 4.5%."
],
}
Desfecho esperado:
A API deteta que 5% está sem terra porque não corresponde à fonte 4.5%de terra fornecida. A resposta inclui o texto da correção: "The interest rate is 4.5%."
Criação de conteúdo com dados históricos
Está a criar conteúdos que envolvem dados ou eventos históricos, onde a precisão é fundamental para manter a credibilidade e evitar desinformação.
Exemplo de Pedido de API:
{
"domain": "Generic",
"task": "Summarization",
"text": "The Battle of Hastings occurred in 1065.",
"groundingSources": [
"The Battle of Hastings occurred in 1066."
],
}
Desfecho esperado:
A API deteta a data 1065 não aterrada e corrige-a com 1066 base na fonte de aterramento. A resposta inclui o texto corrigido: "The Battle of Hastings occurred in 1066."
Resumo interno da documentação
Está a resumir documentos internos onde nomes de produtos, números de versão ou outros dados específicos devem manter-se consistentes.
Exemplo de Pedido de API:
{
"domain": "Generic",
"task": "Summarization",
"text": "Our latest product is SuperWidget v2.1.",
"groundingSources": [
"Our latest product is SuperWidget v2.2."
],
}
Desfecho esperado:
A funcionalidade de correção identifica SuperWidget v2.1 como não aterrada e atualiza-a para SuperWidget v2.2 na resposta. A resposta devolve o texto corrigido: "Our latest product is SuperWidget v2.2."
Limitações
Disponibilidade linguística
Atualmente, a deteção de fundamentação suporta apenas conteúdos em inglês. Embora a API não restrinja submissões em língua não inglesa, a precisão e a qualidade são otimizadas para o inglês.
Limitações do comprimento do texto
O comprimento máximo do texto varia consoante o modo. Consulte Requisitos de entrada para os limites de corrente.
Disponibilidade regional
A deteção de estabilidade está disponível em regiões específicas do Azure. Consulte Disponibilidade de Região para regiões suportadas.
Limitações de taxa
Aplicam-se limites padrão de taxa de consulta. Para requisitos mais elevados de rendimento, contacte o suporte à Segurança de Conteúdos.