Fluxos de Trabalho Agenciais: Adesão às Tarefas (pré-visualização)

Assegure que os seus agentes de IA estão consistentemente alinhados com as instruções dos utilizadores e os objetivos das tarefas. O sinal de Adesão à Tarefa identifica discrepâncias, como invocações de ferramentas desalinhadas, entrada ou saída inadequada da ferramenta em relação à intenção do utilizador, e inconsistências entre as respostas e as entradas do cliente. Esta funcionalidade capacita os programadores de sistemas a mitigar proativamente ações desalinhadas, bloqueando-as ou escalando o problema para intervenção humana.

Os principais objetivos da funcionalidade de Adesão à Tarefa são:

  • Detetar ações da ferramenta que estejam desalinhadas com os objetivos do utilizador ou a intenção de entrada, ou entrada/saída inadequada da ferramenta em relação à intenção do utilizador, ou inconsistências entre as respostas do agente e a entrada do cliente.
  • Para fornecer raciocínio quando as chamadas de ferramenta estão desalinhadas.
  • Fornecer um sinal para o bloqueio de invocação de ferramentas a jusante e a escalada para revisão humana em ciclo (HITL) quando o alinhamento das tarefas estiver em risco.
  • Promover a confiança dos utilizadores nos sistemas agentes, reforçando a consistência comportamental, transparência e controlo.

Pré-requisitos

  • Uma subscrição Azure - Crie uma gratuitamente
  • Depois de ter a sua subscrição do Azure, crie um recurso de Segurança de Conteúdos no portal do Azure para obter a sua chave e endpoint. Introduza um nome único para o seu recurso, selecione a sua subscrição e selecione um grupo de recursos, região e escalão de preços suportado. Depois seleciona Criar.
    • O recurso demora alguns minutos a ser implementado. Depois de terminar, seleciona ir para o recurso. No painel esquerdo, em Gestão de Recursos, selecione Chave de Subscrição e Endpoint. O endpoint e qualquer uma das chaves são usados para chamar APIs.
  • cURL instalado.

Pedido

Nota

Para um exemplo de escudo de prompt, veja escudos de prompt.

Versão API:2024-12-15-preview

Campos na URL

Nome Obrigatório Descrição Tipo
Ponto final Sim O URL base da API de Segurança de Conteúdo. Substitua <endpoint> pelo endpoint fornecido para o seu serviço de Azure. Corda
Versão API Sim A versão da API a usar. Para esta funcionalidade, a versão é 2024-12-15-preview. Exemplo: <endpoint>/contentsafety/agent:analyzeTaskAdherence?api-version=2024-12-15-preview Corda

Parâmetros no corpo do pedido

Nome Obrigatório Descrição Tipo
Ferramentas Sim Uma lista de ferramentas que definem funções a serem usadas na tarefa. Cada ferramenta inclui um tipo (por exemplo, "função") e detalhes sobre a função, incluindo o seu nome e descrição. Array de objetos JSON
Mensagens Sim Uma lista de mensagens trocadas entre o utilizador, assistente e ferramentas. Cada mensagem inclui a origem (por exemplo, "Prompt", "Completion"), função (por exemplo, "Utilizador", "Assistente", "Ferramenta"), conteúdo (texto da mensagem) e, opcionalmente, toolCalls ou toolCallId. Array de objetos JSON

Exemplo de esquema de corpo de pedido

As tabelas seguintes são descrições dos campos-chave no corpo do pedido:

Campo de ferramentas
Nome Obrigatório Descrição Tipo
tipo Sim O tipo de ferramenta que está a ser usada. Para esta funcionalidade, o termo adequado é "função". Corda
function.name Sim O nome da função. Por exemplo, "read_emails" Corda
função.descrição Sim Uma breve descrição do que a função faz. Por exemplo, "Lê os emails dos utilizadores" Corda
Campo mensagens
Nome Obrigatório Descrição Tipo
origem Sim A origem da mensagem. Valores possíveis: "Solicitação", "Conclusão" Corda
função Sim A função associada à mensagem. Valores possíveis: "Utilizador", "Assistente", "Ferramenta" Corda
Índice Sim O conteúdo da mensagem. Por exemplo, "Resumir os meus emails" String ou array
ToolCalls Não Uma lista de chamadas de ferramenta feitas pelo agente, incluindo tipo (por exemplo, "função"), function.name, argumentos de função e um ID único. Array de objetos JSON
toolCallId Não (Para mensagens da Ferramenta) O ID da chamada de ferramenta a que foi respondida. Corresponde ao ID fornecido na chamada de ferramentas do agente. Corda

Resposta da API

Depois de submeter o seu pedido, receberá dados JSON que refletem a análise realizada pela Adesão à Tarefa. Estes dados sinalizam potenciais vulnerabilidades no fluxo de trabalho do seu agente. Eis como é uma saída típica:

{
  "taskRiskDetected": true,
  "details": "Agent attempts to share a document externally without user request or confirmation."
}
Nome Descrição Tipo
tarefaRiscoDetetado Contém resultados de deteção de risco relativa à entrada booleano
Detalhes Retorna o raciocínio, quando um risco é detetado Corda

Um valor de true para taskRiskDetected indica um risco detetado, caso em que recomendamos revisão e ação, como bloqueio do pedido de invocação da ferramenta ou escalonamento com intervenção humana.

Pré-requisitos

Uma conta no Azure. Se não tiveres um, podes criar um gratuitamente. Um recurso de IA do Azure.

Configurar e utilizar Adesão a Tarefas

Siga estes passos para usar a página de testes de Segurança de Conteúdo :

  1. Vai ao Azure AI Foundry e navega até ao teu projeto/hub. Depois seleciona o separador Guardrails + controlos no navegador esquerdo e seleciona o separador Experimentar.
  2. Na página Experimente, pode testar várias funcionalidades de Guardrails e controlos, como texto e imagens, usando limiares ajustáveis para filtrar conteúdos prejudiciais.
  3. Navegue até ao Fluxo de Trabalho Agential e selecione Adesão à Tarefa.
  4. Pode selecionar um dos exemplos com chamadas de ferramenta de agente alinhadas ou desalinhadas ou criar as suas próprias para testar a Adesão à Tarefa.
  5. Selecione Executar teste. A Adesão à Tarefa devolve a bandeira de risco para cada amostra e, se for detetado um risco, devolve uma razão.

Cenários de utilizador

Apoio ao Cliente

Cenário: Um assistente de apoio ao cliente integrado numa plataforma empresarial ajuda os utilizadores a verificar o uso de dados, resolver problemas e gerir as definições da conta. Para garantir uma automação precisa, o sistema inclui a funcionalidade de Conformidade de Tarefas para validar os planos dos agentes antes de executar chamadas de ferramentas de backend.

Utilizador: Utilizadores finais, agentes de suporte e equipas de experiência do cliente.

Ação: Um utilizador envia uma mensagem ao chatbot: "Consegues verificar quantos dados usei este mês?" O assistente planeia invocar uma change_data_plan() ferramenta. A Adesão à Tarefa deteta um desalinhamento entre a intenção do utilizador (pedido de informação) e a ação proposta (alteração da subscrição). A invocação da ferramenta pode ser bloqueada, e o sistema ou interrompe a execução ou pede ao utilizador para revisão.

Recursos Humanos

Cenário: Um assistente empresarial automatiza fluxos de trabalho rotineiros relacionados com os RH, como reservar licenças, submeter despesas e verificar detalhes da política. A Adesão às Tarefas garante que as ações do agente se mantêm dentro do âmbito esperado e não tomam atalhos não intencionais.

Utilizador: Colaboradores, parceiros de negócios de RH e equipas de automação de fluxos de trabalho.

Ação: Um funcionário escreve: "Quero saber quantas férias anuais me restam." O agente planeia invocar apply_leave(). A Adesão à Tarefa identifica uma incompatibilidade de tarefa—o utilizador pediu informação, não para iniciar um processo. A execução é bloqueada; O agente reformula ou pede confirmação.

Ferramentas de Produtividade

Cenário: Um assistente de produtividade integrado numa plataforma de email ajuda os profissionais a ligar-se a bases de dados e a redigir, rever e enviar mensagens. A Adesão à Tarefa é usada para distinguir entre escrever um rascunho e executar um comando de envio, especialmente em casos em que a intenção do utilizador é ambígua.

Utilizador: Trabalhadores do conhecimento, assistentes executivos e equipas de conformidade de TI.

Ação: O utilizador pergunta: "Escreva um email ao cliente sobre o prazo perdido." O agente gera uma mensagem e planeia invocar send_email(). A Adesão à Tarefa sinaliza o plano como potencialmente prematuro; Não existe uma instrução explícita a enviar. O sistema, em vez disso, bloqueia a chamada de ferramenta pretendida e solicita a revisão do utilizador.

Cumprimento das Tarefas: Uso de Ferramentas Alinhadas e Desalinhadas

O sinal da API de Adesão às Tarefas ajuda os programadores e proprietários de plataformas a perceber quando a invocação da ferramenta de um agente corresponde ou se desvia da intenção do utilizador.

Exemplos

Classificação Descrição Exemplo
Alinhado O agente recupera a informação solicitada sem tomar uma ação indesejada. Utilizador: "Podes mostrar-me os meus eventos recentes do calendário?"
Ferramenta planeada:get_calendar_events()
✅ O agente recupera os acontecimentos conforme solicitado.

Saída:
{ "taskRiskDetected": false }
Desalinhado O agente tenta modificar as definições do utilizador quando apenas foi feito um pedido de informação. Utilizador: "Podes mostrar-me os meus eventos recentes do calendário?"
Ferramenta planeada:clear_calendar_events()
❌ O agente prepara-se para apagar dados.

Saída:
{ "taskRiskDetected": true, "details": "Planned action deletes calendar events, but user only requested to view them."}
Alinhado O Agente inicia um fluxo de criação de documentos após o pedido do utilizador para gerar um novo documento. Utilizador: "Criar um novo documento de proposta de projeto para o cliente."
Ferramenta planeada:create_document()
✅ Corresponde ao pedido de tarefa do utilizador.

Saída:
{ "taskRiskDetected": false}
Desalinhado O Agente partilha o documento com colaboradores externos sem instrução do utilizador. Utilizador: "Criar um novo documento de proposta de projeto para o cliente."
Ferramenta planeada:share_document()
❌ Não há instruções do utilizador para partilhar.

Saída:
{ "taskRiskDetected": true, "details": "Agent attempts to share a document externally without user request or confirmation."}

Limitações

Disponibilidade linguística

A adesão à Tarefa foi testada em texto em inglês; no entanto, a funcionalidade pode funcionar em muitas outras línguas, embora a qualidade possa variar. Em todos os casos, recomendamos testar para o seu caso de uso e aplicação para garantir que funciona para os seus cenários.

Limitação do comprimento do texto

Atualmente, a API de adesão às tarefas tem limitações no comprimento das entradas. O comprimento máximo do texto é de 100.000 caracteres. Se o comprimento da sua entrada exceder esta limitação, receberá um erro.

Disponibilidade regional e processamento de dados

Embora a Adesão às Tarefas possa ser ativada em todas as regiões do Segurança de conteúdo de IA do Azure, os dados podem ser encaminhados e processados noutras regiões dos EUA e da UE fora da geolocalização especificada.