Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Nota
Este documento refere-se ao portal Microsoft Foundry (clássico).
Os agentes clássicos agora estão obsoletos e serão desativados em 31 de março de 2027. Use os novos agentes no geralmente disponível Microsoft Foundry Agents Service. Siga o guia de migração para atualizar suas cargas de trabalho.
O Serviço do Foundry Agent oferece suporte para threads persistentes, execuções e mensagens. Esses componentes são essenciais para gerenciar estados de conversa e interações com os usuários.
Componentes do agente
Quando você usa um agente, as seguintes etapas estão envolvidas:
- Criar um agente: Crie um agente para começar a enviar mensagens e receber respostas.
- Crie um thread: Crie um thread uma vez e acrescente mensagens a ele à medida que os usuários respondem. O histórico de conversas é mantido e gerenciado automaticamente.
- Enviar mensagens: O agente e o usuário podem enviar mensagens. Essas mensagens podem incluir texto, imagens e outros arquivos.
- Execute o agente: Quando você inicia uma execução, o agente processa as mensagens no thread e executa tarefas com base em sua configuração. Ele pode acrescentar novas mensagens ao thread como parte de sua resposta.
- Monitore o status da execução: Monitore a execução até que ela seja concluída.
- Obtenha a resposta: Depois que o agente criar uma resposta, exiba-a para o usuário.
Agente
Um agente é um componente de orquestração configurável que usa modelos de IA com instruções, ferramentas, parâmetros e controles opcionais de segurança e governança. Em tempo de execução, um agente usa esses componentes e o histórico de mensagens de um determinado thread para responder às entradas do usuário.
Tópicos
Os threads são sessões de conversa entre um agente e um usuário. Eles armazenam mensagens e manipulam automaticamente o truncamento para ajustar o conteúdo no contexto de um modelo. Ao criar um thread, você pode acrescentar novas mensagens (até 100.000 por thread) à medida que os usuários respondem.
Quando criar um novo thread
- Novo contexto de conversa: crie um novo thread ao iniciar um novo tópico ou quando o usuário deseja explicitamente "recomeçar".
- Usuários diferentes: cada usuário normalmente deve ter seus próprios threads para manter o isolamento da conversa.
- Considerações de desempenho: threads com milhares de mensagens podem ter uma latência maior. Considere a criação de novos threads para interações de execução prolongada.
Ciclo de vida do thread
Os threads persistem até serem excluídos explicitamente. Na configuração do agente Standard, os threads são armazenados em sua conta Azure Cosmos DB. Planeje sua estratégia de retenção de thread com base em:
- Custos de armazenamento: um grande número de threads com muitas mensagens consomem armazenamento
- Requisitos de conformidade: considere suas políticas de retenção de dados ao gerenciar a exclusão de thread
Mensagens
As mensagens são as partes individuais de comunicação dentro de um thread. Eles podem ser criados pelo agente ou pelo usuário e podem incluir texto ou outros arquivos. As mensagens são armazenadas como uma lista dentro do thread, permitindo um fluxo de conversa estruturado e organizado.
Executa
Uma execução envolve invocar o agente em um thread. O agente processa as mensagens no thread e pode acrescentar novas mensagens, que são respostas do agente. O agente usa sua configuração e as mensagens do thread para executar tarefas chamando modelos e ferramentas. Como parte de uma execução, o agente acrescenta mensagens ao thread.
Valores de status de execução
Monitore o status de execução para determinar quando o processamento é concluído:
| Status | Descrição |
|---|---|
queued |
A execução está aguardando para ser processada |
in_progress |
O agente está processando ativamente |
requires_action |
O agente precisa de resultados de chamada de função (para ferramentas de chamada de função) |
completed |
Execução concluída com êxito |
failed |
A execução encontrou um erro |
cancelled |
A execução foi cancelada |
expired |
Os limites de tempo foram excedidos |
Práticas recomendadas
- Limpar recursos: excluir threads e agentes quando não for mais necessário gerenciar custos e armazenamento
-
Manipular erros de forma elegante: sempre verifique o
failedstatus da execução e implemente a lógica de repetição com backoff exponencial - Use os intervalos de sondagem apropriados: ao verificar o status da execução, comece com intervalos de 500ms e aumente para operações de execução mais longas
- Limitar o tamanho da mensagem: enquanto os threads dão suporte a até 100.000 mensagens, procure manter as conversas concisas para um desempenho ideal