Partilhar via


Tarefa Permanente para agentes de IA

O Durable Task Scheduler, combinado com o modelo de programação Durable Task, fornece a infraestrutura subjacente para execução duradoura, gestão de estados, checkpointing e coordenação distribuída para que o código do seu agente não tenha de o fazer.

Com o modelo de programação Durable Task, pode construir fluxos de trabalho agentivos resilientes e com estado usando construtos de programação padrão (como ciclos, condicionais e tratamento de erros) em .NET, Python, Java e JavaScript/TypeScript, enquanto o runtime persiste no estado e recupera automaticamente das falhas.

Embora o modelo de programação Durable Task não seja propriamente um framework de agentes, funciona com qualquer framework de agentes de IA, incluindo o Microsoft Agent Framework, LangChain ou chamadas diretas à API LLM. Esta separação de preocupações permite-lhe focar-se na lógica do agente, enquanto a Durable Task gere uma execução fiável em escala.

Neste artigo, você aprende sobre:

  • Desafios na produção que a execução sustentável resolve para agentes de IA
  • Padrões de fluxo de trabalho agêntico suportados pelo modelo de programação do Durable Task
  • Como a stack tecnológica Durable Task se compara com outras opções de workflow agentic no Azure

Desafios de produção que a execução duradoura resolve

Agentes de IA que realizam trabalho real em produção são tipicamente de longa duração, com estado e dependentes de ferramentas e serviços externos. Interações humanas no ciclo, cadeias de raciocínio em múltiplos passos e fluxos de trabalho aumentados por ferramentas podem manter uma sessão de agente ativa durante horas, dias ou até semanas. Durante esse tempo, o agente acumula estados, incluindo histórico de conversas, resultados intermédios e decisões pendentes, que devem ser preservadas em cada etapa.

Processar grandes volumes de tokens LLM é dispendioso e demorado. Os fornecedores de modelos podem impor limites de taxa que abrandam o seu agente a meio do fluxo de trabalho. Se ocorrer uma falha de infraestrutura, como um reinício de VM ou uma falha de rede, durante uma tarefa de agente com múltiplas etapas, os tokens já consumidos e o tempo já gasto são perdidos.

Interrupções nos fluxos de trabalho de agentes de longa duração, seja devido a reinícios de computação, implementações, eventos de escalonamento ou falhas transitórias da infraestrutura, agravam estes custos. Sem um mecanismo de recuperação, uma sessão de agente crashada tem de reiniciar do início, reconsumindo todos os tokens previamente gastos e repetindo todo o trabalho previamente concluído.

A execução duradoura resolve estes desafios. O runtime Durable Task verifica automaticamente cada transição de estado num fluxo de trabalho de agente (respostas LLM, resultados de chamadas de ferramenta e decisões de fluxo de controlo) para armazenamento durável. Quando ocorre uma falha, a execução recomeça automaticamente numa VM saudável a partir do último checkpoint, em vez de reiniciar do zero. As chamadas LLM concluídas não são repetidas, preservando tanto o gasto de tokens como o tempo de relógio de parede. Políticas de retentativa incorporadas com backoff configurável lidam com falhas temporárias provenientes de APIs LLM, ferramentas externas e serviços downstream sem necessidade de código adicional.

Padrões de fluxo de trabalho agentivos

A Durable Task suporta uma variedade de padrões de fluxo de trabalho agentivos que se enquadram em duas grandes categorias:

  • Fluxos de trabalho determinísticos: O seu código define o fluxo de controlo. Escreve-se a sequência de passos — incluindo ramificação, paralelismo e tratamento de erros — usando construtos de programação padrão. O LLM é chamado como um passo dentro do fluxo de trabalho, mas não controla o fluxo global.
  • Fluxos de trabalho dirigidos por agentes (circuitos de agentes): O LLM gere o fluxo de controlo. O agente decide que ferramentas chamar, em que ordem e quando a tarefa está concluída. Forneces ferramentas e instruções, mas o agente determina o caminho de execução em tempo de execução.

Ambas as categorias beneficiam de uma execução duradoura e podem ser combinadas na mesma aplicação. Para uma análise detalhada dos padrões suportados com exemplos de código, veja Padrões de aplicação agente.

Compare opções de fluxo de trabalho agentic no Azure

Existem várias opções para construir fluxos de trabalho agentivos no Azure, além do stack tecnológico Durable Task. Cada opção tem diferentes pontos fortes e compromissos, dependendo das suas necessidades de fluxo de controlo, suporte a linguagens de programação, integração de frameworks de IA, alojamento, gestão de estados e público-alvo. A tabela seguinte ajuda-o a decidir qual se adequa às suas necessidades.

Capacidade Tarefa durável Fluxos de trabalho baseados em grafos do Microsoft Agent Framework Loop do agente do Logic Apps
Fluxo de controlo Definido por código (imperativo) Definido por código (grafos) Designer / declarativo (JSON)
Linguagens de programação .NET, Python, Java, TypeScript/JavaScript .NET, Python Visual designer / JSON
Suporte a frameworks de IA Qualquer framework (Kernel Semântico, LangChain, AutoGen, etc.) ou chamadas diretas de API para modelos Otimizado para o Microsoft Agent Framework Conectores de IA integrados
Hospedagem Funções do Azure (via Durable Functions) ou qualquer host (via Durable Task SDKs) Qualquer um, com suporte de primeira classe para Foundry Hosted Agents Azure Logic Apps managed service (Consumption ou Standard SKU)
Armazenamento de estado Planeador de Tarefas Duráveis (gerido) Traz o teu próprio (extensível através do gestor de pontos de controlo) Tempo de execução do Logic Apps (gerido)
Fluxos de trabalho dirigidos por agentes Construa a sua própria solução utilizando orquestrações e entidades, ou utilize a extensão Durable Task no Microsoft Agent Framework. Built-in Sim, através da ação Agent Loop
Público-alvo Desenvolvedores de backend Programadores de aplicações Desenvolvedores de integração e utilizadores de código reduzido
Tarefas de execução prolongada Primeira classe (horas / dias / semanas / eternas) Suportado através do checkpointing de estado do fluxo de trabalho controlado pelos desenvolvedores Suportado apenas para fluxos de trabalho com estado (até 90 dias)
Recuperação da falha Automático Manual Automático
Observabilidade Histórico de execução no painel do Durable Task Scheduler, OpenTelemetry OpenTelemetry, visualização personalizada Azure Monitor / diagnóstico de Aplicações Lógicas

Passos seguintes