Agentische Anwendungsmuster

Es gibt zwei allgemeine Ansätze zum Erstellen agentischer Anwendungen mit KI:

Deterministische Workflows – Ihr Code definiert den Steuerungsfluss. Sie schreiben die Abfolge von Schritten, Verzweigungen, Parallelität und Fehlerbehandlung mithilfe von Standardprogrammierungskonstrukten. Das LLM führt innerhalb jedes Schritts Arbeit durch, steuert jedoch nicht den gesamten Fluss.
Agentgesteuerte Workflows (Agentschleifen) – Die LLM steuert den Steuerungsfluss. Der Agent entscheidet, welche Tools aufgerufen werden sollen, in welcher Reihenfolge und wann die Aufgabe abgeschlossen ist. Sie stellen Tools und Anweisungen bereit, aber der Agent bestimmt den Ausführungspfad zur Laufzeit.

Beide Ansätze profitieren von dauerhafter Ausführung und können mithilfe des Programmiermodells für dauerhafte Aufgaben implementiert werden. In diesem Artikel wird gezeigt, wie Sie jedes Muster mit einsatzbereiten Codebeispielen in C#, Python, JavaScript/TypeScript und Java erstellen.

Tipp

Prerequisites: Bevor Sie diese Muster verwenden, richten Sie die SDKs für dauerhafte Aufgaben oder Durable Functions ein. Sehen Sie sich die SDK-Übersicht oder die Übersicht über Durable Functions an, um zu beginnen.

Auf dieser Seite:

Verketten von Prompts – Sequenzielle LLM-Schritte mit Validierungsgates
Routing – Klassifizieren und Verteilen an spezialisierte Agenten
Parallelisierung – Auffächern nach außen/innen für unabhängige Teilvorgänge
Orchestrator-Worker – LLM-geplante dynamische Delegierung von Teilvorgängen
Evaluator-Optimierer – Iterative Generations- und Verfeinerungsschleife
Agent-Schleifen – LLM-gesteuerte Toolaufrufschleifen (orchestrierungs- oder entitätsbasiert)

Tipp

Diese Muster stimmen mit den agentischen Workflow-Designs überein, die in Anthropics Building Effective Agents beschrieben werden. Das Programmmodell für dauerhafte Aufgaben ist diesen Mustern natürlich zugeordnet: Orchestrierungen definieren den Workflowsteuerungsfluss und werden automatisch überprüft, während Aktivitäten nicht deterministische Vorgänge wie LLM-Aufrufe, Toolaufrufe und API-Anforderungen umschließen.

Auswählen eines Ansatzes

In der folgenden Tabelle können Sie entscheiden, wann die einzelnen Ansätze verwendet werden sollen.

Deterministische Workflows verwenden, wenn...	Agentschleifen verwenden, wenn...
Die Abfolge der Schritte ist im Voraus bekannt.	Die Aufgabe ist offen und die Schritte können nicht vorhergesagt werden.
Sie benötigen explizite Richtlinien für das Verhalten von Agenten.	Sie möchten, dass die LLM entscheiden soll, welche Tools und wann verwendet werden sollen.
Compliance oder Auditierbarkeit erfordert einen prüfbaren Kontrollfluss.	Der Agent muss seinen Ansatz basierend auf Zwischenergebnissen anpassen.
Sie möchten mehrere KI-Frameworks in einem einzigen Workflow kombinieren.	Sie erstellen einen Konversationsagenten mit Werkzeugaufruffunktionen.

Beide Ansätze bieten automatische Prüfpunktausführungen, Wiederholungsrichtlinien, verteilte Skalierung und Unterstützung durch Menschen durch beständige Ausführung.

Deterministische Workflowmuster

In einem deterministischen Workflow steuert Ihr Code den Ausführungspfad. Das LLM wird als Schritt innerhalb des Workflows aufgerufen, entscheidet aber nicht, was als Nächstes geschieht. Das Programmiermodell für dauerhafte Aufgaben ist diesem Ansatz natürlich zugeordnet:

Orchestrierungen definieren den Workflowsteuerungsfluss (Sequenz, Verzweigung, Parallelität, Fehlerbehandlung) und werden automatisch überprüft.
Aktivitäten umschließen nicht deterministische Vorgänge wie LLM-Aufrufe, Toolaufrufe und API-Anforderungen. Aktivitäten können auf jeder verfügbaren Computeinstanz ausgeführt werden.

In den folgenden Beispielen wird Durable Functions verwendet, der auf Azure Functions mit serverlosem Hosting ausgeführt wird.

In den folgenden Beispielen wird die portable Durable Task SDKs verwendet, die auf jeder Host-Compute ausgeführt werden, einschließlich Azure Container Apps, Kubernetes, virtuellen Computern oder lokal.

Verkettungsmuster für Prompts

Die Verkettung von Prompts ist das einfachste Agent-Muster. Sie unterteilen eine komplexe Aufgabe in eine Reihe sequenzieller LLM-Interaktionen, bei denen die Ausgabe jedes Schritts als Eingabe für den nächsten Schritt dient. Da jeder Aktivitätsaufruf automatisch gespeichert wird, erzwingt ein Absturz mitten in der Pipeline nicht, dass Sie von vorne beginnen und teure LLM-Token erneut verbrauchen – die Ausführung wird ab dem letzten abgeschlossenen Schritt fortgesetzt.

Sie können auch programmgesteuerte Validierungsgates zwischen Schritten einfügen. Beispielsweise können Sie nach dem Generieren einer Gliederung überprüfen, ob sie eine Längen- oder Themeneinschränkung erfüllt, bevor Sie sie an den Entwurfsschritt übergeben.

Dieses Muster ordnet sich direkt dem Funktionskettenmuster im Programmiermodell "Durable Task" zu.

Verwendungsbedingungen: Pipelines zur Inhaltsgenerierung, mehrstufige Dokumentverarbeitung, sequenzielle Datenanreicherung, Workflows, die Zwischenüberprüfungsgates erfordern.

Hinweis

In allen folgenden Beispielen wird der Orchestrierungszustand bei jeder await/yield Anweisung automatisch überprüft. Wenn der Hostprozess abstürzt oder die virtuelle Maschine neu gestartet wird, wird die Orchestrierung vom letzten abgeschlossenen Schritt fortgesetzt, anstatt von vorne zu beginnen.

[Function(nameof(PromptChainingOrchestration))]
public async Task<string> PromptChainingOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    var topic = context.GetInput<string>();

    // Step 1: Generate research outline
    string outline = await context.CallActivityAsync<string>(
        nameof(GenerateOutlineAgent), topic);

    // Step 2: Write first draft from outline
    string draft = await context.CallActivityAsync<string>(
        nameof(WriteDraftAgent), outline);

    // Step 3: Refine and polish the draft
    string finalContent = await context.CallActivityAsync<string>(
        nameof(RefineDraftAgent), draft);

    return finalContent;
}

@app.orchestration_trigger(context_name="context")
def prompt_chaining_orchestration(context: df.DurableOrchestrationContext):
    topic = context.get_input()

    # Step 1: Generate research outline
    outline = yield context.call_activity("generate_outline_agent", topic)

    # Step 2: Write first draft from outline
    draft = yield context.call_activity("write_draft_agent", outline)

    # Step 3: Refine and polish the draft
    final_content = yield context.call_activity("refine_draft_agent", draft)

    return final_content

const df = require("durable-functions");

df.app.orchestration("promptChainingOrchestration", function* (context) {
    const topic = context.df.getInput();

    // Step 1: Generate research outline
    const outline = yield context.df.callActivity("generateOutlineAgent", topic);

    // Step 2: Write first draft from outline
    const draft = yield context.df.callActivity("writeDraftAgent", outline);

    // Step 3: Refine and polish the draft
    const finalContent = yield context.df.callActivity("refineDraftAgent", draft);

    return finalContent;
});

@FunctionName("PromptChainingOrchestration")
public String promptChainingOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    String topic = ctx.getInput(String.class);

    // Step 1: Generate research outline
    String outline = ctx.callActivity(
        "GenerateOutlineAgent", topic, String.class).await();

    // Step 2: Write first draft from outline
    String draft = ctx.callActivity(
        "WriteDraftAgent", outline, String.class).await();

    // Step 3: Refine and polish the draft
    String finalContent = ctx.callActivity(
        "RefineDraftAgent", draft, String.class).await();

    return finalContent;
}

[DurableTask]
public class PromptChainingOrchestration : TaskOrchestrator<string, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, string topic)
    {
        // Step 1: Generate research outline
        string outline = await context.CallActivityAsync<string>(
            nameof(GenerateOutlineAgent), topic);

        // Step 2: Write first draft from outline
        string draft = await context.CallActivityAsync<string>(
            nameof(WriteDraftAgent), outline);

        // Step 3: Refine and polish the draft
        string finalContent = await context.CallActivityAsync<string>(
            nameof(RefineDraftAgent), draft);

        return finalContent;
    }
}

def prompt_chaining_orchestration(ctx: task.OrchestrationContext, topic: str) -> str:
    # Step 1: Generate research outline
    outline = yield ctx.call_activity(generate_outline_agent, input=topic)

    # Step 2: Write first draft from outline
    draft = yield ctx.call_activity(write_draft_agent, input=outline)

    # Step 3: Refine and polish the draft
    final_content = yield ctx.call_activity(refine_draft_agent, input=draft)

    return final_content

const promptChainingOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext, topic: string): any {

    // Step 1: Generate research outline
    const outline: string = yield ctx.callActivity(generateOutlineAgent, topic);

    // Step 2: Write first draft from outline
    const draft: string = yield ctx.callActivity(writeDraftAgent, outline);

    // Step 3: Refine and polish the draft
    const finalContent: string = yield ctx.callActivity(refineDraftAgent, draft);

    return finalContent;
};

ctx -> {
    String topic = ctx.getInput(String.class);

    // Step 1: Generate research outline
    String outline = ctx.callActivity(
        "GenerateOutlineAgent", topic, String.class).await();

    // Step 2: Write first draft from outline
    String draft = ctx.callActivity(
        "WriteDraftAgent", outline, String.class).await();

    // Step 3: Refine and polish the draft
    String finalContent = ctx.callActivity(
        "RefineDraftAgent", draft, String.class).await();

    ctx.complete(finalContent);
}

Routing

Routing verwendet einen Klassifizierungsschritt, um zu bestimmen, welcher downstreame Agent oder Modell eine Anforderung verarbeiten soll. Die Orchestrierung ruft zuerst eine Klassifizierungsaktivität auf und verzweigt dann basierend auf dem Ergebnis zum entsprechenden Handler. Mit diesem Ansatz können Sie das Eingabeaufforderungs-, Modell- und Toolset jedes Handlers unabhängig anpassen, z. B. Abrechnungsfragen an einen spezialisierten Agenten mit Zugriff auf Zahlungs-APIs weiterleiten und allgemeine Fragen an ein leichteres Modell senden.

Verwendungsbedingungen: Kundensupport-Triage, Absichtsklassifizierung für spezialisierte Agenten, dynamische Modellauswahl basierend auf der Aufgabenkomplexität.

[Function(nameof(RoutingOrchestration))]
public async Task<string> RoutingOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    var request = context.GetInput<SupportRequest>();

    // Classify the request type
    string category = await context.CallActivityAsync<string>(
        nameof(ClassifyRequestAgent), request.Message);

    // Route to the appropriate specialized agent
    return category switch
    {
        "billing" => await context.CallActivityAsync<string>(
            nameof(BillingAgent), request),
        "technical" => await context.CallActivityAsync<string>(
            nameof(TechnicalSupportAgent), request),
        "general" => await context.CallActivityAsync<string>(
            nameof(GeneralInquiryAgent), request),
        _ => await context.CallActivityAsync<string>(
            nameof(GeneralInquiryAgent), request),
    };
}

@app.orchestration_trigger(context_name="context")
def routing_orchestration(context: df.DurableOrchestrationContext):
    request = context.get_input()

    # Classify the request type
    category = yield context.call_activity("classify_request_agent", request["message"])

    # Route to the appropriate specialized agent
    if category == "billing":
        return (yield context.call_activity("billing_agent", request))
    elif category == "technical":
        return (yield context.call_activity("technical_support_agent", request))
    else:
        return (yield context.call_activity("general_inquiry_agent", request))

const df = require("durable-functions");

df.app.orchestration("routingOrchestration", function* (context) {
    const request = context.df.getInput();

    // Classify the request type
    const category = yield context.df.callActivity("classifyRequestAgent", request.message);

    // Route to the appropriate specialized agent
    switch (category) {
        case "billing":
            return yield context.df.callActivity("billingAgent", request);
        case "technical":
            return yield context.df.callActivity("technicalSupportAgent", request);
        default:
            return yield context.df.callActivity("generalInquiryAgent", request);
    }
});

@FunctionName("RoutingOrchestration")
public String routingOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    SupportRequest request = ctx.getInput(SupportRequest.class);

    // Classify the request type
    String category = ctx.callActivity(
        "ClassifyRequestAgent", request.getMessage(), String.class).await();

    // Route to the appropriate specialized agent
    return switch (category) {
        case "billing" -> ctx.callActivity(
            "BillingAgent", request, String.class).await();
        case "technical" -> ctx.callActivity(
            "TechnicalSupportAgent", request, String.class).await();
        default -> ctx.callActivity(
            "GeneralInquiryAgent", request, String.class).await();
    };
}

[DurableTask]
public class RoutingOrchestration : TaskOrchestrator<SupportRequest, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, SupportRequest request)
    {
        // Classify the request type
        string category = await context.CallActivityAsync<string>(
            nameof(ClassifyRequestAgent), request.Message);

        // Route to the appropriate specialized agent
        return category switch
        {
            "billing" => await context.CallActivityAsync<string>(
                nameof(BillingAgent), request),
            "technical" => await context.CallActivityAsync<string>(
                nameof(TechnicalSupportAgent), request),
            _ => await context.CallActivityAsync<string>(
                nameof(GeneralInquiryAgent), request),
        };
    }
}

def routing_orchestration(ctx: task.OrchestrationContext, request: dict) -> str:
    # Classify the request type
    category = yield ctx.call_activity(classify_request_agent, input=request["message"])

    # Route to the appropriate specialized agent
    if category == "billing":
        return (yield ctx.call_activity(billing_agent, input=request))
    elif category == "technical":
        return (yield ctx.call_activity(technical_support_agent, input=request))
    else:
        return (yield ctx.call_activity(general_inquiry_agent, input=request))

const routingOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext, request: SupportRequest): any {

    // Classify the request type
    const category: string = yield ctx.callActivity(classifyRequestAgent, request.message);

    // Route to the appropriate specialized agent
    switch (category) {
        case "billing":
            return yield ctx.callActivity(billingAgent, request);
        case "technical":
            return yield ctx.callActivity(technicalSupportAgent, request);
        default:
            return yield ctx.callActivity(generalInquiryAgent, request);
    }
};

ctx -> {
    SupportRequest request = ctx.getInput(SupportRequest.class);

    // Classify the request type
    String category = ctx.callActivity(
        "ClassifyRequestAgent", request.getMessage(), String.class).await();

    // Route to the appropriate specialized agent
    String result = switch (category) {
        case "billing" -> ctx.callActivity(
            "BillingAgent", request, String.class).await();
        case "technical" -> ctx.callActivity(
            "TechnicalSupportAgent", request, String.class).await();
        default -> ctx.callActivity(
            "GeneralInquiryAgent", request, String.class).await();
    };

    ctx.complete(result);
}

Parallelisierung

Wenn Sie über mehrere unabhängige Teilvorgänge verfügen, können Sie sie als parallele Aktivitätsaufrufe verteilen und auf alle Ergebnisse warten, bevor Sie fortfahren. Der "Durable Task Scheduler" verteilt diese Aktivitäten automatisch über alle verfügbaren Computeinstanzen, was bedeutet, dass durch das Hinzufügen weiterer Mitarbeiter direkt die Gesamtzeit der Wanduhr reduziert wird.

Eine gängige Variante ist eine Mehrfachmodellabstimmung: Sie senden die gleiche Aufforderung an mehrere Modelle (oder dasselbe Modell mit unterschiedlichen Temperaturen) parallel, aggregieren oder auswählen aus den Antworten. Da jede parallele Verzweigung unabhängig voneinander überprüft wird, wirkt sich ein vorübergehender Fehler in einer Verzweigung nicht auf die anderen aus.

Dieses Muster ordnet sich direkt dem Lüfterausgangs-/Fan-In-Muster in "Durable Task" zu.

Verwendungsbedingungen: Batchanalyse von Dokumenten, parallelen Toolaufrufen, Multimodellauswertung, Inhaltsmoderation mit mehreren Prüfern.

[Function(nameof(ParallelResearchOrchestration))]
public async Task<string> ParallelResearchOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    var request = context.GetInput<ResearchRequest>();

    // Fan-out: research multiple subtopics in parallel
    var researchTasks = request.Subtopics
        .Select(subtopic => context.CallActivityAsync<string>(
            nameof(ResearchSubtopicAgent), subtopic))
        .ToList();
    string[] researchResults = await Task.WhenAll(researchTasks);

    // Aggregate: synthesize all research into a single summary
    string summary = await context.CallActivityAsync<string>(
        nameof(SynthesizeAgent),
        new { request.Topic, Research = researchResults });

    return summary;
}

@app.orchestration_trigger(context_name="context")
def parallel_research_orchestration(context: df.DurableOrchestrationContext):
    request = context.get_input()

    # Fan-out: research multiple subtopics in parallel
    research_tasks = []
    for subtopic in request["subtopics"]:
        research_tasks.append(
            context.call_activity("research_subtopic_agent", subtopic)
        )
    research_results = yield context.task_all(research_tasks)

    # Aggregate: synthesize all research into a single summary
    summary = yield context.call_activity("synthesize_agent", {
        "topic": request["topic"],
        "research": research_results
    })

    return summary

const df = require("durable-functions");

df.app.orchestration("parallelResearchOrchestration", function* (context) {
    const request = context.df.getInput();

    // Fan-out: research multiple subtopics in parallel
    const tasks = request.subtopics.map((subtopic) =>
        context.df.callActivity("researchSubtopicAgent", subtopic)
    );
    const researchResults = yield context.df.Task.all(tasks);

    // Aggregate: synthesize all research into a single summary
    const summary = yield context.df.callActivity("synthesizeAgent", {
        topic: request.topic,
        research: researchResults,
    });

    return summary;
});

@FunctionName("ParallelResearchOrchestration")
public String parallelResearchOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    ResearchRequest request = ctx.getInput(ResearchRequest.class);

    // Fan-out: research multiple subtopics in parallel
    List<Task<String>> tasks = request.getSubtopics().stream()
        .map(subtopic -> ctx.callActivity(
            "ResearchSubtopicAgent", subtopic, String.class))
        .collect(Collectors.toList());
    List<String> researchResults = ctx.allOf(tasks).await();

    // Aggregate: synthesize all research into a single summary
    String summary = ctx.callActivity(
        "SynthesizeAgent", researchResults, String.class).await();

    return summary;
}

[DurableTask]
public class ParallelResearchOrchestration : TaskOrchestrator<ResearchRequest, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, ResearchRequest request)
    {
        // Fan-out: research multiple subtopics in parallel
        var researchTasks = request.Subtopics
            .Select(subtopic => context.CallActivityAsync<string>(
                nameof(ResearchSubtopicAgent), subtopic))
            .ToList();
        string[] researchResults = await Task.WhenAll(researchTasks);

        // Aggregate: synthesize all research into a single summary
        string summary = await context.CallActivityAsync<string>(
            nameof(SynthesizeAgent),
            new { request.Topic, Research = researchResults });

        return summary;
    }
}

def parallel_research_orchestration(ctx: task.OrchestrationContext, request: dict) -> str:
    # Fan-out: research multiple subtopics in parallel
    research_tasks = []
    for subtopic in request["subtopics"]:
        research_tasks.append(
            ctx.call_activity(research_subtopic_agent, input=subtopic)
        )
    research_results = yield task.when_all(research_tasks)

    # Aggregate: synthesize all research into a single summary
    summary = yield ctx.call_activity(synthesize_agent, input={
        "topic": request["topic"],
        "research": research_results
    })

    return summary

const parallelResearchOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext,
    request: { topic: string; subtopics: string[] }): any {

    // Fan-out: research multiple subtopics in parallel
    const tasks = request.subtopics.map((subtopic) =>
        ctx.callActivity(researchSubtopicAgent, subtopic)
    );
    const researchResults: string[] = yield whenAll(tasks);

    // Aggregate: synthesize all research into a single summary
    const summary: string = yield ctx.callActivity(synthesizeAgent, {
        topic: request.topic,
        research: researchResults,
    });

    return summary;
};

ctx -> {
    ResearchRequest request = ctx.getInput(ResearchRequest.class);

    // Fan-out: research multiple subtopics in parallel
    List<Task<String>> tasks = request.getSubtopics().stream()
        .map(subtopic -> ctx.callActivity(
            "ResearchSubtopicAgent", subtopic, String.class))
        .collect(Collectors.toList());
    List<String> researchResults = ctx.allOf(tasks).await();

    // Aggregate: synthesize all research into a single summary
    String summary = ctx.callActivity(
        "SynthesizeAgent", researchResults, String.class).await();

    ctx.complete(summary);
}

Orchestrator-Worker-Muster

Bei diesem Muster ruft ein zentraler Orchestrator zunächst ein LLM über einen Prozess auf, um die Arbeit zu planen. Basierend auf der LLM-Ausgabe bestimmt der Orchestrator dann, welche Teilvorgänge erforderlich sind. Der Orchestrator verteilt diese Unteraufgaben dann an spezialisierte Arbeits-Orchestrierungen. Der hauptunterschied zur Parallelisierung besteht darin, dass der Satz von Teilvorgängen zur Entwurfszeit nicht festgelegt ist; der Orchestrator bestimmt sie dynamisch zur Laufzeit.

Dieses Muster verwendet Unterorchestrierungen, die unabhängig von untergeordneten Workflows überprüft werden. Jede Worker-Orchestrierung kann selbst mehrere Schritte, Wiederholungen und verschachtelte Parallelität enthalten.

Wann verwenden: Umfassende Forschungspipelines, Code-Agent-Workflows, die mehrere Dateien ändern, Zusammenarbeit mehrerer Agenten, bei der jeder Agent eine spezielle Rolle hat.

[Function(nameof(OrchestratorWorkersOrchestration))]
public async Task<string> OrchestratorWorkersOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    var request = context.GetInput<ResearchRequest>();

    // Central orchestrator: determine what research is needed
    string[] subtasks = await context.CallActivityAsync<string[]>(
        nameof(PlanResearchAgent), request.Topic);

    // Delegate to worker orchestrations in parallel
    var workerTasks = subtasks
        .Select(subtask => context.CallSubOrchestratorAsync<string>(
            nameof(ResearchWorkerOrchestration), subtask))
        .ToList();
    string[] results = await Task.WhenAll(workerTasks);

    // Synthesize results
    string finalReport = await context.CallActivityAsync<string>(
        nameof(SynthesizeAgent),
        new { request.Topic, Research = results });

    return finalReport;
}

@app.orchestration_trigger(context_name="context")
def orchestrator_workers_orchestration(context: df.DurableOrchestrationContext):
    request = context.get_input()

    # Central orchestrator: determine what research is needed
    subtasks = yield context.call_activity("plan_research_agent", request["topic"])

    # Delegate to worker orchestrations in parallel
    worker_tasks = []
    for subtask in subtasks:
        worker_tasks.append(
            context.call_sub_orchestrator("research_worker_orchestration", subtask)
        )
    results = yield context.task_all(worker_tasks)

    # Synthesize results
    final_report = yield context.call_activity("synthesize_agent", {
        "topic": request["topic"],
        "research": results
    })

    return final_report

const df = require("durable-functions");

df.app.orchestration("orchestratorWorkersOrchestration", function* (context) {
    const request = context.df.getInput();

    // Central orchestrator: determine what research is needed
    const subtasks = yield context.df.callActivity("planResearchAgent", request.topic);

    // Delegate to worker orchestrations in parallel
    const workerTasks = subtasks.map((subtask) =>
        context.df.callSubOrchestrator("researchWorkerOrchestration", subtask)
    );
    const results = yield context.df.Task.all(workerTasks);

    // Synthesize results
    const finalReport = yield context.df.callActivity("synthesizeAgent", {
        topic: request.topic,
        research: results,
    });

    return finalReport;
});

@FunctionName("OrchestratorWorkersOrchestration")
public String orchestratorWorkersOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    ResearchRequest request = ctx.getInput(ResearchRequest.class);

    // Central orchestrator: determine what research is needed
    List<String> subtasks = ctx.callActivity(
        "PlanResearchAgent", request.getTopic(), List.class).await();

    // Delegate to worker orchestrations in parallel
    List<Task<String>> workerTasks = subtasks.stream()
        .map(subtask -> ctx.callSubOrchestrator(
            "ResearchWorkerOrchestration", subtask, String.class))
        .collect(Collectors.toList());
    List<String> results = ctx.allOf(workerTasks).await();

    // Synthesize results
    String finalReport = ctx.callActivity(
        "SynthesizeAgent", results, String.class).await();

    return finalReport;
}

[DurableTask]
public class OrchestratorWorkersOrchestration : TaskOrchestrator<ResearchRequest, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, ResearchRequest request)
    {
        // Central orchestrator: determine what research is needed
        string[] subtasks = await context.CallActivityAsync<string[]>(
            nameof(PlanResearchAgent), request.Topic);

        // Delegate to worker orchestrations in parallel
        var workerTasks = subtasks
            .Select(subtask => context.CallSubOrchestratorAsync<string>(
                nameof(ResearchWorkerOrchestration), subtask))
            .ToList();
        string[] results = await Task.WhenAll(workerTasks);

        // Synthesize results
        string finalReport = await context.CallActivityAsync<string>(
            nameof(SynthesizeAgent),
            new { request.Topic, Research = results });

        return finalReport;
    }
}

def orchestrator_workers_orchestration(ctx: task.OrchestrationContext, request: dict) -> str:
    # Central orchestrator: determine what research is needed
    subtasks = yield ctx.call_activity(plan_research_agent, input=request["topic"])

    # Delegate to worker orchestrations in parallel
    worker_tasks = []
    for subtask in subtasks:
        worker_tasks.append(
            ctx.call_sub_orchestrator(research_worker_orchestration, input=subtask)
        )
    results = yield task.when_all(worker_tasks)

    # Synthesize results
    final_report = yield ctx.call_activity(synthesize_agent, input={
        "topic": request["topic"],
        "research": results
    })

    return final_report

const orchestratorWorkersOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext, request: ResearchRequest): any {

    // Central orchestrator: determine what research is needed
    const subtasks: string[] = yield ctx.callActivity(planResearchAgent, request.topic);

    // Delegate to worker orchestrations in parallel
    const workerTasks = subtasks.map((subtask) =>
        ctx.callSubOrchestrator(researchWorkerOrchestration, subtask)
    );
    const results: string[] = yield whenAll(workerTasks);

    // Synthesize results
    const finalReport: string = yield ctx.callActivity(synthesizeAgent, {
        topic: request.topic,
        research: results,
    });

    return finalReport;
};

ctx -> {
    ResearchRequest request = ctx.getInput(ResearchRequest.class);

    // Central orchestrator: determine what research is needed
    List<String> subtasks = ctx.callActivity(
        "PlanResearchAgent", request.getTopic(), List.class).await();

    // Delegate to worker orchestrations in parallel
    List<Task<String>> workerTasks = subtasks.stream()
        .map(subtask -> ctx.callSubOrchestrator(
            "ResearchWorkerOrchestration", subtask, String.class))
        .collect(Collectors.toList());
    List<String> results = ctx.allOf(workerTasks).await();

    // Synthesize results
    String finalReport = ctx.callActivity(
        "SynthesizeAgent", results, String.class).await();

    ctx.complete(finalReport);
}

Evaluator-Optimierer-Muster

Das Evaluator-Optimierer-Muster koppelt einen Generator-Agent mit einem Evaluator-Agent in einer Verfeinerungsschleife. Der Generator erzeugt eine Ausgabe, der Evaluator bewertet sie anhand von Qualitätskriterien und liefert Feedback, und die Schleife wiederholt sich, bis die Ausgabe die Kriterien erfüllt oder eine maximale Iterationsanzahl erreicht ist. Da jede Schleifeniteration überprüft wird, geht bei einem Absturz nach drei erfolgreichen Verfeinerungsrunden kein Fortschritt verloren.

Dieses Muster ist besonders nützlich, wenn die Qualität programmgesteuert gemessen werden kann, z. B. durch die Validierung, dass der generierte Code kompiliert wird, oder dass eine Übersetzung benannte Entitäten beibehält.

Wann zu verwenden: Codegenerierung mit automatisierter Überprüfung, literarische Übersetzung, iterative Inhaltsverfeinerung, komplexe Suchaufgaben, die mehrere Analyserunden erfordern.

[Function(nameof(EvaluatorOptimizerOrchestration))]
public async Task<string> EvaluatorOptimizerOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    var request = context.GetInput<ContentRequest>();
    int maxIterations = 5;
    string content = "";
    string feedback = "";

    for (int i = 0; i < maxIterations; i++)
    {
        // Generate or refine content
        content = await context.CallActivityAsync<string>(
            nameof(GenerateContentAgent),
            new { request.Prompt, PreviousContent = content, Feedback = feedback });

        // Evaluate quality
        var evaluation = await context.CallActivityAsync<EvaluationResult>(
            nameof(EvaluateContentAgent), content);

        if (evaluation.MeetsQualityBar)
            return content;

        feedback = evaluation.Feedback;
    }

    return content; // Return best effort after max iterations
}

@app.orchestration_trigger(context_name="context")
def evaluator_optimizer_orchestration(context: df.DurableOrchestrationContext):
    request = context.get_input()
    max_iterations = 5
    content = ""
    feedback = ""

    for i in range(max_iterations):
        # Generate or refine content
        content = yield context.call_activity("generate_content_agent", {
            "prompt": request["prompt"],
            "previous_content": content,
            "feedback": feedback
        })

        # Evaluate quality
        evaluation = yield context.call_activity("evaluate_content_agent", content)

        if evaluation["meets_quality_bar"]:
            return content

        feedback = evaluation["feedback"]

    return content  # Return best effort after max iterations

const df = require("durable-functions");

df.app.orchestration("evaluatorOptimizerOrchestration", function* (context) {
    const request = context.df.getInput();
    const maxIterations = 5;
    let content = "";
    let feedback = "";

    for (let i = 0; i < maxIterations; i++) {
        // Generate or refine content
        content = yield context.df.callActivity("generateContentAgent", {
            prompt: request.prompt,
            previousContent: content,
            feedback: feedback,
        });

        // Evaluate quality
        const evaluation = yield context.df.callActivity("evaluateContentAgent", content);

        if (evaluation.meetsQualityBar) {
            return content;
        }

        feedback = evaluation.feedback;
    }

    return content; // Return best effort after max iterations
});

@FunctionName("EvaluatorOptimizerOrchestration")
public String evaluatorOptimizerOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    ContentRequest request = ctx.getInput(ContentRequest.class);
    int maxIterations = 5;
    String content = "";
    String feedback = "";

    for (int i = 0; i < maxIterations; i++) {
        // Generate or refine content
        content = ctx.callActivity("GenerateContentAgent",
            new GenerateInput(request.getPrompt(), content, feedback),
            String.class).await();

        // Evaluate quality
        EvaluationResult evaluation = ctx.callActivity(
            "EvaluateContentAgent", content, EvaluationResult.class).await();

        if (evaluation.meetsQualityBar()) {
            return content;
        }

        feedback = evaluation.getFeedback();
    }

    return content; // Return best effort after max iterations
}

[DurableTask]
public class EvaluatorOptimizerOrchestration : TaskOrchestrator<ContentRequest, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, ContentRequest request)
    {
        int maxIterations = 5;
        string content = "";
        string feedback = "";

        for (int i = 0; i < maxIterations; i++)
        {
            // Generate or refine content
            content = await context.CallActivityAsync<string>(
                nameof(GenerateContentAgent),
                new { request.Prompt, PreviousContent = content, Feedback = feedback });

            // Evaluate quality
            var evaluation = await context.CallActivityAsync<EvaluationResult>(
                nameof(EvaluateContentAgent), content);

            if (evaluation.MeetsQualityBar)
                return content;

            feedback = evaluation.Feedback;
        }

        return content; // Return best effort after max iterations
    }
}

def evaluator_optimizer_orchestration(ctx: task.OrchestrationContext, request: dict) -> str:
    max_iterations = 5
    content = ""
    feedback = ""

    for i in range(max_iterations):
        # Generate or refine content
        content = yield ctx.call_activity(generate_content_agent, input={
            "prompt": request["prompt"],
            "previous_content": content,
            "feedback": feedback
        })

        # Evaluate quality
        evaluation = yield ctx.call_activity(evaluate_content_agent, input=content)

        if evaluation["meets_quality_bar"]:
            return content

        feedback = evaluation["feedback"]

    return content  # Return best effort after max iterations

const evaluatorOptimizerOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext, request: ContentRequest): any {

    const maxIterations = 5;
    let content = "";
    let feedback = "";

    for (let i = 0; i < maxIterations; i++) {
        // Generate or refine content
        content = yield ctx.callActivity(generateContentAgent, {
            prompt: request.prompt,
            previousContent: content,
            feedback: feedback,
        });

        // Evaluate quality
        const evaluation = yield ctx.callActivity(evaluateContentAgent, content);

        if (evaluation.meetsQualityBar) {
            return content;
        }

        feedback = evaluation.feedback;
    }

    return content; // Return best effort after max iterations
};

ctx -> {
    ContentRequest request = ctx.getInput(ContentRequest.class);
    int maxIterations = 5;
    String content = "";
    String feedback = "";

    for (int i = 0; i < maxIterations; i++) {
        // Generate or refine content
        content = ctx.callActivity("GenerateContentAgent",
            new GenerateInput(request.getPrompt(), content, feedback),
            String.class).await();

        // Evaluate quality
        EvaluationResult evaluation = ctx.callActivity(
            "EvaluateContentAgent", content, EvaluationResult.class).await();

        if (evaluation.meetsQualityBar()) {
            ctx.complete(content);
            return;
        }

        feedback = evaluation.getFeedback();
    }

    ctx.complete(content); // Return best effort after max iterations
}

Agentschleifen

In einer typischen KI-Agent-Implementierung wird ein LLM in einer Schleife aufgerufen, um Tools aufzurufen und Entscheidungen zu treffen, bis die Aufgabe abgeschlossen ist oder eine Beendigungsbedingung erreicht ist. Im Gegensatz zu deterministischen Workflows ist der Ausführungspfad nicht vorherbestimmt. Der Agent bestimmt, was bei jedem Schritt zu tun ist, basierend auf ergebnissen aus vorherigen Schritten.

Agentschleifen eignen sich gut für Vorgänge, bei denen die Anzahl oder Reihenfolge der Schritte nicht vorhergesagt werden kann. Häufige Beispiele sind offene Codierungsagenten, autonome Forschung und Konversations-Bots mit der Fähigkeit, Tools aufzurufen.

Es gibt zwei empfohlene Ansätze für die Implementierung von Agentenschleifen mit dem Durable Task-Programmiermodell.

Vorgehensweise	Beschreibung	Wann verwenden?
Orchestrierungsbasiert	Die Agent-Schleife ist eine dauerhafte Orchestrierung. Toolaufrufe sind Aktivitäten; Menschliche Eingabe verwendet externe Ereignisse.	Präzise Steuerung, Wiederholungsrichtlinien pro Tool, verteilte Toolausführung, IDE-Debugging.
Entitätsbasiert	Jede Agentinstanz ist eine dauerhafte Entität. Das Agent-Framework verwaltet die Schleife; die Entität sorgt für Sitzungspersistenz.	Sie verwenden ein Framework (z. B. Microsoft Agent Framework), das bereits über eine Agentschleife verfügt und sie mit minimalen Änderungen haltbarkeitsfähig machen möchten.

Orchestrierungsbasierte Agenten-Schleifen

Eine orchestrierungsbasierte Agent-Schleife kombiniert mehrere Durable Task-Funktionen: ewige Orchestrierungen (continue-as-new), um den Speicherverbrauch zu begrenzen, Auffächern nach außen/innen für parallele Toolausführung und externe Ereignisse für menschengestützte Interaktionen. Jede Iteration der Schleife:

Sendet den aktuellen Unterhaltungskontext über eine Aktivität oder eine zustandsbehaftete Entität an das LLM.
Empfängt die Antwort des LLM, die Toolaufrufe enthalten kann.
Führt alle Toolaufrufe als Aktivitäten aus (verteilt auf verfügbare Compute).
Optional wartet auf die Eingabe von Menschen mithilfe externer Ereignisse.
Die Schleife wird mit dem aktualisierten Zustand fortgesetzt oder abgeschlossen, wenn der Agent signalisiert, dass er fertig ist.

[Function(nameof(AgentLoopOrchestration))]
public async Task<string> AgentLoopOrchestration(
    [OrchestrationTrigger] TaskOrchestrationContext context)
{
    // Get state from input (supports continue-as-new)
    var state = context.GetInput<AgentState>() ?? new AgentState();

    int maxIterations = 100;
    while (state.Iteration < maxIterations)
    {
        // Send conversation history to the LLM
        var llmResponse = await context.CallActivityAsync<LlmResponse>(
            nameof(CallLlmAgent), state.Messages);

        state.Messages.Add(llmResponse.Message);

        // If the LLM returned tool calls, execute them in parallel
        if (llmResponse.ToolCalls is { Count: > 0 })
        {
            var toolTasks = llmResponse.ToolCalls
                .Select(tc => context.CallActivityAsync<ToolResult>(
                    nameof(ExecuteTool), tc))
                .ToList();
            ToolResult[] toolResults = await Task.WhenAll(toolTasks);

            foreach (var result in toolResults)
                state.Messages.Add(result.ToMessage());
        }
        // If the LLM needs human input, wait for it
        else if (llmResponse.NeedsHumanInput)
        {
            string humanInput = await context.WaitForExternalEvent<string>("HumanInput");
            state.Messages.Add(new Message("user", humanInput));
        }
        // LLM is done
        else
        {
            return llmResponse.FinalAnswer;
        }

        state.Iteration++;

        // Periodically continue-as-new to keep the history bounded
        if (state.Iteration % 10 == 0)
        {
            context.ContinueAsNew(state);
            return null!; // Orchestration will restart with updated state
        }
    }

    return "Max iterations reached.";
}

@app.orchestration_trigger(context_name="context")
def agent_loop_orchestration(context: df.DurableOrchestrationContext):
    # Get state from input (supports continue-as-new)
    state = context.get_input() or {"messages": [], "iteration": 0}

    max_iterations = 100
    while state["iteration"] < max_iterations:
        # Send conversation history to the LLM
        llm_response = yield context.call_activity("call_llm_agent", state["messages"])

        state["messages"].append(llm_response["message"])

        # If the LLM returned tool calls, execute them
        if llm_response.get("tool_calls"):
            tool_tasks = [
                context.call_activity("execute_tool", tc)
                for tc in llm_response["tool_calls"]
            ]
            tool_results = yield context.task_all(tool_tasks)

            for result in tool_results:
                state["messages"].append(result)

        # If the LLM needs human input, wait for it
        elif llm_response.get("needs_human_input"):
            human_input = yield context.wait_for_external_event("HumanInput")
            state["messages"].append({"role": "user", "content": human_input})

        # LLM is done
        else:
            return llm_response["final_answer"]

        state["iteration"] += 1

        # Periodically continue-as-new to keep the history bounded
        if state["iteration"] % 10 == 0:
            context.continue_as_new(state)
            return

    return "Max iterations reached."

const df = require("durable-functions");

df.app.orchestration("agentLoopOrchestration", function* (context) {
    // Get state from input (supports continue-as-new)
    const state = context.df.getInput() || { messages: [], iteration: 0 };

    const maxIterations = 100;
    while (state.iteration < maxIterations) {
        // Send conversation history to the LLM
        const llmResponse = yield context.df.callActivity("callLlmAgent", state.messages);

        state.messages.push(llmResponse.message);

        // If the LLM returned tool calls, execute them
        if (llmResponse.toolCalls && llmResponse.toolCalls.length > 0) {
            const toolTasks = llmResponse.toolCalls.map((tc) =>
                context.df.callActivity("executeTool", tc)
            );
            const toolResults = yield context.df.Task.all(toolTasks);

            for (const result of toolResults) {
                state.messages.push(result);
            }
        // If the LLM needs human input, wait for it
        } else if (llmResponse.needsHumanInput) {
            const humanInput = yield context.df.waitForExternalEvent("HumanInput");
            state.messages.push({ role: "user", content: humanInput });
        // LLM is done
        } else {
            return llmResponse.finalAnswer;
        }

        state.iteration++;

        // Periodically continue-as-new to keep the history bounded
        if (state.iteration % 10 === 0) {
            context.df.continueAsNew(state);
            return;
        }
    }

    return "Max iterations reached.";
});

@FunctionName("AgentLoopOrchestration")
public String agentLoopOrchestration(
        @DurableOrchestrationTrigger(name = "ctx") TaskOrchestrationContext ctx) {
    // Get state from input (supports continue-as-new)
    AgentState state = ctx.getInput(AgentState.class);
    if (state == null) state = new AgentState();

    int maxIterations = 100;
    while (state.getIteration() < maxIterations) {
        // Send conversation history to the LLM
        LlmResponse llmResponse = ctx.callActivity(
            "CallLlmAgent", state.getMessages(), LlmResponse.class).await();

        state.getMessages().add(llmResponse.getMessage());

        // If the LLM returned tool calls, execute them
        if (llmResponse.getToolCalls() != null && !llmResponse.getToolCalls().isEmpty()) {
            List<Task<ToolResult>> toolTasks = llmResponse.getToolCalls().stream()
                .map(tc -> ctx.callActivity("ExecuteTool", tc, ToolResult.class))
                .collect(Collectors.toList());
            List<ToolResult> toolResults = ctx.allOf(toolTasks).await();

            for (ToolResult result : toolResults) {
                state.getMessages().add(result.toMessage());
            }
        // If the LLM needs human input, wait for it
        } else if (llmResponse.needsHumanInput()) {
            String humanInput = ctx.waitForExternalEvent("HumanInput", String.class).await();
            state.getMessages().add(new Message("user", humanInput));
        // LLM is done
        } else {
            return llmResponse.getFinalAnswer();
        }

        state.incrementIteration();

        // Periodically continue-as-new to keep the history bounded
        if (state.getIteration() % 10 == 0) {
            ctx.continueAsNew(state);
            return null;
        }
    }

    return "Max iterations reached.";
}

[DurableTask]
public class AgentLoopOrchestration : TaskOrchestrator<AgentState, string>
{
    public override async Task<string> RunAsync(
        TaskOrchestrationContext context, AgentState? state)
    {
        state ??= new AgentState();

        int maxIterations = 100;
        while (state.Iteration < maxIterations)
        {
            // Send conversation history to the LLM
            var llmResponse = await context.CallActivityAsync<LlmResponse>(
                nameof(CallLlmAgent), state.Messages);

            state.Messages.Add(llmResponse.Message);

            // If the LLM returned tool calls, execute them
            if (llmResponse.ToolCalls is { Count: > 0 })
            {
                var toolTasks = llmResponse.ToolCalls
                    .Select(tc => context.CallActivityAsync<ToolResult>(
                        nameof(ExecuteTool), tc))
                    .ToList();
                ToolResult[] toolResults = await Task.WhenAll(toolTasks);

                foreach (var result in toolResults)
                    state.Messages.Add(result.ToMessage());
            }
            // If the LLM needs human input, wait for it
            else if (llmResponse.NeedsHumanInput)
            {
                string humanInput = await context.WaitForExternalEvent<string>("HumanInput");
                state.Messages.Add(new Message("user", humanInput));
            }
            // LLM is done
            else
            {
                return llmResponse.FinalAnswer;
            }

            state.Iteration++;

            // Periodically continue-as-new to keep the history bounded
            if (state.Iteration % 10 == 0)
            {
                context.ContinueAsNew(state);
                return null!;
            }
        }

        return "Max iterations reached.";
    }
}

def agent_loop_orchestration(ctx: task.OrchestrationContext, state: dict | None) -> str:
    if state is None:
        state = {"messages": [], "iteration": 0}

    max_iterations = 100
    while state["iteration"] < max_iterations:
        # Send conversation history to the LLM
        llm_response = yield ctx.call_activity(call_llm_agent, input=state["messages"])

        state["messages"].append(llm_response["message"])

        # If the LLM returned tool calls, execute them
        if llm_response.get("tool_calls"):
            tool_tasks = [
                ctx.call_activity(execute_tool, input=tc)
                for tc in llm_response["tool_calls"]
            ]
            tool_results = yield task.when_all(tool_tasks)

            for result in tool_results:
                state["messages"].append(result)

        # If the LLM needs human input, wait for it
        elif llm_response.get("needs_human_input"):
            human_input = yield ctx.wait_for_external_event("HumanInput")
            state["messages"].append({"role": "user", "content": human_input})

        # LLM is done
        else:
            return llm_response["final_answer"]

        state["iteration"] += 1

        # Periodically continue-as-new to keep the history bounded
        if state["iteration"] % 10 == 0:
            ctx.continue_as_new(state)
            return

    return "Max iterations reached."

const agentLoopOrchestration: TOrchestrator = async function* (
    ctx: OrchestrationContext, state: AgentState | null): any {

    if (!state) state = { messages: [], iteration: 0 };

    const maxIterations = 100;
    while (state.iteration < maxIterations) {
        // Send conversation history to the LLM
        const llmResponse = yield ctx.callActivity(callLlmAgent, state.messages);

        state.messages.push(llmResponse.message);

        // If the LLM returned tool calls, execute them
        if (llmResponse.toolCalls && llmResponse.toolCalls.length > 0) {
            const toolTasks = llmResponse.toolCalls.map((tc: any) =>
                ctx.callActivity(executeTool, tc)
            );
            const toolResults = yield whenAll(toolTasks);

            for (const result of toolResults) {
                state.messages.push(result);
            }
        // If the LLM needs human input, wait for it
        } else if (llmResponse.needsHumanInput) {
            const humanInput: string = yield ctx.waitForExternalEvent("HumanInput");
            state.messages.push({ role: "user", content: humanInput });
        // LLM is done
        } else {
            return llmResponse.finalAnswer;
        }

        state.iteration++;

        // Periodically continue-as-new to keep the history bounded
        if (state.iteration % 10 === 0) {
            ctx.continueAsNew(state);
            return;
        }
    }

    return "Max iterations reached.";
};

ctx -> {
    AgentState state = ctx.getInput(AgentState.class);
    if (state == null) state = new AgentState();

    int maxIterations = 100;
    while (state.getIteration() < maxIterations) {
        // Send conversation history to the LLM
        LlmResponse llmResponse = ctx.callActivity(
            "CallLlmAgent", state.getMessages(), LlmResponse.class).await();

        state.getMessages().add(llmResponse.getMessage());

        // If the LLM returned tool calls, execute them
        if (llmResponse.getToolCalls() != null && !llmResponse.getToolCalls().isEmpty()) {
            List<Task<ToolResult>> toolTasks = llmResponse.getToolCalls().stream()
                .map(tc -> ctx.callActivity("ExecuteTool", tc, ToolResult.class))
                .collect(Collectors.toList());
            List<ToolResult> toolResults = ctx.allOf(toolTasks).await();

            for (ToolResult result : toolResults) {
                state.getMessages().add(result.toMessage());
            }
        // If the LLM needs human input, wait for it
        } else if (llmResponse.needsHumanInput()) {
            String humanInput = ctx.waitForExternalEvent("HumanInput", String.class).await();
            state.getMessages().add(new Message("user", humanInput));
        // LLM is done
        } else {
            ctx.complete(llmResponse.getFinalAnswer());
            return;
        }

        state.incrementIteration();

        // Periodically continue-as-new to keep the history bounded
        if (state.getIteration() % 10 == 0) {
            ctx.continueAsNew(state);
            return;
        }
    }

    ctx.complete("Max iterations reached.");
}

Entitätsbasierte Agentschleifen

Wenn Sie ein Agentframework verwenden, das bereits eine eigene Agentschleife implementiert, können Sie es in eine dauerhafte Entität einschließen, um eine Haltbarkeit hinzuzufügen, ohne die Schleifenlogik neu zu schreiben. Jede Entitätsinstanz stellt eine einzelne Agentsitzung dar. Die Entität empfängt Nachrichten, delegiert diese intern an das Agenten-Framework und speichert den Gesprächszustand über mehrere Interaktionen hinweg.

Der Hauptvorteil dieses Ansatzes ist die Einfachheit: Sie schreiben Ihren Agent mit Ihrem bevorzugten Framework und fügen Haltbarkeit als Hosting-Problem hinzu, anstatt den Steuerungsfluss des Agenten neu zu gestalten. Die Entität fungiert als dauerhafter Wrapper, der die Sitzungspersistenz und Wiederherstellung automatisch verwaltet.

Die folgenden Beispiele zeigen, wie Sie ein vorhandenes Agent-SDK als dauerhafte Entität umschließen. Die Entität macht einen message Vorgang verfügbar, den Clients aufrufen, um Benutzereingaben zu senden. Intern delegiert die Entität an das Agent-Framework, das eine eigene Toolaufrufschleife verwaltet.

// Define the entity that wraps an existing agent SDK
public class ChatAgentEntity : TaskEntity<ChatAgentState>
{
    private readonly IChatClient _chatClient;

    public ChatAgentEntity(IChatClient chatClient)
    {
        _chatClient = chatClient;
    }

    // Called by clients to send a message to the agent
    public async Task<string> Message(string userMessage)
    {
        // Add the user message to the conversation history
        State.Messages.Add(new ChatMessage(ChatRole.User, userMessage));

        // Delegate to the agent SDK for the LLM call (with tool loop)
        ChatResponse response = await _chatClient.GetResponseAsync(
            State.Messages, State.Options);

        // Persist the response in the entity state
        State.Messages.AddRange(response.Messages);

        return response.Text;
    }

    // Azure Functions entry point for the entity
    [Function(nameof(ChatAgentEntity))]
    public Task RunEntityAsync([EntityTrigger] TaskEntityDispatcher dispatcher)
    {
        return dispatcher.DispatchAsync<ChatAgentEntity>();
    }
}

# Define the entity that wraps an existing agent SDK
@app.entity_trigger(context_name="context")
def chat_agent_entity(context):
    # Load persisted conversation state
    state = context.get_state(lambda: {"messages": []})

    if context.operation_name == "message":
        user_message = context.get_input()

        # Add the user message to the conversation history
        state["messages"].append({"role": "user", "content": user_message})

        # Delegate to the agent SDK for the LLM call (with tool loop)
        response = call_agent_sdk(state["messages"])

        # Persist the response in the entity state
        state["messages"].append({"role": "assistant", "content": response})
        context.set_state(state)

        context.set_result(response)

const df = require("durable-functions");

// Define the entity that wraps an existing agent SDK
const chatAgentEntity = async function (context) {
    // Load persisted conversation state
    let state = context.df.getState(() => ({ messages: [] }));

    switch (context.df.operationName) {
        case "message":
            const userMessage = context.df.getInput();

            // Add the user message to the conversation history
            state.messages.push({ role: "user", content: userMessage });

            // Delegate to the agent SDK for the LLM call (with tool loop)
            const response = await callAgentSdk(state.messages);

            // Persist the response in the entity state
            state.messages.push({ role: "assistant", content: response });
            context.df.setState(state);

            context.df.return(response);
            break;
    }
};
df.app.entity("ChatAgent", chatAgentEntity);

Hinweis

Dauerhafte Entitäten in Java erfordern Version 1.9.0 oder höher der Pakete durabletask-azure-functions und durabletask-client.

// Define the entity that wraps an existing agent SDK
public class ChatAgentEntity extends AbstractTaskEntity<ChatAgentState> {

    // Called by clients to send a message to the agent
    public String message(String userMessage) {
        // Add the user message to the conversation history
        this.state.getMessages().add(new ChatMessage("user", userMessage));

        // Delegate to the agent SDK for the LLM call (with tool loop)
        String response = callAgentSdk(this.state.getMessages());

        // Persist the response in the entity state
        this.state.getMessages().add(new ChatMessage("assistant", response));

        return response;
    }

    @Override
    protected ChatAgentState initializeState(TaskEntityOperation operation) {
        return new ChatAgentState();
    }
}

// Register the entity with Azure Functions
@FunctionName("ChatAgent")
public String chatAgentEntity(
        @DurableEntityTrigger(name = "req") String req) {
    return EntityRunner.loadAndRun(req, ChatAgentEntity::new);
}

// Define the entity that wraps an existing agent SDK
[DurableTask(Name = "ChatAgent")]
public class ChatAgentEntity : TaskEntity<ChatAgentState>
{
    private readonly IChatClient _chatClient;

    public ChatAgentEntity(IChatClient chatClient)
    {
        _chatClient = chatClient;
    }

    // Called by clients to send a message to the agent
    public async Task<string> Message(string userMessage)
    {
        // Add the user message to the conversation history
        State.Messages.Add(new ChatMessage(ChatRole.User, userMessage));

        // Delegate to the agent SDK for the LLM call (with tool loop)
        ChatResponse response = await _chatClient.GetResponseAsync(
            State.Messages, State.Options);

        // Persist the response in the entity state
        State.Messages.AddRange(response.Messages);

        return response.Text;
    }
}

from durabletask.entities.durable_entity import DurableEntity

# Define the entity that wraps an existing agent SDK
class ChatAgentEntity(DurableEntity):
    """Durable entity wrapping an agent SDK."""

    def message(self, user_message: str) -> str:
        # Load persisted conversation state
        state = self.get_state(default={"messages": []})

        # Add the user message to the conversation history
        state["messages"].append({"role": "user", "content": user_message})

        # Delegate to the agent SDK for the LLM call (with tool loop)
        response = call_agent_sdk(state["messages"])

        # Persist the response in the entity state
        state["messages"].append({"role": "assistant", "content": response})
        self.set_state(state)

        return response

import { TaskEntity } from "@microsoft/durabletask-js";

// Define the entity that wraps an existing agent SDK
class ChatAgentEntity extends TaskEntity<ChatAgentState> {

    // Called by clients to send a message to the agent
    async message(userMessage: string): Promise<string> {
        // Add the user message to the conversation history
        this.state.messages.push({ role: "user", content: userMessage });

        // Delegate to the agent SDK for the LLM call (with tool loop)
        const response = await callAgentSdk(this.state.messages);

        // Persist the response in the entity state
        this.state.messages.push({ role: "assistant", content: response });

        return response;
    }

    initializeState(): ChatAgentState {
        return { messages: [] };
    }
}

Hinweis

Dauerhafte Entitäten in Java erfordern Version 1.9.0 oder höher des pakets durabletask-client.

// Define the entity that wraps an existing agent SDK
public class ChatAgentEntity extends AbstractTaskEntity<ChatAgentState> {

    // Called by clients to send a message to the agent
    public String message(String userMessage) {
        // Add the user message to the conversation history
        this.state.getMessages().add(new ChatMessage("user", userMessage));

        // Delegate to the agent SDK for the LLM call (with tool loop)
        String response = callAgentSdk(this.state.getMessages());

        // Persist the response in the entity state
        this.state.getMessages().add(new ChatMessage("assistant", response));

        return response;
    }

    @Override
    protected ChatAgentState initializeState(TaskEntityOperation operation) {
        return new ChatAgentState();
    }
}

Die erweiterung Durable Task for Microsoft Agent Framework verwendet diesen Ansatz. Er umschließt Microsoft Agent Framework-Agents als dauerhafte Entitäten, stellt persistente Sitzungen, automatische Prüfpunkte und integrierte API-Endpunkte mit einer einzigen Konfigurationszeile bereit.

Nächste Schritte

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-06

Agentische Anwendungsmuster

Auswählen eines Ansatzes

Deterministische Workflowmuster

Verkettungsmuster für Prompts

Routing

Parallelisierung

Orchestrator-Worker-Muster

Evaluator-Optimierer-Muster

Agentschleifen

Orchestrierungsbasierte Agenten-Schleifen

Entitätsbasierte Agentschleifen

Nächste Schritte

Feedback

Zusätzliche Ressourcen