Leistung und Skalierung in dauerhaften Funktionen

Verwenden Sie diesen Artikel, um das Leistungs- und Skalierungsverhalten Ihrer App für dauerhafte Funktionen zu optimieren. Es deckt die Haupthebel ab, die Sie anpassen können:

Worker scaling: Wie der Azure Functions-Host basierend auf der Auslastung Worker hinzufügt und entfernt.
Konkurrenzauslastungen: Begrenzung der Anzahl der Funktionen, die gleichzeitig auf jedem Worker ausgeführt werden.
Zwischenspeicherung von Instanzen: Reduzieren des Wiedergabeaufwands durch Zwischenspeichern des Orchestrierungszustands im Arbeitsspeicher des Mitarbeiters.
Partitionsanzahl: Wie die Partitionierung für Skalierung und Lokalität konfiguriert wird.

Important

Wenn Sie Python oder PowerShell verwenden, lesen Sie überlegungen zur Sprachlaufzeit , bevor Sie Parallelitätseinstellungen konfigurieren. Falsch konfigurierte Parallelität kann dazu führen, dass Aktivitäten an einem einzelnen Mitarbeiter hängen.

Workerskalierung

Ein wichtiger Vorteil des Aufgabenhub-Konzepts ist, dass die Anzahl der Mitarbeiter, die Aufgabenhubarbeitselemente verarbeiten, nach oben und unten skaliert wird. Anwendungen fügen Instanzen hinzu (Skalieren nach außen), um die Verarbeitung der Arbeit zu beschleunigen, und entfernen Instanzen (Skalieren nach innen), wenn nicht genügend Arbeit vorhanden ist, um sie auszulasten. Sie können sogar auf Null skalieren , wenn der Aufgabenhub im Leerlauf ist. Wenn Sie auf Null skalieren, werden keine Worker ausgeführt. Nur der Skalierungscontroller und speicher bleiben aktiv.

Dieses Konzept wird im folgenden Diagramm veranschaulicht:

Diagramm, das zeigt, wie Durable Functions-Prozesse erweitert, reduziert und auf Null gesetzt werden können, um einen Aufgabenhub zu skalieren.

Autoskalierung

In den Plänen "Verbrauch" und "Elastic Premium" unterstützt Durable Functions die Automatische Skalierung über den Azure Functions Scale Controller. Der Skalierungscontroller überwacht, wie lange Nachrichten und Aufgaben vor der Verarbeitung warten. Basierend auf diesen Latenzen werden Mitarbeiter hinzugefügt oder entfernt.

Hinweis

Ab Durable Functions 2.0 können Sie Funktions-Apps so konfigurieren, dass sie in virtuellen netzwerkgeschützten Dienstendpunkten im Elastic Premium-Plan ausgeführt werden. In dieser Konfiguration starten die Durable Functions-Trigger Skalierungsanforderungen anstelle des Skalierungscontrollers. Weitere Informationen finden Sie unter Runtime-Skalierungsüberwachung.

Im Premium-Plan hält die automatische Skalierung die Anzahl der Mitarbeiter (und Betriebskosten) ungefähr proportional zur Auslastung der Anwendung.

Drosselungen der Parallelität

Eine einzelne Arbeitsinstanz kann mehrere Arbeitsaufgaben gleichzeitig ausführen. Dies erhöht Parallelität und nutzt Arbeitsressourcen effizienter. Wenn ein Worker jedoch zu viele Arbeitsaufgaben gleichzeitig verarbeitet, kann er Ressourcen wie CPU, Netzwerkverbindungen und Arbeitsspeicher ausschöpfen.

Damit ein einzelner Worker nicht überlastet wird, müssen Sie möglicherweise die Parallelität pro Instanz drosseln. Die Anzahl der gleichzeitig auf jedem Arbeiter ausgeführten Funktionen einzuschränken, hilft zu vermeiden, dass die Ressourcengrenzen dieses Arbeiters erreicht werden.

Hinweis

Einschränkungen der Parallelität gelten nur lokal und beschränken die laufenden Prozesse pro Worker. Daher beschränken sie den Gesamten Systemdurchsatz nicht.

Tipp

In einigen Fällen kann die Drosselung der Parallelität pro Arbeitskraft tatsächlich den Gesamtdurchsatz des Systems erhöhen . Dies kann der Fall sein, wenn jeder Worker weniger Aufgaben übernimmt, sodass der Skalierungscontroller weitere Worker hinzufügt, um mit den Warteschlangen Schritt zu halten, was wiederum den Gesamtdurchsatz erhöht.

Parallelitätsdrosselungen konfigurieren

Konfigurieren Von Aktivitäts-, Orchestrator- und Entitätsfunktions-Parallelitätsgrenzwerten in der host.json Datei. Verwenden Sie durableTask/maxConcurrentActivityFunctions für Aktivitätsfunktionen und durableTask/maxConcurrentOrchestratorFunctions für Orchestrator- und Entitätsfunktionen. Diese Einstellungen beschränken die Anzahl der Orchestrator-, Entitäts- und Aktivitätsfunktionen, die ein Worker in den Arbeitsspeicher lädt.

Hinweis

Orchestrierungen und Entitäten werden nur während der Verarbeitung von Ereignissen oder Vorgängen in den Arbeitsspeicher geladen, oder wenn das Zwischenspeichern von Instanzen aktiviert ist. Nachdem sie ihre Logik ausgeführt haben und dann auf (z. B. await in C# oder yield in JavaScript und Python) gewartet haben, können sie aus dem Arbeitsspeicher entfernt werden. Entladene Orchestrierungen und Entitäten zählen nicht für die maxConcurrentOrchestratorFunctions-Drosselung. Auch wenn sich Millionen von Instanzen im Zustand „Wird ausgeführt“ befinden, werden nur Instanzen im Arbeitsspeicher für das Drosselungslimit gezählt. Eine Orchestrierung, die auf den Abschluss einer Aktivität wartet, zählt nicht für die Drosselung.

{
  "extensions": {
    "durableTask": {
      "maxConcurrentActivityFunctions": 10,
      "maxConcurrentOrchestratorFunctions": 10
    }
  }
}

Sprachlaufzeitüberlegungen

Die ausgewählte Sprachlaufzeit kann strenge Parallelitätseinschränkungen für Ihre Funktionen festlegen. Beispielsweise können Durable Functions Apps, die in Python oder PowerShell geschrieben wurden, jeweils nur eine Funktion auf einer einzelnen VM ausführen. Dies kann zu Leistungsproblemen führen, wenn Sie dies nicht berücksichtigen. Wenn ein Orchestrator zehn Aktivitäten vorsieht, die Sprach-Laufzeit aber nur eine Funktion zulässt, müssen neun der zehn Aktivitätsfunktionen warten, bis sie ausgeführt werden können. Außerdem können diese wartenden Aktivitäten nicht per Load Balancing auf andere Prozesse verteilt werden, da die Durable Functions-Laufzeit sie bereits in den Arbeitsspeicher lädt. Dies ist besonders problematisch, wenn die Aktivitätsfunktionen lange andauern.

Wenn ihre Sprachlaufzeit die Parallelität einschränkt, aktualisieren Sie Durable Functions Parallelitätseinstellungen, um sie abzugleichen. Dadurch wird verhindert, dass die Laufzeitumgebung von Durable Functions mehr Funktionen gleichzeitig ausführt, als von der Sprachlaufzeit erlaubt wird, und ausstehende Aktivitäten auf andere VMs verteilt werden können. Wenn eine Python-App beispielsweise die Parallelität auf vier Funktionen einschränkt (z. B. 4 Threads in einem Arbeitsprozess mit einer Sprache oder 1 Thread für 4 Spracharbeitsprozesse), konfigurieren Sie sowohl maxConcurrentOrchestratorFunctions als auch maxConcurrentActivityFunctions auf 4.

Informationen zu Python Leistungsempfehlungen finden Sie unter Improve throughput performance of Python apps in Azure Functions. Diese Techniken können Durable Functions Leistung und Skalierbarkeit erheblich verbessern.

Zwischenspeicherung von Instanzen

Zum Verarbeiten einer Orchestrierungsarbeitsaufgabe führt ein Worker zwei Dinge aus:

Orchestrierungshistorie abrufen.
Wiederholung des Orchestratorcodes mithilfe des Verlaufs.

Wenn derselbe Arbeiter mehrere Arbeitselemente für dieselbe Orchestrierung verarbeitet, kann der Speicheranbieter den Verlauf im Arbeitsspeicher des Arbeiters zwischenspeichern, um den ersten Schritt zu überspringen. Es kann auch den Orchestrator während der Ausführung zwischenspeichern, um zu vermeiden, dass der Verlauf für nachfolgende Arbeitselemente erneut abgespielt wird.

Aktivieren Sie das Zwischenspeichern, wenn Ihre Orchestrierungen viele Instanzen aufweisen und Sie einen hohen Replay-Overhead feststellen. Das Caching reduziert typischerweise die E/A-Anforderungen für den zugrunde liegenden Speicherdienst und verbessert Durchsatz und Latenz, erhöht jedoch auch die Speicherauslastung der Arbeitseinheit.

Tipp

Die Zwischenspeicherung kann die Anzahl der Wiederholungen des Verlaufs durch die Laufzeit reduzieren, Wiederholungen können jedoch nicht völlig eliminiert werden. Testen Sie während der Entwicklung Orchestratoren mit deaktivierter Zwischenspeicherung. Die erzwungene Wiedergabe hilft Ihnen, Verstöße gegen Orchestratorfunktionscodeeinschränkungen zu erkennen.

Hinweis

Der Permanente Vorgangsplaner verwaltet die Zwischenspeicherung intern. Die folgenden Konfigurationsdetails gelten nur für die BYO-Speicheranbieter.

Zwischenspeichern nach Speicheranbieter

In der folgenden Tabelle wird die Unterstützung für das Zwischenspeichern von Instanzen zwischen Anbietern verglichen und die Konfiguration der einzelnen Instanzen zusammengefasst.

	Azure Storage Anbieter	Netherite-Speicheranbieter	MSSQL-Speicheranbieter
Zwischenspeichern von Instanzen	Unterstützt (nur .NET In-Prozess-Worker)	Unterstützt	Nicht unterstützt
Standardeinstellung	Deaktiviert	Aktiviert	n/a
Mechanismus	Erweiterte Sitzungen	Instanzcache	n/a

Erweiterte Sitzungen (Azure Storage-Anbieter) behalten Mid-Execution-Orchestratoren im Arbeitsspeicher bei, bis sie für eine festgelegte Zeit im Leerlauf sind. Aktivieren und optimieren Sie dieses Verhalten mit extendedSessionsEnabled und extendedSessionIdleTimeoutInSeconds in Ihrer host.json Datei:

{
  "extensions": {
    "durableTask": {
      "extendedSessionsEnabled": true,
      "extendedSessionIdleTimeoutInSeconds": 30
    }
  }
}

Hinweis

Erweiterte Sitzungen werden nur im .NET In-Process-Worker unterstützt. Für Details siehe Erweiterte Sitzungen in der Azure Storage-Anbieterdokumentation.

Der Instanzcache (Netherite Storage Provider) behält den Instanzstatus und den Verlauf im Arbeitsspeicher des Mitarbeiters bei und verfolgt die Gesamtspeichernutzung. Wenn der Cache den InstanceCacheSizeMB Grenzwert überschreitet, werden die zuletzt verwendeten Instanzdaten entfernt. Wenn Sie CacheOrchestrationCursors auf true setzen, speichert der Cache auch die Mid-Execution-Orchestratoren.

Hinweis

Instanzencaches funktionieren mit allen Sprach-SDKs, die Option CacheOrchestrationCursors ist jedoch nur für den .NET In-Process-Worker verfügbar. Ausführliche Informationen finden Sie in der Dokumentation zum Instanzcache in der Dokumentation des Netherite-Speicheranbieters.

Partitionsanzahl

Einige Speicheranbieter unterstützen die Partitionierung und ermöglichen ihnen das Festlegen partitionCount.

Bei der Partitionierung konkurrieren Die Mitarbeiter nicht um einzelne Arbeitsaufgaben. Das Partitionieren gruppiert Arbeitselemente in partitionCount Partitionen, und der Ladevorgang weist diese Partitionen den Workern zu. Dieser Ansatz reduziert die Gesamtanzahl der Speicherzugriffe. Außerdem kann er Instanzspeicherung aktivieren und die Lokalität verbessern, da Affinität erschaffen wird: Der gleiche Worker verarbeitet alle Workitems für dieselbe Instanz.

Hinweis

Der Durable Task Scheduler verwaltet die Partitionierung intern. Die folgenden Konfigurationsdetails gelten nur für die BYO-Speicheranbieter.

Für die meisten Apps reicht die Standardpartitionsanzahl aus. Erhöhen Sie die Partitionsanzahl, wenn Sie erwarten, dass über die Standardanzahl der Workers für Orchestrierungsvorgänge hinaus skaliert werden soll, da die Partitionsanzahl die Anzahl der Workers einschränkt, die Orchestrierungsnachrichten aus einer partitionierten Warteschlange verarbeiten können.

Die folgende Tabelle zeigt, welche Warteschlangen von jedem Speicheranbieter partitioniert werden, sowie den zulässigen Bereich und die Standardwerte für partitionCount.

	Azure Storage Anbieter	Netherite-Speicheranbieter	MSSQL-Speicheranbieter
Instanznachrichten	Partitioniert	Partitioniert	Nicht partitioniert
Aktivitätsmeldungen	Nicht partitioniert	Partitioniert	Nicht partitioniert
Standard `partitionCount`	4	12	n/a
Maximale `partitionCount`	16	32	n/a
Dokumentation	Siehe Horizontale Skalierung des Orchestrators	Siehe Überlegungen zur Partitionsanzahl	n/a

Warnung

Sie können die Partitionsanzahl nach dem Erstellen eines Aufgabenhubs nicht mehr ändern. Legen Sie es hoch genug fest, um die erwarteten Skalierungsanforderungen für die Task Hub-Instanz zu erfüllen.

Konfigurieren der Partitionsanzahl

Geben Sie in der Datei partitionCount an. Der folgende host.json-Ausschnitt setzt durableTask/storageProvider/partitionCount auf 3.

{
  "extensions": {
    "durableTask": {
      "storageProvider": {
        "partitionCount": 3
      }
    }
  }
}

Funktionsausführungsverhalten

In diesem Abschnitt werden Die Ausführungsdetails behandelt, die sich auf die Leistung auswirken: welche Art von Arbeit jeder Funktionstyp verarbeiten soll, wie Timeouts funktionieren und wie Entitätsvorgänge batchweise verarbeitet werden.

Arbeitsplatzverteilung nach Funktionstyp

Orchestrator-Funktionen führen ihre Logik mehrmals aus, da sie wiederholt werden. Daher ist es wichtig, dass Orchestrator-Funktionsthreads keine CPU-intensiven Aufgaben ausführen, keine E/A durchführen oder blockieren. Verschieben Sie Arbeit, die E/A, Blockierung oder mehrere Threads erfordern kann, in Aktivitätsfunktionen.

Aktivitätsfunktionen verhalten sich wie normale, in der Warteschlange ausgelöste Funktionen. Sie unterstützen E/A, CPU-intensive Vorgänge und mehrere Threads. Da Aktivitätstrigger zustandslos sind, skalieren sie auf viele VMs.

Entitätsfunktionen laufen auch auf einem einzelnen Thread und führen Operationen nacheinander aus. Entitätsfunktionen haben keine Einschränkungen für den Codetyp, den sie ausführen.

Funktion-Timeouts

Aktivitäts-, Orchestrator- und Entitätsfunktionen unterliegen den gleichen Funktionstimeouts wie den anderen Azure Functions. Durable Functions behandelt ein Funktionstimeout wie eine unbehandelte Ausnahme im Code.

Wenn z. B. bei einer Aktivität eine Zeitüberschreitung auftritt, zeichnet Durable Functions die Ausführung als fehlgeschlagen auf und benachrichtigt den Orchestrator. Der Orchestrator behandelt die Zeitüberschreitung wie jede andere Ausnahme: Die Laufzeit versucht, den Vorgang zu wiederholen, wenn der Aufruf dies angibt, oder es wird ein Exception Handler ausgeführt.

Batchverarbeitung von Entitätsvorgängen

Um die Leistung zu verbessern und Kosten zu senken, kann eine einzelne Arbeitsaufgabe eine Reihe von Entitätsvorgängen ausführen. Im Verbrauchsplan wird jeder Batch als einzelne Funktionsausführung abgerechnet.

Standardmäßig beträgt die maximale Batchgröße 50 im Verbrauchsplan und 5.000 für andere Pläne. Sie können auch die maximale Batchgröße in der host.json Datei konfigurieren. Wenn die maximale Batchgröße auf „1“ festgelegt wird, ist die Batchverarbeitung faktisch deaktiviert.

Hinweis

Wenn einzelne Entitätsvorgänge lange dauern, kann es hilfreich sein, die maximale Batchgröße einzuschränken, um das Risiko von Funktionstimeouts zu verringern, insbesondere im Verbrauchsplan.

Leistungsziele

Wenn Sie eine Produktions-App mit Durable Functions planen, sollten Sie die Leistungsanforderungen frühzeitig berücksichtigen. Diese grundlegenden Nutzungsszenarien helfen Ihnen bei der Planung:

Sequenzielle Aktivitätsausführung: In diesem Szenario wird eine Orchestratorfunktion beschrieben, die eine Reihe von Aktivitätsfunktionen sequenziell ausführt. Es ähnelt am ehesten dem Funktionskettenbeispiel .
Parallele Aktivitätsausführung: In diesem Szenario wird eine Orchestratorfunktion beschrieben, die viele Aktivitätsfunktionen parallel mithilfe des Fan-out-, Fan-In-Musters ausführt.
Parallele Antwortverarbeitung: Dieses Szenario ist die zweite Hälfte des Fan-out-Fan-In-Musters. Es konzentriert sich auf die Fan-in-Leistung. Im Gegensatz zu Fanout wird fan-in in einer einzigen Orchestratorfunktionsinstanz ausgeführt, sodass sie auf einer einzelnen VM ausgeführt wird.
Externe Ereignisverarbeitung: Dieses Szenario stellt eine einzelne Orchestratorfunktionsinstanz dar, die jeweils auf externe Ereignisse wartet.
Verarbeitung von Entitätsvorgängen: In diesem Szenario wird getestet, wie schnell eine einzelneCounter-Entität einen konstanten Vorgangsstrom verarbeiten kann.

Durchsatznummern für diese Szenarien befinden sich in der Dokumentation des Speicheranbieters. Dies gilt insbesondere für:

Informationen zum Azure Storage-Anbieter finden Sie unter Performance targets.
Informationen zum Netherite-Speicheranbieter finden Sie unter "Grundlegende Szenarien".
Informationen zum MSSQL-Speicheranbieter finden Sie unter Orchestration-Durchsatz-Benchmarks.

Tipp

Im Gegensatz zu Fan-Out-Operationen sind Fan-In-Operationen auf eine einzelne virtuelle Maschine beschränkt. Wenn in Ihrer Anwendung das Muster „Auffächern nach außen/innen (Fan-out, Fan-in)“ verwendet wird und Sie die Leistung im Hinblick auf die Auffächerung nach innen optimieren möchten, können Sie die Auffächerung der Aktivitätsfunktionen nach außen in mehrere untergeordnete Orchestrierungen unterteilen.

Nächste Schritte

Azure Storage Provider

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-23

Leistung und Skalierung in dauerhaften Funktionen

Workerskalierung

Autoskalierung

Drosselungen der Parallelität

Parallelitätsdrosselungen konfigurieren

Sprachlaufzeitüberlegungen

Zwischenspeicherung von Instanzen

Zwischenspeichern nach Speicheranbieter

Partitionsanzahl

Konfigurieren der Partitionsanzahl

Funktionsausführungsverhalten

Arbeitsplatzverteilung nach Funktionstyp

Funktion-Timeouts

Batchverarbeitung von Entitätsvorgängen

Leistungsziele

Nächste Schritte

Feedback

Zusätzliche Ressourcen