Skalierbarkeit und Leistung

Wichtig

Ab dem 20. September 2023 können Sie keine neuen Personalizer-Ressourcen erstellen. Der Personalizer-Dienst wird am 1. Oktober 2026 eingestellt. Wir empfehlen, zu dem Open-Source-Projekt microsoft/learning-loop zu migrieren.

Bei hochleistungsfähigen und stark frequentierten Websites und Anwendungen müssen beim Dienst „Personalisierung“ hinsichtlich Skalierbarkeit und Leistung zwei Hauptfaktoren berücksichtigt werden:

  • Bei Aufrufen der Rank-API die Latenzzeit gering halten
  • Sicherstellen, dass der Trainingsdurchsatz mit der Ereigniseingabe Schritt hält

Die Personalisierung kann schnell einen Rang zurückgeben, wobei der größte Teil der Aufrufdauer der Kommunikation über die REST-API vorbehalten ist. Azure wird die Fähigkeit, schnell auf Anforderungen zu reagieren, automatisch skalieren.

Szenarien mit kurzer Wartezeit

Einige Anwendungen erfordern bei der Rückgabe eines Rangs kurze Wartezeiten. Geringe Latenzzeiten sind erforderlich:

  • Um zu verhindern, dass der Benutzer zu lange auf die Anzeige von bewerteten Inhalten wartet.
  • Um einem Server mit extrem hohen Datenverkehr beim Vermeiden zu helfen, knappe Computezeit und Netzwerkverbindungen zu binden.

Skalierbarkeit und Trainingsdurchsatz

Die Personalisierung funktioniert, indem ein Modell aktualisiert wird, das basierend auf von der Personalisierung asynchron gesendeten Nachrichten gemäß Rangfolgen- und Relevanz-API neu trainiert wird. Diese Nachrichten werden mithilfe eines Azure EventHub für die Anwendung gesendet.

Es ist unwahrscheinlich, dass die meisten Anwendungen den maximalen Teilnehmer- und Trainingsdurchsatz des Diensts „Personalisierung“ erreichen. Wenngleich das Erreichen dieses Maximums die Anwendung nicht bremst, würde es bedeuten, dass Event Hub-Warteschlangen intern schneller gefüllt werden, als sie bereinigt werden können.

Wie man seine Durchsatzanforderungen einschätzt

  • Schätzen Sie die durchschnittliche Anzahl von Bytes pro bewertetem Ereignis, indem Sie die Länge der JSON-Dokumente für Kontext und Aktion addieren.
  • Dividieren Sie 20 MB/s durch diese geschätzte durchschnittliche Anzahl von Bytes.

Wenn Ihre durchschnittliche Payload beispielsweise aus 500 Merkmalen besteht und jedes davon geschätzte 20 Zeichen lang ist, dann hat jedes Ereignis eine Größe von etwa 10 KB. Bei dieser Schätzungen gilt: 20.000.000 : 10.000 = 2.000 Ereignisse/s, also ca. 173 Mio. Ereignisse pro Tag.

Wenn Sie diese Grenzwerte erreichen, wenden Sie sich zwecks Architekturberatung an unser Supportteam.

Nächste Schritte

Erstellen und Konfigurieren des Diensts „Personalisierung“