Freigeben über


Lernrichtlinie und -einstellungen

Wichtig

Ab dem 20. September 2023 können Sie keine neuen Personalizer-Ressourcen erstellen. Der Personalizer-Dienst wird am 1. Oktober 2026 eingestellt. Wir empfehlen, zu dem Open-Source-Projekt microsoft/learning-loop zu migrieren.

Die Lerneinstellungen legen die Hyperparameter des Modelltrainings fest. Zwei Modelle, die anhand der gleichen Daten mit unterschiedlichen Einstellungen trainiert werden, sind im Ergebnis verschieden.

Learning-Richtlinie und -Einstellungen werden auf Ihrer Personalizer-Ressource im Azure-Portal festgelegt.

Importieren und Exportieren von Lernrichtlinien

Sie können Lernrichtliniendateien aus dem Azure-Portal importieren und exportieren. Auf diese Weise können Sie vorhandene Richtlinien speichern, testen, ersetzen und zur späteren Referenz und Überprüfung als Artefakte in Ihrer Quellcodeverwaltung archivieren.

Erfahren Sie, wie Sie eine Lernrichtlinie im Azure-Portal für Ihre Personalizer-Ressource importieren und exportieren.

Grundlegendes zu Lernrichtlinieneinstellungen

Die Einstellungen in der Lernrichtlinie sollten nicht geändert werden. Ändern Sie die Einstellungen nur, wenn Sie genau wissen, wie sich die Änderungen auf die Personalisierung auswirken. Ohne dieses Wissen könnten Sie Probleme verursachen, einschließlich der Invalidierung von Personalisierungsmodellen.

Der Personalisierungsdienst verwendet vowpalwabbit zum Trainieren und Bewerten der Ereignisse. Informationen zum Bearbeiten der Lerneinstellungen mit vowpalwabbit finden Sie in der vowpalwabbit-Dokumentation. Nachdem Sie über die richtigen Befehlszeilenargumente verfügen, speichern Sie den Befehl in einer Datei mit dem folgenden Format (ersetzen Sie den Argumenteigenschaftenwert durch den gewünschten Befehl), und laden Sie die Datei hoch, um Lerneinstellungen in den Model- und Lerneinstellungenbereich im Azure Portal für Ihre Personalizer-Ressource zu importieren.

Der folgende .json-Code ist ein Beispiel für eine Lernrichtlinie.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Vergleichen von Lernrichtlinien

Mithilfe von Offlineauswertungen können Sie das Abschneiden verschiedener Lernrichtlinien anhand von Vergangenheitsdaten in Personalisierungsprotokollen vergleichen.

Laden Sie Ihre eigenen Lernrichtlinien hoch, um sie mit der aktuellen Lernrichtlinie zu vergleichen.

Optimieren von Lernrichtlinien

Mithilfe einer Offlineauswertung kann der Personalizer eine optimierte Lernrichtlinie erstellen. Eine optimierte Lernrichtlinie zeichnet sich bei einer Offlineauswertung durch eine höhere Relevanz aus und liefert bessere Ergebnisse, wenn sie online bei der Personalisierung verwendet wird.

Nachdem Sie eine Lernrichtlinie optimiert haben, können Sie sie direkt auf die Personalisierung anwenden und damit die aktuelle Richtlinie sofort ersetzen. Sie können die optimierte Richtlinie aber auch zur weiteren Auswertung speichern und später entscheiden, ob sie verworfen, gespeichert oder angewandt werden soll.

Nächste Schritte