Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Einige der in diesem Releaseplan beschriebenen Funktionen wurden nicht veröffentlicht. Die Zeitpläne für die Veröffentlichung können sich ändern, und geplante Funktionen werden möglicherweise nicht veröffentlicht (weitere Informationen finden Sie in der Microsoft-Richtlinie). Weitere Informationen: Neuerungen und Planungen
| Aktiviert für | Öffentliche Vorschau | Allgemeine Verfügbarkeit |
|---|---|---|
| Administrierende, Erstellende, Marketingfachkräfte oder Mitarbeitende in der Analyse, automatisch | Juli 2026 | - |
Geschäftswert
Die Bewertung von Agents für Microsoft 365 Copilot ermöglicht die professionelle Validierung deklarativer Agents, die in echten und kritischen Geschäftsworkflows eingesetzt werden, und ermöglicht Teams den Übergang von manuellen Ad-hoc-Tests zu einem skalierbaren, standardisierten Evaluierungsverfahren. Mit diesem Feature können Sie das Produktionsrisiko reduzieren, indem Sie Qualitäts-, Korrektheits- und Verhaltensprobleme vor der Veröffentlichung erkennen und durch automatisierte, wiederholbare und erklärbare Auswertungsprozesse die Veröffentlichungssicherheit und Iterationen verbessern.
Funktionendetails
Die Bewertung von Agents für Microsoft 365 Copilot (auch als deklarative Agents bezeichnet) bietet ein umfassendes Evaluierungsframework, das auf deklarative Agents während der Entwicklungs-, Test- und Produktionsbereitschaftsphase zugeschnitten ist.
Sie ermöglicht eine strukturierte Validierung von Qualität, Verhalten und Zuverlässigkeit mithilfe automatisierter und wiederholbarer Workflows.
Die deklarative Agent-Auswertung umfasst die folgenden Funktionen:
Evaluierungseinrichtung und Eingaben
Analysten können konfigurieren, welche Daten in Tests verwendet werden sollen:
- Erstellen und Verwalten von benutzerdefinierten Testdaten.
- Erstellen Sie Auswertungseingaben aus vorhandenen Unterhaltungen.
Auswertungsausführung
Analysten können den Umfang oder die Art der Auswertungsausführung konfigurieren:
- Automatisierte Auswertungsläufe
- Vollständige Gesprächsauswertung (mehrstufig)
- Authentifizierter Auswertungskontext
Bewertungsmethodik (Grader)
Analysefachkräfte können auf diese Bewertungstools zugreifen:
- Bewertungsframework auf Satzebene
- Bewertungstools bezüglich Ähnlichkeit
- Semantischer Bedeutungsvergleich
- Schlüsselwort-Übereinstimmung
- Benutzerdefinierter Bewerter mit konfigurierbaren Labels
- KI-basierte Qualitätsbeurteiler
- Bewertungstools für Tool- und Themenaufruf
Sie können auch mehrere Bewerter pro Eingabe verwenden.
Analyse und Geschichtenerzählen
Analysten können auch Berichterstellungstools und Analysefunktionen verwenden:
- Aggregierte Ergebnisanalyse
- Drilldownansichten für testweise Überprüfung
- Aktivitätskarten-Visualisierung
- Erfassen und Analysieren von Benutzerreaktionen
Fortschrittsverfolgung und -vergleich
Analysten können Ergebnisse und Durchläufe kontextbezogen verwalten mit:
- Run-to-Run-Vergleiche
- Export von Auswertungsergebnissen
Geografische Gebiete
Besuchen Sie den "Explore Feature Geography"-Bericht für Microsoft Azure-Regionen, in denen dieses Feature geplant oder verfügbar ist.
Verfügbare Sprachen
Besuchen Sie den Bericht "Explore Feature Language", um Informationen über die Verfügbarkeit dieser Funktion zu erhalten.