Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Important
Några av funktionerna som beskrivs i den här lanseringsplanen har inte släppts. Leveranstider kan ändras och förväntade funktioner kanske inte släpps (mer information finns i Microsofts policy). Läs mer: Nyheter och planer
| Aktiverat för | Offentlig förhandsversion | Allmän tillgänglighet |
|---|---|---|
| Administratörer, utvecklare, marknadsförare eller analytiker, automatiskt | Jul 2026 | - |
Affärsvärde
Agenter för Microsoft 365 Copilot-utvärdering möjliggör validering i företagsklass av deklarativa agenter som används i verkliga och kritiska affärsarbetsflöden och flyttar team från manuell, ad hoc-testning till en skalbar och standardiserad utvärderingspraxis. Med den här funktionen kan du minska produktionsrisken genom att identifiera kvalitets-, korrekthets- och beteendeproblem före lanseringen och förbättra versionsförtroendet och iterationerna genom automatiserade, repeterbara och förklarande utvärderingsprocesser.
Information om funktionen
Utvärdering för agenter för Microsoft 365 Copilot (kallas även deklarativa agenter) ger ett omfattande utvärderingsramverk som är skräddarsytt för deklarativa agenter i utvecklings-, testnings- och produktionsberedskapsfaser.
Det möjliggör strukturerad validering av kvalitet, beteende och tillförlitlighet med hjälp av automatiserade och repeterbara arbetsflöden.
Utvärdering av en deklarativ agent inkluderar följande kapaciteter:
Konfiguration och indata för utvärdering
Analytiker kan konfigurera vilka data som ska användas i tester:
- Skapa och hantera anpassade testdata.
- Skapa utvärderingsindata från befintliga konversationer.
Utvärderingskörning
Analytiker kan konfigurera omfånget eller typen av utvärderingskörning:
- Automatiserade utvärderingskörningar
- Fullständig konversationsutvärdering (fleromgångs)
- Autentiserad utvärderingskontext
Utvärderingsmetodik (bedömare)
Analytiker kan komma åt dessa bedömare:
- Ramverk för klassificering på uppsättningsnivå
- Likhetsgranskare
- Semantisk meningsjämförelse
- Nyckelordsmatchning
- Anpassad bedömning med konfigurerbara etiketter
- AI-baserade kvalitetsklassare
- Bedömare av verktyg och ämnesanrop
De kan också använda flera bedömare per indata.
Analys och berättande
Analytiker kan också använda rapporteringsverktyg och analysfunktioner:
- Aggregerad resultatanalys
- Detaljgranskningsvyer för testspecifik inspektion
- Visualisering av aktivitetskarta
- Samla in och analysera användarreaktioner
Förloppsspårning och jämförelse
Analytiker kan hantera resultat och körningar kontextuellt med:
- Kör-till-kör-jämförelser
- Export av utvärderingsresultat
Geografiska områden
Besök rapporten Utforska funktionsgeografi för Microsoft Azure-områden där den här funktionen är planerad eller tillgänglig.
Språktillgänglighet
Besök rapporten Utforska funktionsspråk för information om den här funktionens tillgänglighet.