Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
Vigtigt!
Nogle af de funktioner, der beskrives i denne udgivelsesplan, er ikke blevet udgivet endnu. Tidslinjerne for levering ændres muligvis, og de forventede funktioner udgives muligvis ikke (se Microsofts politik). Få mere at vide: Nyheder og planlagte tiltag
| Aktiveret til | Offentlig prøveversion | Generel tilgængelighed |
|---|---|---|
| Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk | Jul 2026 | - |
Forretningsværdi
Agenter til Microsoft 365 Copilot-evaluering muliggør validering i virksomhedsklassen af deklarative agenter, der bruges i reelle og kritiske forretningsarbejdsprocesser, og flytter teams fra manuel ad hoc-test til en skalerbar og standardiseret evalueringspraksis. Med denne funktion kan du reducere produktionsrisikoen ved at registrere kvalitet, korrekthed og adfærdsmæssige problemer før udgivelsen og forbedre udgivelsessikkerhed og gentagelser gennem automatiserede evalueringsprocesser, der kan gentages og forklares.
Detaljer om funktioner
Evaluering for Agents for Microsoft 365 Copilot (også kaldet deklarative agenter) giver en omfattende evalueringsramme, der er skræddersyet til deklarative agenter på tværs af udviklings-, test- og produktionsparathedsfaser.
Den muliggør struktureret validering af kvalitet, funktionsmåde og pålidelighed ved hjælp af automatiserede og gentagne arbejdsprocesser.
Evaluering af deklarative agenter omfatter følgende funktioner:
Konfiguration af evaluering og input
Analytikere kan konfigurere, hvilke data der skal bruges i test:
- Opret og administrer brugerdefinerede testdata.
- Opret evalueringsinput fra eksisterende samtaler.
Udførelse af evaluering
Analytikere kan konfigurere omfanget eller typen af udførelse af evaluering:
- Automatiserede evalueringskørsler
- Fuld samtaleevaluering med flere trin
- Godkendt evalueringskontekst
Evalueringsmetode (gradere)
Analytikere kan få adgang til disse gradere:
- Rammeværk for klassificering på sæt-niveau
- Lighedsbedømmer
- Sammenligning af semantisk betydning
- Nøgleordsmatch
- Brugerdefineret grader med konfigurerbare mærkater
- AI-baserede kvalitet gradere
- Bedømmer til aktivering af værktøj og emne
De kan også bruge flere gradere pr. input.
Analyse og historiefortælling
Analytikere kan også bruge rapporteringsværktøjer og analysefunktioner:
- Aggregeret resultatanalyse
- Detaljevisninger til inspektion for hver test
- Visualisering af aktivitetskort
- Registrer og analysér brugerseaktioner
Statussporing og sammenligning
Analytikere kan administrere resultater og køre kontekstuelt med:
- Sammenligninger fra løb til løb
- Eksport af evalueringsresultater
Geografiske områder
Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.
Tilgængelighed af sprog
Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.