Evaluer agenterne for Microsoft 365 Copilot i Copilot Studio

Vigtigt!

Nogle af de funktioner, der beskrives i denne udgivelsesplan, er ikke blevet udgivet endnu. Tidslinjerne for levering ændres muligvis, og de forventede funktioner udgives muligvis ikke (se Microsofts politik). Få mere at vide: Nyheder og planlagte tiltag

Aktiveret til	Offentlig prøveversion	Generel tilgængelighed
Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk	Jul 2026	-

Forretningsværdi

Agenter til Microsoft 365 Copilot-evaluering muliggør validering i virksomhedsklassen af deklarative agenter, der bruges i reelle og kritiske forretningsarbejdsprocesser, og flytter teams fra manuel ad hoc-test til en skalerbar og standardiseret evalueringspraksis. Med denne funktion kan du reducere produktionsrisikoen ved at registrere kvalitet, korrekthed og adfærdsmæssige problemer før udgivelsen og forbedre udgivelsessikkerhed og gentagelser gennem automatiserede evalueringsprocesser, der kan gentages og forklares.

Detaljer om funktioner

Evaluering for Agents for Microsoft 365 Copilot (også kaldet deklarative agenter) giver en omfattende evalueringsramme, der er skræddersyet til deklarative agenter på tværs af udviklings-, test- og produktionsparathedsfaser.

Den muliggør struktureret validering af kvalitet, funktionsmåde og pålidelighed ved hjælp af automatiserede og gentagne arbejdsprocesser.

Evaluering af deklarative agenter omfatter følgende funktioner:

Konfiguration af evaluering og input

Analytikere kan konfigurere, hvilke data der skal bruges i test:

Opret og administrer brugerdefinerede testdata.
Opret evalueringsinput fra eksisterende samtaler.

Udførelse af evaluering

Analytikere kan konfigurere omfanget eller typen af udførelse af evaluering:

Automatiserede evalueringskørsler
Fuld samtaleevaluering med flere trin
Godkendt evalueringskontekst

Evalueringsmetode (gradere)

Analytikere kan få adgang til disse gradere:

Rammeværk for klassificering på sæt-niveau
Lighedsbedømmer
Sammenligning af semantisk betydning
Nøgleordsmatch
Brugerdefineret grader med konfigurerbare mærkater
AI-baserede kvalitet gradere
Bedømmer til aktivering af værktøj og emne

De kan også bruge flere gradere pr. input.

Analyse og historiefortælling

Analytikere kan også bruge rapporteringsværktøjer og analysefunktioner:

Aggregeret resultatanalyse
Detaljevisninger til inspektion for hver test
Visualisering af aktivitetskort
Registrer og analysér brugerseaktioner

Statussporing og sammenligning

Analytikere kan administrere resultater og køre kontekstuelt med:

Sammenligninger fra løb til løb
Eksport af evalueringsresultater

Geografiske områder

Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.

Tilgængelighed af sprog

Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.

Feedback

Var denne side nyttig?

Last updated on 2026-03-18