Evaluer agenterne for Microsoft 365 Copilot i Copilot Studio

Vigtigt!

Nogle af de funktioner, der beskrives i denne udgivelsesplan, er ikke blevet udgivet endnu. Tidslinjerne for levering ændres muligvis, og de forventede funktioner udgives muligvis ikke (se Microsofts politik). Få mere at vide: Nyheder og planlagte tiltag

Aktiveret til Offentlig prøveversion Generel tilgængelighed
Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk Jul 2026 -

Forretningsværdi

Agenter til Microsoft 365 Copilot-evaluering muliggør validering i virksomhedsklassen af deklarative agenter, der bruges i reelle og kritiske forretningsarbejdsprocesser, og flytter teams fra manuel ad hoc-test til en skalerbar og standardiseret evalueringspraksis. Med denne funktion kan du reducere produktionsrisikoen ved at registrere kvalitet, korrekthed og adfærdsmæssige problemer før udgivelsen og forbedre udgivelsessikkerhed og gentagelser gennem automatiserede evalueringsprocesser, der kan gentages og forklares.

Detaljer om funktioner

Evaluering for Agents for Microsoft 365 Copilot (også kaldet deklarative agenter) giver en omfattende evalueringsramme, der er skræddersyet til deklarative agenter på tværs af udviklings-, test- og produktionsparathedsfaser.

Den muliggør struktureret validering af kvalitet, funktionsmåde og pålidelighed ved hjælp af automatiserede og gentagne arbejdsprocesser.

Evaluering af deklarative agenter omfatter følgende funktioner:

Konfiguration af evaluering og input

Analytikere kan konfigurere, hvilke data der skal bruges i test:

  • Opret og administrer brugerdefinerede testdata.
  • Opret evalueringsinput fra eksisterende samtaler.

Udførelse af evaluering

Analytikere kan konfigurere omfanget eller typen af udførelse af evaluering:

  • Automatiserede evalueringskørsler
  • Fuld samtaleevaluering med flere trin
  • Godkendt evalueringskontekst

Evalueringsmetode (gradere)

Analytikere kan få adgang til disse gradere:

  • Rammeværk for klassificering på sæt-niveau
  • Lighedsbedømmer
  • Sammenligning af semantisk betydning
  • Nøgleordsmatch
  • Brugerdefineret grader med konfigurerbare mærkater
  • AI-baserede kvalitet gradere
  • Bedømmer til aktivering af værktøj og emne

De kan også bruge flere gradere pr. input.

Analyse og historiefortælling

Analytikere kan også bruge rapporteringsværktøjer og analysefunktioner:

  • Aggregeret resultatanalyse
  • Detaljevisninger til inspektion for hver test
  • Visualisering af aktivitetskort
  • Registrer og analysér brugerseaktioner

Statussporing og sammenligning

Analytikere kan administrere resultater og køre kontekstuelt med:

  • Sammenligninger fra løb til løb
  • Eksport af evalueringsresultater

Geografiske områder

Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.

Tilgængelighed af sprog

Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.