Tilføj forventede svar til testcases for agentvurdering

Aktiveret til	Offentlig prøveversion	Generel tilgængelighed
Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk	21. sep. 2025	-

Forretningsværdi

Denne funktion er udviklet til udviklere, der bruger Copilot Studio Agent Evaluation til at validere deres agenter før og efter udrulningen. Ved at lade oprettere angive det forventede svar for hver testcase kan evalueringsstrukturen anvende de forskellige gradertyper nøjagtigt (eksakt, delvis, lighed og sammenlignings betydning) og give tydelige, gentagne resultater. Denne funktion sparer tid og ressourcer ved at fjerne manuelle sammenligninger i regneark eller eksterne værktøjer og giver organisationer større tillid til, at agenter fungerer efter hensigten. Det forbedrer kvaliteten og overholdelse af angivne standarder i stor skala, fremskynder udgivelsescyklusser og reducerer omkostningerne ved at løse problemer efter at være gået live ved at indhente huller tidligt i testen.

Detaljer om funktioner

Funktionen Tilføj forventet svar gør det muligt for oprettere at definere, redigere og administrere de forventede output for hver testcase. Dette input opretter direkte forbindelse til graderstrukturen og bestemmer, hvordan agentsvar evalueres.

Vigtige funktioner:

Konfiguration af før-testsag
- Oprettere angiver det forventede svar, når der oprettes eller redigeres en testcase.
- Både korte, præcise svar og længere beskrivende referencer understøttes.
Integration med graderfamilier
- Nøjagtigt eller delvist match – kræv nøjagtig tekst eller nøgleudtryk for at validere.
- Lighed – sammenlign semantisk lighed med referencen.
- Sammenlign betydning (hensigt) – bruger referencesvaret til at bedømme betydningens justering.
- AI-målepunkter – kræver ikke en reference. leverer i stedet kvalitetssignaler.
Validering og anvendelighed
- Indbygget fejlhåndtering, hvis en grader, der kræver en reference, vælges uden et forventet svar.

Geografiske områder

Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.

Tilgængelighed af sprog

Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.

Opret testcases for at evaluere din agent (prøveversion) (dokumentation)

Feedback

Var denne side nyttig?

Last updated on 2026-04-30