Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
| Aktiveret til | Offentlig prøveversion | Generel tilgængelighed |
|---|---|---|
| Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk |
21. sep. 2025 |
- |
Forretningsværdi
Denne funktion er udviklet til udviklere, der bruger Copilot Studio Agent Evaluation til at validere deres agenter før og efter udrulningen. Ved at lade oprettere angive det forventede svar for hver testcase kan evalueringsstrukturen anvende de forskellige gradertyper nøjagtigt (eksakt, delvis, lighed og sammenlignings betydning) og give tydelige, gentagne resultater. Denne funktion sparer tid og ressourcer ved at fjerne manuelle sammenligninger i regneark eller eksterne værktøjer og giver organisationer større tillid til, at agenter fungerer efter hensigten. Det forbedrer kvaliteten og overholdelse af angivne standarder i stor skala, fremskynder udgivelsescyklusser og reducerer omkostningerne ved at løse problemer efter at være gået live ved at indhente huller tidligt i testen.
Detaljer om funktioner
Funktionen Tilføj forventet svar gør det muligt for oprettere at definere, redigere og administrere de forventede output for hver testcase. Dette input opretter direkte forbindelse til graderstrukturen og bestemmer, hvordan agentsvar evalueres.
Vigtige funktioner:
Konfiguration af før-testsag
Oprettere angiver det forventede svar, når der oprettes eller redigeres en testcase.
Både korte, præcise svar og længere beskrivende referencer understøttes.
Integration med graderfamilier
Nøjagtigt eller delvist match – kræv nøjagtig tekst eller nøgleudtryk for at validere.
Lighed – sammenlign semantisk lighed med referencen.
Sammenlign betydning (hensigt) – bruger referencesvaret til at bedømme betydningens justering.
AI-målepunkter – kræver ikke en reference. leverer i stedet kvalitetssignaler.
Validering og anvendelighed
- Indbygget fejlhåndtering, hvis en grader, der kræver en reference, vælges uden et forventet svar.
Geografiske områder
Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.
Tilgængelighed af sprog
Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.
Relateret indhold
Opret testcases for at evaluere din agent (prøveversion) (dokumentation)
21. sep. 2025