Testsager til evaluering af klassifikationsagent

Aktiveret til Offentlig prøveversion Generel tilgængelighed
Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk 21. sep. 2025 -

Forretningsværdi

Strukturen for gradere styrker agentevalueringen ved at introducere fleksible scoringsmetoder ud over simple pass/fail. Udviklere kan vælge mellem nøjagtige match, nøgleordskontroller, lighedsalgoritmer, hensigtserklæringsgenkendelse og AI-drevne kvalitetsmålepunkter, hvilket giver mulighed for mere nøjagtig og meningsfuld validering af agentsvar. Denne fleksibilitet gør det muligt for teams at registrere fejl, finjustere tærskler og forstå, hvorfor svar mislykkes, og dermed forbedre tilliden og fremskynde gentagelsen.

Detaljer om funktioner

Graders-funktionaliteten i Copilot Studio udvider evalueringsstrukturen ved at muliggøre fleksible og konfigurerbare metoder til vurdering af agentsvar. I stedet for kun at være afhængig af binær bestået/mislykket kan oprettere nu vælge den mest passende klassificeringsmetode pr. testcase, så nøjagtighed, gennemsigtighed og tilpasningsevne sikres på tværs af forskellige scenarier.

Du kan vælge mellem tre testmetoder, også kaldet gradere, til at evaluere agentsvar: kvalitet, lighed og tekstmatch. Du kan få flere oplysninger om de forskellige testmetoder under Testmetoder.

Geografiske områder

Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.

Tilgængelighed af sprog

Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.

Opret test cases for at evaluere din agent (dokumenter)