Testcases voor de evaluatie van agenten beoordelen

Geactiveerd voor Openbare preview Algemene beschikbaarheid
Beheerders, makers, marketeers of analisten, automatisch 21 sep 2025 -

Zakelijke waarde

Het beoordelingsframework versterkt de evaluatie van agents door flexibele scoremethoden te introduceren die verder gaan dan eenvoudige pass/fail. Makers kunnen kiezen uit exacte overeenkomsten, trefwoordcontroles, overeenkomstenalgoritmen, intentieherkenning en metrische gegevens van ai-gestuurde kwaliteit, waardoor agentreacties nauwkeuriger en zinvoller kunnen worden gevalideerd. Dankzij deze flexibiliteit kunnen teams fouten detecteren, drempelwaarden verfijnen en begrijpen waarom reacties mislukken, vertrouwen verbeteren en iteratie versnellen.

Details van functies

De graders-mogelijkheid in Copilot Studio breidt het evaluatieframework uit door flexibele en configureerbare methoden in te schakelen om agentreacties te beoordelen. In plaats van alleen te vertrouwen op binaire pass/fail, kunnen makers nu de meest geschikte beoordelingsbenadering per testcase kiezen, zodat nauwkeurigheid, transparantie en aanpassingsmogelijkheden in verschillende scenario's worden gegarandeerd.

U hebt een keuze uit drie testmethoden, ook wel graders genoemd, om agentreacties te evalueren: kwaliteit, gelijkenis en tekstovereenkomst. Zie Testmethoden voor meer informatie over de verschillende testmethoden.

Geografische gebieden

Ga naar het rapport Explore Feature Geography om de Microsoft Azure-gebieden te zien waar deze functie is gepland of beschikbaar is.

Beschikbaarheid van taal

Ga naar het rapport Functietaal verkennen voor informatie over de beschikbaarheid van deze functie.

Testcases maken om uw agent te evalueren (docs)