Bedöma testkörningar för agentutvärdering

Aktiverat för Offentlig förhandsversion Allmän tillgänglighet
Administratörer, utvecklare, marknadsförare eller analytiker, automatiskt 21 sep, 2025 -

Affärsvärde

Ramverket för utvärderingar förbättrar utvärdering av agenter genom att introducera flexibla bedömningsmetoder utöver enkel godkänd/icke godkänd. Tillverkare kan välja mellan exakta matchningar, nyckelordskontroller, likhetsalgoritmer, avsiktsigenkänning och AI-drivna kvalitetsmått, vilket möjliggör mer exakt och meningsfull validering av agentsvar. Med den här flexibiliteten kan team identifiera fel, finjustera tröskelvärden och förstå varför svar misslyckas, förbättra förtroendet och påskynda iterationen.

Information om funktionen

Graders-funktionen i Copilot Studio utökar utvärderingsramverket genom att aktivera flexibla och konfigurerbara metoder för att utvärdera agentsvar. I stället för att bara förlita sig på binärt pass/fail kan skaparna nu välja den lämpligaste klassificeringsmetoden per testfall, vilket säkerställer noggrannhet, transparens och anpassningsbarhet i olika scenarier.

Du kan välja mellan tre testmetoder, även kallade bedömningsmetoder, för att bedöma agentsvar: kvalitet, likhet och textöverensstämmelse. Mer information om de olika testmetoderna finns i Testmetoder.

Geografiska områden

Besök rapporten Utforska funktionsgeografi för Microsoft Azure-områden där den här funktionen är planerad eller tillgänglig.

Språktillgänglighet

Besök rapporten Utforska funktionsspråk för information om den här funktionens tillgänglighet.

Skapa testfall för att utvärdera din agent (dokument)