Evaluer testsæt med flere gradere

Aktiveret til Offentlig prøveversion Generel tilgængelighed
Administratorer, udviklere, marketingmedarbejdere eller analytikere, automatisk 8. februar 2026 -

Forretningsværdi

Få tydeligere og mere handlingsklar indsigt i, hvordan din agent klarer sig, ved at køre flere gradere på hvert testsæt. Denne funktion giver dig mulighed for at evaluere flere aspekter af din agent og få en omfattende visning af dens kvalitet i en enkelt udførelse. Denne funktion kan hjælpe med at forenkle test, spare tid, indsamle forskellige kvalitative feedback og minimere gentagne test.

Detaljer om funktioner

Flere gradere pr. testsæt gør det muligt for oprettere at konfigurere og køre flere gradere på det samme testsæt i en enkelt evalueringskørsel.

For hvert testsæt kan producenter:

  • Tilføj flere gradere, f.eks. generel kvalitet, tekstlighed, nøjagtigt match og meget mere.
  • Definer afleveringskriterier for hver grader.
  • Udfør alle valgte bedømmelsesværktøjer i en enkelt proces.

Under udførelse:

  • Alle gradere anvendes ensartet på hver testcase.
  • Resultaterne vises som separate kolonner pr. grader.
  • Aggregerede resultater vises i oversigten Evaluering.

Resultatet er en bedre indsigt i agentkvalitet og understøtter flere evalueringsperspektiver i ét gennemløb.

Geografiske områder

Besøg rapporten Udforsk funktionsgeografi for Microsoft Azure-områder, hvor denne funktion er planlagt eller tilgængelig.

Tilgængelighed af sprog

Besøg rapporten Udforsk funktionssprog for at få oplysninger om denne funktions tilgængelighed.

Opret eller rediger et testsæt for at evaluere din agent (dokumenter)