Utvärdera helheten av konversationer med flera vändor

Important

Några av funktionerna som beskrivs i den här lanseringsplanen har inte släppts. Leveranstider kan ändras och förväntade funktioner kanske inte släpps (mer information finns i Microsofts policy). Läs mer: Nyheter och planer

Aktiverat för Offentlig förhandsversion Allmän tillgänglighet
Administratörer, utvecklare, marknadsförare eller analytiker, automatiskt 31 mar 2026 juni 2026

Affärsvärde

Denna funktion har följande fördelar:

  • Förbättrar utvärderingsprecisionen genom att verifiera agentkvaliteten i fullständiga konversationsflöden, inte isolerade svar.
  • Minskar produktionsrisken genom att identifiera kontextförlust, instruktionsdrift och störningar som bara visas över flera omgångar.
  • Möjliggör mer realistisk testning som speglar verkliga kundinteraktioner.
  • Påskyndar problemidentifiering i komplexa arbetsflöden, vilket minskar kostsamma korrigeringar efter lanseringen.
  • Lyfter förtroendet för releaser för företagsapplikationer som arbetar i flerstegsscenarier.

Information om funktionen

Utvärdering av konversationer med flera turer möjliggör utvärdering av agentbeteende i en hel dialog i stället för att gradera eller utvärdera isolerade svar.

I stället för att utvärdera enkla prompt-response-par analyserar systemet hela konversationsflödet.

Så här fungerar det:

  1. Ett testfall med flera svängar innehåller en sekvens med användar- och agentinteraktioner.
  2. Under utvärderingen bedömer utvärderaren kvaliteten i hela sekvensen, med hänsyn till beroenden mellan omgångar och kumulativt beteende.

Väghyveln passar perfekt för följande exempelscenarier:

  • Komplexa arbetsflöden som kräver flera steg.
  • Uppgiftsorienterade agenter.
  • Kundtjänstsimuleringar.
  • Scenarier där kvalitetsförsämring visas över tid.

Den här funktionen justerar utvärderingen med verkliga användningsmönster och möjliggör mer tillförlitlig validering av produktionsberedskap.

Geografiska områden

Besök rapporten Utforska funktionsgeografi för Microsoft Azure-områden där den här funktionen är planerad eller tillgänglig.

Språktillgänglighet

Besök rapporten Utforska funktionsspråk för information om den här funktionens tillgänglighet.