Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Important
Några av funktionerna som beskrivs i den här lanseringsplanen har inte släppts. Leveranstider kan ändras och förväntade funktioner kanske inte släpps (mer information finns i Microsofts policy). Läs mer: Nyheter och planer
| Aktiverat för | Offentlig förhandsversion | Allmän tillgänglighet |
|---|---|---|
| Administratörer, utvecklare, marknadsförare eller analytiker, automatiskt |
31 mar 2026 |
juni 2026 |
Affärsvärde
Denna funktion har följande fördelar:
- Förbättrar utvärderingsprecisionen genom att verifiera agentkvaliteten i fullständiga konversationsflöden, inte isolerade svar.
- Minskar produktionsrisken genom att identifiera kontextförlust, instruktionsdrift och störningar som bara visas över flera omgångar.
- Möjliggör mer realistisk testning som speglar verkliga kundinteraktioner.
- Påskyndar problemidentifiering i komplexa arbetsflöden, vilket minskar kostsamma korrigeringar efter lanseringen.
- Lyfter förtroendet för releaser för företagsapplikationer som arbetar i flerstegsscenarier.
Information om funktionen
Utvärdering av konversationer med flera turer möjliggör utvärdering av agentbeteende i en hel dialog i stället för att gradera eller utvärdera isolerade svar.
I stället för att utvärdera enkla prompt-response-par analyserar systemet hela konversationsflödet.
Så här fungerar det:
- Ett testfall med flera svängar innehåller en sekvens med användar- och agentinteraktioner.
- Under utvärderingen bedömer utvärderaren kvaliteten i hela sekvensen, med hänsyn till beroenden mellan omgångar och kumulativt beteende.
Väghyveln passar perfekt för följande exempelscenarier:
- Komplexa arbetsflöden som kräver flera steg.
- Uppgiftsorienterade agenter.
- Kundtjänstsimuleringar.
- Scenarier där kvalitetsförsämring visas över tid.
Den här funktionen justerar utvärderingen med verkliga användningsmönster och möjliggör mer tillförlitlig validering av produktionsberedskap.
Geografiska områden
Besök rapporten Utforska funktionsgeografi för Microsoft Azure-områden där den här funktionen är planerad eller tillgänglig.
Språktillgänglighet
Besök rapporten Utforska funktionsspråk för information om den här funktionens tillgänglighet.
31 mar 2026