Hele gesprekken met meerdere paden evalueren

Important

Een deel van de functionaliteit die in dit releaseplan wordt beschreven, is nog niet uitgebracht. Leveringstijdlijnen kunnen veranderen en de verwachte functionaliteit wordt mogelijk niet uitgebracht (zie Microsoft-beleid). Meer informatie: Wat is er nieuw en gepland

Geactiveerd voor Openbare preview Algemene beschikbaarheid
Beheerders, makers, marketeers of analisten, automatisch 31 maart 2026 Jun 2026

Zakelijke waarde

Deze functie biedt de volgende voordelen:

  • Verbetert de nauwkeurigheid van de evaluatie door agentkwaliteit te valideren in volledige gespreksstromen, niet geïsoleerde antwoorden.
  • Vermindert het productierisico door het detecteren van contextverlies, instructieverlies en storingen die alleen na meerdere interacties zichtbaar worden.
  • Maakt realistischere tests mogelijk die de interacties van echte klanten weerspiegelen.
  • Versnelt de identificatie van problemen in complexe werkstromen, waardoor kostbare oplossingen na de release worden verminderd.
  • Versterkt het vertrouwen van de release voor enterprise-agents die in scenario's met meerdere stappen werken.

Details van functies

Gespreksevaluatie met meerdere beurten stelt in staat om het gedrag van agents in de hele dialoog te beoordelen, in plaats van geïsoleerde reacties te beoordelen.

In plaats van enkelvoudige prompt-antwoordparen te evalueren, analyseert het systeem de volledige gespreksstroom.

Hoe werkt het:

  1. Een testcase met meerdere beurten bevat een reeks interacties tussen gebruikers en agents.
  2. Tijdens de evaluatie beoordeelt de grader de kwaliteit in de volledige reeks, rekening houdend met afhankelijkheden tussen beurten en cumulatief gedrag.

De grader is ideaal voor de volgende voorbeeldscenario's:

  • Complexe werkstromen die meerdere stappen vereisen.
  • Taakgerichte agenten.
  • Simulaties van klantenservice.
  • Scenario's waarbij kwaliteitsdegradatie in de loop van de tijd wordt weergegeven.

Deze mogelijkheid is afgestemd op de evaluatie met praktijkgebruikspatronen en maakt een betrouwbaardere validatie van productiegereedheid mogelijk.

Geografische gebieden

Ga naar het rapport Explore Feature Geography om de Microsoft Azure-gebieden te zien waar deze functie is gepland of beschikbaar is.

Beschikbaarheid van taal

Ga naar het rapport Functietaal verkennen voor informatie over de beschikbaarheid van deze functie.