Agents evalueren voor Microsoft 365 Copilot in Copilot Studio

Important

Een deel van de functionaliteit die in dit releaseplan wordt beschreven, is nog niet uitgebracht. Leveringstijdlijnen kunnen veranderen en de verwachte functionaliteit wordt mogelijk niet uitgebracht (zie Microsoft-beleid). Meer informatie: Wat is er nieuw en gepland

Geactiveerd voor Openbare preview Algemene beschikbaarheid
Beheerders, makers, marketeers of analisten, automatisch Juli 2026 -

Zakelijke waarde

Agents voor Microsoft 365 Copilot-evaluatie maakt validatie op bedrijfsniveau mogelijk van declaratieve agents die worden gebruikt in echte en kritieke bedrijfswerkstromen, en verplaatst teams van handmatige, ad-hoctests naar een schaalbare en gestandaardiseerde evaluatiepraktijk. Met deze functie kunt u productierisico's verminderen door kwaliteit, juistheid en gedragsproblemen te detecteren vóór de release, en het vertrouwen en iteraties van de release te verbeteren via geautomatiseerde, herhaalbare en uitlegbare evaluatieprocessen.

Details van functies

Evaluatie voor agents voor Microsoft 365 Copilot (ook wel declaratieve agents genoemd) biedt een uitgebreid evaluatieframework dat is afgestemd op declaratieve agents in ontwikkelings-, test- en productiegereedheidsfasen.

Het maakt gestructureerde validatie van kwaliteit, gedrag en betrouwbaarheid mogelijk met behulp van geautomatiseerde en herhaalbare werkstromen.

Evaluatie van declaratieve agents omvat de volgende mogelijkheden:

Evaluatie-instellingen en -invoer

Analisten kunnen configureren welke gegevens in tests moeten worden gebruikt:

  • Aangepaste testgegevens maken en beheren.
  • Evaluatie-invoer maken van bestaande gesprekken.

Evaluatieuitvoering

Analisten kunnen het bereik of het type evaluatie-uitvoering configureren:

  • Geautomatiseerde evaluatieuitvoeringen
  • Evaluatie van een volledig gesprek (meerdere beurten)
  • Geverifieerde evaluatiecontext

Evaluatiemethodologie (beoordelaars)

Analisten hebben toegang tot deze beoordelingsinstrumenten:

  • Beoordelingsframework op setniveau
  • Similariteitsscorer
  • Vergelijking van semantische betekenis
  • Trefwoordmatch
  • Aangepaste grader met configureerbare labels
  • Op AI gebaseerde kwaliteitsclassificaties
  • Beoordelaar voor tool- en onderwerpaanroepen

Ze kunnen ook meerdere beoordelaars per invoer gebruiken.

Analyse en verhalen

Analisten kunnen ook rapportagehulpprogramma's en analysefuncties gebruiken:

  • Analyse van samengevoegde resultaten
  • Inzoomweergaven voor testspecifieke inspectie
  • Visualisatie van activiteitenoverzicht
  • Gebruikersreacties vastleggen en analyseren

Voortgang bijhouden en vergelijken

Analisten kunnen resultaten en uitvoeringen contextueel beheren met:

  • Run-to-run-vergelijkingen
  • Evaluatieresultaten exporteren

Geografische gebieden

Ga naar het rapport Explore Feature Geography om de Microsoft Azure-gebieden te zien waar deze functie is gepland of beschikbaar is.

Beschikbaarheid van taal

Ga naar het rapport Functietaal verkennen voor informatie over de beschikbaarheid van deze functie.