Utvärdera agenter för Microsoft 365 Copilot i Copilot Studio

Important

Några av funktionerna som beskrivs i den här lanseringsplanen har inte släppts. Leveranstider kan ändras och förväntade funktioner kanske inte släpps (mer information finns i Microsofts policy). Läs mer: Nyheter och planer

Aktiverat för Offentlig förhandsversion Allmän tillgänglighet
Administratörer, utvecklare, marknadsförare eller analytiker, automatiskt Jul 2026 -

Affärsvärde

Agenter för Microsoft 365 Copilot-utvärdering möjliggör validering i företagsklass av deklarativa agenter som används i verkliga och kritiska affärsarbetsflöden och flyttar team från manuell, ad hoc-testning till en skalbar och standardiserad utvärderingspraxis. Med den här funktionen kan du minska produktionsrisken genom att identifiera kvalitets-, korrekthets- och beteendeproblem före lanseringen och förbättra versionsförtroendet och iterationerna genom automatiserade, repeterbara och förklarande utvärderingsprocesser.

Information om funktionen

Utvärdering för agenter för Microsoft 365 Copilot (kallas även deklarativa agenter) ger ett omfattande utvärderingsramverk som är skräddarsytt för deklarativa agenter i utvecklings-, testnings- och produktionsberedskapsfaser.

Det möjliggör strukturerad validering av kvalitet, beteende och tillförlitlighet med hjälp av automatiserade och repeterbara arbetsflöden.

Utvärdering av en deklarativ agent inkluderar följande kapaciteter:

Konfiguration och indata för utvärdering

Analytiker kan konfigurera vilka data som ska användas i tester:

  • Skapa och hantera anpassade testdata.
  • Skapa utvärderingsindata från befintliga konversationer.

Utvärderingskörning

Analytiker kan konfigurera omfånget eller typen av utvärderingskörning:

  • Automatiserade utvärderingskörningar
  • Fullständig konversationsutvärdering (fleromgångs)
  • Autentiserad utvärderingskontext

Utvärderingsmetodik (bedömare)

Analytiker kan komma åt dessa bedömare:

  • Ramverk för klassificering på uppsättningsnivå
  • Likhetsgranskare
  • Semantisk meningsjämförelse
  • Nyckelordsmatchning
  • Anpassad bedömning med konfigurerbara etiketter
  • AI-baserade kvalitetsklassare
  • Bedömare av verktyg och ämnesanrop

De kan också använda flera bedömare per indata.

Analys och berättande

Analytiker kan också använda rapporteringsverktyg och analysfunktioner:

  • Aggregerad resultatanalys
  • Detaljgranskningsvyer för testspecifik inspektion
  • Visualisering av aktivitetskarta
  • Samla in och analysera användarreaktioner

Förloppsspårning och jämförelse

Analytiker kan hantera resultat och körningar kontextuellt med:

  • Kör-till-kör-jämförelser
  • Export av utvärderingsresultat

Geografiska områden

Besök rapporten Utforska funktionsgeografi för Microsoft Azure-områden där den här funktionen är planerad eller tillgänglig.

Språktillgänglighet

Besök rapporten Utforska funktionsspråk för information om den här funktionens tillgänglighet.