ToolCallAccuracyEvaluator Klass

Definition

En IEvaluator som utvärderar ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.

public ref class ToolCallAccuracyEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type ToolCallAccuracyEvaluator = class
    interface IEvaluator
type ToolCallAccuracyEvaluator = class
    interface IEvaluator
Public NotInheritable Class ToolCallAccuracyEvaluator
Implements IEvaluator
Arv
ToolCallAccuracyEvaluator
Attribut
Implementeringar

Kommentarer

ToolCallAccuracyEvaluator mäter hur exakt ett AI-system använder verktyg genom att undersöka verktygsanrop (dvs. FunctionCallContents) som finns i det angivna svaret för att bedöma relevansen av dessa verktygsanrop till konversationen, parametern korrekthet för dessa verktygsanrop med avseende på de verktygsdefinitioner som tillhandahålls via ToolDefinitionsoch noggrannheten i parametervärdets extrahering från den angivna konversationen.

Observera att för närvarande ToolCallAccuracyEvaluator har endast stöd för utvärdering av anrop till verktyg som definieras som AIFunctionDeclarations. Alla andra AITool definitioner som tillhandahålls via ToolDefinitions ignoreras.

ToolCallAccuracyEvaluator returnerar en BooleanMetric som innehåller en poäng för "Noggrannhet för verktygsanrop". Poängen är false om verktygsanropet är irrelevant eller innehåller information som inte finns i konversationen och true om verktygsanropet är relevant med korrekt extraherade parametrar från konversationen.

Observera:ToolCallAccuracyEvaluator är en AI-baserad utvärderare som använder en AI-modell för att utföra utvärderingen. Även om uppmaningen som utvärderaren använder för att utföra utvärderingen är utformad för att vara modellagnostisk, kan prestandan för den här prompten (och den resulterande utvärderingen) variera beroende på vilken modell som används och kan vara särskilt dålig när en mindre/lokal modell används.

Uppmaningen som ToolCallAccuracyEvaluator använder har testats mot (och finjusterats för att fungera bra med) följande modeller. Så att använda den här utvärderaren med en modell från följande lista kommer sannolikt att ge bästa resultat. (Den modell som ska användas kan konfigureras via ChatClient.)

GPT-4o

Konstruktorer

Name Description
ToolCallAccuracyEvaluator()

En IEvaluator som utvärderar ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.

Egenskaper

Name Description
EvaluationMetricNames

Hämtar s:erna NameEvaluationMetricsom produceras av den här IEvaluator.

ToolCallAccuracyMetricName

Hämtar den Name returnerade BooleanMetric av ToolCallAccuracyEvaluator.

Metoder

Name Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

Tilläggsmetoder

Name Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Utvärderar den angivna modelResponse och returnerar en EvaluationResult som innehåller en eller flera EvaluationMetrics.

Gäller för