EquivalenceEvaluator Classe

Définition

Qui IEvaluator évalue l'« équivalence » d’une réponse produite par un modèle IA avec une autre réponse fournie via GroundTruth.

public ref class EquivalenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
public sealed class EquivalenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
type EquivalenceEvaluator = class
    interface IEvaluator
Public NotInheritable Class EquivalenceEvaluator
Implements IEvaluator
Héritage
EquivalenceEvaluator
Implémente

Remarques

EquivalenceEvaluator mesure le degré auquel la réponse évaluée est similaire à la réponse fournie via GroundTruth. Elle retourne un NumericMetric score qui contient un score pour l’équivalence. Le score est un nombre compris entre 1 et 5, avec 1 indiquant un score médiocre, et 5 indiquant un excellent score.

Note:EquivalenceEvaluator est un évaluateur basé sur l’IA qui utilise un modèle IA pour effectuer son évaluation. Bien que l’invite utilisée par cet évaluateur pour effectuer son évaluation soit conçue pour être indépendante du modèle, les performances de cette invite (et de l’évaluation résultante) peuvent varier en fonction du modèle utilisé et peuvent être particulièrement médiocres lorsqu’un modèle plus petit/local est utilisé.

L’invite qui EquivalenceEvaluator utilise a été testée sur (et paramétrée pour fonctionner correctement avec) les modèles suivants. Par conséquent, l’utilisation de cet évaluateur avec un modèle de la liste suivante est susceptible de produire les meilleurs résultats. (Le modèle à utiliser peut être configuré via ChatClient.)

GPT-4o

Constructeurs

Nom Description
EquivalenceEvaluator()

Qui IEvaluator évalue l'« équivalence » d’une réponse produite par un modèle IA avec une autre réponse fournie via GroundTruth.

Propriétés

Nom Description
EquivalenceMetricName

Obtient le Name résultat NumericMetric retourné par EquivalenceEvaluator.

EvaluationMetricNames

Obtient les Names des EvaluationMetrics produites par ce IEvaluator.

Méthodes

Nom Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

Méthodes d’extension

Nom Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Évalue l’élément fourni modelResponse et retourne un EvaluationResult ou plusieurs EvaluationMetrics contenant.

S’applique à