Microsoft.Extensions.AI.Evaluation.Quality Namnområde

Innehåller utvärderarklasser som utvärderar kvaliteten på llm-svar (large language model) i en app enligt olika mått.

Klasser

Name Description
CoherenceEvaluator

En IEvaluator som utvärderar "Enhetlighet" för ett svar som skapats av en AI-modell.

CompletenessEvaluator

En IEvaluator som utvärderar "fullständighet" för ett svar som skapats av en AI-modell.

CompletenessEvaluatorContext

Sammanhangsbaserad information som CompletenessEvaluator används för att utvärdera "Fullständighet" för ett svar.

EquivalenceEvaluator

En IEvaluator som utvärderar "Likvärdighet" för ett svar som skapats av en AI-modell med ett annat svar som tillhandahålls via GroundTruth.

EquivalenceEvaluatorContext

Sammanhangsinformation som EquivalenceEvaluator används för att utvärdera "Likvärdighet" för ett svar.

FluencyEvaluator

En IEvaluator som utvärderar "Fluency" för ett svar som produceras av en AI-modell.

GroundednessEvaluator

En IEvaluator som utvärderar "Groundedness" för ett svar som produceras av en AI-modell.

GroundednessEvaluatorContext

Sammanhangsbaserad information som GroundednessEvaluator används för att utvärdera "Groundedness" för ett svar.

IntentResolutionEvaluator

En IEvaluator som utvärderar ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter.

IntentResolutionEvaluatorContext

Sammanhangsbaserad information som IntentResolutionEvaluator används för att utvärdera ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter.

RelevanceEvaluator

En IEvaluator som utvärderar relevansen för ett svar som skapats av en AI-modell.

RelevanceTruthAndCompletenessEvaluator

En IEvaluator som utvärderar relevans, sanning och fullständighet för ett svar som skapats av en AI-modell.

RetrievalEvaluator

En IEvaluator som utvärderar ett AI-systems prestanda vid hämtning av information för ytterligare kontext som svar på en användarbegäran (till exempel i ett RAG-scenario (Retrieval Augmented Generation).

RetrievalEvaluatorContext

Sammanhangsinformation som RetrievalEvaluator används för att utvärdera ai-systemets prestanda vid hämtning av information för ytterligare kontext.

TaskAdherenceEvaluator

En IEvaluator som utvärderar ett AI-systems effektivitet genom att följa den uppgift som tilldelats det.

TaskAdherenceEvaluatorContext

Sammanhangsbaserad information som TaskAdherenceEvaluator används för att utvärdera ai-systemets effektivitet vid anslutning till den uppgift som tilldelats det.

ToolCallAccuracyEvaluator

En IEvaluator som utvärderar ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.

ToolCallAccuracyEvaluatorContext

Sammanhangsbaserad information som ToolCallAccuracyEvaluator används för att utvärdera ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.