Microsoft.Extensions.AI.Evaluation.Quality Namnområde

Viktigt

En del information gäller för förhandsversionen av en produkt och kan komma att ändras avsevärt innan produkten blir allmänt tillgänglig. Microsoft lämnar inga garantier, uttryckliga eller underförstådda, avseende informationen som visas här.

Innehåller utvärderarklasser som utvärderar kvaliteten på llm-svar (large language model) i en app enligt olika mått.

Klasser

Name	Description
CoherenceEvaluator	En IEvaluator som utvärderar "Enhetlighet" för ett svar som skapats av en AI-modell.
CompletenessEvaluator	En IEvaluator som utvärderar "fullständighet" för ett svar som skapats av en AI-modell.
CompletenessEvaluatorContext	Sammanhangsbaserad information som CompletenessEvaluator används för att utvärdera "Fullständighet" för ett svar.
EquivalenceEvaluator	En IEvaluator som utvärderar "Likvärdighet" för ett svar som skapats av en AI-modell med ett annat svar som tillhandahålls via GroundTruth.
EquivalenceEvaluatorContext	Sammanhangsinformation som EquivalenceEvaluator används för att utvärdera "Likvärdighet" för ett svar.
FluencyEvaluator	En IEvaluator som utvärderar "Fluency" för ett svar som produceras av en AI-modell.
GroundednessEvaluator	En IEvaluator som utvärderar "Groundedness" för ett svar som produceras av en AI-modell.
GroundednessEvaluatorContext	Sammanhangsbaserad information som GroundednessEvaluator används för att utvärdera "Groundedness" för ett svar.
IntentResolutionEvaluator	En IEvaluator som utvärderar ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter.
IntentResolutionEvaluatorContext	Sammanhangsbaserad information som IntentResolutionEvaluator används för att utvärdera ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter.
RelevanceEvaluator	En IEvaluator som utvärderar relevansen för ett svar som skapats av en AI-modell.
RelevanceTruthAndCompletenessEvaluator	En IEvaluator som utvärderar relevans, sanning och fullständighet för ett svar som skapats av en AI-modell.
RetrievalEvaluator	En IEvaluator som utvärderar ett AI-systems prestanda vid hämtning av information för ytterligare kontext som svar på en användarbegäran (till exempel i ett RAG-scenario (Retrieval Augmented Generation).
RetrievalEvaluatorContext	Sammanhangsinformation som RetrievalEvaluator används för att utvärdera ai-systemets prestanda vid hämtning av information för ytterligare kontext.
TaskAdherenceEvaluator	En IEvaluator som utvärderar ett AI-systems effektivitet genom att följa den uppgift som tilldelats det.
TaskAdherenceEvaluatorContext	Sammanhangsbaserad information som TaskAdherenceEvaluator används för att utvärdera ai-systemets effektivitet vid anslutning till den uppgift som tilldelats det.
ToolCallAccuracyEvaluator	En IEvaluator som utvärderar ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.
ToolCallAccuracyEvaluatorContext	Sammanhangsbaserad information som ToolCallAccuracyEvaluator används för att utvärdera ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det.

Feedback

Var den här sidan till hjälp?