Microsoft.Extensions.AI.Evaluation.Quality Namnområde
Viktigt
En del information gäller för förhandsversionen av en produkt och kan komma att ändras avsevärt innan produkten blir allmänt tillgänglig. Microsoft lämnar inga garantier, uttryckliga eller underförstådda, avseende informationen som visas här.
Innehåller utvärderarklasser som utvärderar kvaliteten på llm-svar (large language model) i en app enligt olika mått.
Klasser
| Name | Description |
|---|---|
| CoherenceEvaluator |
En IEvaluator som utvärderar "Enhetlighet" för ett svar som skapats av en AI-modell. |
| CompletenessEvaluator |
En IEvaluator som utvärderar "fullständighet" för ett svar som skapats av en AI-modell. |
| CompletenessEvaluatorContext |
Sammanhangsbaserad information som CompletenessEvaluator används för att utvärdera "Fullständighet" för ett svar. |
| EquivalenceEvaluator |
En IEvaluator som utvärderar "Likvärdighet" för ett svar som skapats av en AI-modell med ett annat svar som tillhandahålls via GroundTruth. |
| EquivalenceEvaluatorContext |
Sammanhangsinformation som EquivalenceEvaluator används för att utvärdera "Likvärdighet" för ett svar. |
| FluencyEvaluator |
En IEvaluator som utvärderar "Fluency" för ett svar som produceras av en AI-modell. |
| GroundednessEvaluator |
En IEvaluator som utvärderar "Groundedness" för ett svar som produceras av en AI-modell. |
| GroundednessEvaluatorContext |
Sammanhangsbaserad information som GroundednessEvaluator används för att utvärdera "Groundedness" för ett svar. |
| IntentResolutionEvaluator |
En IEvaluator som utvärderar ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter. |
| IntentResolutionEvaluatorContext |
Sammanhangsbaserad information som IntentResolutionEvaluator används för att utvärdera ett AI-systems effektivitet när det gäller att identifiera och lösa användarinsikter. |
| RelevanceEvaluator |
En IEvaluator som utvärderar relevansen för ett svar som skapats av en AI-modell. |
| RelevanceTruthAndCompletenessEvaluator |
En IEvaluator som utvärderar relevans, sanning och fullständighet för ett svar som skapats av en AI-modell. |
| RetrievalEvaluator |
En IEvaluator som utvärderar ett AI-systems prestanda vid hämtning av information för ytterligare kontext som svar på en användarbegäran (till exempel i ett RAG-scenario (Retrieval Augmented Generation). |
| RetrievalEvaluatorContext |
Sammanhangsinformation som RetrievalEvaluator används för att utvärdera ai-systemets prestanda vid hämtning av information för ytterligare kontext. |
| TaskAdherenceEvaluator |
En IEvaluator som utvärderar ett AI-systems effektivitet genom att följa den uppgift som tilldelats det. |
| TaskAdherenceEvaluatorContext |
Sammanhangsbaserad information som TaskAdherenceEvaluator används för att utvärdera ai-systemets effektivitet vid anslutning till den uppgift som tilldelats det. |
| ToolCallAccuracyEvaluator |
En IEvaluator som utvärderar ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det. |
| ToolCallAccuracyEvaluatorContext |
Sammanhangsbaserad information som ToolCallAccuracyEvaluator används för att utvärdera ai-systemets effektivitet med hjälp av de verktyg som tillhandahålls till det. |