Microsoft.Extensions.AI.Evaluation.Quality 名前空間
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
さまざまなメトリックに従ってアプリ内の大規模言語モデル (LLM) 応答の品質を評価するエバリュエーター クラスが含まれています。
クラス
| 名前 | 説明 |
|---|---|
| CoherenceEvaluator |
AI モデルによって生成された応答の "一貫性" を評価する IEvaluator 。 |
| CompletenessEvaluator |
AI モデルによって生成された応答の "完全性" を評価する IEvaluator 。 |
| CompletenessEvaluatorContext |
CompletenessEvaluatorが応答の "完全性" を評価するために使用するコンテキスト情報。 |
| EquivalenceEvaluator |
IEvaluatorを介して提供される別の応答で AI モデルによって生成された応答の "等価性" を評価するGroundTruth。 |
| EquivalenceEvaluatorContext |
EquivalenceEvaluatorが応答の "等価性" を評価するために使用するコンテキスト情報。 |
| FluencyEvaluator |
AI モデルによって生成された応答の "流暢性" を評価する IEvaluator 。 |
| GroundednessEvaluator |
AI モデルによって生成された応答の "Groundedness" を評価する IEvaluator 。 |
| GroundednessEvaluatorContext |
GroundednessEvaluatorが応答の "Groundedness" を評価するために使用するコンテキスト情報。 |
| IntentResolutionEvaluator |
ユーザーの意図を特定して解決する際の AI システムの有効性を評価する IEvaluator 。 |
| IntentResolutionEvaluatorContext |
ユーザーの意図を特定して解決する際に AI システムの有効性を評価するために IntentResolutionEvaluator が使用するコンテキスト情報。 |
| RelevanceEvaluator |
AI モデルによって生成された応答の "関連性" を評価する IEvaluator 。 |
| RelevanceTruthAndCompletenessEvaluator |
AI モデルによって生成された応答の "関連性"、"真実"、"完全性" を評価する IEvaluator 。 |
| RetrievalEvaluator |
ユーザー要求に応答して追加のコンテキストの情報を取得する際の AI システムのパフォーマンスを評価する IEvaluator (たとえば、取得拡張生成 (RAG) シナリオ)。 |
| RetrievalEvaluatorContext |
追加のコンテキストの情報を取得する際に、 RetrievalEvaluator が AI システムのパフォーマンスを評価するために使用するコンテキスト情報。 |
| TaskAdherenceEvaluator |
割り当てられたタスクへの準拠における AI システムの有効性を評価する IEvaluator 。 |
| TaskAdherenceEvaluatorContext |
割り当てられたタスクに従って AI システムの有効性を評価するために TaskAdherenceEvaluator が使用するコンテキスト情報。 |
| ToolCallAccuracyEvaluator |
提供されたツールの使用における AI システムの有効性を評価する IEvaluator 。 |
| ToolCallAccuracyEvaluatorContext |
ToolCallAccuracyEvaluatorが、提供されたツールを使用して AI システムの有効性を評価するために使用するコンテキスト情報。 |