TaskAdherenceEvaluator Classe

Definição

Espaço de Nomes:: Microsoft.Extensions.AI.Evaluation.Quality

Assemblagem:: Microsoft.Extensions.AI.Evaluation.Quality.dll

Pacote:: Microsoft.Extensions.AI.Evaluation.Quality v10.6.0

Origem:: TaskAdherenceEvaluator.cs

Importante

Algumas informações dizem respeito a um produto pré-lançado que pode ser substancialmente modificado antes de ser lançado. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui apresentada.

Um que avalia a eficácia de um sistema de IA em cumprir a tarefa que lhe foi IEvaluator atribuída.

public ref class TaskAdherenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator

[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type TaskAdherenceEvaluator = class
    interface IEvaluator

type TaskAdherenceEvaluator = class
    interface IEvaluator

Public NotInheritable Class TaskAdherenceEvaluator
Implements IEvaluator

Herança: Object
TaskAdherenceEvaluator

Atributos: ExperimentalAttribute

Implementações: IEvaluator

Observações

TaskAdherenceEvaluator mede quão precisamente um sistema de IA adere à tarefa atribuída, examinando o alinhamento da resposta fornecida com as instruções e definições presentes no histórico da conversa, a precisão e clareza da resposta, e o uso adequado das definições de ferramentas fornecidas via ToolDefinitions.

Note que, neste momento, TaskAdherenceEvaluator só suporta a avaliação de chamadas para ferramentas definidas como AIFunctionDeclarations. Quaisquer outras AITool definições fornecidas por ToolDefinitions serão ignoradas.

TaskAdherenceEvaluator retorna um NumericMetric que contém uma pontuação para 'Adesão à Tarefa'. A pontuação é um número entre 1 e 5, sendo 1 uma pontuação fraca e 5 uma pontuação excelente.

Nota:TaskAdherenceEvaluator é um avaliador baseado em IA que utiliza um modelo de IA para realizar a sua avaliação. Embora o prompt que este avaliador utiliza para realizar a sua avaliação seja concebido para ser independente do modelo, o desempenho deste prompt (e da avaliação resultante) pode variar consoante o modelo utilizado, e pode ser especialmente fraco quando se utiliza um modelo mais pequeno ou local.

O prompt que TaskAdherenceEvaluator utiliza foi testado contra (e ajustado para funcionar bem) com os seguintes modelos. Portanto, usar este avaliador com um modelo da lista seguinte é provável que produza os melhores resultados. (O modelo a ser utilizado pode ser configurado via ChatClient.)

GPT-4o

Construtores

Name	Description
TaskAdherenceEvaluator()	Um que avalia a eficácia de um sistema de IA em cumprir a tarefa que lhe foi IEvaluator atribuída.

Propriedades

Name	Description
EvaluationMetricNames	Obtém o Names do EvaluationMetrics produzido por isto IEvaluator.
TaskAdherenceMetricName	Obtém o Name de devolvido NumericMetric por TaskAdherenceEvaluator.

Métodos

Name	Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Métodos da Extensão

Name	Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Aplica-se a

Comentários

Esta página foi útil?