ToolCallAccuracyEvaluator Classe

Definição

Espaço de Nomes:: Microsoft.Extensions.AI.Evaluation.Quality

Assemblagem:: Microsoft.Extensions.AI.Evaluation.Quality.dll

Pacote:: Microsoft.Extensions.AI.Evaluation.Quality v10.6.0

Origem:: ToolCallAccuracyEvaluator.cs

Importante

Algumas informações dizem respeito a um produto pré-lançado que pode ser substancialmente modificado antes de ser lançado. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui apresentada.

Um que avalia a eficácia de um sistema de IA no uso das ferramentas que lhe são IEvaluator fornecidas.

public ref class ToolCallAccuracyEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator

[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type ToolCallAccuracyEvaluator = class
    interface IEvaluator

type ToolCallAccuracyEvaluator = class
    interface IEvaluator

Public NotInheritable Class ToolCallAccuracyEvaluator
Implements IEvaluator

Herança: Object
ToolCallAccuracyEvaluator

Atributos: ExperimentalAttribute

Implementações: IEvaluator

Observações

ToolCallAccuracyEvaluator mede a precisão com que um sistema de IA utiliza ferramentas examinando as chamadas de ferramentas (ou seja, FunctionCallContents) presentes na resposta fornecida para avaliar a relevância dessas chamadas para a conversa, a correção dos parâmetros para essas chamadas em relação às definições de ferramentas fornecidas via ToolDefinitions, e a precisão da extração do valor do parâmetro da conversa fornecida.

Note que, neste momento, ToolCallAccuracyEvaluator só suporta a avaliação de chamadas para ferramentas definidas como AIFunctionDeclarations. Quaisquer outras AITool definições fornecidas por ToolDefinitions serão ignoradas.

ToolCallAccuracyEvaluator retorna a BooleanMetric que contém uma pontuação para 'Precisão das Chamadas de Ferramenta'. A pontuação é false se a chamada à ferramenta for irrelevante ou contiver informação não presente na conversa e true se a chamada à ferramenta for relevante com parâmetros devidamente extraídos da conversa.

Nota:ToolCallAccuracyEvaluator é um avaliador baseado em IA que utiliza um modelo de IA para realizar a sua avaliação. Embora o prompt que este avaliador utiliza para realizar a sua avaliação seja concebido para ser independente do modelo, o desempenho deste prompt (e da avaliação resultante) pode variar consoante o modelo utilizado, e pode ser especialmente fraco quando se utiliza um modelo mais pequeno ou local.

O prompt que ToolCallAccuracyEvaluator utiliza foi testado contra (e ajustado para funcionar bem) com os seguintes modelos. Portanto, usar este avaliador com um modelo da lista seguinte é provável que produza os melhores resultados. (O modelo a ser utilizado pode ser configurado via ChatClient.)

GPT-4o

Construtores

Name	Description
ToolCallAccuracyEvaluator()	Um que avalia a eficácia de um sistema de IA no uso das ferramentas que lhe são IEvaluator fornecidas.

Propriedades

Name	Description
EvaluationMetricNames	Obtém o Names do EvaluationMetrics produzido por isto IEvaluator.
ToolCallAccuracyMetricName	Obtém o Name de devolvido BooleanMetric por ToolCallAccuracyEvaluator.

Métodos

Name	Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Métodos da Extensão

Name	Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.
EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	Avalia o fornecido `modelResponse` e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Aplica-se a

Comentários

Esta página foi útil?