ToolCallAccuracyEvaluator Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Um IEvaluator que avalia a eficácia de um sistema de IA ao usar as ferramentas fornecidas a ele.
public ref class ToolCallAccuracyEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type ToolCallAccuracyEvaluator = class
interface IEvaluator
type ToolCallAccuracyEvaluator = class
interface IEvaluator
Public NotInheritable Class ToolCallAccuracyEvaluator
Implements IEvaluator
- Herança
-
ToolCallAccuracyEvaluator
- Atributos
- Implementações
Comentários
ToolCallAccuracyEvaluator mede com que precisão um sistema de IA usa ferramentas examinando chamadas de ferramenta (ou seja, FunctionCallContents) presentes na resposta fornecida para avaliar a relevância dessas chamadas de ferramenta para a conversa, a correção do parâmetro para essas chamadas de ferramenta em relação às definições de ferramenta fornecidas por meio ToolDefinitionse a precisão da extração de valor do parâmetro da conversa fornecida.
Observe que, no momento, ToolCallAccuracyEvaluator só dá suporte à avaliação de chamadas para ferramentas definidas como AIFunctionDeclarations. Todas as outras AITool definições fornecidas por meio ToolDefinitions serão ignoradas.
ToolCallAccuracyEvaluator retorna um BooleanMetric que contém uma pontuação para "Precisão de Chamada de Ferramenta". A pontuação será false se a chamada de ferramenta for irrelevante ou contiver informações não presentes na conversa e true se a chamada de ferramenta for relevante com parâmetros extraídos corretamente da conversa.
Nota:ToolCallAccuracyEvaluator é um avaliador baseado em IA que usa um modelo de IA para executar sua avaliação. Embora o prompt que esse avaliador usa para executar sua avaliação seja projetado para ser independente de modelo, o desempenho desse prompt (e a avaliação resultante) pode variar dependendo do modelo usado e pode ser especialmente ruim quando um modelo menor/local é usado.
O prompt que ToolCallAccuracyEvaluator usa foi testado (e ajustado para funcionar bem com) os modelos a seguir. Portanto, usar esse avaliador com um modelo da lista a seguir provavelmente produzirá os melhores resultados. (O modelo a ser usado pode ser configurado por meio de ChatClient.)
GPT-4o
Construtores
| Nome | Description |
|---|---|
| ToolCallAccuracyEvaluator() |
Um IEvaluator que avalia a eficácia de um sistema de IA ao usar as ferramentas fornecidas a ele. |
Propriedades
| Nome | Description |
|---|---|
| EvaluationMetricNames |
Obtém os Names dos EvaluationMetrics produzidos por este IEvaluator. |
| ToolCallAccuracyMetricName |
Obtém o Name do BooleanMetric retornado por ToolCallAccuracyEvaluator. |
Métodos
| Nome | Description |
|---|---|
| EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken) |
Avalia o fornecido |