Avaliar a totalidade das conversas com várias rodadas

Importante

Algumas das funcionalidades descritas neste plano de versão não foram lançadas. As linhas do tempo de entrega podem mudar e a funcionalidade projetada pode não ser lançada (consulte a política da Microsoft). Saiba mais: Novidades e planejamento

Habilitação para Versão preliminar pública Disponibilidade Geral
Administradores, desenvolvedores, profissionais de marketing ou analistas, automaticamente 31 de março de 2026 Junho de 2026

Valor de negócios

Esse recurso oferece os seguintes benefícios:

  • Melhora a precisão da avaliação validando a qualidade do agente em fluxos de conversa completos, não em respostas isoladas.
  • Reduz o risco de produção ao detectar perda de contexto, deriva de instrução e falhas que aparecem apenas ao longo de várias interações.
  • Permite testes mais realistas que espelham interações reais do cliente.
  • Acelera a identificação de problemas em fluxos de trabalho complexos, reduzindo correções dispendiosas pós-lançamento.
  • Reforça a confiança de lançamento para agentes empresariais que operam em cenários com várias etapas.

Detalhes da funcionalidade

A avaliação de conversa de vários turnos permite a avaliação do comportamento do agente em um diálogo inteiro, em vez de classificar ou avaliar respostas isoladas.

Em vez de avaliar pares de prompt-response únicos, o sistema analisa o fluxo de conversação completo.

Como funciona:

  1. Um caso de teste de múltiplas etapas inclui uma sequência de interações de usuário e agente.
  2. Durante a avaliação, o avaliador avalia a qualidade em toda a sequência completa, levando em conta as dependências entre as etapas e o comportamento cumulativo.

O classificador é ideal para os seguintes cenários de exemplo:

  • Fluxos de trabalho complexos que exigem várias etapas.
  • Agentes orientados a tarefas.
  • Simulações de atendimento ao cliente.
  • Cenários em que a degradação da qualidade aparece ao longo do tempo.

Essa funcionalidade alinha a avaliação com padrões de uso do mundo real e permite uma validação de preparação de produção mais confiável.

Áreas geográficas

Visite o relatório Explore Feature Geography para ver as áreas do Microsoft Azure onde esse recurso está planejado ou disponível.

Disponibilidade de idiomas

Visite o relatório Explorar Linguagem de Recursos para obter informações sobre a disponibilidade desse recurso.