Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
A compreensão da linguagem natural (NLU) está no cerne de como os agentes do Copilot Studio compreendem as perguntas dos utilizadores e fornecem respostas relevantes e contextuais. Uma abordagem bem definida para o reconhecimento de intenções, extração de entidades e gestão de exceções garante que os agentes realizam conversas eficientes e naturais, alinhadas com as necessidades empresariais.
Quando um utilizador introduz informação a um agente, isto é conhecido como um enunciado. O agente precisa de dividir essa expressão em intenção e entidades, tornando a resposta do agente natural e eficiente.
O que é a compreensão de uma língua?
A compreensão da linguagem (LU) é uma subárea do Processamento de Linguagem Natural (PLN) focada em permitir que as máquinas compreendam o significado, a intenção e o contexto por detrás da linguagem humana.
Diagrama que mostra como a mensagem do utilizador é dividida em intenção e entidades. Uma pessoa escreve: "Quero reservar um voo para Paris para a próxima semana." A mensagem é rotulada como um enunciado. A expressão "Quero reservar um voo" é identificada como a intenção, e "Paris" e "próxima semana" são identificados como entidades. O sistema pede então mais detalhes como a cidade de partida e a classe de viagem. O diagrama ilustra como o agente utiliza a intenção, as entidades e o contexto para determinar a melhor resposta.
A compreensão da língua envolve:
- Reconhecimento de intenções: Identificar o que o utilizador pretende alcançar (por exemplo, "Reserve um voo para Paris na próxima semana" corresponde à intenção de reservar um voo).
- Extração de entidades: Extração de detalhes-chave como datas, locais ou nomes (por exemplo, "Paris" como destino, "próxima semana" como data de viagem).
- Consciência do contexto: Manter a continuidade e resolver ambiguidades na conversa (por exemplo, compreender pronomes ou referências).
- Lidar com ambiguidades: Usar o contexto para resolver palavras com múltiplos significados (por exemplo, "banco" como instituição financeira ou margem de rio).
Compreensão de línguas no Copilot Studio
O Copilot Studio tem um modelo flexível para a compreensão de línguas, com múltiplas opções de configuração.
Orquestração generativa
A orquestração generativa utiliza modelos de linguagem para encadear inteligentemente tópicos, ações e conhecimento. Esta capacidade permite reconhecimento de múltiplas intenções, extração avançada de entidades e geração dinâmica de planos para buscas complexas.
Este método é o padrão para Copilot Studio. Esta abordagem reconhece múltiplas intenções ou tópicos numa única enunciação, cadeia automaticamente ações e fontes de conhecimento, e gera respostas unificadas. É especialmente útil para lidar com conversas complexas que abrangem várias áreas de negócio. A orquestração generativa tem limites, como cinco mensagens por tópico ou cadeia de ações, e 128 tópicos ou ações por orquestração, mas oferece uma forma poderosa de escalar a amplitude da conversa.
Saiba mais em Aplicar capacidades de orquestração generativa.
Orquestração clássica
A orquestração clássica usa frases de gatilho e roteamento de tópicos determinístico. Se uma enunciação de um utilizador corresponder a uma frase de ativação, o tópico correspondente é executado. Se não houver correspondência, os mecanismos de recurso pesquisam fontes de conhecimento ou solicitam esclarecimentos ao utilizador.
NLU incorporado
Esta abordagem era a padrão, mas agora é a alternativa de reserva. O Copilot Studio fornece um modelo NLU pronto para uso que suporta frases de gatilho, entidades pré-definidas e entidades personalizadas. Este modelo permite aos agentes identificar a intenção do utilizador e extrair detalhes-chave como datas, destinos ou quantidades diretamente de uma consulta.
NLU+
Para maior precisão, use a opção NLU+. A opção NLU+ é ideal para grandes aplicações de nível empresarial. Esses tipos de aplicativos geralmente consistem em um grande número de tópicos e entidades e usam um grande número de amostras de treinamento. Além disso, se você tiver um agente habilitado para voz, seus dados de treinamento NLU+ também serão usados para otimizar seus recursos de reconhecimento de fala.
Integração com Azure CLU
Para cenários mais avançados onde não pode usar a orquestração generativa padrão, pode integrar Azure Conversational Language Understanding (CLU). O CLU oferece uma maior personalização, suporte multilingue e extração de entidades complexas (por exemplo, múltiplas entidades "de"). Tens de mapear as intenções do CLU para os temas do Copilot Studio para os manter sincronizados. Esta opção é especialmente valiosa para vocabulários específicos da indústria, línguas não inglesas ou cenários que exijam maior precisão.
Principais características e limitações
Esta tabela compara as três abordagens de compreensão linguística no Copilot Studio. Destaca as suas principais características e limitações para o ajudar a escolher o modelo certo para as necessidades de complexidade, escala e precisão do seu agente.
| Funcionalidades e limitações | Orquestração generativa | Modelo NLU incorporado | Modelo CLU Personalizado do Azure |
|---|---|---|---|
| Principais características |
|
|
|
| Limits |
|
|
|
Saiba mais sobre Visão Geral de Aprendizagem de Linguagem Natural (NLU).
Estrutura do tópico e contingência
Os temas mudaram de um caminho rígido baseado na intenção para uma abordagem mais flexível e focada na orquestração. Em vez de dependerem apenas de gatilhos e caminhos pré-definidos, os tópicos funcionam agora como instruções modulares que o agente pode usar ao orquestrar uma conversa. A orquestração generativa gere a maior parte do encaminhamento ao interpretar a entrada de utilizador de forma dinâmica, e os tópicos fornecem uma contingência estruturada quando é necessária precisão.
O design mais tradicional e estruturado do tema faz com que as conversas pareçam naturais e eficientes. Os tópicos podem ser pontos de entrada desencadeados por enunciados do utilizador ou subtópicos reutilizáveis chamados por redirecionamentos ou eventos do sistema. Os tópicos de desambiguação ajudam a evitar confusão quando vários tópicos podem ser acionados, enquanto os tópicos de contingência e de reforço conversacional oferecem redes de segurança quando o agente não consegue corresponder com confiança à intenção. Também pode adicionar respostas generativas para extrair de fontes externas de conhecimento, garantindo que os utilizadores raramente ficam sem resposta.
Saiba mais em Seguir as melhores práticas de redação de tópicos.
Localização e idiomas
A linguagem usada por um agente Copilot Studio é determinada pelo valor da variável do sistema: System.User.Language.
Esta variável atua como o ponto de controlo central para todo o comportamento relacionado com a linguagem no agente. Pode definir o seu valor manualmente, programáticamente, ou detetá-lo automaticamente.
Como funciona?
Conhecimento de pesquisa na língua do utilizador: O Copilot Studio utiliza o valor de
System.User.Languagepara pesquisar fontes de conhecimento na linguagem especificada. Esta abordagem significa que, mesmo que um utilizador faça uma pergunta numa língua, o agente traduz a consulta de pesquisa para o conjunto de línguas emSystem.User.Language(autotradução para consulta de pesquisa).Responder na língua do utilizador: O agente gera respostas na língua especificada por
System.User.Language, independentemente da língua usada na pergunta ou dos documentos originais (tradução automática para geração de respostas).Substituição manual: pode definir manualmente o valor de
System.User.Languagepara forçar o agente a operar num idioma específico. Esta funcionalidade é útil para testes ou para cenários onde é necessário controlar explicitamente a linguagem. Saiba mais em Configurar e criar agentes multilíngues.
Deteção automática de língua falada
Pode configurar o Copilot Studio para detetar automaticamente a linguagem falada ou escrita do utilizador e definir a variável System.User.Language em conformidade. Esta funcionalidade permite experiências multilíngues sem necessidade de especificar a preferência linguística dos utilizadores.
Como funciona a deteção automática
- Deteção baseada em gatilho: Quando o bot recebe uma mensagem, um gatilho inicia um fluxo de deteção de língua.
-
Definir variável do sistema: O bot atribui a linguagem detetada a
System.User.Language. - Resposta dinâmica: O agente continua a conversa na língua detetada, pesquisando conhecimento e gerando respostas em conformidade.
Benefícios
- Experiência personalizada: Os utilizadores interagem na sua língua preferida sem configuração manual.
- Experiência consistente: Todas as respostas e recuperações de conhecimento alinham-se com a linguagem detetada ou definida.
- Solução escalável: Suporta implementações globais com configuração mínima.
Tip
Consulte a solução de exemplo que demonstra como permitir que os agentes do Copilot Studio detetem automaticamente a linguagem falada de um utilizador e mude para uma das linguagens aprovadas pelo fabricante para o agente na Auto Detect Language for Generative Responses.
Melhores práticas para localização
- Configure as linguagens suportadas: Defina as linguagens primárias e secundárias para o seu agente. Use ficheiros de localização (JSON ou ResX) para fornecer traduções de prompts, mensagens e tópicos.
- Teste cenários multilíngues: Simule interações do utilizador em diferentes línguas para garantir transições suaves e respostas precisas.
- Use tradução automática: Confie na tradução incorporada do Copilot Studio para pesquisa de conhecimento e geração de respostas, mas forneça traduções personalizadas para conteúdos críticos ou delicados.
- Monitorize e aperfeiçoe: Use análises para acompanhar o uso da língua e melhorar a cobertura de localização ao longo do tempo.
Abordagens linguísticas dos agentes do Copilot Studio:
- Agentes separados por língua.
- Agentes individuais multilíngues com traduções pré-redigidas.
- Agentes multilíngues em tempo real, utilizando serviços de tradução entre utilizador e agente.
A abordagem correta depende do uso, das preocupações com a separação, escala, cadência de atualização e recursos disponíveis.
Desafios técnicos identificados
Os desafios típicos incluem garantir que os tópicos do Azure CLU e do Copilot Studio se mantenham sincronizados, lidar com enunciações ambíguas e escalar implementações multilíngues. A identificação precoce destes entraves permite planear estratégias de mitigação, como configurações de contingência, testes massivos de expressões acionadoras ou serviços de tradução baseados em relé.
O objetivo da compreensão de línguas é garantir que cada agente consiga interpretar as consultas dos utilizadores com precisão, adaptar-se a linguagens e cenários diversos, e lidar com o inesperado com elegância. Este objetivo cria uma base sólida para construir conversas fiáveis, envolventes e eficientes no Copilot Studio.