Perguntas frequentes sobre a CLI do Agentic para AKS

Este artigo fornece respostas para algumas das perguntas mais comuns sobre a CLI agentic para o Serviço Kubernetes do Azure (AKS).

O que é a CLI agente para AKS?

A CLI agente para AKS é uma ferramenta de linha de comandos alimentada por IA, concebida para ajudar os utilizadores de AKS a resolver problemas de cluster de forma eficiente. Ele analisa sinais de telemetria (logs, métricas, eventos), correlaciona-os entre infraestrutura e cargas de trabalho e fornece insights acionáveis. O agente usa consultas de linguagem natural como entrada e retorna resumos de diagnóstico, análises de causa raiz e sugestões de correção. A CLI agente não inclui os modelos de IA, por isso precisas de fornecer as tuas próprias chaves de API de grandes modelos de linguagem (LLM) para o agente funcionar.

O que pode a CLI de agente fazer no AKS?

A CLI agencial do AKS atua como assistente local que interpreta consultas em linguagem natural, executa comandos de diagnóstico e fornece informações acionáveis. Integra-se perfeitamente com ferramentas nativas AKS e fontes de telemetria, como eventos Kubernetes, logs, Inspektor Gadget, Azure e APIs AKS. Cada um deles está ativado como conjuntos de ferramentas nativamente em az aks agent.

O agente respeita o controlo de acesso baseado em funções (RBAC) e os controlos de identidade do Azure, pois herda as permissões dos utilizadores da CLI do Azure. Funciona em modo apenas de leitura por defeito. Pode configurar o seu fornecedor de IA (por exemplo, OpenAI, Azure, OpenAI e Anthropic) e o modelo. Também podes configurar o agente para gerar as saídas do conjunto de ferramentas.

As saídas de az aks agent incluem:

  • Uma resposta resumida sintetizada por IA à consulta do utilizador.
  • Análise da causa raiz com evidências de apoio.
  • Sugestões de remediação adaptadas às melhores práticas do AKS.
  • Os registos de diagnóstico e os resultados da ferramenta.

Quais são as utilizações pretendidas para a CLI agentic no AKS?

A CLI agentic para AKS tem os seguintes usos pretendidos:

  • Interações humanas no ciclo com os seus clusters AKS para o ajudar a detetar, diagnosticar e resolver problemas de forma eficiente.
  • Interações apenas de leitura com as APIs Kubernetes e AKS. Pode obter informações sobre recursos, compreender a saúde dos recursos do cluster AKS e seguir as melhores práticas gerais do Kubernetes e do AKS.

A CLI agente para AKS não é feita para ser usada como um agente genérico de codificação ou IA para além do âmbito das interações com AKS. Não consegue aceder à internet para responder a perguntas genéricas.

A CLI agente do AKS está otimizada para cenários específicos do AKS. Integra-se com ferramentas como kubectl, Azure CLI, Inspektor Gadget e Azure Monitor, mas pode cometer erros. O agente pode ocasionalmente perder sinais sutis, interpretar mal a telemetria barulhenta ou sugerir mitigações que exigem validação humana. Por exemplo, pode atribuir incorretamente uma falha do Sistema de Nomes de Domínio (DNS) a uma política de rede quando a causa raiz é um servidor DNS upstream mal configurado. Este cenário pode ocorrer especialmente se a telemetria for incompleta ou as permissões forem restringidas.

Para evitar o viés de automação, deve considerar a saída do agente como um ponto de partida útil e não como um veredicto final. Destaca-se em revelar causas prováveis e orientar investigações, mas a supervisão humana é essencial. A revisão humana é necessária em ambientes complexos ou de alto risco.

Quanto a modelos de IA, recomendamos que utilize um modelo implementado no Azure OpenAI, como GPT4o ou GPTo3. Também pode usar um diretamente da plataforma API OpenAI. Pode usar qualquer fornecedor de modelos LLM suportado por especificações da Open API, como Anthropic e Gemini.

Como foi avaliada a CLI agential para AKS? Que métricas são usadas para medir o desempenho?

O CLI agente para AKS está a ser avaliado através de uma combinação de testes internos e avaliações programáticas concebidas para garantir que as suas capacidades de diagnóstico são precisas, relevantes e significativas.

Para avaliações programáticas, medimos métricas padrão de IA responsável, como fundamentação, jailbreak UPIA e XPIA, conteúdos nocivos e qualidade da conversa (tais como coerência e fluência).

Esses testes nos ajudam a identificar lacunas no raciocínio, na integração de ferramentas e na execução rápida. Uma métrica fundamental para o sucesso é a precisão do diagnóstico do agente e a relevância das suas recomendações. O agente identificou corretamente a causa raiz e sugeriu mitigações acionáveis e conscientes do contexto?

Realizamos ataques internos de bugs e equipas vermelhas para testar rigorosamente o comportamento do agente em vários casos. Verificamos degradação da saúde dos nós, falhas no DNS, interrupções de atualizações e problemas de agendamento de pods.

Reconhecemos a natureza dinâmica das interações agente-IA e agradecemos o seu feedback como parte da pré-visualização. Pode partilhar o seu feedback diretamente connosco em aksagentcli@service.microsoft.com. Também podes abrir uma questão no GitHub.

Quais são as limitações da CLI agentic para AKS? Como posso minimizar o efeito destas limitações quando uso o sistema?

A CLI agêntica para AKS é poderosa e construída para diagnosticar e resolver problemas nos clusters AKS. Tem algumas limitações importantes que deve ter em conta para garantir uma utilização eficaz e responsável:

  • A capacidade do agente de aceder e analisar dados depende diretamente das suas permissões e da disponibilidade de telemetria. Se não tiver direitos de acesso suficientes, ou se fontes de telemetria como registos, métricas ou eventos estiverem em falta ou incompletas, o agente pode não conseguir gerar diagnósticos precisos ou completos.
  • O sistema está sujeito a limites de tokens ao processar grandes conjuntos de dados, como métricas de séries temporais. Estas limitações podem limitar a profundidade ou amplitude da análise em cenários complexos de resolução de problemas.
  • No seu estado atual de MVP, a CLI agente oferece suporte limitado para experiências Azure geridas. Certos fluxos de trabalho, como a integração de alertas do Azure Monitor, podem não ser totalmente suportados.

Para minimizar o efeito destas limitações, pode tomar várias medidas proativas:

  • Certifique-se de que as ferramentas de diagnóstico necessárias, como o Azure Monitor, estejam configuradas corretamente para ajudar o agente a acessar uma telemetria mais avançada e executar diagnósticos mais abrangentes.
  • Estenda as capacidades da CLI agente utilizando-a com servidores Azure Model Context Protocol (MCP) ou AKS MCP. Para obter mais informações, consulte Integrar o servidor MCP do AKS com a CLI agentic para AKS.
  • Utilize o raciocínio de última geração ou modelos de uso geral, como GPT4o e GPTo3, para garantir os melhores resultados possíveis. A CLI agente para AKS não inclui modelos de IA.

Que fatores e configurações operacionais permitem uma utilização eficaz e responsável da CLI agente para o AKS?

Para usar a CLI agentic para AKS de forma eficaz e responsável, várias configurações operacionais desempenham um papel fundamental. O agente foi projetado para operar no modo somente leitura por padrão, o que garante diagnósticos seguros sem fazer alterações no cluster. Quando são necessárias operações de escrita, como a implementação de pods de depuração ou a execução de passos de remediação, requerem aprovação explícita do utilizador para manter o controlo do utilizador e minimizar efeitos não intencionais.

O agente corre localmente na sua máquina e também aceita fornecedores de IA próprios. Por esta razão, pode configurar as suas próprias chaves de API do LLM. Esta configuração garante que pode trazer os fornecedores e endpoints de IA aprovados pela sua organização. Todo o processamento de dados ocorre localmente para preservar a privacidade dos dados e alinhar com os padrões de segurança empresariais.

O agente também oferece definições de verbosidade configuráveis, que pode usar para alternar entre resumos concisos e resultados de diagnóstico detalhados, conforme as suas necessidades. Esta flexibilidade apoia a recolha de insights rápidos e total transparência sobre o raciocínio e a execução da ferramenta do agente.

A integração com Azure Identity e RBAC garante ainda mais que o agente acede apenas aos recursos que está autorizado a consultar. Esta restrição simplifica a configuração e impõe limites de acesso seguros. Juntas, essas configurações criam um ambiente seguro, consciente da privacidade e controlado pelo usuário para solucionar problemas de clusters AKS com assistência de IA.

Como posso fornecer feedback ou obter ajuda com a CLI agentic para AKS?

Você pode fornecer feedback ou obter ajuda com a CLI agentic para AKS através de vários canais:

  • Problemas e pull requests no repositório agentic CLI no GitHub.
  • Canais internos durante a fase de visualização preliminar.
  • Tickets de suporte do Azure ou interação direta com o produto AKS.

O que são plugins e como é que a CLI agente do AKS os utiliza?

No contexto da CLI agente para AKS, os plugins são extensões modulares que melhoram as capacidades de diagnóstico do agente, integrando ferramentas externas, fontes de dados e lógica específica do domínio nos seus fluxos de trabalho de resolução de problemas. Esses plug-ins permitem que o agente vá além da execução de comandos estáticos e incorpore raciocínio dinâmico e consciente de cenários. O agente suporta os seguintes tipos de plugins:

  • Integrações de conjunto de ferramentas: você pode estender os recursos do agente com conjuntos de ferramentas que se conectam a plataformas de observabilidade como Prometheus, Datadog e Azure Monitor. Esses conjuntos de ferramentas expõem métricas, logs e alertas que o agente pode consultar e analisar em tempo real. Por exemplo, um conjunto de ferramentas Prometheus pode permitir ao agente obter tendências de uso de CPU e memória para um pod com falha. Uma integração com o Azure Monitor pode revelar alertas recentes ou registos de atividade relevantes para uma questão de saúde de um nó.
  • Servidores MCP: Os servidores do Protocolo de Contexto de Modelo atuam como intermediários que expõem ferramentas de diagnóstico e modelos de prompts aos agentes de IA. No agente CLI para AKS, os servidores MCP fornecem acesso estruturado a recursos Kubernetes e Azure. O agente pode então executar comandos como kubectl describe ou az aks show até implementar pods de debug. Estes servidores também ajudam a padronizar a forma como as ferramentas são invocadas e como os dados são devolvidos, o que facilita a escalabilidade das capacidades do agente entre ambientes.

Que dados pode a CLI agente do AKS fornecer aos plugins? Que permissões têm os plugins?

Todos os plugins são apenas pull. As ferramentas permitem que a CLI agente do AKS recolha dados de várias fontes ou utilize os livros de execução personalizados que incorpora como parte dos pedidos do LLM para melhorar as suas capacidades de diagnóstico. O único fluxo de dados externo é para os modelos de IA que você conecta à CLI agentic para AKS.

Que tipos de problemas podem surgir quando uso a CLI agente para AKS ativada com plugins?

Quando utiliza a CLI agentic para AKS com plugins, podem surgir diversos tipos de problemas que podem afetar a fiabilidade ou precisão da experiência de diagnóstico.

Um desafio comum é a invocação incorreta das ferramentas devido a prompts mal configurados. Os plugins muitas vezes dependem de modelos de prompts para orientar o raciocínio e a seleção de ferramentas da IA. Mesmo pequenos erros na lógica ou estrutura dos prompts podem levar a que as ferramentas erradas sejam ativadas ou que as ferramentas certas sejam usadas no contexto errado. O resultado pode ser diagnósticos enganosos ou investigações incompletas.

Outro risco é a geração de saídas fabricadas ou incorretas, especialmente quando os plugins retornam dados incompletos, desatualizados ou ambíguos. Nesses casos, a IA pode tentar "preencher as lacunas" com explicações plausíveis, mas incorretas. Também podem ocorrer erros quando falta telemetria ou quando o plugin é usado numa configuração de cluster que não suporta. Por exemplo, um cluster privado pode não ter acesso a certas APIs ou ferramentas.

Para mitigar esses riscos, a CLI agentic para AKS inclui várias salvaguardas. Registos verbosos e relatórios de erros podem ajudar a rastrear exatamente que ferramentas foram invocadas, que dados foram devolvidos e como a IA os interpretou. Os relatórios facilitam a identificação e correção de problemas. Você também pode substituir ou desativar manualmente plug-ins específicos se suspeitar que eles estão causando problemas ou retornando dados não confiáveis.

Finalmente, documentação clara e suporte da comunidade são essenciais para o desenvolvimento e manutenção de plugins. Plugins bem documentados com exemplos, notas de compatibilidade de versão e limitações conhecidas ajudam você a entender como usá-los de forma responsável e contribuir com melhorias quando necessário. O uso de modelos LLM/raciocínio de última geração dos principais provedores de IA também reduz o risco de informações incorretas.