Questions fréquentes sur l'interface de ligne de commande agentique pour AKS

Cet article fournit des réponses à certaines des questions les plus courantes sur l’interface CLI agentique pour Azure Kubernetes Service (AKS).

Qu’est-ce que l’interface CLI agentique pour AKS ?

L’interface CLI agentique pour AKS est un outil en ligne de commande basé sur l’IA conçu pour aider les utilisateurs AKS à résoudre efficacement les problèmes de cluster. Il analyse les signaux de télémétrie (journaux, métriques, événements), les met en corrélation entre l’infrastructure et les charges de travail, et fournit des insights exploitables. L’agent prend des requêtes en langage naturel comme entrée et retourne des résumés de diagnostic, des analyses de cause racine et des suggestions de correction. L’interface CLI agentique n’inclut pas les modèles IA. Vous devez donc fournir vos propres clés API LLM (Large Language Model) pour que l’agent fonctionne.

Que peut faire l’interface CLI agentique pour AKS ?

L’interface CLI agentique pour AKS agit en tant qu’assistant local qui interprète les requêtes en langage naturel, exécute des commandes de diagnostic et retourne des insights actionnables. Il s'intègre parfaitement aux outils AKS natifs et aux sources de télémétrie telles que les événements Kubernetes, les journaux, Inspektor Gadget, Azure et les API AKS. Chacun d’eux est activé en tant qu’ensembles d’outils en mode natif dans az aks agent.

L’agent respecte le contrôle d’accès en fonction du rôle Azure (RBAC) et les contrôles d’identité, car il hérite des autorisations des utilisateurs à partir d’Azure CLI. Il fonctionne en mode lecture seule par défaut. Vous pouvez configurer votre fournisseur IA (par exemple, OpenAI, Azure OpenAI et Anthropic) et le modèle. Vous pouvez également configurer l’agent pour générer les sorties de l’ensemble d’outils.

Les résultats de az aks agent incluent :

  • Réponse récapitulative synthétisée par IA à la requête utilisateur.
  • Analyse de la cause racine avec des preuves à l'appui.
  • Suggestions de correction adaptées aux meilleures pratiques AKS.
  • Les traces de diagnostic et les sorties de l’outil.

Quelles sont les utilisations prévues pour l’interface CLI agentique pour AKS ?

L’interface CLI agentique pour AKS a les utilisations prévues suivantes :

  • Interactions humaines dans la boucle avec vos clusters AKS pour vous aider à détecter, diagnostiquer et résoudre efficacement les problèmes.
  • Interactions en lecture seule avec les API Kubernetes et AKS. Vous pouvez obtenir des informations sur les ressources, comprendre l’intégrité des ressources de cluster AKS et suivre les meilleures pratiques générales de Kubernetes et d'AKS.

L’interface CLI agentique pour AKS n’est pas destinée à être utilisée en tant qu’agent de codage générique ou d’IA au-delà de l’étendue des interactions AKS. Il ne peut pas accéder à Internet pour répondre aux questions génériques.

L’interface CLI agentique pour AKS est optimisée pour les scénarios spécifiques à AKS. Il s’intègre à des outils tels que kubectl, Azure CLI, Inspektor Gadget et Azure Monitor, mais il peut faire des erreurs. L’agent peut parfois manquer des signaux subtils, mal interpréter les données de télémétrie bruyantes ou suggérer des atténuations qui nécessitent une validation humaine. Par exemple, il peut maltribuer un échec dns (Domain Name System) à une stratégie réseau lorsque la cause racine est un serveur DNS en amont mal configuré. Ce scénario peut se produire en particulier si la télémétrie est incomplète ou si les autorisations sont restreintes.

Pour éviter les biais d’automatisation, vous devez traiter la sortie de l’agent comme un point de départ utile et non un verdict final. Il excelle pour exposer les causes probables et guider l'investigation, mais une surveillance humaine reste essentielle. L’examen humain est nécessaire dans des environnements complexes ou à enjeux élevés.

Quant aux modèles IA, nous vous recommandons d’utiliser un modèle déployé Azure OpenAI, tel que GPT4o ou GPTo3. Vous pouvez également utiliser un directement à partir de la plateforme d’API OpenAI. Vous pouvez utiliser n’importe quel fournisseur de modèle LLM pris en charge par les spécifications d’API Open, telles que Anthropic et Gemini.

Comment l’interface CLI agentique pour AKS a-t-elle été évaluée ? Quelles métriques sont utilisées pour mesurer les performances ?

L’interface CLI agentique pour AKS est évaluée à l’aide d’une combinaison de tests internes et d’évaluations programmatiques conçues pour s’assurer que ses fonctionnalités de diagnostic sont précises, pertinentes et significatives.

Pour les évaluations programmatiques, nous avons mesuré des indicateurs standard de l'IA responsable tels que l'ancrage contextuel, l'UPIA et le jailbreak XPIA, le contenu dangereux et la qualité des conversations (comme la cohérence et la fluidité).

Ces tests nous aident à identifier les lacunes dans le raisonnement, l’intégration des outils et l’exécution rapide. Une métrique principale pour le succès est la précision du diagnostic de l’agent et la pertinence de ses recommandations. L’agent a-t-il correctement identifié la cause racine et suggère-t-il des atténuations exploitables et prenant en compte le contexte ?

Nous réalisons des dépistages de bogues et organisons des équipes rouges en interne pour tester rigoureusement le comportement de l’agent dans différents cas. Nous vérifions la dégradation de l’intégrité des nœuds, les défaillances DNS, les interruptions de mise à niveau et les problèmes de planification des pods.

Nous reconnaissons la nature dynamique des interactions agentic-AI, et nous accueillons vos commentaires dans le cadre de la préversion. Vous pouvez partager vos commentaires directement avec nous à l’adresse aksagentcli@service.microsoft.com. Vous pouvez également ouvrir un problème GitHub.

Quelles sont les limitations de l’interface CLI agentique pour AKS ? Comment puis-je réduire l’effet de ces limitations quand j’utilise le système ?

L’interface CLI agentique pour AKS est puissante et conçue pour diagnostiquer et résoudre les problèmes dans les clusters AKS. Il présente quelques limitations importantes que vous devez connaître pour garantir une utilisation efficace et responsable :

  • La capacité de l’agent à accéder aux données et les analyser dépend directement de vos autorisations et de la disponibilité des données de télémétrie. Si vous ne disposez pas de droits d’accès suffisants ou si des sources de télémétrie telles que les journaux, les métriques ou les événements sont manquants ou incomplets, l’agent peut ne pas être en mesure de générer des diagnostics précis ou complets.
  • Le système est soumis à des limites de jetons lors du traitement de jeux de données volumineux, tels que les métriques de série chronologique. Ces limitations peuvent limiter la profondeur ou l’étendue de l’analyse dans des scénarios de résolution des problèmes complexes.
  • Dans son état MVP actuel, l’interface CLI agentique offre une prise en charge limitée des expériences Azure managées. Certains flux de travail, tels que l’intégration des alertes Azure Monitor, peuvent ne pas être entièrement pris en charge.

Pour réduire l’effet de ces limitations, vous pouvez effectuer plusieurs étapes proactives :

  • Assurez-vous que les outils de diagnostic requis, tels qu’Azure Monitor, sont correctement configurés pour aider l’agent à accéder à des données de télémétrie plus riches et à effectuer des diagnostics plus complets.
  • Étendez les fonctionnalités de l’interface CLI agentique en l’utilisant avec des serveurs MCP (Azure Model Context Protocol) ou AKS MCP. Pour plus d’informations, consultez Intégrer le serveur MCP AKS à l’interface CLI agentique pour AKS.
  • Utilisez le raisonnement de dernière génération ou les modèles à usage général, tels que GPT4o et GPTo3, pour garantir les meilleurs résultats possibles. L'interface CLI agentique pour AKS n'est pas fournie avec des modèles IA inclus.

Quels sont les facteurs opérationnels et les paramètres qui permettent une utilisation efficace et responsable de l’interface CLI agentique pour AKS ?

Pour utiliser l’interface CLI agentique pour AKS de manière efficace et responsable, plusieurs paramètres opérationnels jouent un rôle clé. L’agent est conçu pour fonctionner en mode lecture seule par défaut, ce qui garantit des diagnostics sécurisés sans apporter de modifications au cluster. Lorsque des opérations d’écriture sont nécessaires, telles que le déploiement de pods de débogage ou l’exécution des étapes de correction, elles nécessitent une approbation explicite de l’utilisateur pour maintenir le contrôle utilisateur et réduire les effets inattendus.

L’agent s’exécute localement sur votre ordinateur et prend également en charge les fournisseurs d’IA propre. Pour cette raison, vous pouvez configurer vos propres clés API LLM. Cette configuration garantit que vous pouvez apporter les fournisseurs et points de terminaison d’IA approuvés de votre organisation. Tout le traitement des données se produit localement pour préserver la confidentialité des données et s’aligner sur les normes de sécurité de l’entreprise.

L’agent offre également des paramètres de détail configurables, que vous pouvez utiliser pour basculer entre des résumés concis et des sorties de diagnostic détaillées en fonction de vos besoins. Cette flexibilité facilite la collecte d’aperçus rapides et une transparence totale dans le raisonnement de l'agent et l’exécution de ses outils.

L’intégration avec l’identité Azure et RBAC garantit davantage que l’agent accède uniquement aux ressources que vous êtes autorisé à afficher. Cette restriction simplifie la configuration et applique les limites d’accès sécurisé. Ensemble, ces paramètres créent un environnement sécurisé, conscient de la confidentialité et contrôlé par l’utilisateur pour résoudre les problèmes des clusters AKS avec une assistance ia.

Comment puis-je fournir des commentaires ou obtenir de l’aide sur l’interface CLI agentique pour AKS ?

Vous pouvez fournir des commentaires ou obtenir de l’aide sur l’interface CLI agentique pour AKS via plusieurs canaux :

  • Problèmes GitHub et demandes d’extraction sur le référentiel CLI agentique.
  • Canaux internes pendant la phase d'aperçu.
  • Tickets de support Azure ou engagement direct avec l’équipe produit AKS.

Qu’est-ce que les plug-ins et comment l’interface CLI agentique pour AKS les utilise-t-elle ?

Dans le contexte de l’interface CLI agentique pour AKS, les plug-ins sont des extensions modulaires qui améliorent les fonctionnalités de diagnostic de l’agent en intégrant des outils externes, des sources de données et une logique spécifique au domaine dans ses workflows de résolution des problèmes. Ces plug-ins permettent à l’agent d’aller au-delà de l’exécution de commandes statiques et d’incorporer un raisonnement dynamique et prenant en charge les scénarios. L’agent prend en charge les types de plug-ins suivants :

  • Intégrations d’ensembles d’outils : vous pouvez étendre les fonctionnalités de l’agent avec des ensembles d’outils qui se connectent à des plateformes d’observabilité telles que Prometheus, Datadog et Azure Monitor. Ces ensembles d’outils exposent des métriques, des journaux et des alertes que l’agent peut interroger et analyser en temps réel. Par exemple, un ensemble d’outils Prometheus peut permettre à l’agent d’extraire les tendances d’utilisation du processeur et de la mémoire pour un pod défaillant. Une intégration d’Azure Monitor peut afficher des alertes récentes ou des journaux d’activité pertinents pour un problème de santé d’un nœud.
  • Serveurs MCP : les serveurs de protocole modèle-contexte agissent en tant qu'intermédiaires qui exposent des outils de diagnostic et des modèles d'invite aux agents IA. Dans l’agent CLI pour AKS, les serveurs MCP fournissent un accès structuré aux ressources Kubernetes et Azure. L'agent peut ensuite exécuter des commandes telles que kubectl describe et az aks show, ou même déployer des pods de débogage. Ces serveurs permettent également de normaliser la façon dont les outils sont appelés et la façon dont les données sont retournées, ce qui facilite la mise à l’échelle des fonctionnalités de l’agent entre les environnements.

Quelles données l’interface CLI agentique pour AKS peut-elle fournir aux plug-ins ? Quelles sont les autorisations dont disposent les plug-ins ?

Tous les plug-ins sont uniquement en mode pull. Les outils permettent à l’interface CLI agentique pour AKS d’extraire des données à partir de différentes sources ou d’utiliser les runbooks personnalisés qu’il incorpore dans le cadre des invites LLM pour améliorer ses fonctionnalités de diagnostic. Le seul flux de données vers l’extérieur concerne les modèles IA que vous connectez à l’interface CLI agentique pour AKS.

Quels types de problèmes peuvent survenir lorsque j’utilise l’interface CLI agentique pour AKS activée avec des plug-ins ?

Lorsque vous utilisez l’interface CLI agentique pour AKS avec des plug-ins, plusieurs types de problèmes peuvent survenir, ce qui peut affecter la fiabilité ou la précision de l’expérience de résolution des problèmes.

Un défi courant est l’appel incorrect des outils en raison d’invites mal configurées. Les plug-ins s’appuient souvent sur des modèles d’invite pour guider le raisonnement de l'IA et la sélection des outils. Même les petites erreurs dans la logique ou la structure d’invite peuvent entraîner le déclenchement d’outils incorrects ou les outils appropriés utilisés dans le contexte incorrect. Le résultat peut être des diagnostics trompeurs ou des enquêtes incomplètes.

Un autre risque est la génération de sorties fabriquées ou incorrectes, en particulier lorsque les plug-ins retournent des données incomplètes, obsolètes ou ambiguës. Dans ce cas, l’IA peut tenter de « combler les lacunes » avec des explications plausibles mais incorrectes. Les erreurs peuvent également se produire lorsque la télémétrie est manquante ou lorsque le plug-in est utilisé dans une configuration de cluster qu’il ne prend pas en charge. Par exemple, un cluster privé peut ne pas accéder à certaines API ou outils.

Pour atténuer ces risques, l’interface CLI agentique pour AKS inclut plusieurs protections. La journalisation détaillée et les rapports d’erreurs peuvent vous aider à tracer exactement quels outils ont été appelés, quelles données ont été retournées et comment l’IA l’a interprétée. Les rapports facilitent la détection et la correction des problèmes. Vous pouvez également remplacer ou désactiver manuellement des plug-ins spécifiques si vous pensez qu’ils provoquent des problèmes ou retournent des données non fiables.

Enfin, une documentation claire et une prise en charge de la communauté sont essentielles pour le développement et la maintenance des plug-ins. Les plug-ins bien documentés avec des exemples, des notes de compatibilité de version et des limitations connues vous aident à comprendre comment les utiliser de manière responsable et contribuer aux améliorations si nécessaire. L’utilisation des modèles LLM/raisonnement de dernière génération des principaux fournisseurs d’IA réduit également le risque d’informations incorrectes.