Preguntas más frecuentes sobre la CLI Agentic para AKS

En este artículo se proporcionan respuestas a algunas de las preguntas más comunes sobre la CLI agente para Azure Kubernetes Service (AKS).

¿Qué es la CLI agente para AKS?

La CLI agente para AKS es una herramienta de línea de comandos con tecnología de inteligencia artificial diseñada para ayudar a los usuarios de AKS a solucionar problemas de clúster de forma eficaz. Analiza las señales de telemetría (registros, métricas, eventos), las correlaciona entre la infraestructura y las cargas de trabajo y proporciona información útil. El agente toma consultas de lenguaje natural como entrada y devuelve resúmenes de diagnóstico, análisis de causa principal y sugerencias de corrección. La CLI de agente no incluye los modelos de IA, por lo que debe proporcionar sus propias claves de API para modelos de lenguaje grande (LLM) para que el agente funcione.

¿Qué puede hacer la CLI agentic para AKS?

La CLI agente para AKS actúa como asistente local que interpreta consultas de lenguaje natural, ejecuta comandos de diagnóstico y devuelve información procesable. Se integra perfectamente con herramientas nativas de AKS y orígenes de telemetría, como eventos de Kubernetes, registros, Gadget de Inspektor, Azure y API de AKS. Cada uno de ellos está habilitado como conjuntos de herramientas de forma nativa en az aks agent.

El agente respeta el control de acceso basado en rol (RBAC) de Azure y los controles de identidad, ya que hereda los permisos de los usuarios de la CLI de Azure. Funciona en modo de solo lectura de forma predeterminada. Puede configurar el proveedor de INTELIGENCIA ARTIFICIAL (por ejemplo, OpenAI, Azure OpenAI y Anthropic) y el modelo. También puede configurar el agente para generar las salidas del conjunto de herramientas.

Las salidas de az aks agent incluyen:

  • Respuesta de resumen sintetizada por IA a la consulta del usuario.
  • Análisis de causa principal con evidencia de apoyo.
  • Sugerencias de corrección adaptadas a los procedimientos recomendados de AKS.
  • Los registros de diagnóstico y los resultados de la herramienta.

¿Cuáles son los usos previstos para la CLI agente para AKS?

La CLI agente para AKS tiene los siguientes usos previstos:

  • Interacciones humanas en bucle con los clústeres de AKS para ayudarle a detectar, diagnosticar y resolver problemas de forma eficaz.
  • Interacciones de solo lectura con las API de Kubernetes y AKS. Puede obtener información de recursos, comprender el estado de los recursos del clúster de AKS y seguir los procedimientos recomendados generales de Kubernetes y AKS.

La CLI agente para AKS no está pensada para usarse como un agente de inteligencia artificial o codificación genérico más allá del ámbito de las interacciones de AKS. No puede acceder a Internet para responder a preguntas genéricas.

La CLI agente para AKS está optimizada para escenarios específicos de AKS. Se integra con herramientas como kubectl, la CLI de Azure, Inspektor Gadget y Azure Monitor, pero puede cometer errores. En ocasiones, el agente podría perder señales sutiles, interpretar mal la telemetría ruidosa o sugerir mitigaciones que requieren validación humana. Por ejemplo, podría atribuir erróneamente un fallo del sistema de nombres de dominio (DNS) a una política de red cuando la causa principal es un servidor DNS superior mal configurado. Este escenario puede producirse especialmente si la telemetría está incompleta o los permisos están restringidos.

Para evitar el sesgo de automatización, debe tratar el resultado del agente como un punto de partida útil y no un veredicto final. Sobresale en identificar causas probables y guiar la investigación, pero la supervisión humana es esencial. La revisión humana es necesaria en entornos complejos o de alto riesgo.

En cuanto a los modelos de IA, se recomienda usar un modelo implementado de Azure OpenAI, como GPT4o o GPTo3. También puede usar uno directamente desde la plataforma de api de OpenAI. Puede usar cualquier proveedor de modelos LLM compatible con las especificaciones de Open API, como Anthropic y Gemini.

¿Cómo se evaluó la CLI agente para AKS? ¿Qué métricas se utilizan para medir el rendimiento?

La CLI agente para AKS se evalúa mediante una combinación de pruebas internas y evaluaciones mediante programación diseñadas para garantizar que sus funcionalidades de diagnóstico sean precisas, relevantes y significativas.

En el caso de las evaluaciones mediante programación, medimos métricas estándar de IA responsable, como la fundamentación, el 'jailbreak' de UPIA y XPIA, el contenido dañino y la calidad de la conversación (como la coherencia y la fluidez).

Estas pruebas nos ayudan a identificar brechas en el razonamiento, la integración de herramientas y la ejecución rápida. Una métrica básica para el éxito es la precisión del diagnóstico del agente y la relevancia de sus recomendaciones. ¿El agente identificó correctamente la causa principal y sugirió mitigaciones accionables y compatibles con el contexto?

Llevamos a cabo bashes de errores internos y equipos rojos para probar rigurosamente el comportamiento del agente en varios casos. Buscamos problemas de degradación del estado del nodo, errores de DNS, interrupciones de actualización y programación de pods.

Reconocemos la naturaleza dinámica de las interacciones agentic-AI y agradecemos sus comentarios como parte de la versión preliminar. Puede compartir comentarios directamente con nosotros en aksagentcli@service.microsoft.com. También puede abrir un problema de GitHub.

¿Cuáles son las limitaciones de la CLI agente para AKS? ¿Cómo puedo minimizar el efecto de estas limitaciones cuando uso el sistema?

La CLI agente para AKS es eficaz y está diseñada para diagnosticar y resolver problemas en clústeres de AKS. Tiene algunas limitaciones importantes que debe tener en cuenta para garantizar un uso eficaz y responsable:

  • La capacidad del agente de acceder a los datos y analizarlos depende directamente de los permisos y de la disponibilidad de la telemetría. Si no tiene suficientes derechos de acceso o si los orígenes de telemetría, como registros, métricas o eventos faltan o están incompletos, es posible que el agente no pueda generar diagnósticos precisos o completos.
  • El sistema está sujeto a límites de token al procesar grandes conjuntos de datos, como las métricas de serie temporal. Estas limitaciones pueden restringir la profundidad o amplitud del análisis en escenarios complejos de solución de problemas.
  • En su estado MVP actual, la CLI agente ofrece compatibilidad limitada con experiencias administradas de Azure. Es posible que determinados flujos de trabajo, como la integración de alertas de Azure Monitor, no sean totalmente compatibles.

Para minimizar el efecto de estas limitaciones, puede realizar varios pasos proactivos:

  • Asegúrese de que las herramientas de diagnóstico necesarias, como Azure Monitor, están configuradas correctamente para ayudar al agente a acceder a datos de telemetría más completos y realizar diagnósticos más completos.
  • Amplíe las funcionalidades de la CLI agente mediante su uso con los servidores de Azure Model Context Protocol (MCP) o AKS MCP. Para obtener más información, consulte Integración del servidor MCP de AKS con la CLI agente para AKS.
  • Use el razonamiento de última generación o los modelos de uso general, como GPT4o y GPTo3, para garantizar los mejores resultados posibles. La CLI agente para AKS no incluye modelos de INTELIGENCIA ARTIFICIAL.

¿Qué factores operativos y configuraciones permiten un uso eficaz y responsable de la CLI agente para AKS?

Para usar la CLI de agente para AKS de forma eficaz y responsable, varias configuraciones operativas desempeñan un papel clave. El agente está diseñado para funcionar en modo de solo lectura de forma predeterminada, lo que garantiza diagnósticos seguros sin realizar cambios en el clúster. Cuando se necesitan operaciones de escritura, como la implementación de pods de depuración o la ejecución de pasos de corrección, requieren aprobación explícita del usuario para mantener el control de usuario y minimizar los efectos no deseados.

El agente se ejecuta localmente en tu máquina y también admite proveedores de IA de su elección. Por este motivo, puede configurar sus propias claves de API de LLM. Esta configuración garantiza que su organización puede traer los proveedores de inteligencia artificial y los puntos de conexión aprobados. Todo el procesamiento de datos se produce localmente para conservar la privacidad de los datos y alinearse con los estándares de seguridad de la empresa.

El agente también ofrece opciones de detalle configurables, que puede usar para alternar entre resúmenes concisos y salidas de diagnóstico detalladas en función de sus necesidades. Esta flexibilidad admite la recopilación de información rápida y transparencia completa en el razonamiento y la ejecución de herramientas del agente.

La integración con la identidad de Azure y RBAC garantiza aún más que el agente acceda solo a los recursos que está autorizado para ver. Esta restricción simplifica la configuración y aplica límites de acceso seguros. Juntos, esta configuración crea un entorno seguro, consciente de la privacidad y controlado por el usuario para solucionar problemas de clústeres de AKS con asistencia de IA.

¿Cómo puedo proporcionar comentarios o obtener ayuda con la CLI de agente para AKS?

Puede proporcionar comentarios o obtener ayuda con la CLI agente para AKS a través de varios canales:

  • GitHub emite y extrae solicitudes en el repositorio de la CLI agente.
  • Canales internos durante la fase de vista previa.
  • Incidencias de soporte técnico de Azure o interacción directa con el equipo de productos de AKS.

¿Qué son los complementos y cómo los usa la CLI agente para AKS?

En el contexto de la CLI agente para AKS, los complementos son extensiones modulares que mejoran las funcionalidades de diagnóstico del agente mediante la integración de herramientas externas, orígenes de datos y lógica específica del dominio en sus flujos de trabajo de solución de problemas. Estos complementos permiten al agente ir más allá de la ejecución de comandos estáticos e incorporar razonamiento dinámico y compatible con escenarios. El agente admite los siguientes tipos de complementos:

  • Integraciones de conjuntos de herramientas: puede ampliar las funcionalidades del agente con conjuntos de herramientas que se conectan a plataformas de observabilidad como Prometheus, Datadog y Azure Monitor. Estos conjuntos de herramientas exponen métricas, registros y alertas que el agente puede consultar y analizar en tiempo real. Por ejemplo, un conjunto de herramientas de Prometheus podría permitir que el agente obtenga tendencias de uso de CPU y memoria para un pod que está fallando. Una integración de Azure Monitor podría exponer alertas recientes o registros de actividad relevantes para un problema de mantenimiento del nodo.
  • Servidores MCP: los servidores del Protocolo de contexto de modelo actúan como intermediarios que exponen herramientas de diagnóstico y solicitan plantillas a agentes de IA. En el agente de la CLI para AKS, los servidores MCP proporcionan acceso estructurado a los recursos de Kubernetes y Azure. Después, el agente puede ejecutar comandos como kubectl describe y az aks show o incluso implementar pods de depuración. Estos servidores también ayudan a estandarizar cómo se invocan las herramientas y cómo se devuelven los datos, lo que facilita la escala de las funcionalidades del agente en todos los entornos.

¿Qué datos puede proporcionar la CLI de agente para AKS a los complementos? ¿Qué permisos tienen los complementos?

Todos los complementos son solo de extracción. Las herramientas permiten que la CLI agente de AKS extraiga datos de varios orígenes o use los runbooks personalizados que inserta como parte de las indicaciones de LLM para mejorar sus funcionalidades de diagnóstico. El único flujo de datos saliente es para los modelos de inteligencia artificial que se conectan a la CLI agente para AKS.

¿Qué tipos de problemas pueden surgir al usar la CLI agentic para AKS habilitado con complementos?

Cuando se usa la CLI agente para AKS con complementos, pueden surgir varios tipos de problemas que pueden afectar a la confiabilidad o precisión de la experiencia de solución de problemas.

Un desafío común es la invocación incorrecta de las herramientas debido a indicaciones mal configuradas. Los complementos a menudo se basan en plantillas de solicitud para guiar el razonamiento y la selección de herramientas de la inteligencia artificial. Incluso pequeños errores en la lógica o estructura del mensaje pueden provocar que se desencadenen herramientas incorrectas o que se usen las herramientas correctas en el contexto incorrecto. El resultado puede ser diagnósticos engañosos o investigaciones incompletas.

Otro riesgo es la generación de salidas fabricadas o incorrectas, especialmente cuando los complementos devuelven datos incompletos, obsoletos o ambiguos. En tales casos, la inteligencia artificial podría intentar "rellenar las lagunas" con explicaciones creíbles pero incorrectas. Los errores también pueden producirse cuando falta telemetría o cuando el complemento se usa en una configuración de clúster que no admite. Por ejemplo, un clúster privado podría carecer de acceso a determinadas API o herramientas.

Para mitigar estos riesgos, la CLI con funciones de agente para AKS incluye varias medidas de seguridad. El registro detallado y los informes de errores pueden ayudarle a rastrear exactamente qué herramientas se invocaron, qué datos se devolvieron y cómo lo interpretó la inteligencia artificial. Los informes facilitan la detectar y corregir problemas. También puede invalidar o deshabilitar manualmente complementos específicos si sospecha que están causando problemas o devolviendo datos no confiables.

Por último, la documentación clara y el soporte técnico de la comunidad son esenciales para el desarrollo y el mantenimiento de complementos. Los complementos bien documentados con ejemplos, notas de compatibilidad de versiones y limitaciones conocidas le ayudan a comprender cómo usarlos de forma responsable y contribuir a mejoras cuando sea necesario. El uso de modelos de LLM/razonamiento de última generación de proveedores líderes en inteligencia artificial también reduce el riesgo de información errónea.