Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se proporcionan instrucciones sobre cómo optimizar el uso y los costos de Azure Kubernetes Service (AKS). Trata las instrucciones sobre los temas siguientes:
- Escalado automático
- Ajuste de tamaño correcto del clúster
- Optimizaciones de GPU
- Arquitectura multiempresa
- Descuentos de Azure
Escalado automático
Escalado automático horizontal de pods
Horizontal Pod Autoscaler (HPA) supervisa la demanda de recursos y actualiza automáticamente un recurso de carga de trabajo para escalar automáticamente el número de pods para que coincidan con la demanda. La respuesta al aumento de la carga es implementar más pods. Si la carga disminuye y el número de pods está por encima del mínimo configurado, el escalador automático indica al recurso de carga de trabajo que se reduzca verticalmente.
La API de métricas obtiene datos de kubelet cada 60 segundos y HPA comprueba la API de métricas cada 15 segundos para los cambios necesarios de forma predeterminada. Esto significa que HPA se actualiza cada 60 segundos. Al configurar el HPA para una implementación, se define el número mínimo y máximo de réplicas que se pueden ejecutar y las métricas que usa HPA para determinar cuándo escalar.
Para obtener más información, consulte Escalado automático horizontal de pods y Escalado automático de pods en AKS.
Escalado automático controlado por eventos de Kubernetes
El escalador automático controlado por eventos (KEDA) de Kubernetes aplica el escalado automático controlado por eventos a las cargas de trabajo. KEDA funciona con HPA y puede ampliar la funcionalidad sin sobrescribir ni duplicar.
Puede usar el complemento KEDA para AKS para escalar las aplicaciones y aprovechar un amplio catálogo de escaladores de Azure KEDA. Para obtener más información, consulte Escalado automático de aplicaciones con el complemento KEDA e Instalación del complemento KEDA para AKS.
Escalado vertical automático de pods
El Vertical Pod Autoscaler (VPA) establece automáticamente las solicitudes y límites de recursos en los contenedores para cada carga de trabajo, basándose en el uso pasado. El VPA libera CPU y Memoria para los pods para garantizar un uso eficaz de los clústeres de AKS. Con el tiempo, el VPA proporciona recomendaciones para el uso de recursos.
Para más información, consulte Escalado automático vertical de pods en Azure Kubernetes Service (AKS) y Utilice el escalador automático vertical de pods (VPA) en Azure Kubernetes Service (AKS).
Ajuste de tamaño correcto del clúster
Ajusta el tamaño del clúster
Es importante ajustar el tamaño correcto de los clústeres para optimizar los costos y el rendimiento. Puede cambiar manualmente el tamaño de un clúster agregando o quitando los nodos según las necesidades de las aplicaciones. También puede escalar automáticamente el clúster para ajustar automáticamente el número de nodos en respuesta a las demandas cambiantes.
Para más información, consulte Cambio de tamaño de los clústeres de Azure Kubernetes Service (AKS).
Escalado automático del clúster
Con el escalador automático del clúster, puede escalar automáticamente los grupos de nodos en función del uso y las restricciones de recursos, como aumentar para programar pods pendientes o disminuir para reducir los costos de los nodos no utilizados. El perfil del escalador automático del clúster es un conjunto de parámetros que puede ajustar para controlar el comportamiento del escalador automático del clúster.
Para más información, consulte Escalado automático de clústeres en Azure Kubernetes Service (AKS) yUso del escalador automático de clústeres en Azure Kubernetes Service (AKS).
Aprovisionamiento automático de nodos (versión preliminar)
El aprovisionamiento automático de nodos (NAP) ( versión preliminar), basado en el proyecto karpenter de código abierto, le ayuda a aprovisionar la infraestructura adecuada en función de los requisitos de recursos de pod pendientes de las cargas de trabajo. Con el empaquetado de contenedores eficaz, puede consolidar las cargas de trabajo en la infraestructura de tamaño adecuado para reducir los costos operativos.
Para más información, consulte Aprovisionamiento automático de nodos (versión preliminar) en Azure Kubernetes Service (AKS).
Optimizaciones de GPU
Creación de particiones y uso compartido de GPU
La creación de particiones de GPU ayuda a combatir la infrautilización mediante la división o el uso compartido de GPU en varias cargas de trabajo. En las secciones siguientes se tratan diferentes formas de crear particiones y compartir GPU en AKS.
Segmentación de tiempo
El operador de GPU de NVIDIA habilita la segmentación de tiempo de las GPU en clústeres de Kubernetes. Con la segmentación de tiempo, un administrador de sistemas puede definir un conjunto de réplicas para una GPU, cada una de las cuales se puede asignar individualmente a un pod para ejecutar cargas de trabajo. Puede aplicar configuraciones predeterminadas de segmentación de tiempo a nivel de clúster y configuraciones específicas del nodo.
Para más información, consulte segmentación temporal de GPUs en Kubernetes.
Servicio de procesamiento múltiple (MPS)
Es posible que un único proceso no use toda la capacidad de ancho de banda de memoria y proceso disponible en una GPU. El servicio multiproceso (MPS) permite la creación de particiones lógicas de recursos de memoria y proceso entre cargas de trabajo y permite que las operaciones de kernel y memcopy de diferentes procesos se superpongan en la GPU. MPS le ayuda a lograr un mayor uso de GPU y tiempos de ejecución más cortos.
Para obtener más información, consulte Servicio multiproceso (MPS).
GPU de instancias múltiples (MIG)
Las GPU de varias instancias (MIG) permiten particionar GPU basadas en nvidia Ampere y arquitecturas posteriores en instancias de GPU independientes y seguras para las aplicaciones CUDA.
Para más información, consulte Operador de GPU con MIG y Creación de un grupo de nodos de GPU de varias instancias en Azure Kubernetes Service (AKS).
Arquitectura multiempresa
Multitenencia se refiere al uso compartido de la infraestructura entre inquilinos, equipos y unidades de negocio. En la tabla siguiente se describen diferentes formas de implementar multitenancy en AKS.
| Tipo de multitenencia | Nivel multiarrendatario | Densidad de pods de clúster | Asignación de costes | Caso de uso ideal | Riesgos potenciales |
|---|---|---|---|---|---|
| Clúster dedicado | Arquitectura multiempresa estricta | Minúsculas | Más fácil | Límites de aislamiento de seguridad completos y asignación directa de costos | • La expansión de clústeres a escala agrega costos de sobrecarga de administración • Menor densidad de pods y más recursos sobreaprovisionados |
| Grupo de nodos dedicado | Arquitectura multiempresa flexible | Medio | Medio | Densidad media de pod | • Requiere confianza entre inquilinos • Requiere configuraciones de clúster adicionales, como directivas de red, administración de cuotas, control de acceso basado en rol (RBAC), etc. |
| Espacio de nombres dedicado | Arquitectura multiempresa flexible | Más alto | Más difícil | Uso compartido de la infraestructura para maximizar el uso de recursos | • No seguro para entornos hostiles de forma predeterminada • Requiere configuraciones de clúster adicionales, como directivas de red, administración de cuotas, control de acceso basado en rol (RBAC), etc. |
Clúster dedicado
Con la arquitectura multiempresa de clústeres dedicados, los clústeres se dedican a una sola carga de trabajo o equipo.
En la tabla siguiente se describen las ventajas y desventajas del uso de un clúster dedicado:
| Ventajas | Desventajas |
|---|---|
| • Método de aislamiento más sencillo • Asignación directa de costos y recuperación de costes • Ideal para los casos en los que los inquilinos no confían entre sí (a menudo desde las perspectivas de seguridad y uso compartido de recursos) |
• Alta gestión y sobrecarga financiera • Generalmente baja densidad de pods y recursos sobreaprovisionados |
Grupo de nodos dedicado
Con la arquitectura multiempresa del grupo de nodos dedicado, muchos inquilinos comparten los clústeres.
En la tabla siguiente se describen las ventajas y desventajas del uso de un grupo de nodos dedicado:
| Ventajas | Desventajas |
|---|---|
| • Densidad media de pod • Algunas infraestructuras compartidas • Aplicar etiquetas de Azure a grupos de nodos dedicados a un solo inquilino (las etiquetas se propagan a los nodos y se conservan a través de las actualizaciones). |
• Requiere confianza entre los inquilinos • Requiere configuraciones de clúster adicionales, como directivas de red, administración de cuotas, control de acceso basado en rol (RBAC), etc. |
Espacio de nombres dedicado
Con la arquitectura multiempresa de espacio de nombres dedicado, muchos inquilinos comparten clústeres, con los espacios de nombres sirviendo como el límite de aislamiento.
En la tabla siguiente se describen las ventajas y desventajas del uso de un espacio de nombres dedicado:
| Ventajas | Desventajas |
|---|---|
| • Mayor densidad de pods • Mejor empaquetamiento de contenedores • Uso compartido de la infraestructura para maximizar el uso de recursos |
• No seguro para entornos hostiles de forma predeterminada • Requiere medidas de seguridad adicionales si no se puede confiar en todos los inquilinos. |
Descuentos de Azure
Para seguir ahorrando un paso más, aproveche los descuentos de Azure, como Los planes de ahorro de Azure, las instancias reservadas y las ventajas híbridas de Azure.
| Tipo de descuento de Azure | Detalles |
|---|---|
| Planes de ahorro de Azure | • Compromiso inicial de 1 a 3 años • Ahorre hasta un 65 % en comparación con el modelo de pago por uso • Flexible, sin restricciones de familia o región de SKU • Ideal para cargas de trabajo con costos coherentes que involucran recursos en varias SKU y regiones |
| Instancias reservadas | • Compromiso inicial de 1 a 3 años • Ahorre hasta un 72% en comparación con el sistema de pago según consumo • Restringido a familias y regiones de SKU específicas • Lo mejor para cargas de trabajo estables que se ejecutan continuamente (sin cambios inesperados de SKU o región) |
| Ventajas híbridas de Azure | • Traiga sus propias licencias locales de Windows Server y SQL Server a Azure • Use las licencias locales aptas que tengan una suscripción activa de Software Assurance (SA) o una suscripción apta. |
Pasos siguientes
Para más información sobre el costo en AKS, consulte los artículos siguientes: