Precios y facturación del agente de SRE de Azure

Obtenga información sobre cómo funciona la facturación del agente de SRE de Azure y qué esperar en la factura de Azure.

Dos componentes de facturación son flujo siempre activo (fijo) y flujo activo (variable, basado en tokens). El flujo activo mide los tokens del modelo de lenguaje extenso (LLM) que consume tu agente. Cada tipo de token se mide a una tasa fija de Unidad de agente de Azure (UAA) basada en el modelo configurado de su agente.

Puede supervisar el consumo en el portal en Configuración>Consumo del Agente.

Cómo funciona la facturación

Los cargos de Azure SRE Agent se basan en UAA, una medida estandarizada de procesamiento de agentes que se utiliza en todos los agentes de Azure precompilados. Su factura mensual combina dos tipos de cargos: flujo siempre activo y flujo activo.

Flujo siempre activado (costo fijo)

Al crear un agente, se factura a una tarifa fija mientras este exista.

Componente Tarifa
Flujo siempre activado Cuatro AAUs por hora del agente

El flujo siempre activo no significa que el agente esté procesando activamente el trabajo. Representa el costo base de mantener el agente aprovisionado y disponible. La facturación siempre activa se mantiene desde la creación del agente hasta que este se elimina.

Flujo activo (costo variable)

Siempre que su agente está trabajando, consume UAA de flujo activo. Los ejemplos de trabajo pueden ser si un usuario hace una pregunta de forma interactiva, una automatización desencadena una tarea o se ejecuta una operación asincrónica en segundo plano. Cada vez que el agente está procesando activamente cuenta como flujo activo, independientemente de cómo se inició el trabajo.

Cómo se convierten los tokens en AAUs

Cada vez que su agente realiza una tarea, consume tokens LLM. Cada tipo de token se mide por separado a la velocidad que se muestra en la tabla siguiente.

Tipo de token Qué mide
Entrada Tokens enviados al modelo (avisos, resultados de herramientas y contexto).
Salida Tokens generados por el modelo (respuestas y razonamiento).
Lectura de caché Tokens servidos desde la caché de indicaciones (contexto repetido).
Escritura en caché Los tokens se guardan en la caché de indicaciones para su reutilización futura.

El total de UAA de flujo activo de una tarea equivale a la suma de las UAA de los cuatro tipos de token.

Tarifas de AAU por modelo

En la tabla siguiente se muestra el número de AAUs consumidas por cada millón de tokens.

Modelo Entrada Salida Lectura de caché Escritura en caché
Claude Opus 4.6 100 AAUs 500 AAUs 10 AAUs 125 AAU
GPT 5.3 Codex 35 AAUs 280 AAUs 3.5 AAUs
GPT 5.2 35 AAUs 280 AAUs 3.5 AAUs

Las tasas son por 1 millón de tokens. A partir del 15 de abril de 2026. Es posible que se agreguen más modelos y proveedores en el futuro. Azure establece las tarifas de AAU y se pueden actualizar a medida que se publiquen nuevos modelos.

Detalles clave

  • Solo cuenta el tiempo de procesamiento: El tiempo que el agente dedica a esperar la respuesta no se factura como parte del flujo activo.
  • El flujo activo se restablece mensualmente: El contador de consumo de las AAUs se restablece al principio de cada mes natural.
  • El proveedor se establece en el nivel de agente: El proveedor de modelos (Anthropic, OpenAI y otros) está configurado en la configuración del agente. El modelo correspondiente determina las tasas de AAU.

Flujo activo por tipo de tarea

El número de tokens que se consumen y que determina las AAUs que se facturan depende de la complejidad de la tarea. Las tareas más complejas requieren más pasos de razonamiento de LLM, llamadas a herramientas y procesamiento de datos, lo que significa más tokens.

En la tabla siguiente se muestra cómo se traduce el consumo de tokens en AAUs en escenarios comunes.

Escenario Tokens de entrada Tokens de salida Lectura de caché Escritura en caché Claude Opus 4.6 AAUs Unidades de aceleración de IA (UAA) para el modelo Codex basado en GPT 5.3" Ejemplo
Pregunta rápida ~20 000 Alrededor de 2000 Alrededor de 15 000 Alrededor de 5000 Aproximadamente 3,8 ~1.6 "Muéstrame alertas recientes".
Investigación de incidentes ~200 000 Alrededor de 15 000 ~150 000 ~50K ~35.5 ~13.7 Incidente automatizado desde Azure Monitor.
Corrección completa ~500 000 ~40 000 ~400 000 ~100 000 ~86.5 ~33.9 "Diagnosticar y corregir la implementación con errores".

Funcionamiento de las matemáticas

En la tabla siguiente se muestran las matemáticas del ejemplo anterior de Claude Opus 4.6 utilizando los números de la fila de preguntas rápidas.

Tipo de token Tokens Tasa por 1 M Unidades de Asignación Autorizada (AAUs)
Entrada 20 K 100 2.0
Salida 2K 500 1.0
Lectura de caché 15 000 10 0.15
Escritura en caché 5K 125 0.625
Total 3.775 AAUs

Sugerencia

Para mantener los costos de flujo activos predecibles, establezca un límite de asignación mensual de AAU en Configuración>Consumo del agente.

Supervisión de los costos

En el portal del agente de SRE

Vaya a Configuración>Consumo de agente para ver el uso:

  • Límite mensual de AAU: Muestra la asignación combinada de flujos en modo continuo y activo.
  • Consumo total de flujo activo: Muestra una barra de progreso que compara el uso actual con el límite.
  • Consumo diario de flujo activo: Incluye un gráfico de barras que ilustra el uso diario de AAU para el mes actual.
  • Desglose del uso de tokens: Muestra el total de tokens consumidos por categoría (entrada, salida, lectura de caché y escritura en caché) para que puedas ver exactamente dónde van tus AAUs.

Establecimiento de un límite de gasto de flujo activo

Seleccione Cambiar asignación de AAU para establecer un límite de AAU de flujo activo mensual (mínimo 500, máximo de 1000 000 AAU). Este límite solo se aplica al flujo activo. La facturación de "siempre activo" continúa mientras el agente exista.

  • Cuando el agente alcanza el límite de flujo activo, deja de estar disponible para el chat y las acciones hasta el mes siguiente. Los cargos permanentes continúan durante el resto del mes.
  • Puede aumentar o disminuir la asignación en cualquier momento.
  • Los aumentos surten efecto inmediatamente. Si aumenta el límite por encima del consumo actual, el chat y las acciones se reanudan inmediatamente.
  • Las disminuciones por debajo del consumo actual surten efecto el mes siguiente. Hasta entonces, el agente se ejecuta únicamente en el flujo "siempre activo".

Impacto en la facturación por acción

Acción Flujo activo Siempre activo Reanudar el próximo mes
Establecer límite de presupuesto (alcanzar el límite) Paradas Todavía facturado Se restablece automáticamente al principio del mes.
Detener agente Paradas Todavía facturado Seleccione Inicio manualmente en Configuración>Básicas.
Eliminar agente Paradas Paradas Crear un nuevo agente.

En Microsoft Cost Management

Para obtener desgloses detallados de facturación en varios agentes y recursos, use Microsoft Cost Management en Azure Portal.

Sugerencias para la optimización de costos

Estrategia Impacto Cómo hacerlo
Agregue contexto al agente. Desperdicia menos tokens. Agregue aptitudes, conocimientos y documentos para que el agente permanezca enfocado y conciso. La memoria persistente de las interacciones pasadas mejora la eficacia con el tiempo.
Filtre los incidentes con planes de respuesta. Reduce el trabajo innecesario. Use planes de respuesta para filtrar las alertas de Azure Monitor por gravedad, servicio o palabra clave. El agente solo investiga incidentes que coinciden.
Trabajo por lotes con tareas programadas. Realiza menos corridas. Programe tareas para que se ejecuten diaria o semanalmente en lugar de sondear continuamente.
Pruebe en el chat antes de automatizar. Evita corridas innecesarias. Pruebe primero su comando en el chat o en el entorno de pruebas. Una automatización mal configurada se ejecuta repetidamente y desperdicia las AAU.
Detenga los agentes inactivos. Elimina el flujo activo. Vaya a Configuración>Básico y seleccione Detener. El agente mantiene su configuración, pero detiene todo el flujo activo. El costo permanente continúa hasta que se elimine.
Eliminar agentes sin usar. Elimina todos los costos. En la página web del agente de SRE de Azure , abra el agente y vaya a Configuración>Básico>Eliminar agente. Toda la facturación se detiene inmediatamente.

Preguntas más frecuentes

¿Cómo calcula el agente las AAU de los tokens?

Cada vez que tu agente realiza trabajo, realiza un seguimiento de los tokens de LLM consumidos en los cuatro tipos de token y los contabiliza según las tarifas de AAU para tu modelo configurado. Puede ver su consumo de AAU en Configuración>consumo del agente.

¿El proveedor que elijo afecta a mis costos?

El proveedor de modelos (Anthropic, OpenAI y otros) se establece en el nivel de agente y determina qué tarifas de AAU se aplican. Los diferentes modelos tienen tasas diferentes. Para obtener las tarifas actuales, consulte la tabla de tarifas de AAU.

¿Qué modelo debo elegir?

Claude Opus 4.6 tiene mayores volúmenes de UAA, pero normalmente investiga de forma más exhaustivas con menos fases de razonamiento. Para las investigaciones complejas de incidentes y el análisis de la causa raíz, Opus suele llegar a una conclusión con menos invocaciones de herramientas, lo que puede compensar la mayor tasa por token.

Los modelos GPT son una buena opción para tareas más sencillas y de gran volumen, como comprobaciones de cumplimiento programadas en las que la eficiencia de los costos es más importante que la profundidad. Puede cambiar el proveedor de modelos en cualquier momento en Configuración>básica y comparar los resultados.

¿Se me cobra cuando el agente está esperando que responda?

N.º Solo el tiempo que el agente dedica activamente a procesar una tarea cuenta como flujo activo. Si el agente solicita su aprobación y espera, no se factura el tiempo de espera.

¿Qué cuenta como flujo activo?

Cada vez que el agente está realizando activamente el trabajo cuenta como flujo activo, como los ejemplos siguientes:

  • Avisos interactivos: un usuario que pregunta al agente en el chat.
  • Automatización: tareas programadas, planes de respuesta a incidentes u otros desencadenadores automatizados.
  • Operaciones asincrónicas: investigaciones en segundo plano, generación de informes o tareas de corrección.

En todos los casos, el agente mide los tokens consumidos como AAUs.

¿Qué ocurre si detengo mi agente?

Un agente detenido no puede supervisar los recursos ni responder a las solicitudes, pero sigue incurriendo en el costo fijo siempre activo. Las AAU de flujo activo no se consumen mientras se detienen. Para detener el agente, vaya a Configuración>Básicas y seleccione Detener. Para reanudarlo, seleccione Iniciar en la misma página. Para detener toda la facturación, elimine el agente.

¿Puede un agente controlar varias cargas de trabajo?

Sí. Un solo agente puede supervisar varios recursos dentro de su ámbito configurado. La consolidación de cargas de trabajo en un único agente reduce los costos de estar siempre activos en comparación con la implementación de agentes independientes.

¿Hay un nivel gratis?

N.º Los cargos de Azure SRE Agent empiezan a cobrarse con la creación del agente. Para conocer las tarifas actuales, consulte la calculadora de precios de Azure.

¿Los precios son los mismos en todas las regiones?

Para conocer los precios actuales en su región, consulte la calculadora de precios de Azure.