Preço e faturamento para o Azure SRE Agent

Saiba como funciona a faturação do Azure SRE Agent e o que esperar na sua fatura Azure.

Dois componentes de faturação são o fluxo sempre ativo (fixo) e o fluxo ativo (variável, baseado em token). O fluxo ativo mede os grandes tokens do modelo de linguagem (LLM) que o seu agente consome. Cada tipo de token é medido a uma taxa fixa Azure Agent Unit (AAU) com base no modelo configurado pelo seu agente.

Pode monitorizar o consumo no portal em Definições>Consumo de Agentes.

Como funciona a faturação

As cobranças dos agentes Azure SRE baseiam-se em AAUs, uma medida padronizada do processamento agential utilizada em todos os agentes Azure pré-construídos. A sua fatura mensal combina dois tipos de encargos: fluxo contínuo e fluxo ativo.

Fluxo sempre ativo (custo fixo)

Quando crias um agente, é faturado a uma taxa fixa enquanto existe.

Componente Tarifa
Fluxo contínuo Quatro AAUs por hora de agente

Fluxo sempre ativo não significa que o agente esteja a processar trabalho ativamente. Representa o custo base de manter o seu agente provisionado e disponível. A faturação contínua continua desde a criação do agente até que este seja removido.

Fluxo ativo (custo variável)

Sempre que o seu agente está a trabalhar, ele consome AAUs de fluxo ativo. Exemplos de trabalho podem ser se um utilizador faz uma pergunta de forma interativa, se uma automação desencadeia uma tarefa, ou se uma operação assíncrona corre em segundo plano. Qualquer momento em que o agente esteja a processar ativamente conta como fluxo ativo, independentemente de como o trabalho foi iniciado.

Como os tokens se tornam AAUs

Sempre que o seu agente realiza um trabalho, consome tokens do LLM. Cada tipo de token é medido separadamente à taxa apresentada na tabela seguinte.

Tipo de token O que mede
Entrada Tokens enviados para o modelo (prompts, resultados de ferramentas e contexto).
Output Tokens gerados pelo modelo (respostas e raciocínio).
Leitura de cache Tokens servidos a partir do prompt cache (contexto repetido).
Escrita em cache Tokens escritos para indicar cache para reutilização futura.

O total de AAUs de fluxo ativo para uma tarefa é igual à soma das AAUs dos quatro tipos de tokens.

Taxas AAU por modelo

A tabela seguinte mostra o número de AAUs consumidas por cada 1 milhão de tokens.

Modelo Entrada Output Leitura de cache Escrita em cache
Claude Opus 4.6 100 AAUs 500 AAUs 10 AAUs 125 AAUs
Códice GPT 5.3 35 AAUs 280 AAUs 3.5 AAUs
GPT 5.2 35 AAUs 280 AAUs 3.5 AAUs

As tarifas são por 1 milhão de tokens. Com efeito a partir de 15 de abril de 2026. Mais modelos e fornecedores poderão ser adicionados no futuro. As taxas AAU são definidas pela Azure e podem ser atualizadas à medida que novos modelos forem lançados.

Detalhes principais

  • Só o tempo de processamento conta: O tempo que o agente passa à espera da sua resposta não é contabilizado como fluxo ativo.
  • O fluxo ativo reinicia mensalmente: O contador de consumo dos teus AAUs reinicia no início de cada mês civil.
  • O fornecedor é definido ao nível do agente: O fornecedor de modelos (Anthropic, OpenAI e outros) está configurado nas definições do seu agente. O modelo correspondente determina as suas taxas AAU.

Fluxo ativo por tipo de tarefa

O número de tokens consumidos, o que resulta nas AAUs faturadas, depende da complexidade da tarefa. Tarefas mais complexas exigem mais passos de raciocínio LLM, chamadas de ferramentas e processamento de dados, o que significa mais tokens.

A tabela seguinte mostra como o consumo de tokens se traduz em AAUs em cenários comuns.

Scenario Tokens de entrada Tokens de saída Leitura de cache Escrita em cache Claude Opus 4.6 AAUs AAUs do Códice GPT 5.3 Exemplo
Pergunta rápida ~20K ~2K ~15K ~5K ~3.8 ~1.6 "Mostra-me alertas recentes."
Investigação de incidentes ~200K ~15K cerca de 150 mil ~50K ~35,5 ~13,7 Incidente automatizado do Azure Monitor.
Remediação total ~500K ~40K ~400K cerca de 100K ~86,5 ~33,9 "Diagnosticar e corrigir a implementação falhada."

Como funciona a matemática

A tabela seguinte mostra a matemática para o exemplo anterior do Claude Opus 4.6, usando os números da linha de perguntas rápidas.

Tipo de token Tokens Taxa por 1M AAUs
Entrada 20 mil 100 2.0
Output 2K 500 1.0
Leitura de cache 15K 10 0.15
Escrita em cache 5K 125 0.625
Total 3.775 AAUs

Sugestão

Para manter os custos de fluxo ativo previsíveis, defina um limite mensal de alocação de AAU em Definições>consumo do Agente.

Monitorize os seus custos

No portal do Agente SRE

Vá a Definições>Consumo de Agentes para ver o seu consumo:

  • Limite mensal de AAU: Mostra a sua alocação combinada de fluxo sempre ligado e ativo.
  • Consumo total de fluxo ativo: Mostra uma barra de progresso que compara o teu uso atual com o teu limite.
  • Consumo diário de fluxo ativo: Mostra um gráfico de barras que mostra o seu uso de AAU por dia no mês atual.
  • Divisão do uso dos tokens: Mostra o total de tokens consumidos por categoria (entrada, saída, leitura e escrita em cache) para que possas ver exatamente para onde vão as tuas AAUs.

Defina um limite de despesa de fluxo ativo

Selecione Alterar alocação AAU para definir um limite mensal de fluxo ativo de AAU (mínimo 500, máximo 1.000.000 AAUs). Este limite aplica-se apenas ao fluxo ativo. A faturação permanente continua enquanto o agente existir.

  • Quando o seu agente atinge o limite de fluxo ativo, fica indisponível para chat e ações até ao mês seguinte. As cobranças permanentes continuam durante o resto do mês.
  • Pode aumentar ou diminuir a alocação a qualquer momento.
  • Os aumentos entram em vigor imediatamente. Se aumentar o limite acima do consumo atual, o chat e as ações retomarão imediatamente.
  • As diminuições abaixo do consumo atual entram em vigor no próximo mês. Até lá, o agente funciona apenas em fluxo sempre ativo.

Impacto da faturação por ação

Action Fluxo ativo Sempre ligado A retomar no próximo mês
Definir limite orçamental (limite de atingimento) Paragens Ainda está faturado Reinicia automaticamente no início do mês.
Parar agente Paragens Ainda está faturado Selecionar manualmente Iniciar em Definições>Básicas.
Eliminar agente Paragens Paragens Cria um novo agente.

Na Gestão de Custos da Microsoft

Para análises detalhadas de faturação entre vários agentes e recursos, utilize o Microsoft Cost Management no portal Azure.

Sugestões de otimização de custos

Estratégia Impacto Como fazê-lo
Forneça contexto ao seu agente. Desperdiça menos tokens. Adicione competências, conhecimentos e documentos para que o agente se mantenha com os pés no chão e conciso. A memória persistente de interações passadas melhora a eficiência ao longo do tempo.
Filtrar os incidentes com planos de resposta. Reduz o trabalho desnecessário. Use planos de resposta para filtrar alertas Azure Monitor por gravidade, serviço ou palavra-chave. O agente investiga apenas incidentes que correspondam.
Trabalho em lote com tarefas agendadas. Faz menos corridas. Agende tarefas para serem executadas diariamente ou semanalmente em vez de interrogação contínua.
Teste no chat antes de automatizar. Evita corridas desperdiçadas. Experimenta primeiro o teu prompt no chat ou no parque infantil. Uma automação mal configurada executa-se repetidamente e desperdiça AAUs.
Interrompa os agentes inativos. Desativa o fluxo ativo. Vai a Definições>Básicas e seleciona Parar. O agente mantém a sua configuração, mas suspende todo o fluxo ativo. O custo constante permanece até ser removido.
Apague os agentes não utilizados. Elimina todos os custos. Na página do Agente Azure SRE , abra o agente e vá a Definições>Básicas>Eliminar agente. Toda a faturação para imediatamente.

Perguntas frequentes

Como é que o agente calcula AAUs a partir de tokens?

Sempre que o seu agente realiza trabalho, acompanha os tokens LLM consumidos nos quatro tipos de tokens e mede-os às taxas AAU para o seu modelo configurado. Podes ver o teu consumo de AAU em Definições>consumo do Agente.

O prestador que escolho afeta os meus custos?

O fornecedor do modelo (Anthropic, OpenAI e outros) é definido ao nível do agente e determina quais as taxas AAU aplicáveis. Modelos diferentes têm taxas diferentes. Para as taxas atuais, consulte a tabela de taxas da AAU.

Que modelo devo escolher?

Claude Opus 4.6 tem taxas AAU mais elevadas, mas normalmente produz investigações mais aprofundadas com menos passos de raciocínio. Para investigações complexas de incidentes e análise de causa raiz, o Opus frequentemente chega a uma conclusão com menos chamadas de ferramenta, o que pode compensar a taxa mais elevada por token.

Os modelos GPT são uma boa escolha para tarefas mais simples e de grande volume, como verificações de conformidade programadas, onde a eficiência de custos importa mais do que a profundidade. Pode mudar o seu fornecedor de modelo a qualquer momento em Definições>Básicas e comparar resultados.

Sou cobrado quando o agente está à espera da minha resposta?

Não. Apenas o tempo que o agente passa a processar ativamente uma tarefa conta como fluxo ativo. Se o agente pedir a sua aprovação e esperar, o tempo de espera não é cobrado.

O que conta como fluxo ativo?

Qualquer momento em que o agente esteja a realizar trabalho ativamente conta como fluxo ativo, como nos seguintes exemplos:

  • Prompts interativos: Um utilizador a fazer uma pergunta ao agente no chat.
  • Automação: Tarefas agendadas, planos de resposta a incidentes ou outros gatilhos automáticos.
  • Operações assíncronas: Investigações em segundo plano, geração de relatórios ou tarefas de remediação.

Em todos os casos, o agente mede os tokens consumidos como AAUs.

O que acontece se eu parar o meu agente?

Um agente interrompido não pode monitorizar os seus recursos nem responder a pedidos, mas ainda assim incorre no custo fixo de estar sempre ligado. As AAUs de fluxo ativo não são consumidas enquanto estão paradas. Para parar o seu agente, vá a Definições>Básicas e selecione Parar. Para continuar, selecione Iniciar na mesma página. Para parar completamente toda a faturação, apague o agente.

Será que um agente consegue lidar com múltiplas cargas de trabalho?

Yes. Um único agente pode monitorizar múltiplos recursos dentro do seu âmbito configurado. Consolidar tarefas sob um único agente reduz os custos operacionais contínuos em comparação com a instalação de agentes separados.

Existe um nível gratuito?

Não. As cobranças do Azure SRE Agent começam na criação do agente. Para as taxas atuais, consulte a calculadora de preços Azure.

O preço é igual em todas as regiões?

Para preços atuais na sua região, consulte a calculadora de preços Azure.