Tarification et facturation d’Azure SRE Agent

Découvrez comment fonctionne la facturation de l’Agent SRE Azure et ce qui doit être attendu sur votre facture Azure.

Deux composants de facturation sont un flux toujours actif (fixe) et un flux actif (variable, basé sur un jeton). Le flux actif mesure les jetons de modèle de langage (LLM) consommés par votre agent. Chaque type de jeton est mesuré à un taux fixe d’unité d’agent Azure (AAU) en fonction du modèle configuré de votre agent.

Vous pouvez surveiller la consommation dans le portail à Paramètres>Consommation de l’Agent.

Comment la facturation fonctionne

Les frais de l’agent Azure SRE sont basés sur des AAUs, une mesure standardisée du traitement agentique utilisé dans tous les agents Azure prédéfinis. Votre facture mensuelle combine deux types de frais : flux permanent et flux actif.

Flux Toujours Activé (coût fixe)

Lorsque vous créez un agent, il est facturé à un taux fixe tant qu’il existe.

Composant Taux
Flux Always on Quatre AAU par heure d’agent

Le flux « always-on » ne signifie pas que l’agent traite activement des tâches. Il représente le coût de référence de la mise en service et de la disponibilité de votre agent. La facturation en continu continue de la création de l’agent jusqu’à ce que l’agent soit supprimé.

Flux actif (coût variable)

Chaque fois que votre agent fait du travail, l’agent consomme des AAU de flux actif. Les exemples de travail peuvent être que l’utilisateur pose une question de manière interactive, qu’une automatisation déclenche une tâche ou qu’une opération asynchrone s’exécute en arrière-plan. Chaque fois que l'agent traite activement, cela compte comme un flux actif, indépendamment de la manière dont le travail a été lancé.

Comment les jetons deviennent des unités AAUs

Chaque fois que votre agent fonctionne, il consomme des jetons LLM. Chaque type de jeton est mesuré séparément au taux indiqué dans le tableau suivant.

Type de jeton Ce qu’il mesure
Input Jetons envoyés au modèle (invites, résultats de l’outil et contexte).
Sortie Jetons générés par le modèle (réponses et raisonnement).
Lecture du cache Jetons provenant du cache de prompt (contexte répété).
Écriture du cache Les jetons sont enregistrés dans le cache des requêtes en vue d’une réutilisation ultérieure.

Le nombre total d’AAU de flux actifs pour une tâche est égal à la somme des AAU pour les quatre types de jetons.

Taux d’AAU par modèle

Le tableau suivant indique le nombre d’unités AA consommées par 1 million de jetons.

Modèle Input Sortie Lecture du cache Écriture du cache
Claude Opus 4.6 100 UNITÉS AAUs 500 AAU 10 AAUs 125 AAUs
GPT 5.3 Codex 35 UNITÉS AA 280 UNITÉS AUTONOMES 3.5 AAU
GPT 5.2 35 UNITÉS AA 280 UNITÉS AUTONOMES 3.5 AAU

Les tarifs sont par 1 million de jetons. À compter du 15 avril 2026. D’autres modèles et fournisseurs peuvent être ajoutés à l’avenir. Les tarifs AAU sont définis par Azure et peuvent être mis à jour à mesure que de nouveaux modèles sont publiés.

Détails essentiels

  • Seul le nombre de temps de traitement est compté : Le temps passé par l’agent en attente de votre réponse n’est pas facturé comme flux actif.
  • Réinitialisations du flux actif mensuelles : Le compteur de consommation de vos AAUs est réinitialisé au début de chaque mois calendaire.
  • Le fournisseur est défini au niveau de l’agent : Le fournisseur de modèles (Anthropic, OpenAI et autres) est configuré dans les paramètres de votre agent. Le modèle correspondant détermine vos taux d’AAU.

Flux actif par type de tâche

Le nombre de jetons consommés, ce qui entraîne la facturation des AAUs dépend de la complexité de la tâche. Les tâches plus complexes nécessitent davantage d’étapes de raisonnement LLM, d’appels d’outils et de traitement des données, ce qui signifie plus de jetons.

Le tableau suivant montre comment la consommation de jetons se traduit par des AAUs dans des scénarios courants.

Scénario Jetons d’entrée Jetons de sortie Lecture du cache Écriture du cache Claude Opus 4.6 Unités Automatiques d'Analyse GPT 5.3 Codex AAUs Exemple
Question rapide ~20K ~2K ~15 000 ~5K ~3.8 ~1.6 « Afficher les alertes récentes ».
Enquête sur les incidents environ 200K ~15 000 ~150K ~50K ~35.5 ~13.7 Incident automatisé à partir d’Azure Monitor.
Correction complète ~500K ~40K ~400K ~100K ~86.5 ~33.9 « Diagnostiquer et corriger le déploiement défaillant ».

Fonctionnement des mathématiques

Le tableau suivant montre les mathématiques de l’exemple Claude Opus 4.6 précédent en utilisant les nombres de la ligne de question rapide.

Type de jeton Jetons Taux par 1M AAUs
Input 20 000 100 2.0
Sortie 2K 500 1.0
Lecture du cache 15 000 10 0.15
Écriture du cache 5K 125 0.625
Total 3.775 AAU

Conseil / Astuce

Pour maintenir les coûts de flux actifs prévisibles, définissez une limite d’allocation AAU mensuelle dans Paramètres>Agent de consommation.

Surveiller vos coûts

Dans le portail de l’agent SRE

Accédez à paramètres>Consommation de l'agent pour afficher votre utilisation :

  • Limite mensuelle d’AAU : Affiche votre allocation de flux en continu et actif combinée.
  • Consommation totale de flux actif : Affiche une barre de progression qui compare votre utilisation actuelle à votre limite.
  • Consommation quotidienne de flux actif : Affiche un graphique à barres qui affiche l’utilisation de votre AAU par jour pour le mois en cours.
  • Répartition de l’utilisation des jetons : Affiche vos jetons totaux consommés par catégorie (entrée, sortie, lecture du cache et écriture du cache) afin que vous puissiez voir exactement où se trouvent vos unités AA.

Définir une limite de dépense de flux actif

Sélectionnez Modifier l’allocation AAU pour définir une limite AAU de flux actif mensuel (minimum 500, 1 000 000 unités DA maximum). Cette limite s’applique uniquement au flux actif. La facturation permanente se poursuit tant que l’agent existe.

  • Lorsque votre agent atteint la limite de flux active, il devient indisponible pour les conversations et les actions jusqu’au mois suivant. Les frais permanents continuent pour le reste du mois.
  • Vous pouvez augmenter ou diminuer l’allocation à tout moment.
  • Les augmentations prennent effet immédiatement. Si vous augmentez la limite au-dessus de la consommation actuelle, les conversations et les actions reprendnt immédiatement.
  • Les baisses en dessous de la consommation actuelle prennent effet le mois prochain. Jusqu’à ce moment-là, l’agent s’exécute uniquement en mode « always-on flow ».

Impact de facturation par action

Action Flux actif Always-on Pour reprendre le mois prochain
Définir la limite budgétaire (atteinte de la limite) Arrêts Toujours facturé Réinitialise automatiquement au début du mois.
Arrêter l’agent Arrêts Toujours facturé Sélectionnez manuellement Démarrer dans paramètres>de base.
Supprimer l’assistant Arrêts Arrêts Créer un agent

Dans Microsoft Cost Management

Pour obtenir des répartitions détaillées de facturation entre plusieurs agents et ressources, utilisez Microsoft Cost Management dans le portail Azure.

Conseils d’optimisation des coûts

Stratégie Impact Comment procéder
Ajoutez du contexte à votre agent. Gaspille moins de jetons. Ajoutez des compétences, des connaissances et des documents afin de permettre à l'agent de rester ancré et concis. La mémoire persistante des interactions passées améliore l’efficacité au fil du temps.
Filtrer les incidents avec des plans de réponse. Réduit le travail inutile. Utilisez des plans de réponse pour filtrer les alertes Azure Monitor par gravité, service ou mot clé. L’agent examine uniquement les incidents qui correspondent.
Le travail par lots avec des tâches planifiées. Réalise moins d’exécutions. Planifiez les tâches à exécuter quotidiennement ou hebdomadairement au lieu d’interroger en continu.
Testez dans la conversation avant d’automatiser. Permet d’éviter les exécutions superflues. Commencez par tester votre requête dans le chat ou dans Playground. Une automatisation mal configurée s’exécute à plusieurs reprises et gaspille les AAUs.
Arrêter les agents inactifs. Élimine le flux actif. Accédez à Paramètres>de base , puis sélectionnez Arrêter. L’agent conserve sa configuration, mais arrête tout le flux actif. Le coût permanent se poursuit jusqu’à ce qu’il soit supprimé.
Supprimez les agents inutilisés. Élimine tous les coûts. Sur la page web de l’agent Azure SRE , ouvrez l’agent et accédez à Paramètres>De base>Supprimer l’agent. Toutes les facturations s’arrêtent immédiatement.

Questions fréquemment posées

Comment l’agent calcule-t-il des AAUs à partir de jetons ?

Chaque fois que votre agent effectue un travail, il effectue le suivi des jetons LLM consommés sur les quatre types de jetons et les mesure aux tarifs AAU pour votre modèle configuré. Vous pouvez voir votre consommation AAU dansParamètres>la consommation de l'Agent.

Le fournisseur que je choisis affecte-t-il mes coûts ?

Le fournisseur de modèles (Anthropic, OpenAI et autres) est défini au niveau de l’agent et détermine les taux d’AAU qui s’appliquent. Différents modèles ont des taux différents. Pour connaître les tarifs actuels, consultez le tableau des tarifs de l’AAU.

Quel modèle choisir ?

Claude Opus 4.6 a des taux d’AAU plus élevés, mais produit généralement des enquêtes plus approfondies avec moins d’étapes de raisonnement. Pour les enquêtes d’incidents complexes et l’analyse des causes profondes, Opus parvient souvent à une conclusion en moins d’appels d’outils, ce qui peut compenser le tarif par jeton plus élevé.

Les modèles GPT constituent un bon choix pour des tâches plus simples et à volume élevé, telles que les vérifications de conformité planifiées, où l’efficacité des coûts est plus importante que la profondeur. Vous pouvez modifier votre fournisseur de modèles à tout moment dans Paramètres>de base et comparer les résultats.

Est-ce que je suis facturé lorsque l’agent attend que je réponde ?

Non. Seul le temps passé par l’agent à traiter activement une tâche compte comme flux actif. Si l’agent demande votre approbation et attend, le délai d’attente n’est pas facturé.

Qu’est-ce qui compte comme flux actif ?

Chaque fois que l'agent travaille activement, cela compte comme un flux actif, comme dans les exemples suivants :

  • Invites interactives : un utilisateur qui pose une question à l’agent dans la conversation.
  • Automatisation : tâches planifiées, plans de réponse aux incidents ou autres déclencheurs automatisés.
  • Opérations asynchrones : enquêtes en arrière-plan, génération de rapports ou tâches de correction.

Dans tous les cas, l’agent mesure les jetons consommés en tant qu’AAU.

Que se passe-t-il si j’arrête mon agent ?

Un agent arrêté ne peut pas surveiller vos ressources ni répondre aux prompts, mais il continue à générer le coût fixe always-on. Les unités AA de flux actif ne sont pas consommées lors de l’arrêt. Pour arrêter votre agent, accédez à Paramètres>de base , puis sélectionnez Arrêter. Pour reprendre, sélectionnez Démarrer dans la même page. Pour arrêter entièrement la facturation, supprimez l’agent.

Un agent peut-il gérer plusieurs charges de travail ?

Yes. Un seul agent peut surveiller plusieurs ressources dans son étendue configurée. La consolidation des charges de travail sous un seul agent réduit les coûts permanents par rapport au déploiement de plusieurs agents distincts.

Existe-t-il un niveau gratuit ?

Non. Les frais de l’agent Azure SRE commencent dès la création de l’agent. Pour connaître les tarifs actuels, consultez la calculatrice de prix Azure.

La tarification est-elle la même dans toutes les régions ?

Pour connaître la tarification actuelle dans votre région, consultez la calculatrice de prix Azure.