Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Meer informatie over hoe facturering van Azure SRE Agent werkt en wat u kunt verwachten op uw Azure-factuur.
Twee factureringsonderdelen zijn een always-on-stroom (vast) en een actieve stroom (variabel, op tokens gebaseerd). Actieve stroom meet de LLM-tokens (Large Language Model) die uw agent verbruikt. Elk tokentype wordt gemeten met een vaste AAU-snelheid (Azure Agent Unit) op basis van het geconfigureerde model van uw agent.
U kunt het verbruik in het portaal controleren via Instellingen>Agentverbruik.
Hoe facturering werkt
Azure SRE Agent-kosten zijn gebaseerd op AAUs, een gestandaardiseerde meting van agentische verwerking die wordt gebruikt voor alle vooraf gedefinieerde Azure-agents. Uw maandelijkse factuur combineert twee soorten tarieven: continu-stroom en actieve stroom.
Always-on flow (vaste kosten)
Wanneer u een agent maakt, wordt deze gefactureerd tegen een vast tarief zolang deze bestaat.
| Onderdeel | Tarief |
|---|---|
| Altijd-aan-stroom | Vier AAUs per agentuur |
De altijd actieve stroom betekent niet dat de agent actief werk aan het verwerken is. Dit vertegenwoordigt de basiskosten voor het inrichten en beschikbaar houden van uw agent. Doorlopende facturering wordt voortgezet vanaf het moment dat de agent wordt gemaakt totdat de agent wordt verwijderd.
Actieve stroom (variabele kosten)
Wanneer uw agent werkt, verbruikt de agent actieve stroom-AAUs. Werkvoorbeelden kunnen zijn of een gebruiker interactief een vraag stelt, een automatisering een taak activeert of een asynchrone bewerking op de achtergrond wordt uitgevoerd. Elke keer dat de agent actief bezig is met verwerken, wordt dat meegeteld als actieve verwerking, ongeacht de manier waarop het werk is gestart.
Hoe tokens AAUs worden
Telkens wanneer uw agent werkt, worden LLM-tokens gebruikt. Elk tokentype wordt afzonderlijk gemeten met de snelheid die wordt weergegeven in de volgende tabel.
| Tokentype | Wat het meet |
|---|---|
| Invoer | Tokens die naar het model worden verzonden (prompts, resultaten van hulpprogramma's en context). |
| Uitvoer | Tokens die worden gegenereerd door het model (antwoorden en redenering). |
| Cache lezen | Tokens die worden geleverd vanuit de prompt-cache (herhaalde context). |
| Schrijven in cache | Tokens die zijn geschreven om de cache te vragen voor toekomstig hergebruik. |
De totale actieve stroom-AAUs voor een taak is gelijk aan de som van AAUs voor alle vier de tokentypen.
AAU-tarieven per model
In de volgende tabel ziet u het aantal verbruikte AAUs per 1 miljoen tokens.
| Model | Invoer | Uitvoer | Cache lezen | Schrijven in cache |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| GPT 5.3 Codex | 35 AAUs | 280 AAUs | 3.5 AAUs | — |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | — |
Tarieven zijn per 1 miljoen tokens. Vanaf 15 april 2026. In de toekomst kunnen er meer modellen en providers worden toegevoegd. AAU-tarieven worden ingesteld door Azure en kunnen worden bijgewerkt wanneer er nieuwe modellen worden uitgebracht.
Belangrijke details
- Alleen verwerkingstijdaantallen: De tijd die de agent besteedt aan het wachten op uw antwoord, wordt niet in rekening gebracht als actieve stroom.
- Actieve gegevensstroom wordt maandelijks opnieuw ingesteld: De verbruiksteller voor uw AAUs wordt aan het begin van de maand opnieuw ingesteld.
- Provider is ingesteld op agentniveau: De modelprovider (Antropisch, OpenAI en andere) is geconfigureerd in de instellingen van uw agent. Het bijbehorende model bepaalt uw AAU-tarieven.
Actieve stroom per taaktype
Het aantal tokens dat wordt verbruikt, wat resulteert in de gefactureerde AAU's, is afhankelijk van de complexiteit van de taak. Complexere taken vereisen meer LLM-redeneringsstappen, hulpprogramma-aanroepen en gegevensverwerking, wat betekent dat er meer tokens zijn.
In de volgende tabel ziet u hoe tokenverbruik wordt omgezet in AAUs in veelvoorkomende scenario's.
| Scenario | Invoertokens | Uitvoertokens | Cache lezen | Schrijven in cache | Claude Opus 4.6 AAUs | GPT 5.3 Codex AAUs | Voorbeeld |
|---|---|---|---|---|---|---|---|
| Snelle vraag | ~20K | ~2K | ~15K | ~5K | ~3,8 | ~1,6 | 'Toon recente waarschuwingen'. |
| Incidentonderzoek | ~200K | ~15K | ~150.000 | ~50K | ~35,5 | ~13,7 | Geautomatiseerd incident van Azure Monitor. |
| Volledig herstel | ~500K | Ongeveer 40K | ~400K | ~100.000 | ~86,5 | ~33,9 | 'Diagnose stellen en oplossen van de mislukte implementatie'. |
Hoe de wiskunde werkt
In de volgende tabel ziet u de wiskunde voor het voorgaande Claude Opus 4.6-voorbeeld met behulp van de getallen uit de rij snelle vragen.
| Tokentype | Tokens | Tarief per 1 miljoen | AAUs |
|---|---|---|---|
| Invoer | 20K | 100 | 2.0 |
| Uitvoer | 2K | 500 | 1.0 |
| Cache lezen | 15K | 10 | 0.15 |
| Schrijven in cache | 5K | 125 | 0.625 |
| Total | 3.775 AAUs |
Aanbeveling
Om de actieve stroomkosten voorspelbaar te houden, stelt u een maandelijkse AAU-toewijzingslimiet in via Instellingen>Agentverbruik.
Houd uw kosten in de gaten
In de SRE Agent-portal
Ga naar Instellingen>Het verbruik van de agent om uw gebruik weer te geven:
- Maandelijkse AAU-limiet: Toont de gecombineerde toewijzing van altijd-aan- en actieve stromen.
- Totaal verbruik van actieve stroom: Toont een voortgangsbalk die uw huidige gebruik vergelijkt met uw limiet.
- Dagelijks verbruik van actieve stroom: Toont een staafdiagram met uw AAU-gebruik per dag voor de huidige maand.
- Uitsplitsing van tokengebruik: Geeft het totale aantal tokens weer dat per categorie wordt verbruikt (invoer, uitvoer, cache lezen en schrijven in cache), zodat u precies kunt zien waar uw AAU's heen gaan.
Een bestedingslimiet voor actieve stromen instellen
Selecteer AAU-toewijzing wijzigen om een AAU-limiet voor een maandelijkse actieve stroom in te stellen (minimaal 500, maximum 1.000.000 AAUs). Deze limiet geldt alleen voor actieve stroom. Doorlopende facturering wordt voortgezet zolang de agent bestaat.
- Wanneer uw agent de limiet voor de actieve stroom bereikt, is deze niet meer beschikbaar voor chat en acties tot de volgende maand. Doorlopende kosten blijven de rest van de maand van kracht.
- U kunt de toewijzing op elk gewenst moment vergroten of verkleinen.
- Verhogingen worden onmiddellijk van kracht. Als u de limiet boven het huidige verbruik verhoogt, worden chats en acties meteen hervat.
- Dalingen lager dan het huidige consumptieniveau worden volgende maand van kracht. Tot die tijd draait de agent alleen in een altijd-aan modus.
Gevolgen voor facturering per actie
| Action | Actieve stroom | Always-on | Volgende maand hervatten |
|---|---|---|---|
| Budgetlimiet instellen (limiet bereikt) | Onderbrekingen | Nog steeds gefactureerd | Wordt automatisch opnieuw ingesteld aan het begin van de maand. |
| Agent stoppen | Onderbrekingen | Nog steeds gefactureerd | Selecteer handmatig Start in Instellingen>Basis. |
| Agent verwijderen | Onderbrekingen | Onderbrekingen | Maak een nieuwe agent. |
Binnen Microsoft Cost Management
Gebruik Microsoft Cost Management in Azure Portal voor gedetailleerde factureringsanalyses voor meerdere agents en resources.
Tips voor kostenoptimalisering
| Strategie | Impact | Hoe kunt u het doen? |
|---|---|---|
| Voeg context toe aan uw agent. | Verspilt minder tokens. | Voeg vaardigheden, kennis en documenten toe, zodat de agent geaard en beknopt blijft. Permanent geheugen van eerdere interacties verbetert de efficiëntie in de loop van de tijd. |
| Filter incidenten met reactieplannen. | Vermindert onnodig werk. | Gebruik reactieplannen om Azure Monitor-waarschuwingen te filteren op ernst, service of trefwoord. De agent onderzoekt alleen incidenten die overeenkomen. |
| Batch-werk met geplande taken. | Maakt minder rondes. | Plan taken om dagelijks of wekelijks uit te voeren in plaats van continu polling uit te voeren. |
| Test in chat voordat u automatiseert. | Voorkomt onnodige uitvoeringen. | Probeer eerst uw vraag in de chat of de speeltuin. Een onjuist geconfigureerde automatisering wordt herhaaldelijk uitgevoerd en verspilt AAU's. |
| Stop niet-actieve agenten. | Elimineert actieve stroom. | Ga naar>Basisinstellingen en selecteer Stoppen. De agent behoudt de configuratie, maar stopt alle actieve stroom. De kosten voor always-on worden voortgezet totdat ze zijn verwijderd. |
| Verwijder ongebruikte agents. | Elimineert alle kosten. | Open de agent op de webpagina van de Azure SRE-agent en ga naar De>basisinstellingen> vande agent verwijderen. Alle facturering stopt onmiddellijk. |
Veelgestelde vragen
Hoe berekent de agent AAUs van tokens?
Telkens wanneer uw agent werk verricht, worden de LLM-tokens die worden gebruikt voor alle vier de tokentypen bijgehouden en vervolgens gemeten tegen de AAU-tarieven voor uw geconfigureerde model. U kunt uw AAU-verbruik zien in Instellingen>Agent verbruik.
Heeft de provider die ik kies invloed op mijn kosten?
De modelprovider (Antropisch, OpenAI en andere) wordt ingesteld op agentniveau en bepaalt welke AAU-tarieven van toepassing zijn. Verschillende modellen hebben verschillende tarieven. Zie de AAU-tarieventabel voor actuele tarieven.
Welk model moet ik kiezen?
Claude Opus 4,6 heeft hogere AAU-tarieven, maar produceert doorgaans grondiger onderzoek met minder redeneringsstappen. Voor complexe incidentonderzoeken en hoofdoorzaakanalyse bereikt Opus vaak een conclusie in minder hulpprogramma-aanroepen, wat de hogere snelheid per token kan compenseren.
GPT-modellen zijn een goede keuze voor eenvoudigere taken met een hoog volume, zoals geplande nalevingscontroles, waarbij kostenefficiëntie belangrijker is dan diepte. U kunt uw modelprovider op elk gewenst moment wijzigen inDe basisbeginselen van > en resultaten vergelijken.
Worden er kosten in rekening gebracht wanneer de agent wacht totdat ik reageer?
Nee. Alleen de tijd die de agent actief besteedt aan het verwerken van een taak, telt als actieve stroom. Als de agent om uw goedkeuring vraagt en wacht, wordt de wachttijd niet gefactureerd.
Wat telt als actieve stroom?
Telkens wanneer de agent actief werk uitvoert, telt het werk als actieve stroom, zoals de volgende voorbeelden:
- Interactieve prompts: een gebruiker die de agent een vraag stelt in de chat.
- Automatisering: Geplande taken, incidentresponsplannen of andere geautomatiseerde triggers.
- Asynchrone bewerkingen: achtergrondonderzoeken, rapportgeneratie of hersteltaken.
In alle gevallen meet de agent de geconsumeerde tokens als AAUs.
Wat gebeurt er als ik mijn agent stop?
Een gestopte agent kan uw resources niet controleren of reageren op prompts, maar er worden nog steeds vaste always-on-kosten in rekening gebracht. Actieve flow-AAUs worden niet verbruikt terwijl ze zijn gestopt. Als u uw agent wilt stoppen, gaat u naar>Basisinstellingen en selecteert u Stoppen. Als u wilt hervatten, selecteert u Start op dezelfde pagina. Als u alle facturering volledig wilt stoppen, verwijdert u de agent.
Kan één agent meerdere werkbelastingen verwerken?
Ja. Eén agent kan meerdere resources bewaken binnen het geconfigureerde bereik. Het consolideren van workloads onder één agent vermindert always-on-kosten vergeleken met het implementeren van afzonderlijke agents.
Is er een gratis niveau?
Nee. De kosten voor de Azure SRE-agent beginnen bij de aanmaak van de agent. Zie de Azure-prijscalculator voor actuele tarieven.
Zijn de prijzen in alle regio's hetzelfde?
Raadpleeg de Azure-prijscalculator voor actuele prijzen in uw regio.