Capaciteit van een Azure API Management-exemplaar

VAN TOEPASSING OP: Ontwikkelaar | Basic | Basic v2 | Standaard | Standard v2 | Premium | Premium v2

API Management biedt metrische gegevens van Azure Monitor om het gebruik van systeemcapaciteit te detecteren, u te helpen bij het oplossen van gatewayproblemen en het nemen van weloverwogen beslissingen of u een API Management-exemplaar wilt schalen of upgraden om meer belasting mogelijk te maken.

In dit artikel worden de metrische capaciteitsgegevens uitgelegd en hoe ze zich gedragen, wordt uitgelegd hoe u metrische capaciteitsgegevens opent in Azure Portal en wordt voorgesteld wanneer u uw API Management-exemplaar kunt schalen of upgraden.

Belangrijk

In dit artikel wordt uitgelegd hoe u uw Azure API Management-exemplaar kunt bewaken en schalen op basis van metrische capaciteitsgegevens. Echter, wanneer een exemplaar zijn capaciteit bereikt, wordt het niet vertraagd om overbelasting te voorkomen. In plaats daarvan fungeert het als een overbelaste webserver: verhoogde latentie, verbroken verbindingen en time-outfouten. API-clients moeten klaar zijn om deze problemen op te lossen, net als bij andere externe services, bijvoorbeeld door beleid voor opnieuw proberen te gebruiken.

Aanbeveling

API-teams kunnen deze functie gebruiken in werkruimten. Werkruimten bieden geïsoleerde beheerderstoegang tot API's en hun eigen API-runtimeomgevingen.

Vereisten

Als u de stappen in dit artikel wilt volgen, moet u een API Management-exemplaar hebben in een van de lagen die ondersteuning bieden voor metrische capaciteitsgegevens. Zie Een Azure API Management-exemplaar maken voor meer informatie.

Metrische gegevens over beschikbare capaciteit

Er zijn verschillende metrische capaciteitsgegevens beschikbaar in de v2-servicelagen, klassieke lagen en werkruimtegateways.

In de v2-lagen zijn de volgende metrische gegevens beschikbaar:

  • CPU-percentage van gateway : het percentage CPU-capaciteit dat wordt gebruikt door de gateway-eenheden.

  • Geheugenpercentage van gateway : het percentage geheugencapaciteit dat wordt gebruikt door de gateway-eenheden.

Beschikbare aggregaties voor deze metrische gegevens zijn als volgt.

  • Gem : het gemiddelde percentage capaciteit dat wordt gebruikt voor gatewayprocessen in elke eenheid van een API Management-exemplaar.
  • Max : percentage capaciteit in gatewayproces met het grootste verbruik.

CPU- en geheugengebruik onthult het gebruik van bronnen door:

  • API Management-gegevensvlakservices, zoals aanvraagverwerking, zoals het doorsturen van aanvragen of het uitvoeren van een beleid.
  • Api Management-beheervlakservices, zoals beheeracties die worden toegepast via Azure Portal of Azure Resource Manager, of belasting die afkomstig is van de ontwikkelaarsportal.
  • Geselecteerde besturingssysteemprocessen, inclusief processen die kosten van TLS-handshakes voor nieuwe verbindingen met zich meebrengen.
  • Platformupdates, zoals besturingssysteemupdates voor de onderliggende rekenresources voor het exemplaar.
  • Het aantal geïmplementeerde API's, ongeacht de activiteit, die extra capaciteit kan verbruiken.

Gedrag van capaciteitsmetrieken

In de praktijk kunnen metrische gegevens over capaciteit worden beïnvloed door veel variabelen, bijvoorbeeld:

  • verbindingspatronen (nieuwe verbinding op een aanvraag versus het hergebruik van de bestaande verbinding)
  • grootte van een aanvraag en antwoord
  • beleid dat is geconfigureerd voor elke API of het aantal clients dat aanvragen verzendt.

Hoe complexere bewerkingen voor de aanvragen zijn, hoe hoger het capaciteitsverbruik is. Complexe transformatiebeleiden verbruiken bijvoorbeeld veel meer CPU dan een eenvoudig doorsturen van aanvragen. Trage reacties van back-endservices verhogen ook de responstijd.

Belangrijk

Metrische capaciteitsgegevens zijn geen directe metingen van het aantal aanvragen dat wordt verwerkt.

Capaciteitsmetriek pieken

Metrische capaciteitsgegevens kunnen ook af en toe pieken of groter zijn dan nul, zelfs als er geen aanvragen worden verwerkt. Het gebeurt vanwege systeem- of platformspecifieke acties en hoeft niet te worden overwogen bij het bepalen of een instantie moet worden geschaald.

Hoewel metrische capaciteitsgegevens zijn ontworpen om problemen met uw API Management-exemplaar (of werkruimtegateway) op te lossen, zijn er gevallen waarin problemen niet worden doorgevoerd in wijzigingen in deze metrische gegevens. Daarnaast betekent metrische gegevens met lage capaciteit niet noodzakelijkerwijs dat uw API Management-exemplaar geen problemen ondervindt.

Azure Portal gebruiken om metrische capaciteitsgegevens te onderzoeken

Krijg toegang tot metrische gegevens in de portal om te begrijpen hoeveel capaciteit in de loop van de tijd wordt gebruikt.

  1. Navigeer naar uw API Management-exemplaar in Azure Portal.
  2. Selecteer in het linkermenu onder Bewaking de optie Metrische gegevens.
  3. Selecteer het CPU-percentage van de gateway of het geheugenpercentage van de gateway uit de beschikbare metrische gegevens. Kies de standaardaggregatie Avg of selecteer de maximale aggregatie om het piekgebruik te bekijken.
  4. Kies een gewenste periode in de bovenste balk van de sectie.

Belangrijk

Momenteel verschijnt de Capaciteit metriek ook in de portal voor instanties in v2-tiers. Het wordt echter niet ondersteund voor gebruik in de v2-lagen en geeft een waarde van 0 weer.

Notitie

U kunt een waarschuwing voor metrische gegevens instellen om u te laten weten wanneer er iets onverwachts gebeurt. Ontvang bijvoorbeeld meldingen wanneer uw API Management-exemplaar de verwachte piek-CPU- of geheugengebruik gedurende meer dan 20 minuten heeft overschreden.

Capaciteit gebruiken voor schaalbeslissingen

Gebruik metrische capaciteitsgegevens om beslissingen te nemen of u een API Management-exemplaar (of werkruimtegateway) wilt schalen om meer belasting mogelijk te maken. Hier volgen algemene overwegingen:

  • Bekijk een langetermijntrend en een gemiddeld gemiddelde.
  • Negeer plotselinge pieken die waarschijnlijk niet zijn gerelateerd aan een toename van de belasting (zie de sectie Metrische capaciteitsgedrag voor uitleg).
  • Als algemene regel moet u uw exemplaar upgraden of schalen wanneer een metrische capaciteitswaarde langer is dan 60% - 70% gedurende een lange periode (bijvoorbeeld 30 minuten). Verschillende waarden werken mogelijk beter voor uw service of scenario.
  • Als uw exemplaar of werkruimtegateway is geconfigureerd met slechts één eenheid, upgrade of schaal deze wanneer een capaciteitsmetriek waarde gedurende een lange periode hoger is dan 40%. Deze aanbeveling is gebaseerd op de noodzaak om capaciteit te reserveren voor updates van gastbesturingssystemen in het onderliggende serviceplatform.
  • Gebruik beschikbare diagnostische gegevens om de reactietijden van API-aanroepen te bewaken. Overweeg de drempelwaarden voor schalen aan te passen als u verminderde reactietijden ziet met een toenemende waarde van de metrische capaciteitswaarde.
  • Voor klassieke lagen verwijdert u het meest recente gegevenspunt van 1 minuut bij het lezen van metrische gegevens over onbewerkte Azure API Management-capaciteit, omdat de afgeleide waarde ongeldig kan zijn als brongegevens niet beschikbaar zijn op het moment van aggregatie; baseer operationele of schaalbeslissingen niet op waarden van 1 minuut. Voor automatische schaalaanpassing worden de gemiddelde aggregatievensters van 30 minuten of langer gebruikt, worden er langdurige voorwaarden geëvalueerd voordat u schaalt en aantekeningen toevoegen aan dashboards om het laatste punt van 1 minuut uit te sluiten, zodat trends betrouwbare gegevens weerspiegelen.

Aanbeveling

Als u uw verkeer vooraf kunt schatten, test dan uw exemplaar van API Management of uw werkruimtegateway voor de verwachte workloads. U kunt de verzoekbelasting geleidelijk verhogen en de waarde van de capaciteitsmetriek bewaken die overeenkomt met uw piekbelasting. Volg de stappen uit de vorige sectie om Azure Portal te gebruiken om te begrijpen hoeveel capaciteit op een bepaald moment wordt gebruikt.

Belangrijk

Zorg ervoor dat u bij het definiëren van regels voor automatisch schalen voorkomt dat het automatisch schalen onstabiel wordt, waardoor een lus voor in- en uitschalen ontstaat. Voor meer informatie raden we aan de richtlijnen over flappen van Azure Monitor Autoscale te lezen.