Autoscaling

Viktigt!

Lakebase Autoscaling är den senaste versionen av Lakebase, med automatisk skalningsberäkning, skalning till noll, förgrening och omedelbar återställning. Information om regioner som stöds finns i Regiontillgänglighet. Om du är en Lakebase Provisioned-användare kan du läsa Lakebase Provisioned.

Autoskalning justerar dynamiskt mängden beräkningsresurser som allokerats till dina Lakebase-beräkningar som svar på aktuella arbetsbelastningskrav. Eftersom programmet upplever varierande aktivitetsnivåer under dagen ökar automatisk skalning automatiskt beräkningskapaciteten under hög användning och minskar den under tystare perioder, vilket eliminerar behovet av manuella åtgärder.

Den här visualiseringen visar hur automatisk skalning fungerar under en vanlig dag, med beräkningsresurser som skalas upp eller ned baserat på efterfrågan för att säkerställa att databasen har de resurser den behöver samtidigt som resurser bevaras under tider med låg belastning.

Visualisering av automatisk skalning

Autoskalning fungerar inom ett användardefinierat intervall. Du kan till exempel ställa in en beräkning för att skala mellan 2 och 8 beräkningsenheter (CU), där varje CU ger 2 GB RAM-minne. Din beräkning justeras automatiskt inom dessa gränser baserat på arbetsbelastning, och sjunker aldrig under det lägsta eller högsta värdet oavsett efterfrågan. Autoskalning är tillgängligt för beräkningsenheter upp till 32 CU.

Anmärkning

Lakebase Provisioned vs Autoscaling: I Lakebase Provisioned allokerade varje beräkningsenhet cirka 16 GB RAM-minne. I Lakebase Autoscaling allokerar varje CU 2 GB RAM-minne. Den här ändringen ger mer detaljerade skalningsalternativ och kostnadskontroll.

Så här fungerar automatisk skalning

Automatisk resursjustering

När du aktiverar automatisk skalning och anger dina minsta och högsta beräkningsstorlekar övervakar Lakebase kontinuerligt din arbetsbelastning och justerar resurserna automatiskt. Systemet spårar tre viktiga mått för att fatta skalningsbeslut:

  • CPU-belastning: Övervakar processoranvändningen för att säkerställa att databasen har tillräcklig bearbetningskraft.
  • Minnesanvändning: Spårar RAM-förbrukning för att förhindra minnesbegränsningar.
  • Storlek på arbetsuppsättning: Beräknar dina data som används ofta för att optimera cacheprestanda.

Baserat på dessa mått skalar Lakebase upp din beräkning när efterfrågan ökar och skalas ned när aktiviteten minskar, samtidigt som den håller sig inom ditt konfigurerade intervall.

Skalningsgränser

Du definierar skalningsintervallet genom att ange minsta och högsta beräkningsstorlekar. Det här intervallet innehåller:

  • Prestandagarantier: Minimivärdet garanterar baslinjeprestanda även under låg aktivitet.
  • Kostnadskontroll: Maxvärdet förhindrar obundna resursförbrukningar och kostnader.
  • Automatisk optimering: Inom dessa gränser hanterar Lakebase alla skalningsbeslut.

Skillnaden mellan ditt högsta och lägsta får inte överstiga 16 CU (det vill: max - min ≤ 16 CU).

Ingen stilleståndstid eller manuella åtgärder

Autoskalningsjusteringar inom ditt konfigurerade intervall sker utan att beräkningsomstarter eller anslutningsavbrott krävs. Om du ändrar den lägsta eller högsta CU-konfigurationen kan det dock leda till ett kort avbrott i aktiva anslutningar. När systemet har konfigurerats fungerar det självständigt, så att du kan fokusera på dina program i stället för infrastrukturhantering.

Fördelar med automatisk skalning

Kostnadseffektivitet: Du betalar bara för de beräkningsresurser som du faktiskt använder. Under låg belastning skalas din beräkning ned, vilket minskar kostnaderna. Under perioder med hög belastning skalas den upp för att upprätthålla prestanda.

Prestandaoptimering: Databasen tar automatiskt emot ytterligare resurser när arbetsbelastningen ökar, vilket förhindrar prestandaförsämring vid trafiktoppar eller intensiva åtgärder.

Förutsägbara kostnader: Genom att ange en maximal beräkningsstorlek kontrollerar du den övre gränsen för dina beräkningskostnader, vilket förhindrar oväntade utgifter från skenande resursförbrukning.

Förenklade åtgärder: Autoskalning eliminerar behovet av att manuellt övervaka arbetsbelastningsmönster och justera beräkningsstorlekar, vilket minskar driftkostnaderna och risken för mänskliga fel.

Konfigurera automatisk skalning

Automatisk skalningskonfiguration kräver att du anger gränser för minsta och högsta beräkningsstorlek. Autoskalning är tillgängligt för beräkningsenheter upp till 32 CU. För arbetsbelastningar som kräver mer än 32 CU finns större beräkningsenheter av fast storlek från 36 CU till 112 CU tillgängliga.

Detaljerade anvisningar om hur du aktiverar och konfigurerar automatisk skalning finns i Hantera beräkningar.

Vanliga scenarier för autoskalning

AI-agent och programarbetsbelastningar

AI-agenter och interaktiva program som bygger på Databricks upplever ofta mönster för varierande begäranden. Automatisk skalning säkerställer att databasen hanterar trafiktoppar under aktiva användarsessioner samtidigt som kostnaderna minskas under tysta perioder.

Mer information om hur du ansluter Lakebase med Databricks AI- och programtjänster finns i Databricks-integreringar.

Utvecklings- och testmiljöer

Utvecklingsgrenar för testning av schemaändringar eller validering av datapipelines har oftast sporadisk aktivitet. Automatisk skalning minimerar resurser under inaktiva perioder samtidigt som lämpliga prestanda säkerställs under aktiv utveckling.

Kundriktade instrumentpaneler och program

Program som levererar analys- eller driftinsikter till slutanvändare har ofta användningsmönster för tid på dagen. Automatisk skalning justerar automatiskt resurser så att de matchar användaraktiviteten under dagen.

Autoskalning och skala till noll

Autoskalning fungerar i kombination med skalning till noll. Automatisk skalning justerar resurser baserat på efterfrågan på arbetsbelastning, men skala till noll pausar en beräkning helt efter en period av inaktivitet, vilket minskar beräkningskostnaderna till noll under inaktiva perioder.

När du konfigurerar båda funktionerna:

  1. Aktiv period: Automatisk skalning justerar beräkningsstorleken baserat på arbetsbelastningen inom ditt definierade intervall.
  2. Inaktivitetsperiod: Efter timeouten för skalning till noll suspenderas beräkningen helt.
  3. Återupptagen aktivitet: Beräkningen startas om med minsta storlek för automatisk skalning när nya frågor tas emot.

Den här kombinationen maximerar kostnadseffektiviteten, särskilt för utvecklings-, testnings- eller mellanlagringsmiljöer som upplever långa inaktiva perioder.

Automatisk skalning och hög tillgänglighet

Autoskalning stöds för slutpunkter med hög tillgänglighet. CU-storleksjusteringar gäller enhetligt för alla beräkningsnoder i en konfiguration med hög tillgänglighet – autoskalningsintervallet som du konfigurerar gäller för den primära noden och alla sekundära noder tillsammans.

Två begränsningar gäller när automatisk skalning kombineras med hög tillgänglighet:

  • Sekundära noder kan inte skalas under den primära CU-storleken. Detta säkerställer att sekundärerna alltid är redo att ta över som primära utan ett prestandagap efter befordran.
  • Skala till noll är inte tillgängligt för beräkningar i en konfiguration med hög tillgänglighet. Om du vill minska kostnaderna under perioder av inaktivitet kan du överväga att använda skala ner till noll på grenar som inte är HA-grenar i stället.

Nästa steg