Aangepaste live-pools in Microsoft Fabric

Van toepassing op:✅ Fabric Data Engineering en Data Science

Aangepaste livepools zijn vooraf opgewarmde Spark-clusters die direct sessies opstarten voor notebook-gebaseerde workloads in Microsoft Fabric. In plaats van te wachten op het inrichten van clusters bij elke uitvoering, zorgen aangepaste livepools ervoor dat clusters warm blijven tijdens een geconfigureerd schema-venster, waardoor sessiebegintijden van vijf seconden mogelijk worden gemaakt voor uw interactieve en geplande notebooks.

Waarom aangepaste livepools gebruiken

Voor Standaard Spark-sessies in Fabric is het inrichten van clusters vereist telkens wanneer een sessie wordt gestart. Voor teams die notebooks vaak uitvoeren (interactief, gepland of door een pijplijn geactiveerd), kan deze provisietijd iteratiecycli vertragen en de totale joblatentie verhogen.

Aangepaste livepools pakken dit probleem aan door:

  • Clusters vooraf klaarmaken op basis van een door de gebruiker gedefinieerd schema, zodat de computing capaciteit gereed is wanneer workloads binnenkomen.
  • Het toestaan van nauwkeurige controle over het aantal clusters dat warm blijft en de omgeving die wordt gebruikt voor bibliotheekconfiguratie.
  • Consistente prestaties bij het starten (~5 seconden) voor alle ondersteunde notitiebloksessietypen tijdens het geplande venster.

Aangepaste live-pools vormen een aanvulling op de bestaande starterspool en aangepaste Spark-poolopties in Fabric:

Compute-optie Opstarttijd Op basis van een planning Aangepaste bibliotheken Ondersteunde workloads
Starter Pools 5 tot 10 seconden (zonder codebibliotheken) No No Notitieboekjes, SJD
Aangepaste Spark-pools ~1 min. No Via systeemomgeving Notitieboekjes, SJD
Aangepaste livepools ~5 seconden tot 10 seconden (na hydratatie is voltooid) Ja Via omgeving Alleen notebooks (interactief en geprogrammeerd)

belangrijke concepten

In de volgende concepten wordt uitgelegd hoe aangepaste livepools werken, waaronder hoe clusters worden voorbereid, wanneer ze beschikbaar zijn en hoe capaciteit en bibliotheekconfiguratie worden beheerd.

Hydratatie en opwarmen

Wanneer u een aangepaste livepool maakt en publiceert, begint Fabric met het hydrateren van clusters voor het geplande tijdsvenster. Hydratatie betekent dat clusters volledig zijn ingericht, geconfigureerd met de gekoppelde omgeving en warm worden gehouden totdat een sessieaanvraag binnenkomt.

De opstarttijd van ~5 seconden is alleen beschikbaar nadat het zwembad volledig is gehydrateerd. Tijdens de eerste installatie of direct na een configuratiewijziging kunnen sessies langere opstarttijden ervaren terwijl hydratatie is voltooid. Zie Hydration duurt langer dan verwacht voor het oplossen van problemen.

Planningen

Elke aangepaste livepool vereist een schema dat definieert wanneer de pool actief is. Clusters worden alleen warm gehouden tijdens het geplande venster en facturering vindt alleen plaats terwijl clusters worden toegewezen. Wanneer het schema verloopt of een cluster inactief is voorbij de geconfigureerde drempelwaarde, dealloceert Fabric het en stopt de facturering.

Plan uw schema's om zo aan de verwachte werklastvensters te voldoen, zodat beschikbare rekenkracht beschikbaar is wanneer uw team het nodig heeft. Zie Een livepool configureren voor configuratiestappen en aanbevolen procedures.

Omgevingsbijlage

Elke aangepaste livepool is gekoppeld aan een Fabric-omgeving. De omgeving bepaalt welke bibliotheken vooraf zijn geïnstalleerd op gehydrateerde clusters. Als u bibliotheken wilt bijwerken, moet u de omgeving wijzigen en opnieuw publiceren. Bestaande gehydrateerde clusters worden niet bijgewerkt met de nieuwe bibliotheken totdat de volgende geplande hydratatie plaatsvindt of er een handmatige vernieuwing wordt uitgevoerd. Zie Een livepool configureren voor configuratiestappen.

Publicatiemethoden voor bibliotheken

De bibliotheekpublicatiemodus in de gekoppelde omgeving bepaalt hoe bibliotheken aan gehydrateerde clusters worden geleverd.

  • Volledige modus: Bibliotheken worden opgelost en geïntegreerd in de gehydrateerde cluster-image tijdens het publiceren van de omgeving. Wanneer een sessie wordt gestart, is de momentopname in de volledige modus al aanwezig in het cluster, wat sessies met een opstarttijd van ongeveer 5 seconden mogelijk maakt. Gebruik de volledige modus wanneer u een stabiele, reproduceerbare bibliotheekset nodig hebt met het snelst mogelijke sessie opstarten.
  • Snelle modus: bibliotheken zijn niet vooraf geïnstalleerd op gehydrateerde clusters. In plaats daarvan worden ze geïnstalleerd wanneer de notebooksessie wordt gestart. Gehydrateerde clusters bieden nog steeds snelle rekentoewijzing, maar de installatie van bibliotheken bij de start van de sessie kost extra tijd. Gebruik de snelle modus voor snelle iteratie tijdens de ontwikkeling wanneer bibliotheekstabiliteit minder kritiek is.

Opmerking

De Resources-map voor notitieblokken en de installaties van inlinebibliotheken (zoals %pip install in een codecel) zijn handmatige benaderingen per sessie. Ze zijn onafhankelijk van de omgevingspublicatiemodus en hebben geen invloed op welke bibliotheken vooraf zijn geïnstalleerd op gehydrateerde clusters.

Clustercapaciteit

Elke pool heeft een maximumaantal clusters dat u tijdens de configuratie hebt ingesteld. Fabric schaalt de pool niet automatisch buiten deze waarde. Als alle gehydrateerde clusters in gebruik zijn, schakelen extra taken over op provisioning op aanvraag, wat ongeveer 3 tot 5 minuten of langer duurt, afhankelijk van bibliotheekpakketafhankelijkheden. Zie Clustergrootte voor richtlijnen over het dimensioneren.

Ondersteunde workloads

Aangepaste livepools ondersteunen de volgende spark-sessietypen op basis van notebooks:

  • Interactieve notebooks draaien vanuit de Fabric-portal
  • Geplande notebookuitvoeringen die zijn geconfigureerd in de notebook scheduler
  • Notebook-uitvoeringen die worden geactiveerd door pijplijnen

Opmerking

Spark-taakdefinities (batches) worden niet ondersteund in de huidige versie van aangepaste live-pools.

Capaciteit en licenties

Voor aangepaste livepools is een betaalde SKU voor Microsoft Fabric-capaciteit vereist. Fabric-evaluatiemogelijkheden worden momenteel niet ondersteund.

Zie De concepten en licenties van Microsoft Fabric voor meer informatie over beschikbare capaciteits-SKU's.

Toegangsbeheer

Werkruimteroltoewijzingen beheren de toegang tot aangepaste configuratie en status van de live pool.

Rol toestemmingen
Viewer of lid Alleen lezen toegang tot de poolstatus en -configuratie
admin Volledige configuratie, opslaan en publiceren van machtigingen

B2B-gastgebruikers moeten een expliciete werkruimterol krijgen toegewezen om te communiceren met aangepaste livepools.

Beperkingen

De volgende beperkingen zijn van toepassing op aangepaste livepools in de huidige release:

  • Sessies beginnen pas in ~5 seconden nadat het zwembad volledig is gehydrateerd. Tijdens de eerste installatie of nadat u de configuratie hebt gewijzigd, kunnen opstarttijden langer zijn.
  • Bij bibliotheekwijzigingen moet de gekoppelde omgeving opnieuw gepubliceerd worden. Gehydrateerde clusters worden niet automatisch vernieuwd.
  • Wanneer de gekoppelde omgeving de snelle modus voor sommige bibliotheken gebruikt, worden deze bibliotheken niet vooraf geïnstalleerd op gehydrateerde clusters en moeten ze worden geïnstalleerd bij het starten van de sessie. Gebruik voor de snelste sessie-opstart met aangepaste live-pools de Volledige modus voor de afhankelijkheden van uw bibliotheek.
  • Alleen Spark-sessies op basis van notebooks worden ondersteund. Spark-taakdefinities worden niet ondersteund.
  • Fabric-proefcapaciteiten worden niet ondersteund.
  • Elke pool moet een planning hebben. Pools zonder schema kunnen niet worden gepubliceerd.
  • Aangepaste livepools kunnen niet worden beheerd via openbare API's van de omgeving of CI/CD-pijplijnen. De configuratie moet worden uitgevoerd via de Fabric-portal.