Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op:✅ Fabric Data Engineering en Data Science
Aangepaste livepools zijn vooraf gehydrateerde Spark-clusters die bijna direct opstarten van sessies bieden voor notebooks in Microsoft Fabric. In dit artikel wordt beschreven hoe u aangepaste livepools maakt, configureert en beheert voor optimale prestaties.
Vereiste voorwaarden
Voordat u aangepaste livegroepen instelt, moet u het volgende doen:
- Toegang tot een Microsoft Fabric-werkruimte met een betaalde Fabric-SKU (Fabric-proefcapaciteiten worden niet ondersteund)
- Beheerdersrol in de werkruimte
- Een actieve Fabric-capaciteit die is toegewezen aan uw werkruimte
- Een gepubliceerde Fabric-omgeving die moet worden gebruikt voor bibliotheekconfiguratie.
Belangrijk
Starterpools worden niet ondersteund voor aangepaste live-pools. Als uw werkruimte gebruikmaakt van een starterspool, moet u een aangepaste Spark-pool maken voordat u een aangepaste live-pool configureert.
Een aangepaste pool maken voor de livepool
Maak eerst een aangepaste Spark-pool. In een latere stap schakelt u de live pool-berekening voor deze pool in.
- Navigeer naar uw Fabric-werkruimte.
- Selecteer Werkruimte-instellingen op het startlint van de werkruimte.
- Vouw Data Engineering/Science uit en selecteer Spark-instellingen.
- Selecteer het tabblad Pool .
- Selecteer nieuwe pool in de vervolgkeuzelijst Standaardgroep voor werkruimte.
- Voer een naam in voor de pool. Dit is een unieke id voor de pool (bijvoorbeeld 'dev-team-pool' of 'prod-daily-analytics')
- Selecteer een knooppuntfamilie en knooppuntgrootte voor uw workload.
- Schakel het selectievakje Automatisch schalen in om automatisch schalen voor de pool in te schakelen.
- Stel de minimale knooppunten in op ten minste 2.
Een livepool configureren
Nadat u een aangepaste Spark-pool hebt gemaakt, schakelt u live pool berekenen in via de omgevingsinstellingen .
Open in uw Fabric-werkruimte de omgeving die u wilt koppelen aan een aangepaste live-pool.
Selecteer Compute in het linkerdeelvenster.
Selecteer de pool die u in de vorige stap hebt gemaakt in de vervolgkeuzelijst.
Selecteer onder live pool de optieknop om de live pool-computebronnen voor deze omgeving te activeren.
Selecteer onder Live pool schedule het keuzerondje om het in te schakelen. Alle aangepaste livepools moeten een schema hebben. Clusters worden alleen gehydrateerd binnen het geplande tijdvenster.
Geef de planningsinstellingen op:
- Of het schema terugkerend is
- Begin- en einddag en -tijd
- Tijdzone
- Wanneer de pool moet worden gedeactiveerd en opnieuw geactiveerd
- Andere instellingen, indien van toepassing
Belangrijk
Fabric maakt gebruik van standaard Spark-inrichting voor activiteiten buiten het geplande venster, met tragere opstarttijden. Clusters worden niet warm gehouden buiten het geplande tijdsvenster.
Zie Best practices plannen voor tips voor planning.
Sla de rekeninstellingen op.
Selecteer de knop Publiceren op het bovenste lint.
Nadat u de pool heeft gepubliceerd, is de pool actief en begint Fabric clusters te hydrateren vóór de volgende schema periode.
Opmerking
Het publiceren kan enkele minuten duren.
Voor wijzigingen in de omgeving moet de omgeving opnieuw worden gepubliceerd en gehydrateerde clusters worden bijgewerkt.
Poolstatus bewaken
De status van uw aangepaste live-pool controleren:
Open de bewakingshub in het Fabric-portaal.
Zoek de omgeving die u hebt gepubliceerd en selecteer het beletselteken (...) om het contextmenu te openen.
Selecteer Details weergeven.
Vouw in het rechterdeelvenster de live poolstatus uit om de huidige status van de live pool weer te geven.
De status van de livepool bevat details zoals:
- Poolstatus: bijvoorbeeld Actief, Hydrateren, Niet-actief of Gestopt
- Beschikbare clusters: Aantal clusters dat gereed is voor notebooksessies
- Bezet clusters: aantal clusters dat momenteel sessies uitvoert
- Volgend schema: Komende activiteiten
Beste praktijken
Bekijk de volgende aanbevolen procedures voor configuratie en beheer om optimaal gebruik te maken van aangepaste live-pools:
Optimaliseren voor kosten en prestaties
- Aantal afstemmen op de vraag: stel het maximumaantal clusters in op basis van verwachte gelijktijdige sessies. Overprovisioning verhoogt de kosten.
- Bewaak het gebruik: controleer regelmatig de metrische gegevens van de pool en pas indien nodig het aantal clusters aan.
- Schaal schema's efficiënt: vermijd overlappende schema's in meerdere pools, tenzij dat nodig is.
- Benut time-outs voor inactiviteit: stel de juiste time-outs voor inactiviteit in om een evenwicht te behouden tussen de beschikbaarheid van middelen en het vaak herstarten van clusters te voorkomen.
Grootte van cluster
Houd bij het configureren van uw pool rekening met de volgende instellingen en aanbevelingen:
- Clustergrootte: het aantal uitvoerders voor notebooksessies (bereik: 1-16).
- Maximum aantal clusters: het maximale aantal clusters dat gehydrateerd moet worden. Instellen op basis van verwachte gelijktijdige sessies.
- Time-out voor inactiviteit: hoe lang een ongebruikt cluster toegewezen blijft voordat Fabric het beëindigt.
| Werkbelastingtype | Aanbevolen grootte | Beschrijving |
|---|---|---|
| Verkennende analyse | 2-4 kernen | Lichte workloads, snelle gegevensverkenning |
| Gemiddelde rekenkracht | 8-12 kernen | Dagelijkse rapportage, middelgrote gegevenssets |
| Zware rekenkracht | 14-16 kernen | Grote gegevenssets, complexe transformaties |
Bibliotheekafhankelijkheden beheren
- Omgevingsgroepering gebruiken: installeer algemene bibliotheken vooraf in de omgeving in plaats van on-the-fly-installatie.
- Versiebeheer van de omgeving: Voor het bijwerken van een gekoppelde omgeving moeten gehydrateerde clusters opnieuw gepubliceerd en vernieuwd worden.
- Vernieuw gehydrateerde clusters: Nadat de omgeving is gewijzigd, vernieuw de pool of wacht tot de volgende geplande cyclus de wijzigingen toepast.
Aanpassen aan werkbelastingpatronen
- Extern gedrag bewaken: time-outs voor inactiviteit aanpassen op basis van werkelijke gebruikspatronen.
- Delen tussen sessies: Overweeg om dezelfde omgeving te delen in meerdere pools als u consistente workloadpatronen hebt om het resourcegebruik te verbeteren.
Best practices plannen
- Stem af op workloadpatronen: Plan werktijden wanneer uw team interactieve of geplande notebooks uitvoert.
- Buffertijd: Voeg 60-90 minuten voor verwacht gebruiksvensters toe om volledige hydratatie te garanderen.
- Houd rekening met tijdzones: als uw team meerdere tijdzones omvat, kunt u het schema uitbreiden om de vereiste tijdsbereiken te dekken.
Troubleshooting
Het oplossen van problemen met aangepaste livegroepen omvat het controleren van de poolstatus, de omgevingsstatus en de planningsconfiguratie, zoals wordt beschreven in de volgende scenario's:
Pool blijft niet beschikbaar
Als de pool niet kan worden geactiveerd of de status Niet beschikbaar wordt weergegeven:
- Controleer dat de Fabric-capaciteit actief is en momenteel aan de werkruimte is toegewezen.
- Controleer of de gekoppelde omgeving de status Gereed heeft.
- Zorg ervoor dat de gekoppelde omgeving is gepubliceerd en geen fouten bevat.
Hydratatie duurt langer dan verwacht
Als hydratatie langzamer is dan verwacht:
- Controleer de omgevingsafhankelijkheden en de buildstatus.
- Controleer of de omgeving de status Gereed heeft.
- Bewaak de pooldetails voor meer informatie.
Sessies of notitieblokken kunnen niet worden gestart
Als notebooksessies niet kunnen worden gestart, zelfs niet met een actieve pool:
- Controleer of de sessie de juiste omgeving gebruikt.
- Controleer of het zwembad de status Beschikbaar heeft en volledig gehydrateerd is.