Een opslagmodus kiezen

Voltooid

De eerste ontwerpbeslissing voor een semantisch model in Microsoft Fabric is hoe gegevens in het model stromen. De opslagmodus die u kiest, is van invloed op queryprestaties, gegevensversnissen en welke Fabric functies beschikbaar zijn. In Fabric is Direct Lake de standaardinstelling en voor de meeste workloads is dit de juiste keuze.

Direct Lakemodus

Direct Lake is de standaardopslagmodus voor semantische modellen die zijn gemaakt in Microsoft Fabric. In tegenstelling tot de importmodus kopieert Direct Lake geen gegevens naar het model. In tegenstelling tot DirectQuery worden query's niet omgezet in bron-SQL. In plaats daarvan leest Direct Lake Delta-tabellen rechtstreeks uit OneLake in het geheugen, waarbij de snelheid van importeren wordt gecombineerd met de versheid van DirectQuery.

Wanneer een gebruiker een rapport opent dat wordt ondersteund door een semantisch Direct Lake-model, laadt de engine kolomgegevens uit Delta Parquet-bestanden op aanvraag. U hoeft geen vernieuwing te plannen, zoals bij de importmodus. Wanneer de onderliggende Delta-tabellen worden bijgewerkt, weerspiegelt het model deze wijzigingen.

Direct Lake-modellen schakelen automatisch de opslagindeling voor grote semantische modellen in. Met deze instelling wordt de limiet van de modelgrootte van 10 GB opgeheven en is dit een vereiste voor zowel query scaleout als lees-/schrijftoegang tot het XMLA-eindpunt. U hoeft deze niet handmatig in te schakelen voor Direct Lake-modellen.

Opties voor Direct Lake-verbinding

Direct Lake-modellen kunnen via twee paden verbinding maken met gegevens:

  • OneLake-tabellen: het model maakt rechtstreeks verbinding met Delta-tabellen in een lakehouse of magazijn. Dit is het eenvoudigste pad en werkt goed wanneer uw gegevens zich in één Fabric gegevensarchief bevinden.
  • SQL Analytics-eindpunt: het model maakt verbinding via het SQL-eindpunt van een lakehouse of warehouse. Met dit pad hebt u toegang tot weergaven, query's tussen databases en beveiligingsfuncties die zijn gedefinieerd op de SQL-laag.

Kies OneLake-tabellen wanneer uw gegevens eenvoudig zijn en zich op één plaats bevinden. Kies het SQL-analyse-eindpunt wanneer u weergaven, cross-source joins of beveiliging op rijniveau nodig hebt die is gedefinieerd in SQL.

Fallbackgedrag

Sommige bewerkingen kunnen ertoe leiden dat een Direct Lake-model terugvalt naar de DirectQuery-modus. Complexe DAX-berekeningen, query's die het beschikbare geheugen overschrijden of bepaalde niet-ondersteunde bewerkingen activeren deze terugval. Wanneer er een terugval optreedt, wordt de query uitgevoerd op het SQL Analytics-eindpunt in plaats van Delta-bestanden rechtstreeks te lezen.

U kunt het terugvalgedrag configureren in de semantische modelinstellingen:

  • Terugval toestaan: query's die niet kunnen worden uitgevoerd in de Direct Lake-modus, vallen automatisch terug op DirectQuery. De gebruiker krijgt resultaten, maar de prestaties kunnen afnemen.
  • Geen terugval mogelijk: query's die niet kunnen worden uitgevoerd in de Direct Lake-modus, retourneren een fout. Deze optie dwingt consistente prestaties af, maar vereist dat alle query's binnen direct Lake-mogelijkheden blijven.

Voor de meeste productieworkloads, begin met terugval toestaan en controleer welke query's deze activeren. Optimaliseer vervolgens deze query's of gegevensstructuren om de terugvalfrequentie in de loop van de tijd te verminderen.

Modus Importeren

In de importmodus worden gegevens gekopieerd naar het semantische model en opgeslagen in een gecomprimeerde, in-memory formaat. Query's worden uitgevoerd op de lokale kopie, waardoor Import de snelste opslagmodus voor queryprestaties is. De gegevens zijn echter alleen zo actueel als de laatste vernieuwing.

De importmodus is de juiste keuze wanneer:

  • Uw gegevensbron bevindt zich buiten Fabric (on-premises databases, API's van derden, platte bestanden).
  • Queryprestaties zijn de hoogste prioriteit en bijna realtime versheid is niet vereist.
  • U hebt functies nodig die nog niet worden ondersteund in Direct Lake.

Tip

Wanneer u de importmodus gebruikt, maakt u verbinding met weergaven in plaats van onbewerkte tabellen, neemt u alleen de benodigde kolommen op en gebruikt u de juiste gegevenstypen om de modelgrootte te verkleinen. Meer informatie over technieken voor het verminderen van gegevens die in importmodellen zijn geladen.

DirectQuery modus

DirectQuery verzendt query's rechtstreeks naar de gegevensbron tijdens de query. Er worden geen gegevens opgeslagen in het model, waardoor DirectQuery geschikt is voor realtime gegevensscenario's en zeer grote gegevenssets die niet kunnen worden geïmporteerd.

Het compromis is prestaties. Elke rapportinteractie genereert een query tegen het bronsysteem. DirectQuery werkt het beste wanneer:

  • Realtimegegevens zijn vereist en zelfs korte vernieuwingsvertragingen zijn niet acceptabel.
  • Brongegevensvolumes zijn te groot om te importeren en de gegevensbron valt buiten Fabric.
  • Governancevereisten verplichten dat gegevens bij de bron blijven.

Tip

Zie richtlijnen voor DirectQuery-modellen voor meer informatie.

Samengestelde modus

De samengestelde modus combineert opslagmodi binnen één model. Sommige tabellen maken gebruik van Importeren, terwijl andere DirectQuery of Direct Lake gebruiken. Dit biedt flexibiliteit voor scenario's waarbij verschillende tabellen verschillende prestatie- en versheidsbehoeften hebben.

Een grote feitentabel kan bijvoorbeeld in Direct Lake blijven, terwijl een kleine referentietabel uit een externe bron gebruikmaakt van Importeren. De samengestelde modus maakt ook veel-op-veel-relaties mogelijk tussen tabellen uit verschillende gegevensbronnen.

Gebruik de samengestelde modus wanneer:

  • U hebt gegevens uit zowel Fabric als niet-Fabric bronnen in hetzelfde model nodig.
  • Voor sommige tabellen zijn realtimegegevens vereist, terwijl anderen profiteren van prestaties in de cache.
  • U moet Direct Lake-tabellen combineren met Import-tabellen voor kruislingse bronanalyse.

De juiste opslagmodus kiezen

De volgende tabel geeft een overzicht van wanneer u elke modus wilt kiezen:

Modus Gegevenslocatie Querysnelheid Versheid van gegevens Ideaal voor
Direct Lake OneLake (Delta-tabellen) Snel Bijna in realtime Fabric systeemeigen workloads (standaard)
Invoer Cache in model Snelst Verversingsafhankelijk Niet-Fabric bronnen, maximale prestaties
Directe Query Bronsysteem Afhankelijk van het bronsysteem Bijna in realtime Realtime vereisten, zeer grote externe gegevens
Composiet Mixed Varies Mixed Scenario's voor meerdere bronnen, hybride vereisten

De opslagmodus is ook van invloed op ai-verbruik. Wanneer Copilot of gegevensagenten een semantisch model opvragen, retourneren ze antwoorden op basis van de gegevens die het model momenteel weerspiegelt. De bijna realtime versheid van Direct Lake betekent dat AI-query's actuele resultaten retourneren zonder te wachten op een geplande vernieuwing. Voor modellen die zowel menselijke gebruikers als AI bedienen, heeft de keuze in de opslagmodus rechtstreeks invloed op de kwaliteit van beide ervaringen.

Begin in Fabric met Direct Lake. Ga alleen naar een andere modus wanneer uw specifieke scenario dit vereist.