Forstå datalagre i Fabric

Fullført

Nå som du forstår data warehouse-grunnprinsippene, la oss utforske hva Microsoft Fabric tilbyr for datavarehus.

Beskriv et Fabric-data warehouse

Et Fabric-data warehouse er en fullt administrert, bedriftsskala relasjonsdatabase bygget på OneLake. Den tilbyr fullstendige transaksjonelle T-SQL-funksjoner, inkludert DDL-setninger (CREATE, ALTER, DROP) og DML-setninger (INSERT, UPDATE, DELETE, MERGE), med full ACID-samsvar for datakonsistens.

Data lagres i åpen Delta-format på OneLake, noe som betyr at andre Fabric-arbeidsbelastninger kan access de samme dataene uten duplisering. Du bruker T-SQL til å lage tabeller, laste inn data, bygge visninger og lagrede prosedyrer, og utføre transformasjoner, alt innenfor en kjent SQL-opplevelse.

Viktige funksjoner omfatter følgende:

  • Full T-SQL-støtte - Skriv DDL- og DML-setninger, inkludert MERGE for upsert-scenarier, ved bruk av kjent SQL Server syntaks.
  • Fullt administrert – Ingen infrastruktur å konfigurere. Compute skalerer automatisk og uavhengig av storage.
  • OneLake-integrasjon – Lagerdata lagres i Delta-format og er tilgjengelig for andre Fabric-arbeidsbelastninger uten duplisering.
  • Cross-database-spørring – Søk data på tvers av varehus og lakehouses uten å kopiere data. Bruk tredelt navngivning (database.schema.table) for å koble warehouse-tabeller med lakehouse-tabeller i én enkelt spørring.
  • Kjente verktøy - Koble til SQL Server Management Studio (SSMS), Azure Data Studio eller en hvilken som helst SQL-klient via standard TDS-tilkoblinger.
  • Copilot assistance - Copilot for Data Warehouse genererer SQL-spørringer fra naturlig språk, gir kodefullføring mens du skriver, og kan forklare eller rette eksisterende spørringer i SQL-editoren.

Warehouse vs SQL-analyseendepunkt

Fabric-arbeidsområder kan inneholde to typer SQL-baserte elementer som tjener ulike formål.

Funksjonalitet Warehouse Endepunkt for SQL-analyse
Les data Ja Ja
Skriv data (SETT INN, OPPDATER, SLETT, SLÅ SAMMEN) Ja Nei
Opprett tabeller (DDL) Ja Nei
Opprett visninger og lagrede prosedyrer Ja Ja
Datakilde Native lagertabeller Lakehouse Delta-tabeller

Bruk et lager når du trenger fullstendige lese-/skrive-T-SQL-funksjoner. Bruk SQL analytics-endepunktet når du trenger skrivebeskyttet SQL-access til lakehouse-data.

Opprett et data warehouse

Du kan opprette en data warehouse i Fabric fra create hub eller innenfor en workspace. Etter å ha opprettet et tomt lager, kan du legge til tabeller, visninger og andre objekter.

Skjermbilde av Fabric UI med en pil som peker til create-huben.

Når lageret ditt er opprettet, kan du begynne å lage tabeller og laste inn data ved hjelp av SQL query editor i Fabric-portalen.

Ta inn data i et lager

Det finnes flere måter å laste data inn i et Fabric data warehouse på:

  • KOPIER INTO - Last inn data i bulk fra eksterne filer (CSV, Parquet) i Azure storage inn i lagertabeller.
  • OPENROWSET - Søk filer direkte fra eksterne storage- eller OneLake-lokasjoner for ad hoc-analyse eller inntasting, uten å opprette tabeller først.
  • Pipelines og Dataflows - Bruk Data Factory pipelines eller Dataflows Gen2 for orkestrert databevegelse og transformasjon.
  • Cross-database-spørringer – Søk i lakehouse-tabeller direkte fra lageret ved bruk av tredelt navngivning, uten å kopiere data.

Du kan bruke T-SQL-kommandoen COPY INTO for å laste inn data fra filer i bulk. For eksempel laster følgende setning data fra en CSV-fil inn i en tabell:

COPY INTO dbo.Region
FROM 'https://mystorageaccount.blob.core.windows.net/data/Region.csv'
WITH (
    FILE_TYPE = 'CSV',
    CREDENTIAL = (
        IDENTITY = 'Shared Access Signature',
        SECRET = 'xxx'
    ),
    FIRSTROW = 2
)
GO

Skjermbilde av SQL-query editor med en spørring open.

Tips

Hvis du har tabeller i et lakehouse som du vil spørre fra lageret ditt uten å gjøre endringer, bruk tverrdatabase-spørring i stedet. Du trenger ikke å kopiere dataene.

Lag tabeller og last inn data

Etter å ha opprettet et lager og valgt en inntastingsmetode, er neste steg å definere tabellene dine og laste inn data i dem.

Du lager tabeller ved hjelp av T-SQL-setninger CREATE TABLE . Definer kolonner med passende datatyper for analysearbeidsbelastninger.

CREATE TABLE dbo.DimCustomer
(
    CustomerKey INT NOT NULL,
    CustomerAltKey NVARCHAR(10) NOT NULL,
    CustomerName NVARCHAR(100) NOT NULL,
    Region NVARCHAR(50) NULL
);
GO

CREATE TABLE dbo.FactSales
(
    SalesKey INT NOT NULL,
    CustomerKey INT NOT NULL,
    ProductKey INT NOT NULL,
    DateKey INT NOT NULL,
    SalesAmount DECIMAL(10,2) NOT NULL,
    Quantity INT NOT NULL
);
GO

Velg datatyper som balanserer presisjon med storage-effektivitet. Bruk INT for nøkkelkolonner, NVARCHAR for tekst som kan inneholde spesialtegn, og DECIMAL for finansielle verdier som krever presisjon.

Bruk stagingtabeller for datainnlasting

Et vanlig mønster i datavarehus er å plassere rådata i staging-tabeller før de transformeres og lastes inn i endelige dimensjons- og faktatabeller. Staging tables speiler strukturen til kildedataene dine og fungerer som et midlertidig oppbevaringsområde.

Etter å ha lastet data inn i staging-tabeller med COPY INTO eller pipelines, transformerer og setter du det inn i dimensjonsmodellen din:

INSERT INTO dbo.FactSales (SalesKey, CustomerKey, ProductKey, DateKey, SalesAmount, Quantity)
SELECT
    s.OrderID,
    c.CustomerKey,
    p.ProductKey,
    d.DateKey,
    s.Amount,
    s.Qty
FROM dbo.StgSales AS s
INNER JOIN dbo.DimCustomer AS c ON s.CustomerID = c.CustomerAltKey
INNER JOIN dbo.DimProduct AS p ON s.ProductID = p.ProductAltKey
INNER JOIN dbo.DimDate AS d ON s.OrderDate = d.DateValue;
GO

Dette mønsteret holder kildedataene dine intakte mens du anvender forretningsregler og nøkkeloppslag under lasteprosessen.

Forstå tabellkloner

Du kan lage nullkopi-tabellkloner i et Fabric-data warehouse. Kloner kopierer tabellmetadata samtidig som de refererer til de samme underliggende datafilene i OneLake. Selve dataene er ikke duplisert, noe som holder storage-kostnadene lave.

Følgende kodeeksempel viser deg hvordan du lager en klone med T-SQL:

--Clone creation within the same schema
CREATE TABLE dbo.Employee AS CLONE OF dbo.EmployeeUSA;

Tabellkloner er nyttige for utvikling og testing, datagjenoppretting etter mislykket utgivelse, og bevaring av data på bestemte tidspunkter for historisk rapportering.

Tips

For mer informasjon, se tabellen Clone i dokumentasjonen Microsoft Fabric.

Nå som du forstår Fabrics lagerkapasiteter, la oss utforske hvordan du kan spørre og transformere dataene dine.