Forstå datalagre i Fabric
Nå som du forstår data warehouse-grunnprinsippene, la oss utforske hva Microsoft Fabric tilbyr for datavarehus.
Beskriv et Fabric-data warehouse
Et Fabric-data warehouse er en fullt administrert, bedriftsskala relasjonsdatabase bygget på OneLake. Den tilbyr fullstendige transaksjonelle T-SQL-funksjoner, inkludert DDL-setninger (CREATE, ALTER, DROP) og DML-setninger (INSERT, UPDATE, DELETE, MERGE), med full ACID-samsvar for datakonsistens.
Data lagres i åpen Delta-format på OneLake, noe som betyr at andre Fabric-arbeidsbelastninger kan access de samme dataene uten duplisering. Du bruker T-SQL til å lage tabeller, laste inn data, bygge visninger og lagrede prosedyrer, og utføre transformasjoner, alt innenfor en kjent SQL-opplevelse.
Viktige funksjoner omfatter følgende:
- Full T-SQL-støtte - Skriv DDL- og DML-setninger, inkludert MERGE for upsert-scenarier, ved bruk av kjent SQL Server syntaks.
- Fullt administrert – Ingen infrastruktur å konfigurere. Compute skalerer automatisk og uavhengig av storage.
- OneLake-integrasjon – Lagerdata lagres i Delta-format og er tilgjengelig for andre Fabric-arbeidsbelastninger uten duplisering.
- Cross-database-spørring – Søk data på tvers av varehus og lakehouses uten å kopiere data. Bruk tredelt navngivning (database.schema.table) for å koble warehouse-tabeller med lakehouse-tabeller i én enkelt spørring.
- Kjente verktøy - Koble til SQL Server Management Studio (SSMS), Azure Data Studio eller en hvilken som helst SQL-klient via standard TDS-tilkoblinger.
- Copilot assistance - Copilot for Data Warehouse genererer SQL-spørringer fra naturlig språk, gir kodefullføring mens du skriver, og kan forklare eller rette eksisterende spørringer i SQL-editoren.
Warehouse vs SQL-analyseendepunkt
Fabric-arbeidsområder kan inneholde to typer SQL-baserte elementer som tjener ulike formål.
| Funksjonalitet | Warehouse | Endepunkt for SQL-analyse |
|---|---|---|
| Les data | Ja | Ja |
| Skriv data (SETT INN, OPPDATER, SLETT, SLÅ SAMMEN) | Ja | Nei |
| Opprett tabeller (DDL) | Ja | Nei |
| Opprett visninger og lagrede prosedyrer | Ja | Ja |
| Datakilde | Native lagertabeller | Lakehouse Delta-tabeller |
Bruk et lager når du trenger fullstendige lese-/skrive-T-SQL-funksjoner. Bruk SQL analytics-endepunktet når du trenger skrivebeskyttet SQL-access til lakehouse-data.
Opprett et data warehouse
Du kan opprette en data warehouse i Fabric fra create hub eller innenfor en workspace. Etter å ha opprettet et tomt lager, kan du legge til tabeller, visninger og andre objekter.
Når lageret ditt er opprettet, kan du begynne å lage tabeller og laste inn data ved hjelp av SQL query editor i Fabric-portalen.
Ta inn data i et lager
Det finnes flere måter å laste data inn i et Fabric data warehouse på:
- KOPIER INTO - Last inn data i bulk fra eksterne filer (CSV, Parquet) i Azure storage inn i lagertabeller.
- OPENROWSET - Søk filer direkte fra eksterne storage- eller OneLake-lokasjoner for ad hoc-analyse eller inntasting, uten å opprette tabeller først.
- Pipelines og Dataflows - Bruk Data Factory pipelines eller Dataflows Gen2 for orkestrert databevegelse og transformasjon.
- Cross-database-spørringer – Søk i lakehouse-tabeller direkte fra lageret ved bruk av tredelt navngivning, uten å kopiere data.
Du kan bruke T-SQL-kommandoen COPY INTO for å laste inn data fra filer i bulk. For eksempel laster følgende setning data fra en CSV-fil inn i en tabell:
COPY INTO dbo.Region
FROM 'https://mystorageaccount.blob.core.windows.net/data/Region.csv'
WITH (
FILE_TYPE = 'CSV',
CREDENTIAL = (
IDENTITY = 'Shared Access Signature',
SECRET = 'xxx'
),
FIRSTROW = 2
)
GO
Tips
Hvis du har tabeller i et lakehouse som du vil spørre fra lageret ditt uten å gjøre endringer, bruk tverrdatabase-spørring i stedet. Du trenger ikke å kopiere dataene.
Lag tabeller og last inn data
Etter å ha opprettet et lager og valgt en inntastingsmetode, er neste steg å definere tabellene dine og laste inn data i dem.
Du lager tabeller ved hjelp av T-SQL-setninger CREATE TABLE . Definer kolonner med passende datatyper for analysearbeidsbelastninger.
CREATE TABLE dbo.DimCustomer
(
CustomerKey INT NOT NULL,
CustomerAltKey NVARCHAR(10) NOT NULL,
CustomerName NVARCHAR(100) NOT NULL,
Region NVARCHAR(50) NULL
);
GO
CREATE TABLE dbo.FactSales
(
SalesKey INT NOT NULL,
CustomerKey INT NOT NULL,
ProductKey INT NOT NULL,
DateKey INT NOT NULL,
SalesAmount DECIMAL(10,2) NOT NULL,
Quantity INT NOT NULL
);
GO
Velg datatyper som balanserer presisjon med storage-effektivitet. Bruk INT for nøkkelkolonner, NVARCHAR for tekst som kan inneholde spesialtegn, og DECIMAL for finansielle verdier som krever presisjon.
Bruk stagingtabeller for datainnlasting
Et vanlig mønster i datavarehus er å plassere rådata i staging-tabeller før de transformeres og lastes inn i endelige dimensjons- og faktatabeller. Staging tables speiler strukturen til kildedataene dine og fungerer som et midlertidig oppbevaringsområde.
Etter å ha lastet data inn i staging-tabeller med COPY INTO eller pipelines, transformerer og setter du det inn i dimensjonsmodellen din:
INSERT INTO dbo.FactSales (SalesKey, CustomerKey, ProductKey, DateKey, SalesAmount, Quantity)
SELECT
s.OrderID,
c.CustomerKey,
p.ProductKey,
d.DateKey,
s.Amount,
s.Qty
FROM dbo.StgSales AS s
INNER JOIN dbo.DimCustomer AS c ON s.CustomerID = c.CustomerAltKey
INNER JOIN dbo.DimProduct AS p ON s.ProductID = p.ProductAltKey
INNER JOIN dbo.DimDate AS d ON s.OrderDate = d.DateValue;
GO
Dette mønsteret holder kildedataene dine intakte mens du anvender forretningsregler og nøkkeloppslag under lasteprosessen.
Forstå tabellkloner
Du kan lage nullkopi-tabellkloner i et Fabric-data warehouse. Kloner kopierer tabellmetadata samtidig som de refererer til de samme underliggende datafilene i OneLake. Selve dataene er ikke duplisert, noe som holder storage-kostnadene lave.
Følgende kodeeksempel viser deg hvordan du lager en klone med T-SQL:
--Clone creation within the same schema
CREATE TABLE dbo.Employee AS CLONE OF dbo.EmployeeUSA;
Tabellkloner er nyttige for utvikling og testing, datagjenoppretting etter mislykket utgivelse, og bevaring av data på bestemte tidspunkter for historisk rapportering.
Tips
For mer informasjon, se tabellen Clone i dokumentasjonen Microsoft Fabric.
Nå som du forstår Fabrics lagerkapasiteter, la oss utforske hvordan du kan spørre og transformere dataene dine.