Implementera medaljong-arkitektur med materialiserade sjövyer

Den här självstudien beskriver hur du implementerar en medallionarkitektur med materialiserade vyer i en Fabric-lakehouse. I slutet skapar du ett automatiserat datatransformeringsflöde från brons till silver till guldskikt. Den här självstudien är inte en referensarkitektur, en fullständig funktionsguide eller en föreskriven rekommendation för bästa praxis.

Förutsättningar

Slutför följande förutsättningar innan du börjar:

  1. Logga in på ditt Power BI-konto eller registrera dig för en utvärderingsversion om du inte har något.
  2. Aktivera Microsoft Fabric i din klientorganisation.
  3. Skapa en Fabric-aktiverad arbetsyta.
  4. Skapa ett Lakehouse med scheman aktiverade och ge det namnet SalesLakehouse.

De här förutsättningarna används i den här handledningen: arbetsytan och SalesLakehouse krävs i stegen brons, silver och guldskikt samt i schemaläggning och övervakning.

Scenarioöversikt

I den här självstudien används en fiktiv detaljhandelsorganisation, Contoso, som exempelscenario. Contoso organiserar försäljningsdata i en medaljongarkitektur för att förbättra analysresultaten genom att separera data i bronsskikt (råa), silver (rensade och berikade) och guldskikt (aggregerade och analyserade).

Följande diagram representerar olika entiteter i varje lager av medaljongarkitektur i SalesLakehouse:

Skärmbild som visar medaljongarkitektur.

Viktiga entiteter i scenariot

Följande entiteter motsvarar de entiteter som visas i arkitekturdiagrammet medallion i föregående avsnitt.

  • Beställningar: Den här entiteten innehåller information om varje kundorder, till exempel orderdatum, leveransinformation, produktkategori och underkategori. Insikter kan dras för att optimera leveransstrategier, identifiera populära produktkategorier och förbättra orderhantering.

  • Försäljning: Genom att analysera försäljningsdata kan Contoso utvärdera viktiga mått som totala intäkter, vinstmarginaler, orderprioriteringar och rabatter. Korrelationer mellan dessa faktorer ger en tydligare förståelse för kundernas köpbeteenden och effektiviteten i rabattstrategier.

  • Plats: Detta fångar den geografiska dimensionen av försäljning och beställningar, inklusive städer, delstater, regioner och kundsegment. Det hjälper Contoso att identifiera högpresterande regioner, hantera lågpresterande områden och anpassa strategier för specifika kundsegment.

  • Agent: Med information om agenter som hanterar transaktioner, deras provisioner och försäljningsdata kan Contoso utvärdera enskilda agentprestanda, uppmuntra toppmodeller och utforma effektiva provisionsstrukturer.

  • Agentprovisioner: Genom att införliva provisionsdata säkerställs transparens och bättre kostnadshantering. Att förstå korrelationen mellan provisioner och agentprestanda hjälper till att förfina incitamentssystem.

Exempeldata och anteckningsböcker

I den här handledningen används en exempeldatauppgiftsuppsättning från Fabric samples repo. Ladda ned den fullständiga tutorial mappen innan du fortsätter.

Du använder dessa tillgångar för att bygga bronsskiktet först och sedan skapa silver- och guldmaterialiserade sjövyer.

Den nedladdade tutorial mappen innehåller:

  • CSV-mappar: agent, agent_commissions, location, ordersoch sales.
  • Notebook-fil: Notebook.

Skapa medallion-dataflödet

I det här avsnittet skapar du brons-, silver- och guldskikten för medaljongarkitekturen i SalesLakehouse. Dessa lager definierar det ursprungsbaserade dataflödet för dina materialiserade sjövyer.

Stegen på hög nivå är följande:

  1. Bronsskikt: Mata in rådata i form av CSV-filer till lakehouse. Se Skapa bronsskikt av medaljongarkitektur för försäljningsanalys.
  2. Silver- och guldlager: Rensa data och kurera data för analys och rapportering med materialiserade sjövyer. Se Skapa silver- och guldskikt av medaljongarkitektur.

Senare i den här självstudien schemalägger du uppdatering för det här dataflödet så att det körs automatiskt.

Skapa bronsskikt av medaljongarkitektur för försäljningsanalys

I det här avsnittet skapar du bronsskiktet genom att ladda upp innehållet i den nedladdade tutorial mappen till SalesLakehouse. Dessa filer motsvarar de entiteter som beskrevs tidigare i denna handledning.

  1. Öppna SalesLakehouse på arbetsytan och gå till avsnittet Filer .

  2. Ladda upp innehållet i den nedladdade tutorial mappen och bevara mappstrukturen:

    • agent
    • agent_commissions
    • location
    • orders
    • sales

    Efter uppladdningen skapas en mapp med namnet tutorial under Filer och den innehåller dessa undermappar.

  3. Skapa sedan en genväg till den från avsnittet Tabeller . Välj ... bredvid avsnittet Tabeller och välj Ny schemagenväg och sedan Microsoft OneLake. Välj SalesLakehouse från datakälltyperna. Expandera avsnittet Filer och välj självstudiemappen och välj Skapa. Du kan också använda andra alternativ för att hämta data till Lakehouse.

    Skärmbild som visar hur du skapar en genväg för att hämta data till tabeller.

  4. I avsnittet Tabeller byter du namn på självstudiemappen till brons.

Skapa silver- och guldskikt av medaljongarkitektur

  1. Ladda upp tutorial filen till din arbetsyta från den nedladdade Notebook mappen.

    Skärmbild som visar skapandet av en silverfärgad sjöutsikt.

  2. Öppna den uppladdade anteckningsboken från SalesLakehouse. Mer information finns i Utforska lakehouse-data med en notebook.

  3. Kör alla notebook-celler med Hjälp av Spark SQL för att skapa materialiserade sjövyer med datakvalitetsbegränsningar.

  4. När alla celler har körts uppdaterar du SalesLakehouse för att visa de nya materialiserade sjövyerna under silver - och guldschemana .

    Skärmbild som visar körningsanteckningsboken.

Schemalägg uppdatering

  1. I SalesLakehouse öppnar du fliken Materialiserade vyer över sjön och väljer Hantera för att öppna linjen.

    Ursprungsvyn visar det autogenererade beroendediagrammet, där varje beroende materialiserad sjövy visas som en nod.

    Skärmbild som visar skapande av härkomst.

  2. Välj Schemalägg i menyfliksområdet och välj sedan Nytt schema i schemafönstret.

  3. Aktivera schemat, ange ett namn och välj de materialiserade sjövyer som ska uppdateras.

  4. Ange schemafrekvensen och välj sedan Använd.

  5. Om du vill köra schemat direkt väljer du Kör enligt det skapade schemat.

    Skärmbild som visar hur du skapar schemat.

Övervaka och felsöka

  1. På fliken Senaste körningar granskar du körningsstatusar .

  2. Välj ett Körnings-ID för att öppna information för den körningen.

    Skärmbild som visar de senaste körningarna.

  3. På fliken Körningsdetaljer, granska detaljeringspanelen till höger och aktivitetsfältet längst ner för exekveringsstatus.

  4. Välj en materialiserad lagervy-nod i stamlinjen för att se utförandedetaljer, dess ABFS-sökväg och en länk till detaljerade loggar.

  5. Om nodstatusen misslyckades granskar du det felmeddelande som visas.

    Skärmbild som visar körningsinformation.

  6. Välj Detaljerade loggar för att öppna Monitor Hub och granska Spark-felloggar.

    Skärmbild som visar Spark-loggar.

  7. Välj fliken Datakvalitetsrapport i materialiserade sjövyer för att skapa eller visa en automatiskt genererad datakvalitetsrapport.