Omvandla strukturerade filer till Delta-tabeller

Använd genvägstransformeringar för att konvertera strukturerade filer till frågebara Delta-tabeller. Om dina källdata redan är i tabellformat som CSV, Parquet, JSON eller Excel kopierar och konverterar filtransformeringar automatiskt dessa data till Delta Lake-format så att du kan köra frågor mot dem med hjälp av SQL, Spark eller Power BI utan att skapa ETL-pipelines.

Ostrukturerade textfiler som behöver AI-bearbetning som sammanfattning, översättning eller attitydanalys finns i Genvägstransformeringar (AI-baserade).

Genvägstransformeringar är alltid synkroniserade med källdata. Fabric Spark-beräkning kör omvandlingen och kopierar data som refereras av en OneLake-genväg till en hanterad Delta-tabell. Med automatisk schemahantering, fördjupade utplattningsfunktioner och stöd för flera komprimeringsformat förenklar enkla transformationsprocesser skapandet och underhållet av ETL-pipelines genom att eliminera komplexiteten.

Varför ska du använda genvägstransformeringar?

  • Automatisk konvertering – Fabric kopierar och omvandlar källfiler till Delta-format utan manuell pipelineorkestrering.
  • Frekvent synkronisering – Fabric avsöker genvägen varannan minut och synkroniserar ändringar.
  • Rekursiv mappidentifiering – Systemet traverserar automatiskt undermappar för att upptäcka och transformera filer i hela katalogstrukturen.
  • Delta Lake-utdata – den resulterande tabellen är kompatibel med alla Apache Spark-motorer.
  • Ärvd styrning – Genvägen ärver OneLake-ursprung, behörigheter och Microsoft Purview-principer.

Förutsättningar

Krav Detaljer
Microsoft Fabric-artikelnummer Kapacitet eller testversion som stöder arbetsbelastningar för Lakehouse.
Källdata En mapp som innehåller homogena CSV-, Parquet-, JSON- eller Excel-filer.
Roll i arbetsyta Bidragsgivare eller högre.

Filformat som stöds

Genvägstransformeringar fungerar med mappar från alla datakällor som stöds av OneLake-genvägar.

Källfilformat Tillägg som stöds Komprimeringstyper som stöds Genvägstyp som stöds Notes
CSV (UTF-8, UTF-16) .csv, .txt (avgränsare), .tsv (tabbavgränsad), .psv (röravgränsad) .csv.gz, .csv.bz2 Genväg för tabell .csv.zip och .csv.snappy stöds inte.
Parquet .parquet .parquet.snappy, .parquet.gzip, .parquet.lz4, .parquet.brotli, .parquet.zstd Genväg för tabell Ingen.
JSON .json, .jsonl, .ndjson .json.gz, .json.bz2, .jsonl.gz, .ndjson.gz, .jsonl.bz2, .ndjson.bz2 Genväg för tabell .json.zip och .json.snappy stöds inte.
Excel .xlsx, .xls Ej tillämpligt Genväg till tabell eller schema Tabellgenvägar kombinerar blad till en Delta-tabell. Schemagenvägar skapar en Delta-tabell per blad. .xls (äldre binärt format) stöds på bästa sätt. .xlsx är det rekommenderade formatet.

Anmärkning

Excel-filtransformeringar är för närvarande i förhandsversion. CSV-, Parquet- och JSON-transformeringar är allmänt tillgängliga.

Skapa en tabellgenväg med datatransformering

En tabellgenväg skapar en Delta-tabell i mappen Tabeller i ett lakehouse. Använd den för att transformera CSV-, Parquet-, JSON- eller Excel-filer.

För Excel-filer med flera blad kombinerar en tabellgenväg de markerade bladen till en Delta-tabell. Om du behöver en Delta-tabell per blad skapar du en schemagenväg i stället.

  1. Högerklicka på ett schema under mappen Tabeller i lakehouse och välj sedan Genväg till Ny tabell. Välj din genvägskälla, till exempel Azure Data Lake, Azure Blob Storage, Dataverse, Amazon S3, GCP, SharePoint eller OneDrive.

    Skärmbild som visar hur du skapar

  2. Välj mappen med dina CSV-, Parquet- eller JSON-filer eller välj mappen som innehåller dina .xlsx filer.

  3. I steget Transformera konfigurerar du inställningarna för Delta-konverteringen:

    • CSV-filer:

      • Avgränsare – Välj det tecken som används för att avgränsa kolumner, till exempel kommatecken, semikolon, pipe, tab, ampersand eller blanksteg.
      • Första raden som rubriker – Anger om den första raden innehåller kolumnnamn.
    • Excel-filer:

      • Första raden som rubriker – Anger om den första raden innehåller kolumnnamn.
      • Blad som ska inkluderas – Markera alla blad eller bara en delmängd av bladen. Du kan välja blad efter namn, index eller med hjälp av jokerteckenmönster (till exempel Sales_* matchar blad som Sales_Q1 och Sales_2026). Jokerteckenmatchning är inte skiftlägeskänslig.
  4. Granska genvägskonfigurationen. I steget Förhandsgranskningsgenvägar kan du också konfigurera de här inställningarna innan du väljer Skapa:

    • Genvägsnamn – Välj pennikonen för att redigera genvägsnamnet.
    • Inkludera undermappar – Aktivera rekursiv bearbetning av filer i kapslade underkataloger. Det här alternativet är valt som standard för nya transformeringar. Avmarkera kryssrutan om du bara vill bearbeta mappen på den översta nivån.
  5. Spåra uppdateringar och visa loggar i Hantera hubben för genvägsövervakning.

Fabric Spark-beräkning skapar Delta-tabellen och visar förloppet i fönstret Hantera genväg .

För Excel-filer innehåller __filepath__ den resulterande Delta-tabellen och __sheetname__ metadatakolumner så att du kan spåra varje rad tillbaka till källfilen och bladet.

Skapa en schemagenväg med datatransformering

En schemagenväg skapar flera Delta-tabeller som visas under ett nytt schema i mappen Tabeller i ett lakehouse. Använd den när en Excel-arbetsbok har flera blad och du vill ha en Delta-tabell per blad.

Schemagenvägar med datatransformering är för närvarande endast tillgängliga för Excel-filer (.xlsx). De kräver också ett sjöhus med scheman aktiverade. Mer information finns i Lakehouse-scheman.

  1. Högerklicka på mappen Tabeller i lakehouse och välj sedan Genväg till Nytt schema.

    Skärmbild som visar hur du skapar

  2. Välj datakällan för den här genvägen och navigera till mappen som innehåller dina .xlsx filer.

  3. I steget Transformera konfigurerar du inställningarna för Delta-konverteringen:

    • Första raden som rubriker – Anger om den första raden innehåller kolumnnamn.
    • Blad som ska inkluderas – Markera alla blad eller bara en delmängd av bladen. Du kan välja blad efter namn, index eller genom att använda jokertecken.

    Skärmbild som visar transformeringsalternativ för en schemagenväg.

  4. Granska genvägskonfigurationen. I steget Förhandsgranskningsgenvägar kan du också konfigurera de här inställningarna innan du väljer Skapa:

    • Genvägsnamn – Välj pennikonen för att redigera genvägsnamnet.
    • Inkludera undermappar – Aktivera rekursiv bearbetning av filer i kapslade underkataloger. Det här alternativet är valt som standard för nya transformeringar. Avmarkera kryssrutan om du bara vill bearbeta mappen på den översta nivån.
  5. Spåra uppdateringar och visa loggar i Hantera hubben för genvägsövervakning.

Fabric Spark-beräkning skapar separata Delta-tabeller för de markerade bladen och håller dem synkroniserade med källfilerna. Bladnamnen saneras automatiskt till giltiga tabellnamn. Ett blad med namnet Sales Data (Q1) blir Sales_Data_Q1till exempel .

Så här fungerar synkronisering

Efter den första inläsningen beräknar Fabric Spark:

  • Avsöker genvägsmålet varje två minuter.
  • Identifierar nya eller ändrade filer och lägger till eller skriver över rader i enlighet med detta.
  • Identifierar borttagna filer och tar bort motsvarande rader.

När stöd för undermappar är aktiverat identifierar och bearbetar systemet rekursivt filer över alla kapslade underkataloger i målmappen.

Övervaka och felsöka

Genvägstransformeringar omfattar övervakning och felhantering som hjälper dig att spåra inmatningsstatus och diagnostisera problem.

  1. Öppna lakehouse och högerklicka på genvägen som matar omvandlingen.

  2. Välj Hantera genväg.

  3. I informationsfönstret kan du visa:

    • Status – Senaste genomsökningsresultat och aktuellt synkroniseringstillstånd.

    • Uppdateringshistorik – kronologisk lista över synkroniseringsåtgärder med radantal och eventuell felinformation.

    • Inkludera undermappar – Anger om undermappstransformering är aktiverad (Ja eller Nej).

      Skärmbild som visar

  4. Visa mer information i loggar för felsökning.

    Skärmbild som visar hur du får åtkomst till loggfilen för att felsöka.

Begränsningar

Följande begränsningar gäller för närvarande för genvägstransformeringar.

Allmänna begränsningar

  • Källformat: CSV-, JSON-, Parquet- och Excel-filer stöds.
  • Konsekvens för filschema: Filer måste ha ett identiskt schema.
  • Tillgänglighet för arbetsyta: Endast tillgängligt i Lakehouse-objekt (inte datalager eller KQL-databaser).
  • Skrivåtgärder: Transformeringar är läsoptimerade. Direkta MERGE INTO eller DELETE-instruktioner i måltabellen stöds inte.
  • Tillgänglighet för schemagenvägar: Schemagenvägar för filtransformeringar stöder endast Excel-filer.

CSV-begränsningar

  • Datatyper som inte stöds: Kolumner med blandade datatyper, Timestamp_Nanos, komplexa logiska typer – MAP/LIST/STRUCT, Raw binary.

Parquet-begränsningar

  • Datatyper som inte stöds: Timestamp_nanos, Decimal med INT32/INT64, INT96, Ej tilldelade heltalstyper – UINT_8/UINT_16/UINT_64, Komplexa logiska typer – MAP/LIST/STRUCT.

JSON-begränsningar

  • Datatyper som inte stöds: Blandade datatyper i en matris, binära rawblobar i JSON Timestamp_Nanos.
  • Utplattad matrisdatatyp: Matrisdatatypen behålls i Delta-tabellen och är tillgänglig med Spark SQL och PySpark. För ytterligare omvandlingar använder du Fabric Materialized Lake Views för silverskiktet.
  • Utplattande djup: Kapslade strukturer planas ut upp till fem nivåer djupt. Djupare kapsling kräver förbearbetning.

Excel-begränsningar

  • Cellområde: Data läses alltid från cell A1. Arbetsböcker där data börjar i en annan cell eller använder namngivna tabeller eller intervall kan inte riktas.
  • Hoppa över rader: Rubrikbanderoller, metadataingresser och sidfotssammanfattningar ovanför eller under faktiska data kan inte uteslutas. De matas in som datarader.
  • Schemainferens: Schemainferens är alltid aktiverat för Excel-filer. Identifierare med inledande nollor (till exempel postnummer som 02134 eller medarbetar-ID:er som 001245) konverteras till heltal, vilket tar bort de inledande nollorna.
  • Dolda blad: Alla blad, inklusive dolda blad och systemblad, bearbetas om de inte uttryckligen filtreras efter namn eller index.
  • Valutaformatering: Valutaformaterade celler (till exempel $1,234.56) konverteras till vanliga numeriska värden. Valutasymbolen tas bort.
  • Känslighetsetiketter: Arbetsböcker med Microsoft Purview-känslighetsetiketter kan inte bearbetas.
  • Skadade rader: Excel-läsaren stöder inte skadad postisolering. Skadade eller typomatchade rader i ett blad kan inte åtskiljas och loggas separat.
  • Bladgräns: Filer med fler än 25 blad hoppas över.
  • Äldre format:.xls (äldre binärt format) stöds på bästa sätt och kan ha minskad återgivning för komplex formatering. .xlsx är det rekommenderade formatet.
  • Formelutvärdering: Spark läser det cachelagrade värdet för formelceller. Om arbetsboken inte sparades med beräknade värden kan formelcellerna verka tomma eller inaktuella.

Begränsningar för undermappar

  • Endast tillgängligt för nya transformeringar. Befintliga transformeringar kan inte aktivera stöd för undermappar.
  • När stöd för undermappar har aktiverats kan det inte inaktiveras.
  • Genvägar som finns i målmappen följs inte. Endast fysiska mappar och filer bearbetas.
  • Selektiv inkludering eller exkludering av specifika undermappar stöds inte.
  • Kapslade mappar fungerar inte med SharePoint-genvägar.

Använd bloggen för infrastrukturöversikt och infrastrukturuppdateringar för att lära dig mer om nya funktioner och versioner.

Städa upp

Om du vill stoppa synkroniseringen tar du bort genvägstransformeringen från Lakehouse Explorer.

Om du tar bort omvandlingen tas inte de underliggande filerna bort.