Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Verwenden Sie Verknüpfungstransformationen, um strukturierte Dateien in abfragbare Delta-Tabellen zu konvertieren. Wenn Sich Ihre Quelldaten bereits in einem tabellarischen Format wie CSV, Parkett, JSON oder Excel befinden, kopieren und konvertieren Dateitransformationen diese Daten automatisch in das Delta Lake-Format, sodass Sie sie mithilfe von SQL, Spark oder Power BI abfragen können, ohne ETL-Pipelines zu erstellen.
Informationen zu unstrukturierten Textdateien, die KI-Verarbeitung benötigen, z. B. Zusammenfassungs-, Übersetzungs- oder Stimmungsanalyse, finden Sie unter Shortcut Transformations (AI-powered).
Verknüpfungstransformationen bleiben immer mit den Quelldaten synchronisiert. Fabric Spark compute führt die Transformation durch und kopiert die von einer OneLake-Verknüpfung referenzierten Daten in eine verwaltete Delta-Tabelle. Mit der automatischen Schemabehandlung, tiefgehenden Entflachungskapazitäten und Unterstützung für mehrere Komprimierungsformate reduzieren Abkürzungstransformationen die Komplexität des Erstellens und Verwaltens von ETL-Pipelines.
Gründe für die Verwendung von Kurzweg-Transformationen
- Automatische Konvertierung – Fabric kopiert und konvertiert Quelldateien ohne manuelle Pipeline-Orchestrierung in das Delta-Format.
- Häufige Synchronisierung – Fabric fragt die Verknüpfung alle zwei Minuten einmal ab und synchronisiert Änderungen.
- Rekursive Ordnerermittlung – Fabric durchläuft automatisch Unterordner, um Dateien in der gesamten Verzeichnishierarchie zu erkennen und zu transformieren.
- Delta Lake-Ausgabe – Die resultierende Tabelle ist mit jedem Apache Spark-Modul kompatibel.
- Geerbte Governance – Die Verknüpfung erbt OneLake-Abstammung, Berechtigungen und Microsoft-Purview-Richtlinien.
Voraussetzungen
| Anforderung | Einzelheiten |
|---|---|
| Microsoft Fabric-SKU | Kapazität oder Testversion, die Lakehouse-Workloads unterstützt. |
| Ursprungsdaten | Ein Ordner, der homogene CSV-, Parkett-, JSON- oder Excel-Dateien enthält. |
| Rolle im Arbeitsbereich | Mitwirkender oder höher. |
Unterstützte Dateiformate
Verknüpfungstransformationen funktionieren mit Ordnern aus einer beliebigen Datenquelle, die von OneLake-Verknüpfungen unterstützt wird.
| Quelldateiformat | Unterstützte Erweiterungen | Unterstützte Komprimierungstypen | Unterstützter Verknüpfungstyp | Hinweise |
|---|---|---|---|---|
| CSV (UTF-8, UTF-16) |
.csv, .txt (Trennzeichen), .tsv (durch Tabulatoren getrennt), .psv (durch Pipe getrennt) |
.csv.gz, .csv.bz2 |
Tabellenkurzbefehl |
.csv.zip und .csv.snappy werden nicht unterstützt. |
| Parquet | .parquet |
.parquet.snappy, , .parquet.gzip.parquet.lz4, , .parquet.brotli.parquet.zstd |
Tabellenkurzbefehl | Keiner. |
| JSON |
.json, .jsonl.ndjson |
.json.gz, , .json.bz2.jsonl.gz, .ndjson.gz, , .jsonl.bz2.ndjson.bz2 |
Tabellenkurzbefehl |
.json.zip und .json.snappy werden nicht unterstützt. |
| Excel |
.xlsx, .xls |
Nicht anwendbar | Tabellenverknüpfung oder Schemaverknüpfung | Abkürzungen für Tabellen kombinieren Blätter in einer Delta-Tabelle. Schema-Kurzbefehle erstellen eine Delta-Tabelle pro Blatt.
.xls (Altes Binärformat) wird nach dem Best-Effort-Prinzip unterstützt; .xlsx ist das empfohlene Format. |
Hinweis
Excel-Dateitransformationen befinden sich derzeit in der Vorschau. CSV-, Parkett- und JSON-Transformationen sind allgemein verfügbar.
Erstellen einer Tabellenverknüpfung mit Datentransformation
Eine Tabellenverknüpfung erstellt eine Delta-Tabelle im Ordner "Tabellen " eines Seehauses. Verwenden Sie sie zum Transformieren von CSV-, Parkett-, JSON- oder Excel-Dateien.
Bei Excel-Dateien mit mehreren Blättern kombiniert eine Tabellenverknüpfung die ausgewählten Blätter in einer Delta-Tabelle. Wenn Sie eine Delta-Tabelle pro Blatt benötigen, erstellen Sie stattdessen eine Schemaverknüpfung .
Klicken Sie in Ihrem Lakehouse mit der rechten Maustaste auf ein Schema unter dem Ordner "Tabellen", und wählen Sie dann "Neue Tabellenverknüpfung erstellen" aus. Wählen Sie Ihre Verknüpfungsquelle aus, z. B. Azure Data Lake, Azure Blob Storage, Dataverse, Amazon S3, GCP, SharePoint oder OneDrive.
Wählen Sie den Ordner mit Ihren CSV-, Parkett- oder JSON-Dateien aus, oder wählen Sie den Ordner aus, der Ihre .xlsx Dateien enthält.
Konfigurieren Sie im Schritt "Transformieren " die Einstellungen für die Delta-Konvertierung:
CSV-Dateien:
- Trennzeichen – Wählen Sie das Zeichen aus, das zum Trennen von Spalten verwendet wird, z. B. Komma, Semikolon, Pipe, Tabstopp, Und-Zeichen oder Leerzeichen.
- Erste Zeile als Kopfzeile – Gibt an, ob die erste Zeile Spaltennamen enthält.
Excel-Dateien:
- Erste Zeile als Kopfzeile – Gibt an, ob die erste Zeile Spaltennamen enthält.
-
Einzuschließende Blätter – Wählen Sie alle Blätter oder nur eine Teilmenge von Blättern aus. Sie können Blätter anhand des Namens, nach Index oder mithilfe von Wildcardmustern auswählen (z.B.
Sales_*passt zu Blättern wieSales_Q1undSales_2026). Bei einem Wildcardabgleich wird die Groß-/Kleinschreibung nicht beachtet.
Überprüfen Sie die Shortcut-Konfiguration. Im Schritt "Vorschauverknüpfungen " können Sie diese Einstellungen auch konfigurieren, bevor Sie "Erstellen" auswählen:
- Verknüpfungsname – Wählen Sie das Bleistiftsymbol aus, um den Verknüpfungsnamen zu bearbeiten.
- Unterordner einschließen – Aktivieren der rekursiven Verarbeitung von Dateien in geschachtelten Unterverzeichnissen. Diese Option ist für neue Transformationen standardmäßig aktiviert. Deaktivieren Sie das Kontrollkästchen, wenn Sie nur den Ordner der obersten Ebene verarbeiten möchten.
Aktualisierungen nachverfolgen und Protokolle anzeigen im Hub „Verknüpfungsüberwachung verwalten“.
Fabric Spark Compute erstellt die Delta-Tabelle und zeigt den Fortschritt im Verknüpfungsverwaltungsbereich an.
Für Excel-Dateien enthält die resultierende Delta-Tabelle die __filepath__- und __sheetname__-Metadatenspalten, sodass Sie jede Zeile wieder auf die Quelldatei und das Blatt zurückverfolgen können.
Schema-Verknüpfung mit Datentransformation erstellen
Eine Schemaverknüpfung erstellt mehrere Delta-Tabellen, die unter einem neuen Schema im Tabellen-Ordner eines Lakehouses angezeigt werden. Verwenden Sie sie, wenn eine Excel-Arbeitsmappe über mehrere Blätter verfügt und Sie eine Delta-Tabelle pro Blatt benötigen.
Schemaverknüpfungen mit Datentransformation sind derzeit nur für Excel-Dateien (.xlsx) verfügbar. Außerdem ist ein Seehaus mit aktivierten Schemas erforderlich. Weitere Informationen finden Sie unter Lakehouse-Schemas.
Klicken Sie in Ihrem Lakehouse mit der rechten Maustaste auf den Ordner Tabellen und wählen Sie dann Neue Schema-Verknüpfung aus.
Wählen Sie die Datenquelle für diese Verknüpfung aus, und navigieren Sie zu dem Ordner, der Ihre
.xlsxDateien enthält.Konfigurieren Sie im Schritt "Transformieren " die Einstellungen für die Delta-Konvertierung:
- Erste Zeile als Kopfzeile – Gibt an, ob die erste Zeile Spaltennamen enthält.
- Einzuschließende Blätter – Wählen Sie alle Blätter oder nur eine Teilmenge von Blättern aus. Sie können Blätter anhand des Namens, nach Index oder mithilfe von Wildcardmustern auswählen.
Überprüfen Sie die Shortcut-Konfiguration. Im Schritt "Vorschauverknüpfungen " können Sie diese Einstellungen auch konfigurieren, bevor Sie "Erstellen" auswählen:
- Verknüpfungsname – Wählen Sie das Bleistiftsymbol aus, um den Verknüpfungsnamen zu bearbeiten.
- Unterordner einschließen – Aktivieren der rekursiven Verarbeitung von Dateien in geschachtelten Unterverzeichnissen. Diese Option ist für neue Transformationen standardmäßig aktiviert. Deaktivieren Sie das Kontrollkästchen, wenn Sie nur den Ordner der obersten Ebene verarbeiten möchten.
Aktualisierungen nachverfolgen und Protokolle anzeigen im Hub „Verknüpfungsüberwachung verwalten“.
Fabric Spark-Compute erstellt separate Delta-Tabellen für die ausgewählten Blätter und hält sie mit den Quelldateien synchronisiert. Blattnamen werden automatisch in gültige Tabellennamen saniert. Beispielsweise wird ein Blatt namens Sales Data (Q1) zu Sales_Data_Q1.
Funktionsweise der Synchronisierung
Nach dem anfänglichen Laden berechnet Fabric Spark:
- Fragt das Verknüpfungsziel alle zwei Minuten ab.
- Erkennt neue oder geänderte Dateien und fügt Zeilen entsprechend an oder überschreibt sie.
- Erkennt gelöschte Dateien und entfernt entsprechende Zeilen.
Wenn die Unterstützung des Unterordners aktiviert ist, ermittelt und verarbeitet das System Dateien in allen geschachtelten Unterverzeichnissen innerhalb des Zielordners rekursiv.
Überwachen und Probleme beheben
Abkürzungstransformationen umfassen Überwachung und Fehlerbehandlung, um den Aufnahmestatus nachzuverfolgen und Probleme zu diagnostizieren.
Öffnen Sie das Seehaus, und klicken Sie mit der rechten Maustaste auf die Verknüpfung, die Ihre Transformation einfüttert.
Wählen Sie "Verknüpfung verwalten" aus.
Im Detailbereich können Sie Folgendes anzeigen:
Status – Letztes Scanergebnis und aktueller Synchronisierungsstatus.
Aktualisierungsverlauf – Chronologische Liste der Synchronisierungsvorgänge mit Zeilenanzahl und allen Fehlerdetails.
Unterordner einschließen – Gibt an, ob die Unterordnertransformation aktiviert ist (Ja oder Nein).
Sehen Sie in den Protokollen weitere Details zur Fehlerbehebung an.
Einschränkungen
Die folgenden Einschränkungen gelten derzeit für Verknüpfungstransformationen.
Allgemeine Einschränkungen
- Quellformat: CSV-, JSON-, Parkett- und Excel-Dateien werden unterstützt.
- Dateischemakonsistenz: Dateien müssen ein identisches Schema gemeinsam nutzen.
- Verfügbarkeit des Arbeitsbereichs: Verfügbar nur in Lakehouse-Objekten (nicht in Data Warehouses oder KQL-Datenbanken).
- Schreibvorgänge: Transformationen sind leseoptimiert. Direkte MERGE INTO- und DELETE-Anweisungen auf der Transformationszieltabelle werden nicht unterstützt.
- Verfügbarkeit von Schemaverknüpfungen: Schemaverknüpfungen für Dateitransformationen unterstützen nur Excel-Dateien.
CSV-Einschränkungen
- Nicht unterstützte Datentypen: Gemischte Datentypspalten, Timestamp_Nanos, komplexe logische Typen – MAP/LIST/STRUCT, Raw binary.
Parquet-Beschränkungen
- Nicht unterstützte Datentypen: Timestamp_nanos, Dezimalzahl mit INT32/INT64, INT96, Nicht zugewiesene Ganzzahltypen - UINT_8/UINT_16/UINT_64, Komplexe logische Typen - MAP/LIST/STRUCT.
JSON-Einschränkungen
- Nicht unterstützte Datentypen: Gemischte Datentypen in einem Array, unformatierte binäre Blobs in JSON Timestamp_Nanos.
- Flachung des Arraydatentyps: Der Arraydatentyp wird in der Delta-Tabelle aufbewahrt und kann mit Spark SQL und PySpark zugänglich sein. Verwenden Sie für weitere Transformationen fabric Materialized Lake Views für die Silberschicht.
- Flachungstiefe: Geschachtelte Strukturen werden bis zu fünf Ebenen tief abgeflacht. Für eine tiefere Schachtelung ist eine Vorverarbeitung erforderlich.
Einschränkungen in Excel
- Zellbereich: Daten werden immer ab Zelle A1 gelesen. Arbeitsmappen, in denen Daten in einer anderen Zelle beginnen oder benannte Tabellen oder Bereiche verwenden, können nicht gezielt sein.
- Zeilen überspringen: Titelbanner, Metadatenvorschrift und Fußzeilenzusammenfassungen oberhalb oder unterhalb der tatsächlichen Daten können nicht ausgeschlossen werden. Sie werden als Datenzeilen eingelesen.
-
Schema-Ableitung: Die Schemareferenz ist für Excel-Dateien immer aktiviert. Bezeichner mit führenden Nullen (z. B. Postleitzahlen wie
02134Mitarbeiter-IDs)001245werden in ganze Zahlen konvertiert, wodurch die führenden Nullen entfernt werden. - Ausgeblendete Blätter: Alle Blätter, einschließlich ausgeblendeter und Systemblätter, werden verarbeitet, es sei denn, sie werden explizit nach Name oder Index gefiltert.
-
Währungsformatierung: Währungsformatierte Zellen (z
$1,234.56. B. ) werden in einfache numerische Werte konvertiert. Das Währungssymbol wird entfernt. - Vertraulichkeitsbezeichnungen: Arbeitsmappen mit Microsoft Purview-Vertraulichkeitsbezeichnungen können nicht verarbeitet werden.
- Beschädigte Zeilen: Der Excel-Reader unterstützt keine beschädigte Datensatzisolation. Beschädigte oder mit Typkonflikten behaftete Zeilen innerhalb eines Blatts können nicht gesondert isoliert und protokolliert werden.
- Blattgrenzwert: Dateien mit mehr als 25 Blättern werden übersprungen.
-
Legacy-Format:
.xls(Legacy-Binärformat) wird auf best-effort-Basis unterstützt und kann bei komplexen Formatierungen eine reduzierte Genauigkeit aufweisen..xlsxist das empfohlene Format. - Formelauswertung: Spark liest den zwischengespeicherten Wert von Formelzellen vor. Wenn die Arbeitsmappe nicht mit berechneten Werten gespeichert wurde, werden Formelzellen möglicherweise leer oder veraltet angezeigt.
Einschränkungen des Unterordners
- Nur für neue Transformationen verfügbar. Bei vorhandenen Transformationen kann die Unterstützung für Unterordner nicht aktiviert werden.
- Nachdem die Unterordnerunterstützung aktiviert wurde, kann sie nicht mehr deaktiviert werden.
- Verknüpfungen, die im Zielordner geschachtelt sind, werden nicht befolgt. Nur physische Ordner und Dateien werden verarbeitet.
- Selektives Einschließen oder Ausschließen bestimmter Unterordner wird nicht unterstützt.
- Geschachtelte Ordner funktionieren nicht mit SharePoint-Verknüpfungen.
Verwenden Sie den Fabric-Roadmap - und Fabric-Updates-Blog , um mehr über neue Features und Versionen zu erfahren.
Aufräumen
Um die Synchronisierung zu beenden, löschen Sie die Verknüpfungstransformation aus Lakehouse Explorer.
Durch das Löschen der Transformation werden die zugrunde liegenden Dateien nicht entfernt.