Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Spiegelung in Fabric ist eine kostengünstige und latenzarme Lösung, die Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenführt. Sie können Ihre vorhandenen Datenbestände kontinuierlich direkt aus verschiedenen Azure-Datenbanken und externen Datenquellen in Fabrics OneLake replizieren.
Mit den aktuellsten Daten in einem abfragefähigen Format in OneLake können Sie alle verschiedenen Dienste in Fabric nutzen, wie zum Beispiel Analysen mit Spark auszuführen, Notebooks zu betreiben, Datenengineering durchzuführen, Visualisierungen mit Power BI-Berichten zu erstellen und vieles mehr.
Mithilfe von Mirroring in Fabric erhalten Sie ein hochgradig integriertes, end-to-End- und benutzerfreundliches Produkt, das Ihre Analyseanforderungen vereinfacht. Spiegelung wurde für Offenheit und Kooperation zwischen Microsoft und Technologielösungen entwickelt, die das Open-Source-Delta-Lake-Tabellenformat lesen können. Es ist eine kostengünstige schlüsselfertige Lösung mit geringer Latenz, die eine Kopie Ihrer Daten in OneLake für all Ihre analytischen Anforderungen erstellt.
Sie können die Delta-Tabellen überall in Fabric verwenden, wodurch Sie Ihren Weg zu Fabric beschleunigen können.
Sie aktivieren die Spiegelung, indem Sie eine sichere Verbindung zu Ihrer betrieblichen Datenquelle erstellen. Sie wählen aus, ob eine gesamte Datenbank oder einzelne Tabellen repliziert werden sollen, und die Spiegelung hält Ihre Daten automatisch synchron. Nach der Einrichtung replizieren Daten kontinuierlich in OneLake für Analysezwecke.
Gründe für die Verwendung von Spiegelung in Fabric
Heute verfügen viele Organisationen über unternehmenskritische betriebskritische oder analytische Daten, die in Silos sitzen.
Für den Zugriff und die Arbeit mit diesen Daten sind komplexe ETL-Pipelines (Extract Transform Load), Geschäftsprozesse und Entscheidungssilos erforderlich, wodurch Folgendes erstellt wird:
- Begrenzter und eingeschränkter Zugriff auf wichtige, sich ständig ändernde Daten
- Reibung zwischen Menschen, Prozessen und Technologien
- Lange Wartezeiten beim Erstellen von Pipelines und Prozessen zu kritisch wichtigen Daten.
- Keine Freiheit, die Tools zu verwenden, die Sie benötigen, um Einblicke bequem zu analysieren und freizugeben
- Fehlen einer geeigneten Grundlage für Menschen, um Daten zu teilen und gemeinsam daran zu arbeiten.
- Keine gängigen, offenen Datenformate für alle analytischen Szenarien – BI, AI, Integration, Engineering und sogar Apps
Die Spiegelung in Fabric bietet eine einfache Möglichkeit, um den Mehrwert von Erkenntnissen und Entscheidungen schneller zu realisieren und Datensilos zwischen technologischen Lösungen zu beseitigen.
- Nahezu echtzeitbasierte Duplizierung von Daten und Metadaten in einen SaaS-Datensee mit integrierten Analysewerkzeugen für BI und KI
Die Microsoft Fabric Plattform basiert auf einer Grundlage von Software as a Service (SaaS), die Einfachheit und Integration auf ein ganz neues Niveau erfordert. Weitere Informationen zu Microsoft Fabric finden Sie unter What is Microsoft Fabric?
Im Folgenden sind die Kernprinzipien von Mirroring aufgeführt.
Das Aktivieren von Spiegelung in Fabric ist einfach und intuitiv, ohne komplexe ETL-Pipelines erstellen zu müssen, andere Computeressourcen zuzuweisen oder Datenbewegungen zu verwalten.
Die Spiegelung in Fabric ist ein vollständig verwalteter Dienst, daher müssen Sie sich keine Gedanken über das Hosting, die Verwaltung oder die Replikation der gespiegelten Verbindung machen.
Spiegeln von Objekten
Die Spiegelung erstellt diese Elemente in Ihrem Fabric-Arbeitsbereich:
- Ein Prozess, der die Replikation von Daten und Metadaten in OneLake verwaltet und in das Parquet-Format konvertiert, das analysefähig ist. Dieser Prozess ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und vieles mehr.
- Ein SQL-Analyseendpunkt
Zusätzlich zum SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools, einschließlich SQL Server Management Studio (SSMS),der MSSQL-Erweiterung für Visual Studio Code und sogar GitHub Copilot.
Die Freigabe erleichtert die Steuerung des Zugriffs und der Verwaltung von Berechtigungen, sodass Sie vertrauliche Informationen schützen können. Das Teilen ermöglicht auch eine sichere und demokratische Entscheidungsfindung in Ihrer gesamten Organisation.
Spiegelungstypen
Microsoft Fabric bietet drei verschiedene Ansätze zum Integrieren von Daten in OneLake durch Spiegelung.
- Datenbankspiegelung – Datenbankspiegelung in Fabric repliziert ganze Datenbanken und Tabellen, um Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenzuführen.
- Metadatenspiegelung – Die Metadatenspiegelung in Fabric synchronisiert Metadaten (z. B. Katalognamen, Schemas und Tabellen), anstatt die Daten physisch zu verschieben. Bei diesem Ansatz werden Tastenkombinationen verwendet, um sicherzustellen, dass die Daten in ihrer Quelle verbleiben und gleichzeitig in Fabric leicht zugänglich sind.
- Offene Spiegelung – Open Mirroring in Fabric wurde entwickelt, um die Spiegelung basierend auf dem offenen Delta Lake-Tabellenformat zu erweitern. Mit dieser Funktion können Entwickler die Änderungsdaten ihrer Anwendung direkt in ein gespiegeltes Datenbankelement in Fabric schreiben, basierend auf dem offenen Spiegelungsansatz und öffentlichen APIs.
Derzeit sind die folgenden externen Datenbanken verfügbar:
Nahe Echtzeit-Replikation
Die Nahreplikation in Echtzeit kann von verschiedenen Faktoren abhängen, darunter:
- Standort oder Region der Quelle
- Standort oder Zielregion
- Umfang der Änderungen
- Häufigkeit der Änderungen
- Netzwerkbandbreite und Latenz von der Quelle
- Rechenressourcen, die dem vor Ort installierten Datengateway zugeordnet sind
Wie funktioniert die Datenbankspiegelung?
Delta-Dateien kommen inkrementell aus der Datenquelle in Fabric ein. Die Methode zum Identifizieren der inkrementellen geänderten Daten variiert in jeder Datenquelle. In SQL Server 2025 überprüft die SQL-Database Engine beispielsweise das Transaktionsprotokoll der Quelldatenbank mit hoher Häufigkeit. SQL Server veröffentlicht Änderungen für jede Tabelle in entsprechenden Dateien im Fabric-Landebereich.
Innerhalb von Fabric wird immer ein Replikatmodul ausgeführt und sucht nach neu veröffentlichten Dateien mit hoher Häufigkeit. Fabric integriert sofort eingehende Änderungen in der Zieldeltatabelle. Änderungen können so schnell wie alle 15 Sekunden veröffentlicht werden.
Backoff-Logik, die geringe Aktivität erkennt, vermeidet übermäßigen Aufwand für Datenquellenmodule außerhalb von Fabric und verringert die Latenz, indem sie auf die Häufigkeit eingehender Datenänderungen reagieren.
Wie funktioniert die Metadatenspiegelung?
Die Spiegelung ermöglicht nicht nur die Datenreplikation, sondern kann auch durch Verknüpfungen oder Metadatenspiegelung und nicht durch vollständige Datenreplikation erreicht werden, sodass Daten verfügbar sind, ohne sie physisch zu verschieben oder zu duplizieren. Die Spiegelung in diesem Kontext bezieht sich auf das Replizieren nur von Metadaten wie Katalognamen, Schemas und Tabellen und nicht auf die tatsächlichen Daten selbst. Mit diesem Ansatz kann Fabric Daten aus verschiedenen Quellen zugänglich machen, ohne sie zu duplizieren, die Datenverwaltung zu vereinfachen und die Speicheranforderungen zu minimieren.
Wenn Sie beispielsweise auf daten zugreifen, die im Unity-Katalog registriert sind, spiegelt Fabric nur die Katalogstruktur aus Azure Databricks wieder, sodass auf die zugrunde liegenden Daten über Verknüpfungen zugegriffen werden kann. Diese Methode stellt sicher, dass alle Änderungen an den Quelldaten sofort in Fabric widerspiegelt werden, ohne dass eine Datenbewegung erforderlich ist. Dadurch wird die Echtzeitsynchronisierung beibehalten und die Effizienz beim Zugriff auf aktuelle Informationen verbessert.
Wie funktioniert die offene Spiegelung?
Zusätzlich zur Aktivierung der Datenreplikation durch Erstellen einer sicheren Verbindung zu Ihrer Datenquelle können Sie durch Spiegelung einen vorhandenen Datenanbieter auswählen oder Ihre eigene Anwendung schreiben, um Daten in eine gespiegelte Datenbank zu bringen. Wenn Sie eine offene gespiegelte Datenbank über die öffentliche API oder das Fabric-Portal erstellen, erhalten Sie eine Landing-Zonen-URL in OneLake, in dem Sie Änderungsdaten gemäß der Spezifikation für offene Spiegelung übertragen können.
Sobald sich Daten im Landebereich im richtigen Format befinden, wird die Replikation gestartet und verwaltet die Komplexität der Zusammenführung von Änderungen mit Updates, Einfügungen und Löschungen, um in Delta-Tabellen widergespiegelt zu werden. Mit dieser Methode wird sichergestellt, dass alle Daten, die in die Zielzone geschrieben werden, sofort synchronisiert werden, sodass die Daten in Fabric aktuell bleiben.
Freigabe
Die Freigabe erleichtert die Zugriffssteuerung und -verwaltung. Sicherheitskontrollen wie Sicherheit auf Zeilenebene (RLS), Sicherheit auf Objektebene (OLS) und mehr stellen sicher, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Das Teilen ermöglicht auch eine sichere und demokratische Entscheidungsfindung in Ihrer gesamten Organisation.
Durch die Freigabe gewähren Benutzer anderen Benutzern oder einer Gruppe von Benutzern Zugriff auf eine gespiegelte Datenbank, ohne zugriff auf den Arbeitsbereich und die restlichen Elemente zu gewähren. Wenn jemand eine gespiegelte Datenbank teilt, gewähren sie auch Zugriff auf den SQL-Analyseendpunkt.
Weitere Informationen finden Sie unter Freigeben Ihrer gespiegelten Datenbank und Verwalten von Berechtigungen.
Datenbankübergreifende Abfragen
Mit den Daten aus ihrer in OneLake gespeicherten gespiegelten Datenbank können Sie Datenbankübergreifende Abfragen schreiben, Daten aus gespiegelten Datenbanken, Lagerhäusern und den SQL-Analyseendpunkten von Lakehouses in einer einzigen T-SQL-Abfrage verknüpfen. Weitere Informationen finden Sie unter Schreiben einer datenbankübergreifenden Abfrage.
Sie können z. B. auf die Tabelle aus gespiegelten Datenbanken und Lagerhäusern verweisen, indem Sie dreiteilige Benennungen verwenden. Verwenden Sie im folgenden Beispiel den dreiteiligen Namen, um auf ContosoSalesTable im Lager ContosoWarehouse zu verweisen. Aus anderen Datenbanken oder Datenlagern ist der erste Teil der dreiteiligen SQL-Standardbenennungskonvention der Name der gespiegelten Datenbank.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Kosten für die Spiegelung
Für die Datenbankspiegelung und die offene Spiegelung sind der Fabric-Compute- und OneLake-Speicher bis zu einem kapazitätsbasierten Grenzwert frei.
- Speicher für Repliken ist bis zu einem festgelegten Grenzwert, der sich nach der Kapazitätsgröße richtet, kostenlos. Mirroring bietet einen kostenlosen Terabyte an Spiegelungsspeicher für jede erworbene Kapazitätseinheit (CU). Wenn Sie z. B. eine F64-Kapazität erwerben, erhalten Sie 64 kostenlose Terabyte Speicherplatz, der ausschließlich für die Spiegelung verwendet wird. Sie zahlen für OneLake-Speicher, wenn Sie den freien Spiegelungsspeichergrenzwert überschreiten oder wenn die Kapazität angehalten wird. Weitere Informationen finden Sie unter Microsoft Fabric Pricing.
- Die Background Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos und verbraucht keine Kapazität. Anfragen direkt an OneLake für gespiegelte Daten verbrauchen Kapazität wie die normale OneLake-Rechenleistung. Die Berechnung zum Abfragen von Daten mithilfe von SQL, Power BI oder Spark wird nach regulären Tarifen berechnet.
- Eine laufende Fabric-Kapazität ist nur für die anfängliche Einrichtung der Spiegelung erforderlich.
Datenengineering mit den gespiegelten Daten einer Datenbank
Microsoft Fabric bietet verschiedene Datentechnikfunktionen, um sicherzustellen, dass Ihre Daten leicht zugänglich, gut organisiert und qualitativ hochwertig sind. Aus Fabric Data Engineering können Sie:
- Erstellen und verwalten Sie Ihre Daten mit Spark in einer Lakehouse-Architektur
- Entwerfen Sie Pipelines, um Daten in Ihr Lakehouse zu kopieren.
- Verwenden von Spark-Auftragsdefinitionen zum Senden eines Batch- oder Streamingauftrags an Spark-Cluster
- Verwenden von Notizbüchern zum Schreiben von Code für Die Erfassung, Vorbereitung und Transformation von Daten
Data Science mit Ihren gespiegelten Datenbankdaten
Microsoft Fabric bietet Fabric Data Science an, um Benutzern die Möglichkeit zu geben, End-to-End Data Science-Workflows für den Zweck der Datenerweiterung und Geschäftseinblicke abzuschließen. Sie können eine breite Palette von Aktivitäten im gesamten Data Science-Prozess durchführen, angefangen bei der Datenerkundung, Vorbereitung und Reinigung bis hin zu Experimenten, Modellierung, Modellbewertung und Bereitstellung von predictive Insights für BI-Berichte.
Microsoft Fabric Benutzer können auf Data Science-Workloads zugreifen. Von dort aus können sie verschiedene relevante Ressourcen entdecken und darauf zugreifen. Sie können z. B. Machine Learning Experimente, Modelle und Notizbücher erstellen. Sie können auch vorhandene Notizbücher auf der Data Science-Startseite importieren.
Direct Lake mit gespiegelten Datenbankdaten
Sie können den Direct Lake-Modus mit gespiegelten Datenbanken in Microsoft Fabric verwenden, um hochleistungsfähige Abfragen über gespiegelte Daten zu ermöglichen, ohne dass Datenverschiebungen oder Duplizierung erforderlich sind. Wenn Sie eine gespiegelte Datenbank erstellen, werden die Daten im Delta Lake-Format in OneLake gespeichert. Dieses systemeigene Format ermöglicht es Power BI und anderen Analysetools, über den Direct Lake-Modus eine Verbindung herzustellen, die nahezu Echtzeit-Einblicke bietet, indem direkt auf die zugrunde liegenden Dateien zugegriffen wird. Diese Integration kombiniert die Einfachheit der Spiegelung mit der Geschwindigkeit und Skalierbarkeit von Direct Lake, wodurch schnelle, aktuelle Berichte zu betrieblichen Daten ermöglicht werden.
Aufbewahrung für gespiegelte Daten
Mirroring in Fabric repliziert kontinuierlich Ihren bestehenden Datenbestand in OneLake im Delta-Lake-Tabellenformat. Um die gespiegelten Daten effizient zu speichern und immer für Analysen bereit zu halten, führt die Spiegelung automatisch Vakuum aus, um alte Dateien zu entfernen, auf die nicht mehr durch ein Delta-Protokoll verwiesen wird.
Sie können die Aufbewahrungseinstellung entsprechend Ihren Anforderungen anpassen. Beispielsweise können Sie einen kürzeren Aufbewahrungszeitraum auswählen, um den Spiegelungsspeicherverbrauch zu reduzieren oder den Aufbewahrungszeitraum zu verlängern, um die Zeitreisefunktionen von Delta für Analysen zu nutzen.
Für gespiegelte Datenbanken, die nach Mitte Juni 2025 aus dem Fabric-Portal erstellt wurden, beträgt die Standardaufbewahrungsfrist einen Tag. Bei alten gespiegelten Datenbanken ist die Standardeinstellung sieben Tage. Um die Aufbewahrungseinstellung zu überprüfen oder zu aktualisieren, navigieren Sie im Fabric-Portal zu Ihrer gespiegelten Datenbank ->Einstellungen ->Delta-Tabellenverwaltung-Registerkarte, um den Aufbewahrungsschwellenwert festzulegen. Sie können sie auch über öffentliche API konfigurieren, indem Sie die retentionInDays Eigenschaft angeben.
SQL-Datenbank in Fabric
Sie können auch direkt eine SQL-Datenbank in Microsoft Fabric innerhalb des Fabric-Portals erstellen und verwalten. Basierend auf Der Azure SQL-Datenbank spiegelt die SQL-Datenbank in Fabric Daten automatisch zu Analysezwecken wieder, und Sie können Ihre betriebsbereite Datenbank ganz einfach in Fabric erstellen. DIE SQL-Datenbank ist die Startseite in Fabric für OLTP-Workloads und kann in die Integration der Fabric-Quellcodeverwaltung integriert werden.