Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Um die Leistung und Zuverlässigkeit zu verbessern, verwendet Dataflow Gen2 Staging-Elemente zur Speicherung von Zwischendaten während der Datentransformation. Dieser Artikel enthält Informationen dazu, was Stagingelemente sind und wie Daten darin behandelt werden.
Was sind Stagingelemente?
Stagingelemente sind Zwischenspeicherorte, die von Dataflow Gen2 zum Speichern von Daten während der Datentransformation verwendet werden. Diese Elemente tragen die Namen "DataflowsStagingLakehouse" und "DataflowsStagingWarehouse". Die Stagingelemente werden verwendet, um Zwischendaten während der Datentransformation zu speichern, um die Leistung zu verbessern. Diese Elemente werden automatisch erstellt, wenn Sie Ihren ersten Datenfluss erstellen und von Dataflow Gen2 verwaltet werden. Diese Elemente werden vom Benutzer im Arbeitsbereich ausgeblendet, sind aber möglicherweise in anderen Oberflächen wie "Daten abrufen" oder im Lakehouse-Explorer sichtbar. Wir empfehlen dringend, nicht direkt auf die Daten in den Stagingelementen zuzugreifen oder sie zu ändern, da sie zu unerwartetem Verhalten führen kann. Das Speichern von Daten selbst in den Stagingelementen wird ebenfalls nicht unterstützt und kann zu Datenverlust führen.
Daten in Staging-Elementen
Stagingelemente sind nicht für den direkten Zugriff durch Benutzer ausgelegt. Dataflow Gen2 verwaltet die Daten in den Stagingelementen und stellt sicher, dass sich die Daten in einem konsistenten Zustand befinden. Der direkte Zugriff auf Daten in Stagingelementen wird nicht unterstützt, da es nicht garantiert werden kann, dass sich die Daten in einem konsistenten Zustand befinden. Wenn Sie auf Daten in Staging-Elementen zugreifen müssen, können Sie den Datenfluss-Connector in Power BI, Excel oder anderen Datenflüssen verwenden.
Von Bedeutung
Die interne API, die bereitgestellte Daten für nachgeschaltete Verbraucher (z. B. semantische Modelle oder andere Datenflüsse mithilfe des Dataflows-Connectors) bereitstellt, kann zeitweise zu Timeouts führen. Diese Timeouts können zu Aktualisierungsfehlern bei der Verarbeitung von Elementen führen, die häufig als Fehler "Der Schlüssel stimmt mit keiner Zeile in der Tabelle überein" angezeigt werden. Dieser Fehler weist nicht auf ein Datenproblem hin. Dies bedeutet, dass das Back-End die mehrstufigen Ergebnisse nicht rechtzeitig abrufen konnte.
Empfohlene Problemumgehung: Konfigurieren Sie ein Datenziel (Lakehouse oder Warehouse) für Ihren Datenfluss , und aktualisieren Sie nachgeschaltete Elemente, um direkt mit dem Lakehouse- oder Warehouse-Connector aus diesem Ziel zu lesen. Dadurch wird die interne Staging-API umgangen und die Aktualisierungssicherheit verbessert.
Weitere Informationen finden Sie unter Data Factory-Einschränkungen.
Das Entfernen von Daten aus den Stagingelementen kann durch eine der folgenden Aktionen erzwungen werden:
- Deaktivieren Sie das Staging im Datenfluss und aktualisieren Sie (nach 30 Tagen entsorgen wir die Daten automatisch).
- Löschen Sie das Dataflow (entfernt die Daten direkt).
- Löschen Sie den Arbeitsbereich (löscht direkt das StagingLakehouse und StagingWarehouse).
Kostenfolgen des Staging-Prozesses
Das Staging Lakehouse und das Staging Warehouse speichern Zwischendaten als Teil der Datenstromverarbeitung. Der von diesen Stagingelementen verbrauchte Speicher wird als Teil Ihres OneLake-Speichers abgerechnet. Dies bedeutet, dass die Daten, die in den Stagingelementen gespeichert sind, zu Ihrem gesamten OneLake-Speicherverbrauch beitragen und damit verbundene Kosten verursachen.
So verwalten Sie die Speicherkosten effektiv:
- Überwachen der Stagingspeichernutzung: Beachten Sie, dass die Staging-Daten bei jeder Aktualisierung des Datenflusses bis zur Speicherbereinigung oder ihrer expliziten Entfernung akkumuliert werden.
- Deaktivieren Sie das Staging, wenn es nicht benötigt wird: Wenn Ihre Transformationen in das Quellsystem integriert werden, benötigen Sie möglicherweise kein aktives Staging. Durch das Deaktivieren des Stagings wird der Speicherverbrauch reduziert.
- Bereinigen Sie nicht verwendete Datenflüsse: Durch das Löschen von Datenflüssen, die nicht mehr benötigt werden, werden deren zugehörige Stagingdaten sofort entfernt.
- Erwägen Sie die Aktualisierungshäufigkeit: Häufige Aktualisierungen mit aktivierter Staging-Funktion können zu einem höheren Speicherverbrauch führen. Ausgleich der Leistungsvorteile mit Speicherkosten.
Weitere Informationen zu den OneLake-Speicherpreisen finden Sie unter Microsoft Fabric-Preise.