Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:✅ Warehouse in Microsoft Fabric
In Microsoft Fabric behält ein Lager verschiedene Versionen der Daten basierend auf dem konfigurierten Aufbewahrungszeitraum automatisch bei und verwaltet diese. Dieser Aufbewahrungszeitraum bestimmt, wie weit Zurück in der Zeit Sie Zeitreiseabfragen ausführen können, Tabellenklonen erstellen, Wiederherstellungspunkte verwenden und Lagermomentaufnahmen erstellen können.
Die Datenaufbewahrung wird automatisch gestartet, wenn Sie das Lager erstellen. Standardmäßig behalten Lager den Datenverlauf für 30 Kalendertage bei. Sie können den Aufbewahrungszeitraum auf einen beliebigen Wert zwischen 1 und 120 Tagen konfigurieren. Das System löscht abgelaufene Dateien automatisch nach Ablauf des Aufbewahrungszeitraums.
Das Lager behält alle Einfügungen, Aktualisierungen und Löschungen innerhalb des konfigurierten Aufbewahrungszeitraums bei.
- Das Erhöhen des Aufbewahrungszeitraums bietet ein längeres Fenster für Zeitreiseabfragen, Tabellenklone zu einem früheren Zeitpunkt, Wiederherstellungspunkte und Datenbestands-Snapshots. Ein längerer Aufbewahrungszeitraum erhöht jedoch den Speicherverbrauch und die damit verbundenen Kosten.
- Das Verringern des Aufbewahrungszeitraums reduziert die Speicherkosten, beschränkt jedoch, wie weit Sie historische Daten abfragen oder wiederherstellen können.
Funktionsweise der Datenaufbewahrung
Wenn Daten geändert werden, verwirft das Datenlager nicht sofort den Status der vorherigen Version. Stattdessen werden die vorherigen Versionen der Daten als Teil des Delta Lake-Transaktionsprotokolls beibehalten. Mit diesem Versionsverwaltungsmechanismus können Zeitreisen, Tabellenklonen, Wiederherstellungspunkte und Datenbank-Snapshots funktionieren.
Wenn Verlaufsdatenversionen den konfigurierten Aufbewahrungszeitraum überschreiten, entfernt ein Prozess für die Garbage Collection im Hintergrund automatisch die abgelaufenen Dateien aus OneLake. Dieser Bereinigungsprozess wird asynchron ausgeführt und wirkt sich nicht auf aktive Abfragen oder laufende Transaktionen aus.
Das Lager misst das Alter der aufbewahrten Daten in absoluten Kalendertagen ab dem Zeitpunkt, zu dem die Datenversion erstellt wurde, einschließlich jedes Mal, wenn die Microsoft Fabric Kapazität angehalten wird.
Bereich des Aufbewahrungszeitraums
Wenn Sie den Aufbewahrungszeitraum nicht explizit konfigurieren, verwenden vorhandene Lagerhäuser den Standardaufbewahrungszeitraum von 30 Kalendertagen. Sie können den Datenaufbewahrungszeitraum von 1 bis 120 Tagen konfigurieren.
Konfigurieren der Datenaufbewahrung
Legen Sie den Datenaufbewahrungszeitraum für ein Lager mithilfe der ALTER DATABASE ... SET T-SQL-Befehl. Schritte und weitere Informationen finden Sie unter How to configure data retention in Fabric Data Warehouse.
Verhalten beim Ändern des Aufbewahrungszeitraums
Wenn Sie das Verhalten beim Ändern des Aufbewahrungszeitraums verstehen, können Sie Änderungen planen, um unerwartete Datenverluste oder Speichergrößen zu vermeiden.
Erhöhen des Aufbewahrungszeitraums
Wenn Sie den Aufbewahrungszeitraum erhöhen, wird die neue Einstellung sofort wirksam. Sie können jedoch keine historischen Daten wiederherstellen, die das System bereits unter dem vorherigen kürzeren Aufbewahrungszeitraum bereinigt hat. Nur Datenversionen, die zum Zeitpunkt der Änderung noch in OneLake vorhanden sind, profitieren vom verlängerten Aufbewahrungszeitraum.
Wenn Ihr Lager derzeit einen Aufbewahrungszeitraum von 7 Tagen hat und Sie ihn auf 60 Tage erhöhen, gilt die Änderung ab diesem Zeitpunkt. Datenversionen, die bereits vom System bereinigt wurden, bevor die Änderung (älter als 7 Tage) nicht wiederhergestellt werden kann. Bestehende Datenversionen, die sich zum Zeitpunkt der Änderung noch innerhalb des 7-Tage-Fensters befinden, sowie alle zukünftig erstellten Versionen werden bis zu 60 Tage lang aufbewahrt.
Verringern des Aufbewahrungszeitraums
Wenn Sie den Aufbewahrungszeitraum verringern, können Datenversionen, die sich jetzt außerhalb des neuen kürzeren Aufbewahrungszeitraums befinden, zur Bereinigung berechtigt sein. Der Bereinigungsprozess wird asynchron im Hintergrund ausgeführt und erfolgt nicht sofort. Aktive Abfragen, die bereits ausgeführt werden, sind nicht betroffen.
Wenn Ihr Lager beispielsweise über einen Aufbewahrungszeitraum von 30 Tagen verfügt und Sie ihn auf 7 Tage reduzieren, sind Datenversionen zwischen 8 und 30 Tagen alt für die Hintergrundbereinigung berechtigt.
Von Bedeutung
Das Verringern des Aufbewahrungszeitraums ist aus Sicht des Datenzugriffs unumkehrbar.
Auch wenn Sie den Aufbewahrungszeitraum kurz danach erneut erhöhen, kann nicht mehr auf Daten zugegriffen werden, die während dieser Zeit außerhalb des kürzeren Fensters fielen. Bevor Sie den Aufbewahrungszeitraum verringern, stellen Sie sicher, dass der neue Aufbewahrungszeitraum die Datenwiederherstellungs- und Complianceanforderungen Ihrer Organisation erfüllt.
Aufbewahrungsstichtag
Die time_travel_retention_cutoff_date Spalte in der Systemkatalogansicht "sys.databases " gibt das tatsächliche früheste Datum an, ab dem Reisedaten verfügbar sind, nicht der aktuell konfigurierte Aufbewahrungszeitraum. Die ältesten tatsächlichen Daten können sich vom konfigurierten Aufbewahrungszeitraum unterscheiden.
Der vom Benutzer konfigurierte Aufbewahrungszeitraum definiert, wie viele Tage des Verlaufs das System in Zukunft beibehalten soll . Der tatsächliche wiederherstellbare Verlauf hängt jedoch davon ab, welche Daten vor Aufbewahrungsänderungen beibehalten wurden.
Zwei Situationen führen zu einer Divergenz zwischen konfigurierter Aufbewahrung und dem tatsächlichen verfügbaren Verlauf:
- Die Aufbewahrung wurde reduziert – Das Lager markiert sofort historische Daten, die älter als der neue Aufbewahrungszeitraum für die Garbage Collection sind, und entfernt sie dauerhaft.
- Die Aufbewahrung wurde anschließend erhöht – Das Lager kann den gelöschten Verlauf nicht wiederherstellen. Es muss warten, bis sich der neue Verlauf ansammelt, bevor das vollständige konfigurierte Fenster verfügbar ist.
Szenarien für die Datenaufbewahrung
Berücksichtigen Sie die folgenden Szenarien, wenn Sie entscheiden, wie Sie Ihren Aufbewahrungszeitraum konfigurieren:
Compliance und Prüfung
Organisationen mit behördlichen oder Complianceanforderungen müssen möglicherweise Daten länger aufbewahren, um Auditverpflichtungen zu erfüllen. Durch das Konfigurieren eines Aufbewahrungszeitraums von 90 oder 120 Tagen kann ein umfassenderes Verlaufsfenster für Auditoren bereitgestellt werden, um Datenänderungen im Laufe der Zeit zu überprüfen.
Entwickeln und Testen
Bei Entwicklungs- oder Testarbeitsbereichen, in denen historische Daten weniger wichtig sind, kann ein kürzerer Aufbewahrungszeitraum von 1 bis 7 Tagen die Speicherkosten reduzieren. Diese Reduzierung ist nützlich, wenn der Arbeitsbereich für die schnelle Prototyperstellung oder iterative Entwicklung verwendet wird.
Kostenoptimierung
Wenn Ihr Lager häufig große Datenänderungen (z. B. tägliche volle Lasten) vornimmt, kann das Volumen der aufbewahrten historischen Daten erheblich wachsen. In diesen Szenarien trägt die Reduzierung des Aufbewahrungszeitraums dazu bei, die Speicherkosten zu steuern und gleichzeitig ein angemessenes Wiederherstellungsfenster aufrechtzuerhalten.
Bereitschaft zur Datenwiederherstellung
Für Produktionslager bietet die Beibehaltung eines längeren Aufbewahrungszeitraums mehr Flexibilität für die Datenwiederherstellung durch Wiederherstellungspunkte, Tabellenklonen und Zeitreiseabfragen bei versehentlicher Datenbeschädigung.
Auswirkungen der konfigurierbaren Aufbewahrung auf abhängige Features
Der konfigurierte Aufbewahrungszeitraum gilt einheitlich für die folgenden Features in Fabric Data Warehouse. Das Ändern des Aufbewahrungszeitraums wirkt sich direkt auf die Verfügbarkeit und das Verhalten dieser Features aus.
Zeitreise
Zeitreisen ermöglichen es Ihnen, Daten abzufragen, wie sie zu einem früheren Zeitpunkt innerhalb des Aufbewahrungszeitraums vorhanden sind. Der FOR TIMESTAMP AS OF Abfragehinweis kann Daten von einem beliebigen Punkt innerhalb des konfigurierten Aufbewahrungszeitraums abrufen.
Wenn der Aufbewahrungszeitraum beispielsweise auf 15 Tage festgelegt ist, können Sie Daten abfragen, da sie bis zu 15 Kalendertage in der Vergangenheit vorhanden sind.
Tabelle klonen
Tabellenklone basieren auf der Aufbewahrungsdauer. Sie können einen Klon einer Tabelle zu einem früheren Zeitpunkt nur innerhalb des konfigurierten Aufbewahrungszeitraums erstellen. Wenn Sie einen Klon über den Aufbewahrungszeitraum hinaus anfordern, tritt ein Fehler auf.
Wiederherstellungspunkte
Verwenden Sie Wiederherstellungspunkte, um ein Lager wiederherzustellen. Das System behält sowohl vom System generierte als auch benutzerdefinierte Wiederherstellungspunkte für den konfigurierten Aufbewahrungszeitraum bei. Nach Ablauf des Aufbewahrungszeitraums löscht das System automatisch Wiederherstellungspunkte.
- Das Lager erstellt automatisch alle acht Stunden vom System generierte Wiederherstellungspunkte. Diese Wiederherstellungspunkte sind für den konfigurierten Aufbewahrungszeitraum verfügbar.
- Benutzerdefinierte Wiederherstellungspunkte sind für den konfigurierten Aufbewahrungszeitraum verfügbar. Das System löscht diese Wiederherstellungspunkte automatisch nach Ablauf.
Fabric behält mindestens eine Anzahl von Wiederherstellungspunkten bei, um sicherzustellen, dass genügend Wiederherstellungspunkte immer verfügbar sind.
Lagerbestandsaufnahmen
Lagermomentaufnahmen können auf Daten innerhalb des konfigurierten Aufbewahrungszeitraums verweisen. Der Momentaufnahmezeitstempel kann auf einen beliebigen Punkt innerhalb des konfigurierten Aufbewahrungszeitraums oder auf die Erstellungszeit der Datenbank festgelegt werden, je nachdem, welcher Zeitpunkt später liegt.
Speicherabrechnung
Die Datenaufbewahrung wirkt sich direkt auf den OneLake-Speicherverbrauch aus. Jede aufbewahrte Version von Daten belegt Speicherplatz, und längere Aufbewahrungszeiträume sammeln mehr historische Versionen.
Berücksichtigen Sie bei der Planung der Aufbewahrungskonfiguration den Kompromiss zwischen den Vorteilen des längeren Datenverlaufszugriffs und den damit verbundenen Speicherkosten. Weitere Informationen zum Überwachen des Speichers finden Sie unter Verwenden der Kapazitätsmetriken-App zum Überwachen.
- Aufbewahrte Datendateien: Historische Versionen von Daten, die als Parkettdateien in OneLake gespeichert sind, verbrauchen Speicher. Die Speicherkosten sind proportional zum Volumen und der Häufigkeit von Datenänderungen im Aufbewahrungszeitraum.
- Wiederherstellungspunkte: Die Metadaten für vom System generierte und benutzerdefinierte Wiederherstellungspunkte verbrauchen ebenfalls Speicher. Wiederherstellungspunkte speichern jedoch in erster Linie Metadaten und verweisen auf vorhandene Datendateien, sodass ihr Speicheraufwand relativ gering ist.
- Keine Berechnungsgebühren für die Aufbewahrung: Es entstehen keine berechneten Gebühren, die ausschließlich für die Aufbewahrung von historischen Daten anfallen. Rechengebühren fallen nur an, wenn Sie Daten aktiv abfragen oder wiederherstellen.
Um die Speicherwirkung einer Änderung des Aufbewahrungszeitraums zu schätzen, sollten Sie Folgendes berücksichtigen:
- Das durchschnittliche tägliche Volumen von Datenänderungen in Ihrem Lager.
- Der aktuelle Aufbewahrungszeitraum und der vorgeschlagene neue Aufbewahrungszeitraum.
- Das Delta zwischen den beiden Perioden multipliziert mit dem durchschnittlichen täglichen Änderungsvolumen gibt eine ungefähre Änderung des Speicherverbrauchs an.
Überlegungen zum Entwurf
- Konfigurieren Sie den Aufbewahrungszeitraum basierend auf den Datenwiederherstellungs-, Compliance- und Kostenanforderungen Ihrer Organisation. Der Standardwert von 30 Tagen bietet ein Gleichgewicht zwischen Datenverfügbarkeit und Speicherkosten für die meisten Workloads.
- Koordinieren Sie Änderungen des Aufbewahrungszeitraums mit Ihrer Sicherungs- und Notfallwiederherstellungsstrategie. Stellen Sie sicher, dass der Aufbewahrungszeitraum ihren Wiederherstellungspunktzielen (RPO) entspricht.
- Überwachen Sie den OneLake-Speicherverbrauch nach änderung des Aufbewahrungszeitraums, um die Auswirkungen auf die Speicherkosten zu verstehen.
- Planen Sie Änderungen des Aufbewahrungszeitraums während niedriger Aktivitätszeiträume, wenn möglich, sodass keine Auswirkungen auf den Benutzer auftreten.
- Der Aufbewahrungszeitraum wird auf Lagerebene festgelegt. Wenn Sie unterschiedliche Aufbewahrungszeiträume für verschiedene Datasets benötigen, sollten Sie sie in separaten Lagerhäusern organisieren. Aufbewahrungseinstellungen auf Tabellenebene werden derzeit nicht unterstützt.
Einschränkungen
- Geben Sie den Aufbewahrungszeitraum in ganzen Tagen an. Bruchwerte werden nicht unterstützt.
- Das Verringern des Aufbewahrungszeitraums führt nicht sofort zur Rückgewinnung des Speichers. Die Bereinigung abgelaufener Daten erfolgt asynchron im Hintergrund.
- Das Anhalten der Microsoft Fabric Kapazität wirkt sich auf die Garbage Cleanup-Aktivität aus. Der Vorgang entfernt keine historischen Daten, die älter als die aktuellen Datenaufbewahrungseinstellungen sind, während die Kapazität angehalten wird. Die Bereinigungsaktivitäten werden fortgesetzt, sobald die Kapazität wiederhergestellt ist.
- Die Aufbewahrungseinstellung gilt nur für Lagerhäuser. Der SQL-Analyseendpunkt des Lakehouse wird nicht unterstützt.
- Abfrageerkenntnisse und SQL-Überwachungsprotokolle unterliegen dieser Datenaufbewahrungsrichtlinie nicht und werden separat verwaltet.
Speicherung gelöschter Objekte (Vorschau)
Aufbewahrung verworfener Elemente bewahrt Datenbanken und die dazugehörigen Tabellen, Schemas, Momentaufnahmen, Berechtigungen und gespeicherten Abfragen über einen konfigurierbaren Zeitraum, nachdem sie verworfen oder gelöscht wurden. Dadurch wird sichergestellt, dass versehentliche Löschungen nicht zu dauerhaften Datenverlusten oder geschäftsrelevanten Ausfällen führen. Die Verworfene Aufbewahrung garantiert einen mindesten Aufbewahrungszeitraum von 7 Kalendertagen und verfügt über eine separate Aufbewahrungskonfiguration auf Mandantenebene. Sie können den Aufbewahrungszeitraum für verworfene Elemente in der Mandanteneinstellung für die Elementwiederherstellung konfigurieren.