Einführung
Ganz egal, wie gut Sie planen, manchmal geht etwas schief. Eine Organisation, die IT-Ressourcen besitzt und verwaltet, muss sich auf den schlimmstmöglichen Fall vorbereiten und erwarten, dass dieser eines Tages eintreffen wird. Die Notfallplanung und -wiederherstellung ist eines der kritischsten Elemente der Informatik.
Moderne Cloudplattformen bieten eine Vielzahl von Tools, die Organisationen bei der Vorbereitung auf nachteilige Umstände unterstützt und ihre Auswirkungen mindert, wenn sie auftreten. Cloudbasierte Sicherungsdienste können beispielsweise Replikate von lokal gespeicherten Daten erstellen, sodass die Daten wiederhergestellt werden können, wenn sie gelöscht, beschädigt oder zerstört werden. IaaS-Ressourcen wie VMs (virtuelle Computer) und SQL-Workloads können ebenfalls gesichert werden. Eine PaaS-Dienste umfassen automatische Sicherungen. Azure SQL-Datenbank erstellt beispielsweise wöchentlich vollständige Sicherungen, differenzielle Sicherungen alle 12 Stunden und Transaktionsprotokollsicherungen alle paar Minuten. Die Sicherungen werden im georedundanten Speicher gespeichert, der in einem gekoppelten Rechenzentrum repliziert wird. Verlorene oder beschädigte Datenbanken können problemlos aus Sicherungen auf einen beliebigen Zeitpunkt in der Vergangenheit wiederhergestellt werden.
Der Verlust von Daten ist nicht der einzige „Notfall“, für den IT-Experten planen müssen. Ein umfassender Notfallwiederherstellungsplan stellt außerdem die Geschäftskontinuität sicher, indem beispielsweise Anforderungen (per Failover) an einen sekundären Standort umgeleitet werden, wenn eine Anwendung nicht mehr reagiert oder eine gesamte Region einer öffentlichen Cloud ausfällt. Die Cloud hilft auch in dieser Hinsicht, indem DRaaS (Disaster-Recovery-as-a-Service) angeboten wird. Das Ziel der Systemarchitektur besteht heutzutage darin, jegliche Abhängigkeit von einem einzigen Teil zu vermeiden, der zu einem Single Point of Failure (SPOF) werden kann. Dies ist das Leitprinzip der Resilienz: um ein angemessenes Maß an Ausfall innerhalb des Systems zu ermöglichen und sogar zu planen und gleichzeitig akzeptable Servicelevels für eine Organisation und ihre Kunden aufrechtzuerhalten.
In diesem Modul werden Fehler zunächst ausführlich erläutert. Anschließend werden Replikationsverfahren zum Sichern von Anwendungen, Diensten und Daten vorgestellt, mit denen die Wahrscheinlichkeit von Datenverlusten für das Unternehmen reduziert wird, und die von führenden Clouddienstanbietern angebotenen Sicherungsdienste werden untersucht. Danach werden die Notfallwiederherstellung, DRaaS und Mechanismen zum Erreichen der Geschäftskontinuität behandelt. Schließlich wird erläutert, wie sich die Prinzipien der Resilienz in Cloud Computing auf die Ansätze zur Vorbereitung auswirken, wobei reaktive Maßnahmen durch proaktive ersetzt werden.
Lernziele
- Grundlegendes über die Fehlertoleranz
- Reaktive Maßnahmen zum Einhalten der Fehlertoleranz in Cloudplattformen
- Proaktive Maßnahmen zum Einhalten der Fehlertoleranz in Cloudplattformen
- Informationen zu den Sicherungsdiensten von führenden Clouddienstanbietern
- Informationen zur Rolle von Sicherungsdiensten bei Notfallreaktionen und -wiederherstellungen
- Unterschiede zwischen Sicherungsdiensten und Notfallwiederherstellungsdiensten
- Liste der Servicelevelziele für die Planung der Notfallwiederherstellung
- Liste der Sicherungsdienste von führenden Clouddienstanbietern
- Resilienz und ihre Messung
- Vorteile der Resilienz für die Geschäftskontinuität
Voraussetzungen
- Verstehen, was Cloud Computing ist, einschließlich Clouddienstmodellen und häufig verwendeten Cloudanbietern
- Kennen der verschiedenen Cloudtypen (öffentlich, privat, Hybrid-)
- Erkennen und Unterscheiden von Clouddienstmodellen wie IaaS, PaaS und SaaS
- Verstehen, wie die Bereitstellung von Cloudressourcen funktioniert
- Wissen, wie Rechenzentren funktionieren und wie Daten in der Cloud gespeichert werden
- Grundlegende Kenntnisse über die Cloudsicherheit