Zusammenfassung

Abgeschlossen

Notfallplanung und -wiederherstellung sind ein wichtiger Bestandteil von IT-Vorgängen, unabhängig davon, ob es sich bei den Systemen einer Organisation um lokale Systeme handelt, solche in der Cloud oder eine Kombination aus beidem. Öffentliche Cloudplattformen bieten Dienste zum Sichern kritischer Daten an sowie zur Wiederherstellung selbiger, wenn sie verloren gehen, zum Ausführen von Failovers zu sekundären System, wenn primäre Systeme ausfallen, und allgemein zum Abschwächen der Auswirkungen von Ausfällen (und für eine entsprechenden Erholung). Nachstehend finden Sie einige der wichtigsten Konzepte, die in diesem Modul behandelt wurden:

  • Soweit dies möglich ist, sollten IT-Systeme fehlertolerant sein. Ein fehlertolerantes System ist eines, das sich wie erwartet oder im Einklang mit den Erwartungen gemäß der Vereinbarung zum Servicelevel verhält, auch wenn Fehler auftreten.

  • Fehlertoleranz kann zum Beispiel durch den Einsatz reaktiver Methoden wie Replikation von Tasks und Wiederherstellungspunkte erzielt werden.

  • Proaktive Methoden wie die Replikation von Ressourcen und Lastenausgleich können ebenfalls zu Fehlertoleranz beitragen.

  • Große Cloudplattformen bieten Sicherungsdienste an, die ein Sicherheitsnetz gegen Datenverlust darstellen. Azure Backup ist ein Beispiel für einen cloudbasierten Sicherungsdienst. Ein weiteres Beispiel wäre AWS Backup.

  • Bei der Notfallwiederherstellung wird versucht, Geschäftskontinuität sicherzustellen, indem Datenverkehr bei Bedarf auf sekundäre Systeme umgeleitet wird. Cloud-Dienstanbieter wie Amazon oder Microsoft bieten Disaster-Recovery-as-a-Service (DRaaS) in Form von Diensten wie AWS CloudEndure und Azure Site Recovery an.

  • Häufige Servicelevelziele, die in Notfallwiederherstellungsplänen umgesetzt werden, sind z. B. Recovery Point Objective (RPO), Recovery Time Objective (RTO) und Aufbewahrungszeitraum.

  • Kontinuität ist die erfolgreiche Anwendung bewährter Methoden, um ein positives Ergebnis zu erzielen, wenn ein Notfall eintritt. Ein wichtiger Aspekt der Kontinuität ist Resilienz.

  • Resilienz kann mithilfe von Metriken wie Fehlertoleranz, Unterbrechungstoleranz und Survivability (Beständigkeit) quantifiziert werden. Das ResiliNets-Modell stellt eine Möglichkeit dar, wie Resilienz systematisiert werden kann.

  • Die internationale Norm für die Geschäftskontinuitätsstrategie ist ISO 22301. Azure verwendet Azure Resiliency Framework, um die Einhaltung von ISO 22301 sicherzustellen.

Damit ein Informationssystem resilient ist, müssen die dafür verantwortlichen Personen ein Ideal anstreben: Informationssysteme entwickeln sich wie Lebewesen durch ständige Verbesserung und Überwachung weiter, wenn diese durch Instanzen geschehen, die Lebewesen sind und keine Roboter. Automatisierte Prozesse haben einen positiven Nutzen, sind allerdings kein Ersatz für aktiven Einsatz.