Direkt zum Inhalt
Schutz der IT-Infrastruktur

Wie man IT-Blackouts handhabt

Wenn die IT-Infrastruktur bereits im Notstrombetrieb läuft und sich langsam die Akkumulatoren der unabhängigen Stromversorgung entleeren, ist jede Sekunde kostbar. Dann greift oftmals das Notfallhandbuch und die Vorbereitungen für das Anlaufen der schweren Generatoren sind im Gange.

Artikel Autor
Ein integratives USV-Shutdown-Konzept ermöglicht ein geordnetes Herunter- und Hochfahren der  gesamten IT-Infrastruktur.
Ein integratives USV-Shutdown-Konzept ermöglicht ein geordnetes Herunter- und Hochfahren der gesamten IT-Infrastruktur.

Aber welches Tool wäre jetzt die effizienteste Lösung, um die IT-Infrastruktur eines Unternehmens sowie die hinterlegten Daten bei gezielten Angriffen von außen oder bei nicht beeinflussbaren Naturkatastrophen zu schützen?

Ursachen für Ausfälle gibt es zuhauf. Zahlreiche besorgniserregende Schlagwörter sind täglich in den Medien. Doch meist sind es deutlich trivialere Gründe, die zu IT-Ausfällen führen: Menschliches Versagen, Wetterphänomene und technische Gebrechen, simple Bedienungsfehler, Fehlalarme von Sensoren oder auch Sabotage und Fahrlässigkeit können jederzeit dafür sorgen, dass das Rechenzentrum in den redundanten Notbetrieb übergeführt wird oder sogar Ausfälle bei Kunden und Mitarbeitern feststellbar sind.

Wenn die Telefone heiß laufen

Natürlich melden Netzwerk- und System-Management-Programme oder die Leittechnik sofort, wenn der Strom wegbricht und binnen Millisekunden die USV-Anlagen ihren Dienst versehen. Bei einer unbekannten Ursache müssen Entscheidungen entsprechend zügig gefällt werden: Werden Serverdaten migriert oder sollen Systeme heruntergefahren werden, die eine niedrige Priorität genießen? Wie ist der Status der USV-Anlagen und wird der Stromausfall noch Minuten oder Stunden dauern?

Abhilfe können ein geordneter Server-Shutdown sowie die Live-Migration virtueller Systeme schaffen. Auch Alarmierungssysteme sind sinnvoll. Gängige Applikationen von USV- und Server-Herstellern sowie virtuelle Management-Oberflächen sind zwar hilfreich, jedoch ohne integrierte Logik sowie als Insellösungen im Notfall zeitraubend, nicht automatisiert und widersprechen einer zentralen Vorgangsweise.

Ad

Integriertes Power-Management

Vorausschauende Planung, die Abbildung der IT-Infrastruktur in einem softwarebasierten Logikmodell und eine tiefe Integration in das bestehende Rechenzentrum gelten als Voraussetzung eines effizienten Notfall-Management-Systems. Dennoch ist in den wenigsten Unternehmen ein USV-Shutdown-Konzept vorhanden oder existiert lediglich auf dem Papier.

Spätestens wenn es um Abhängigkeiten von Diensten und Betriebssystemen geht zeigt sich allerdings schnell, dass Erfahrung und ein tiefes Logikverständnis aller Komponenten notwendig ist. Manche helfen sich mit Batch-Dateien und Skripts, womit weder der Compliance ein Gefallen getan wird noch Eventualitäten abbildbar, geschweige denn dokumentiert sind. Ein echtes Power-Management geht also weit über das hinaus, das bisherige Marktlösungen anbieten.

Eine Software als „Cockpit“

Ein flexibles, zentrales Tool, das als Cockpit dient, kann immensen Schaden abwenden und auch kostbare Zeit sparen. So bietet beispielsweise die Lösung „Powerapp“ neben gängigen Informationen wie USV-Status auch die Möglichkeit eines geordneten Shutdowns der Server und Geräte. Der Mehrwert zeigt sich, wenn eine Live-Migration von physischen oder virtuellen Daten vorgenommen werden kann, weniger wichtige Applikationen heruntergefahren oder alte Server nicht plötzlich stromlos werden, sondern schonend einschlafen. Eine Simulation im Rahmen von Desaster-Tests ist genauso auf Knopfdruck möglich wie der Einsatz der Lösung für Wartungsarbeiten.

Interaktion mit bewährter Technologie

Wer mittels einer ausgetüftelten Logik die Chance auf eine synchrone oder asynchrone Interaktion mit den Systemen hat, kann Befehle an die Infrastruktur abwarten und das Ergebnis auswerten oder bei zeitkritischen Operationen direkt eingreifen. Dies geschieht bestenfalls über Management-Ports und Hosts, über die genauso interagiert werden kann wie im Falle der Powerapp über eine VMware vCenter-Integration. Die Zusammenführung vorhandener USV-Daten, virtueller Management-Oberflächen und System-Monitoring-Daten führt somit nicht nur zu einem umfassenden Reporting und Monitoring, sondern zu echten Handlungsoptionen im Krisenfall bis hin zum Shutdown des Rechenzentrums. Mehr als die Shutdown-Planung, also die Prozess-Abbildung der Vorgangsweise im Krisenfall oder in einer Simulation („Desaster Tests“), können sich auch der Auditor und der Compliance Manager nicht wünschen.

Hochfahren der IT-Systeme

Die Erfahrung zeigt, dass trotz aller Vorkehrungen immer wieder Ausfälle passieren und Server und Services stillstehen. Wenn die Ursache gefunden und behoben ist, werden diese oft manuell reaktiviert. Dafür werden Eingaben notwendig, mögliche Schäden müssen gesucht und Einstellungen vorgenommen werden. Schnelle Plattformen überholen womöglich langsame, die jedoch zeitgleich benötigt werden.

Eine vordefinierte Logik, die die zentralen Dienste zuerst aktiviert, um sicher online zu sein, wenn Anwendungen darauf zugreifen, sorgt dafür, dass sich die Administratoren auf die „Ausnahmen“ beschränken können und den Regelbetrieb auf Knopfdruck starten. So kann beispielsweise ab Juli 2014 auch bei der PowerApp vordefiniert werden, dass die Systeme automatisiert hochfahren, wenn die USV-Akkus eine bestimmte Zeitspanne wieder im Netzbetrieb laufen.

Jürgen Kolb, Managing Partner iQSol GmbH

Passend zu diesem Artikel