Sie sind hier: HomeDatacenter

Monitoring und KI: Das Monitoring-Orakel von Delphi

Stillstände und Wartungsausfälle sind Gift für die Effizienz von Rechenzentren. Statt auf Störungen zu warten, versuchen Betreiber mit KI-Algorithmen und Statistik den Betrieb vorausschauend zu optimieren. Neben ersten Erfolgen gibt es noch einige Herausforderungen.

Monitoring-Orakel Bildquelle: © Norbert Preiss - funkschau

Analytics und Business Intelligence sind in der IT-Domäne, wie die Kristallkugel auf historischen Jahrmärkten, nicht mehr wegzudenken. Klassisch genutzt werden sie zur Auswertung meist historischer Datenreihen, um Lehren aus der Vergangenheit zu ziehen und zu erklären, warum die Dinge sind wie sie sind. Heute treten ihre Nachfolger aus dem Bereich Data Science an, dem sagenumwobenen Orakel von Delphi Konkurrenz zu machen und einen validen Blick in die Zukunft zu werfen. Die dafür genutzten mathematischen und analytischen Funktionen gibt es glücklicherweise nicht nur am siebten Tag eines Monats.

Die einfachste Form einer Analyse ist die reine Statistik – gängige Kennzahlen werden erfasst und gemäß ihrer Häufigkeit grafisch dargestellt. Ein deutlich höherer Informationsgehalt lässt sich durch das Einführen zusätzlicher Dimensionen erreichen. Dabei handelt es sich um klassische Data-Warehouse-Technik (OLAP = Online Analytical Processing). Den höchsten Erkenntniswert liefert die vorausschauende Analyse, die das künftige Verhalten von Systemen anhand von Modellen prognostiziert, die sich aus historischen Verhaltensdaten speisen oder aus logischen Zusammenhängen ergeben. Dabei ist die Wirksamkeit der Vorhersage abhängig von der Qualität der Datengrundlage und des verwendeten Modells. Bei einem Drei-Tage-Wetterbericht ist es ähnlich: Er ist aufgrund des ausreichend komplexen Datenmodells viel verlässlicher, während die langfristige Wetterprognose an zu vielen Unberechenbarkeiten leidet.

An dem wertvollen Datenschatz der Monitoring-Systeme bedienen sich diese Vorhersagen bereits. Im Zentrum stehen dabei Vorhersagemodelle für die vorausschauende Wartung (Predictive Maintenance), um Störungen zu vermeiden, während gleichzeitig die Wartungsintervalle anhand des tatsächlichen Bedarfs optimiert werden. Anstelle von Reaktionen auf Vorkommnisse (Monitoring) tritt die Vorhersage möglicher Ereignisse von morgen (Prediction). Ursprünglich wurden Lösungen mit fest vorkonfigurierten, regelbasierten Entscheidungsfindungen realisiert, die heute allmählich durch leistungsstarke und anpassungsfähige KI-Lösungen ersetzt werden.

Ein Beispiel: Filter von Klimageräten verschmutzen nicht gleichmäßig, sondern abhängig vom Staubgehalt der Luft. Hier sind Rechenzentren mit freier Kühlung in städtischen Bereichen (oder in der Nähe zu aktiven Vulkanen) mit hohem Publikumsverkehr im Nachteil gegenüber klassischen, isolierten Innenräumen mit geringen Bestandsveränderungen. Deshalb ist es nicht sinnvoll, für beide Szenarien das gleiche zeitliche Raster für den Tausch oder die Reinigung der Filter in einem Wartungsvertrag festzuschreiben, sondern die Arbeiten abhängig vom Bedarf durchzuführen. Da es andererseits nicht hilfreich ist, so lange darauf zu warten, bis der Filter vollkommen verstopft ist, sodass das Gerät seinen Betrieb einstellt und eine Störung meldet, muss der richtige Zeitpunkt unter Berücksichtigung des Vorlaufs für die Wartungsplanung vorherberechnet werden. Neben einfachen Ansätzen wie Laufzeit (Betriebsstunden) gibt es auch fortschrittlichere und zuverlässigere Verfahren, die aus den heute reichlich verfügbaren Messdaten Rückschlüsse auf den aktuellen Zustand ziehen: Ein verstopfter Filter bedeutet in seiner Konsequenz einen zu geringen Luftdurchsatz, was sich leicht erkennen lässt, wenn die Drehzahl der Lüfter und die tatsächlich erzeugte Luftmenge über deren Geschwindigkeit verglichen wird. Hier bieten allgemeine, anpassbare KI-Ansätzen bereits zahlreiche Anwendungen im RZ-Umfeld.