Sie sind hier: HomeDatacenter

Monitoring von Lastspitzen: Bursts erkennen und vermeiden

Ein modernes Netzwerk ist ein wahrer Lastenesel. Trägt es doch die verantwortungsvolle Aufgabe, sich um die Produktivität des Unternehmens zu kümmern. Zudem schultert es eine Vielzahl an unterschiedlichen Geräten und Diensten.

Bildquelle: © Gina Sanders - fotolia.com

Doch so heterogen heutige Netzwerke und die darin verarbeiteten Dienste auch sind, so reglementierend wirkt sich im Gegenzug das physische Netzwerkkabel auf das Netzwerk aus. Es kann exakt so viele Bits, exakt so viele Nullen und Einsen übertragen, für wie viel es ausgelegt ist, kein Bit mehr. Der Switch oder Router hat dann beim LAN-Uplink den Job, den ankommenden Netzwerkverkehr zu verarbeiten und der niedrigeren Bandbreite anzupassen. Wenn dabei mehrere Datenpakete gleichzeitig ankommen, kann der Switch nicht über sich hinauswachsen, sondern nur ein Paket nach dem anderen wieder weitergeben. Wird die Last des ankommenden Verkehrs über längere Zeit zu groß, stauen sich auf dem Switch die Pakete in einem solchen Umfang, dass der Switch einzelne Pakete wegwerfen muss. Für den Netzwerktechniker sind solche Paketdrops meist ein Hinweis auf Überlastung der Netzwerkbandbreite.  

Spitzen- vs. Durchschnittslast

Allein diese Diagnose reicht dem Systemadministrator allerdings nicht aus, um eine valide Problemlösung herbeizuführen. Denn Paketverluste können sporadisch vorkommen - was ganz normal ist - oder aber häufiger auftreten. Zudem macht es einen großen Unterschied, ob das Netzwerk die ganze Zeit auf Volllast fährt oder ob es lediglich vereinzelt zu einem ungewöhnlichen Konglomerat an Verkehrsvolumen kommt.

Ähnlich geht es einem Verkehrstechniker: Auf einer Autobahn können eine bestimmte Anzahl an Fahrzeugen fließend fahren. Sobald es mehr werden, stockt bzw. staut sich der Verkehr. Die Erkenntnis, dass die Tagesmittellast dabei bei 10 Prozent liegt, hilft bei der Frage, was es für einen permanent flüssigen Verkehr braucht, nicht weiter. Welche Statistiken mehr Aussagekraft besitzen, sind Analysen über die Stoßzeiten, darüber, wo und wann die Probleme auftauchen und von welchen Fahrzeugen sie verursacht werden.
Bei einer maximalen Belastung im Netzwerk verhält es sich ebenso: Der IT-Profi will wissen, wann diese vorherrscht, wie lange und wie oft es zu einer solchen Volllast kommt und von welchen Netzteilnehmern sie verursacht werden. Erst diese Erkenntnisse erlauben es ihm, Vorkehrungen für einen reibungslosen Netzwerkverkehr zu treffen.
 
Auswirkungen von Bursts aufs Netzwerk und einzelne Protokolle

Wie solche Bursts näher untersucht werden können, soll zunächst hintenan gestellt werden. Denn zunächst gilt es die Frage zu klären, wie sich das Netzwerk bei Bursts verhält. Paketverluste und Retransmissions gehören zur Normalität. Besteht denn überhaupt Handlungsbedarf?

Ja und nein. Paketverluste gehören zum Netzwerk wie das Amen in der Kirche, ja. Aber nehmen sie eine Größenordnung an, die sich negativ auf die Performance des Netzwerkes auswirkt, sollte an den Stellschrauben gedreht werden.

Am besten lassen sich die Auswirkungen auf das Netzwerk beleuchten, indem die Datenübertragungsprotokolle auf der einen und die Dienste mit Bedarf an einer gesicherten Bandbreite auf der anderen Seite betrachtet werden.

Bei den wichtigsten Protokollen wie z.B. HTTP oder DNS wirkt sich eine Überlast zwar nicht verheerend aus, sollte auf Dauer aber dennoch behoben werden. Als Beispiel dient ein Webseiten-Aufruf, bei dem schnell mehrere Dutzend DNS-Abfragen gestellt werden. Gehen davon nur fünf Prozent verloren, wartet der Rechner auf eine Antwort, bekommt keine und schickt sie nach einigen Sekunden noch einmal ab. Ein Website-Aufruf verzögert sich dadurch um diese Sekunden. Und dies ist - wie jeder weiß - in der heutigen Zeit ein Grund, die Website ungesehen wieder zu schließen.

Kritischer wirkt sich eine Überlast auf Dienste aus, die auf eine garantierte Bandbreite angewiesen sind, z.B. Telefonie, Webcasts oder die Auslieferung von Audio- oder Videoinhalten. Kommt es hier zu einer Überlast, fällt der jeweilige Dienst komplett aus. In einer Firma, die ihre Mitarbeiter per Online-Kurs einarbeitet, wäre das der GAU. Schon kurze Lastspitzen lassen Videos ruckeln. Wird parallel dazu im gleichen Netz von fünf Rechnern gleichzeitig ein Windows-Update heruntergeladen, legt der Videodienst seine Arbeit komplett nieder.

Wie bei HTTP oder DNS gilt auch hier, dass eine Analyse der Lastspitzen die Ursache schnell einkreist. Eine Burstanalyse lässt schnell den Unterschied erkennen, ob die Lastspitze durch einen blöden Zufall entstand, weil etwa neben den YouTube-Lehrinhalten und den Updates auch noch ein Webcast gestartet wurde oder ob es sich tatsächlich um wiederkehrende, sich wiederholende Lastspitzen handelt.
 
Bursts richtig einordnen

Oft genügt es nicht, wie oben angesprochen, bei solch einer Analyse allein die Durchschnittslast in dem betroffenen Zeitintervall zu kennen. Zeigt die Analyse beispielsweise, dass es auf einer 1-GBit/s-Leitung im Minutenmittel 100 MBit/s Verkehr gibt, kann keine Aussage darüber getroffen werden, ob der Link zu 10 Prozent der Zeit komplett ausgelastet und die restliche Zeit dafür gar keinen Verkehr zu verarbeiten hatte oder ob der Link kontinuierlich mit gleichmäßigem Verkehr zu 10 Prozent ausgelastet war. Um bei schlechter Netzwerkperformance kluge Anpassungsvorschläge machen zu können, kommt es zusätzlich auf einen bestimmten Wert an. Es ist von ausschlaggebender Bedeutung, zu wie viel Prozent der Zeit der Link unter Volllast lief. Liegt der Wert bei null Prozent, können Probleme auf Basis von Bandbreitenüberlast ausgeschlossen werden. In dem Fall sind in dem Bereich keine Anpassungen von Nöten. Weist der Wert allerdings eine andere Prozentzahl als null aus, ist das Netz überlastet, sei es punktuell oder flächendeckend. Der Esel sollte entlastet werden.
 
Was genau das Zuviel an Last verursacht, ist mit intelligenten Monitoring-Lösungen schnell erkannt. Typische Ursachen für ein LAN-Burst sind z.B. Backups, ein großer Datei-Transfer oder ein Windows-Update vom Update-Server, der kurzfristig das LAN oder auch das WLAN ans Limit treibt.

Dabei handelt es sich allesamt um absolut normale Vorgänge, die in vielen Fällen überhaupt kein Problem darstellen. Zum Problem wird es nur dann, wenn plötzlich mehrere dieser Dienste parallel Bandbreite beanspruchen, z.B. am Montag morgen, wenn die Smartphones der Mitarbeiter im WLAN automatisch ihre Updates fahren und hohe Traffic-Raten verursachen. Dann streiten sich die Dienste um Bandbreite. Kommt noch eine weitere Anwendung hinzu, z.B. das Telefonat, kann diese nicht mehr reibungslos funktionieren. Sobald jedoch klar ist, was für die Überlast verantwortlich ist, können geeignete Maßnahmen ergriffen werden, diese zu verhindern.