Sie sind hier: HomeDatacenter

Storage: Die Reise der Daten

Nicht nur Lebewesen, auch Daten durchlaufen einen Lebenszyklus, während dessen sich ihre Rolle und damit auch der Umgang mit ihnen verändert. Doch was genau sind Daten überhaupt? Welche Stationen birgt die Reise der Daten von ihrer täglichen Verwendung hin bis zu ihrer letztendlichen Vernichtung?

Eizelle Spermien Bildquelle: © funkschau

Dem Pluralwort „Daten“ liegt im Singular das „Datum“ zugrunde. Im deutschen Wörterbuch der Gebrüder Grimm wird der Begriff mit der Angabe des Tages und Jahrs bei einem Schriftstück assoziiert. Ursprünglich geht das Wort aber auf das lateinische Verb „dare“ (=dt. geben) zurück. Eine amtliche Definition für Daten im Elektronik-/Informatikbereich findet sich unter DIN 44300: „Daten sind Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Information darstellen, vorrangig zum Zwecke der Verarbeitung und als deren Ergebnis.“ Daten sind also Informationsträger. Sie gliedern sich in unterschiedliche Typen und repäsentieren zum Beispiel Informationen zu Personen, Unternehmen, Verkehr, Wetter oder Verkaufszahlen.

Der Datenbestand wächst täglich exponentiell an. Während im Jahr 2018 noch 33 Zettabyte generiert wurden, wird sich das jährlich aufkommende Datenvolumen bis zum Jahr 2025 laut Statista voraussichtlich auf 175 Zettabyte erhöhen.

Die Speicherung von Daten und deren weitere Nutzung ist aber keine Erfindung der Neuzeit. Bereits das Volk der Sumerer nutzte ab etwa 3000 vor Christus einen Kalender zur Berechnung der Flut, um Aussaat und Ernte zu planen. In der Antike gelang es dem Philosophen Archimedes (um 287-212 vor Christus) durch den Abgleich von Daten Erkenntnisse über das Volumen von echtem Gold zu erlangen. Im Mittelalter behielten Landesherren durch den Abgleich von Daten in sogenannten Schatzungslisten den Überblick über zu zahlende oder tatsächlich gezahlte Steuern der Untertanen. Heute handhaben das Unternehmen oder das Finanzamt ähnlich. Allerdings erfolgt die Datenauswertung inzwischen weitestgehend digital.

Daten bringen wichtige Erkenntnisse, die den Fortschritt vorantreiben können. Sie sind allgegenwärtig. Je zugänglicher sie sind, umso mehr Nutzen haben sie. Mit der Erfindung des Internets hat sich ihre Verfügbarkeit um ein Vielfaches potenziert.

Auf geht’s in die weite Welt
Im Moment ihrer Entstehung und Erfassung treten Daten ihre digitale Reise an. Dann sind sie noch „taufrisch“, werden in der Regel laufend genutzt und meist lokal auf einem Netzwerkserver oder manchmal in der Cloud gesichert. Mit zunehmendem Alter wandern sie schließlich irgendwann von der primären Ablage hin zu anderen, günstigeren Speicherorten.
Für ihre Erfassung braucht es keinen Menschen. Dies kann auch durch eine Maschine oder das Internet of Things geschehen. Was dann mit ihnen passiert und welche Stationen die Daten im Anschluss daran erwarten, hängt davon ab, wie sie entstanden sind, und welchen Wert sie haben.

Spätestens seit der Datenschutz-Grundverordnung (DSGVO) sind Unternehmen dazu aufgerufen, ihren Umgang mit den ihnen vorliegenden Daten transparent zu gestalten. Darüber hinaus müssen sie darstellen, wie die Daten während ihrer gesamten Nutzungszeit innerhalb der dem Nutzer kommunizierten Parameter bleiben.

Der Wert der Daten bleibt nicht konstant. Er kann je nach Art der Daten im Laufe ihres Lebenszyklus immer wieder zu- oder abnehmen. „Maschinengenerierte Daten können nur dann einen echten Wert haben, wenn sie eine Unregelmäßigkeit melden. Andererseits können sie auch über Trends Aufschluss geben. Personenbezogene Daten haben im Moment der Datenerfassung den höchsten Wert. Ausnahmen gibt es dabei auch: Manche Daten, zum Beispiel Kopien, die bis zu 70 Prozent ausmachen, werden nie gebraucht“, bemerkt Olaf Dünnweller, Area Vice President EMEA Central von Commvault.

Olaf Dünnweller Commvault Bildquelle: © Commvault

Olaf Dünnweller, Area Vice President EMEA Central von Commvault

Wenn aus der Reise ein Umzug wird
Bei einer Migration werden Daten von einem Speichermedium auf ein anderes oder von einem Ort zu einem anderen transferiert. Die Gründe hierfür können unterschiedlich sein. Sie sind aber in der Regel von außen bedingt, da ein Wechsel stets Kosten mit sich bringt und die Performance negativ beeinträchtigt. Meist sind Hardware oder Medium in die Jahre gekommen oder nicht mehr einsatzfähig. Oder aber sie bringen nicht die erforderliche Kapazität oder Leistung, etwa weil sich die Anforderungen geändert haben. Back-up-Systeme können dabei helfen, Daten sicher zwischen Speichersystemen zu migrieren. Bei der Migration oder dem Wechsel von Speichersystemen muss das alte System sicher und umweltgerecht entsorgt werden. Vor einem Weiterverkauf der Hardware sollte unbedingt sichergestellt sein, dass alle Daten vollständig und lückenlos gelöscht sind. 

„Daten, die für schnelle Entscheidungen benötigt werden oder schnell weiterverarbeitet werden müssen, können auf einen schnelleren Speicher wie beispielsweise eine Flash-Disk migriert werden. Daten mit einem geringen Wert werden eher auf Medien verschoben, die zwar kostengünstig, aber weniger leistungsstark sind, wenn Daten erneut abgerufen werden müssen, zum Beispiel Tape. Und ja, die Leute nutzen immer noch Tape und sogar Cloud-Tape!“, weiß Dünnweller.

Fertig zum Abflug ins Nirvana
Jede Reise findet irgendwann ihr Ende. Das trifft auch auf jene der Daten zu. Schließlich ist es vollkommen kontraproduktiv, sämtliche generierten Daten bis in alle Ewigkeit zu speichern. Zum einen entstehen damit  unnötige Kosten. Zum anderen verlangsamt die ungeheure Datenmenge die Server signifikant.

Insbesondere sogenannte verwaiste Daten sollten unbedingt entsorgt werden. Hierbei handelt es sich um Daten, die ehemals im Verbund existierten. Da die anderen Elemente des Daten-Ensembles weggefallen sind, weil sie verschoben oder gelöscht wurden, stehen sie nun völlig verlassen und alleine da. Ähnlich wie ein separiertes Satzfragment, dessen Aussage ohne seinen ursprünglichen Zusammenhang nicht dechiffrierbar ist, verhält es sich mit den verwaisten Daten. Sie sind nur schwierig oder kaum mehr verwendbar, weil die übrigen Anwendungen oder Datenbanken nicht mehr verfügbar sind. Das macht sie wertlos. 

Außerdem erfordern die Datenschutzrichtlinien die Löschung von Daten nach Ablauf einer bestimmten Zeit. Dünnweiler bemerkt hierzu: „Maschinen-, Sensor- oder IoT-Daten werden häufig nur vorübergehend gespeichert und kurz nach der Erstellung wieder gelöscht. Wiederum andere Daten müssen laut Verordnung mindestens soundso lang gespeichert werden. Das gilt beispielsweise für Tiefbaupläne von Gebäuden oder Brücken. Da sprechen wir von einer Aufbewahrungsdauer von Hunderten von Jahren.“ Auch auf die Frage, weshalb nicht mehr benötigte Daten nicht in einem externen Back-up-Tape-Archiv für unbefristete Zeit aufbewahrt werden können, hat Dünnweiler eine Antwort parat: „Das Wichtigste vorweg: Wenn das Gesetz vorschreibt, dass die Daten gelöscht werden sollen, müssen sie wirklich gelöscht werden. Wenn das auf Ihren Fall nicht zutrifft und Sie an den Punkt kommen, an dem Sie die Daten brauchen, stellt sich die Frage: Wie finden Sie sie wieder? Und wie gewährleisten Sie deren Sicherheit? Die Daten haben zwar keinen Wert, können aber dennoch ein hohes Risiko darstellen. Wer hat Zugang? Was ist, wenn es zu einer Datenschutzverletzung kommt? Woher ist bekannt, ob und wer auf sie zugegriffen hat? Viele Unternehmen verschwenden viel Zeit und Geld mit der Pflege von Daten, die sie einfach löschen sollten.“

Das war’s dann wirklich
Die Vernichtung nicht mehr benötigter Daten muss kontrolliert ablaufen. Dies impliziert einen fixen Zeitplan und die Einhaltung von rechtlichen sowie behördlichen Regeln. Aber diese lassen sich nicht einfach in einem Handbuch nachschlagen. Auch variieren die Richtlinien je nach Art der Daten. Aufgrund der komplexen Sachlage überlässt man die Angelegenheit am besten einem erfahrenen Experten.

Sofern keine Verpflichtung zur festen Beschäftigung eines Datenschutzbeauftragten vorliegt, kann man die Dienstleistung auch für die Dauer des Projekts „mieten“. Ansonsten ist das Angebot an Schulungen auf diesem Gebiet ist groß. Olaf Dünnweller empfiehlt jedoch nur solche mit Branchenzertifikat zu besuchen

Doch was gibt es bei der Wahl eines solchen Dienstleisters zu beachten?  „Wir empfehlen dringend, nur mit Serviceprovidern zu arbeiten, die nach ISO 27001 zertifiziert sind. Deren AGBs informieren dann konkret, was sie tun. Die Services gehen unter Umständen über das hinaus, was die ISO-Zertifizierung verlangt. In jedem Fall lässt sich so sichergehen, dass Industriestandards eingehalten werden, denn sonst wäre das Unternehmen gar nicht erst zertifiziert worden,“ meint Dünnweiler.

Was die Löschung an sich betrifft, genügt es nicht, vom ursprünglichen Dateiformat auf ein Storage-Media-Format zu wechseln, da bei letzterem eine Wiederherstellung der Daten durchaus möglich ist. Das mehrmalige Überschreiben der Daten mittels geeigneter Software ist die beste Methode, um Daten sicher zu eliminieren. Das sieht zumindest das Bundesamt für Sicherheit in der Informationstechnik (BSI) so. Bei älteren Festplatten empfiehlt es sich sogar, Daten bis zu sieben Mal zu überschreiben – ein langwieriger Prozess.

Anders sieht das bei modernen Laptops mit hardwareverschlüsseltem SSD-/Flash-Speicher aus. Sie kommen ohne diese Art des Überschreibens aus. Der Nutzer kann bei diesen Geräten einfach den Befehl „Secure Erase“ wählen. Um vollends auf der sicheren Seite zu sein, empfiehlt das BSI aber auch in diesem Fall das zusätzliche Überschreiben der Festplatte.

Da die Reise der Daten und damit ihr Lebenszyklus erst endet, wenn in keinem System mehr eine noch so kleine Spur von ihnen nachvollziehbar ist, macht es Sinn, auch ausgemusterte Rechner oder Peripheriegeräte nach ihnen abzusuchen.