Sie sind hier: HomeTelekommunikation

Datenanalyse: Big Data vs. Smart Data

Viele Firmen denken "viel hilft viel" und sammeln Unmengen an Daten. Oft haben diese aber keine Relevanz bei den eigentlichen Datenanalysen und verstopfen die Data Lakes und Datenbanken. Deshalb gilt: Wer sich im Wildwuchs der Daten zurechtfinden möchte, sollte schon vorab sortieren und planen.

Eichhörnchen Bildquelle: © fs

Daten sammeln ist gut, Daten gezielt sammeln ist besser.

Die Medien und das Internet sind voll mit Begriffen rund um ein Thema: Big Data. Schon lange ist aus dem einstigen Trend ein fester Bestandteil eines jeden modernen Unternehmens geworden, da in den letzten Jahren das Potenzial unglaublich gewachsen ist. Mit jeder Bestellung und jedem Post – quasi mit allen Schritten, die wir virtuell im Netz machen – hinterlassen wir digitale Fußspuren, die einzigartig sind und die genutzt werden können. Unternehmen optimieren so ihre Strategien und Prozesse und Kunden bekommen auf diese Weise zum Beispiel mehr relevante Inhalte zu sehen, die zu ihren Interessen passen – eine Win-Win-Situation.

Gleichzeitig suchen sehr viele Firmen händeringend nach Experten für die Auswertung dieser beinahe unerschöpflichen Datenmengen. Bei Stellenausschreibungen stolpert man unweigerlich immer häufiger über offene Positionen in dem Bereich. Allein auf dem Jobportal Stepstone gab es Anfang August 24.080 Treffer zu dem Suchbegriff Data Analysis. Big Data und Datenanalyse werden also immer wichtiger – aber ist es wirklich die Masse an Daten, die Unternehmen in ungeahnte Höhen trägt? Das ist fraglich, denn um besser zu arbeiten, zu wirtschaften und auf dem globalen Parkett bestehen zu können, muss aus Big Data „Smart Data“ werden.

Der „sexiest Job im 21. Jahrhundert“
Die vielversprechendsten Datensätze sind vollkommen unnütz, wenn man niemanden hat, der sie aufbereitet, zusammenführt und auswertet. Und damit nicht genug: Die Ergebnisse müssen noch interpretiert und darauf basierend Entscheidungen für den Kurs des Unternehmens getroffen werden. Dafür brauchen Datenanalysten viel mathematisches Verständnis und kommunikatives Feingefühl, was nicht immer zusammen vorkommt. Das Magazin Harvard Business Review erkannte das und ernannte den Data Scientist zum „sexiest job in the 21st century“.

Der Arbeitsalltag von Datenanalysten ist allerdings weniger glamourös. Ihr Tag besteht meist aus Meetings zu Fragestellungen, die untersucht werden müssen, dementsprechenden Suchmissionen nach relevanten Daten, dem Einsatz von komplizierten Auswertungstools und dem Schreiben von Algorithmen. Natürlich müssen die Ergebnisse dann immer überprüft und richtig interpretiert sowie im Anschluss Anweisungen an die Teams gegeben werden. Dadurch stoßen die Spezialisten schnell an ihre (zeitlichen) Grenzen – vor allem, wenn unsystematisch einfach allerlei Daten gesammelt und gespeichert werden. Hinzu kommt die besonders in Deutschland strenge Regelung in Sachen Datenschutz: Seit dem Inkrafttreten der DSGVO im Mai 2018 müssen Nutzer der Verarbeitung ihrer Daten zustimmen. Nur wenn dies der Fall ist, können legal Daten von Nutzern erhoben und somit analysiert werden.

Daten sind der Rohstoff des 21. Jahrhunderts, der in Zukunft über das Bestehen am Markt entscheidet. Doch lohnt es sich, Big Data wörtlich zu nehmen und alles zu speichern? Per Definition beschreibt Big Data das reine Datensammeln und beinhaltet dabei fünf Punkte: Umfang, Sammelgeschwindigkeit, Verschiedenartigkeit, unternehmerischer Mehrwert und Validität. Diese Dimensionen beschreiben, wie viele Daten in welcher Zeit gesammelt werden, welche Art sowie wie wichtig und relevant sie für die entsprechenden Fragestellungen sind. Diese fünf Punkte variieren zwar bei jedem Unternehmen, aber grundsätzlich bedeutet es erst einmal, viele Daten schnell zu sammeln.

Smart Data hingegen geht darüber hinaus. Stefan Jähnichen, Leiter der Smart-Data-Begleitforschung am Forschungszentrum für Informatik am Karlsruher Institut für Technologie, beschreibt Smart Data mit einer Formel:

Smart Data = Big Data + Nutzen + Semantik + Datenqualität + Sicherheit + Datenschutz = nutzbringende hochwertige und abgesicherte Daten

Er betont weiterhin, dass Big Data der Rohstoff sei, aus dem Smart Data gewonnen werde. Smart Data habe zudem noch den Vorteil, dass aus diesen „veredelten“ Datenmengen Vorhersagen getroffen werden könnten. Als Beispiel kann man hier einen Bahnhof anführen: Alle Daten, die in und um den Bahnhof gesammelt werden, gehören erst einmal zur Kategorie Big Data. So zum Beispiel die internen Daten zur Frequentierung durch Passagiere, Ankunfts- und Abfahrtszeiten oder Wartungsarbeiten, jedoch auch das Wetter als externe Datenquelle. Smart Data konzentriert sich dann auf den Ausschnitt, der für die zu untersuchende Frage sinnvoll ist. So zum Beispiel wie man mit einem Zugausfall aufgrund Extremwetterlagen umgehen soll: Wie viele Passagiere sind betroffen, wenn ein Zug wegen Extremwetterlagen ausfällt und wie kann der Zugbetreiber damit umgehen? Datenexperten können so bereits im Vorfeld bestimmen, was die beste Lösung für die spezifischen Probleme sein können. Die nun alles entscheidende Frage ist jedoch: Wie kommt man von Big Data zu Smart Data?