How to kill your Big Data project

15 Möglichkeiten, die Nutzung eigener Daten zu sabotieren

Klaas Wilhelm Bollhöfer, ist Chief Data Scientist und Big Data Evangelist bei The unbelievable Machine Company (*um), einem Spezialisten für Cloud Computing und Big Data aus Berlin. Er übersetzt Business-Anforderungen in kundenspezifische Big Data Lösungen und agiert an der Schnittstelle von Business, IT, Künstlicher Intelligenz und Design.
Big Data ist da und verändert die Welt – da sind sich die Medien, Gartner und Fachzirkel einig. Vor allem wird Big Data für immer mehr Unternehmen immer wichtiger. Allerdings sind mit Big Data-Projekten auch große Herausforderungen verbunden.

Für Unternehmen, die das eigene Big Data-Projekt erfolgreich realisieren möchten, gilt es deshalb unbedingt, Stolperfallen zu vermeiden. Die 15 beliebtesten finden Sie hier. Samt Navigation zur Umgehung.

Es gibt viele Steine, über die während eines Big Data-Projektes gestolpert werden kann. Besser ist es, die meisten bereits im Vorfeld aus dem Weg zu schaffen.
Es gibt viele Steine, über die während eines Big Data-Projektes gestolpert werden kann. Besser ist es, die meisten bereits im Vorfeld aus dem Weg zu schaffen.
Foto: Jason KS Leung-shotterstock.com

1. Sofort in neue Technologien investieren

Um große Datenmengen abzuspeichern, bauen Unternehmen ihre Serverkapazitäten aus. Vielleicht engagieren Sie auch einen Dienstleister. Dagegen spricht erstmal nichts. Neue Technologien sind attraktiv, doch nicht jede eignet sich für jede Unternehmung. Überlegen Sie also im Vorhinein, ob und wozu Sie Big Data brauchen.

2. Die eigenen Daten reichen vollkommen aus

Wenn alles aus den Daten herausgeholt werden soll, zeigt sich oftmals, dass die eigenen Datenpools doch nicht so gut gefüllt sind wie gedacht. Für Big Data-Analysen benötigen Sie nämlich - wie der Name sagt - große Datenmengen. Nicht selten aus mehreren, frei zugänglichen Datenquellen. Und aktuell, das heißt in Echtzeit, generiert. Rechnen Sie also damit, dass Sie eher zu wenig als zu viele Daten besitzen. Und haben Sie keine Angst davor, noch weitere Daten-Steams hinzuzufügen.

3. Alle Daten in eine einzige Datenbank

So komfortabel der Gedanke scheint - er trügt. Sie werden Ihre Daten kaum in einer einzigen Datenbank ablegen können. Daten unterschiedlichen Formats erfordern unterschiedliche Möglichkeiten sie zu speichern, um sie bestmöglich weiterverarbeiten zu können. Begnügen Sie sich daher nicht mit Kleinkrämerei, sondern prüfen Sie genau, was Sie wirklich brauchen.

4. Datenpools möglichst verschließen

Nicht jeder stellt den Kollegen gerne seine Daten zur Verfügung. Oder dem Dienstleister alle firmeneigenen Daten. Das Horten bringt einen allerdings auch nicht weiter. Für Data Scientists sind Daten wie eine Spielwiese, auf der sie sich austoben müssen. Alle Daten werden meistens nie gebraucht. Doch Sie sollten nicht von Beginn an das Analysieren durch unnötige Restriktionen verkomplizieren.

5. Alles dem Team aus der Business Intelligence überlassen

Business Intelligence funktioniert anders als Data Science. Wen Sie mit Big Data-Projekten betrauen und wie Sie Ihr Team zusammenstellen, sollten Sie wohl überlegt und ganz nach den Kompetenzen der Mitarbeiter entscheiden.

6. Nicht ohne (m)einen Akademiker

Apropos Kompetenzen. Diese sind wichtig und richtig - lassen sich aber nicht immer an einem Titel ablesen. Gerade in den technischen Bereichen gibt es immer wieder hochkompetente Quereinsteiger.

7. Fach-Chinesisch muss man können

Sprechen Sie R? Nein? Macht nichts. Denn es ist nicht wichtig, jede Programmiersprache und jede Anwendung auf einem Expertenlevel zu beherrschen. Ihre Mitarbeiter sollten in der Lage sein, sich schnell und flexibel in jedwede Aufgabe einzuarbeiten und dabei die entsprechenden Maßnahmen zu treffen.

8. Big Data... jetzt und sofort

Mit Daten fix was Tolles zaubern - das klingt wie Magie. Und bleibt es auch. Es ist nämlich ein Irrglaube, dass sich bei Big Data alles ad hoc realisieren lässt. Die Programmierung der Daten zu mathematischen Modellen ist harte Arbeit. Eine überzogene Erwartungshaltung ist hier nicht zielführend. Denn welche Erkenntnisse in den Daten liegen, ist im Voraus kaum absehbar.

9. Die ersten Ergebnisse müssen überzeugen

Big Data ist neu und wird skeptisch betrachtet. Da sollten die ersten Ergebnisse schon überzeugen. Das tun sie aber in den seltensten Fällen. Denn besonders zu Beginn eines Big Data-Projekts wird viel Zeit auf explorative Analysen verwendet. Die Data Scientists machen sich mit den Daten vertraut und loten deren Potenzial aus. Betrachten Sie die ersten Ergebnisse deshalb als vorläufig und als Ausgangspunkt für tiefergehende Analysen.