Talent statt Technik

So werden Mitarbeiter zu Data Scientists

21.06.2017
Von 
Problemlösung steht für Holger Gubbels an oberster Stelle. Als Informatiker ist er es gewohnt, komplexe Anforderungen zu strukturieren, möglichst zu vereinfachen und zu erläutern. Seit 2011 ist er Geschäftsführer der mogular GmbH in Stuttgart und dort als Berater, Dozent und Data Scientist tätig. Ihm liegt es am Herzen, Daten dort nutzbar zu machen, wo sie gebraucht werden.

Vorurteil 1: Es liegt an den Datenmengen

Es heiß, Unternehmen produzietren immer mehr Daten, die immer schwieriger auszuwerten seien. Aber schon mit Excel können Sie eine Million Datensätze auswerten. So wenig ist das zunächst einmal nicht. Seit Excel 2010 gibt es in Excel ein Add-In namens Power Pivot - es ist kostenfrei erhältlich. In Excel 2016 ist dieses Add-In bereits integriert.

Als Demo habe ich aus den USA Daten zu Flügen heruntergeladen und in Power Pivot importiert - etwa 125 Millionen Datensätze. Damit erstelle ich Analysen zu Verspätungen auf Flugstrecken, zu Auslastungen von Flughafen oder Rankings von Fluggesellschaften - nicht auf einem Hochleistungsrechner, sondern auf einem Laptop. In einem Dashboard schränke ich Fluglinien, Auswertungs-Zeitspannen oder Abflug-Flughäfen ein. Die Berechnungen dauern nur Sekunden.

Wären die Datensätze nicht Flüge, sondern Packstücke aus einem Versandsystems der letzten zehn Jahre, dann entspricht das zirka 1.000.000 Packstücke pro Monat, also 50.000 Packstücken am Tag. Bei einem Fünf-Jahres Horizont, der bei Auswertungen eher relevant ist, wären es schon 100.000 Pakete am Tag. Haben Sie mehr Buchungen/Pakete/Besucher/Produktionsaufträge am Tag? Falls ja, dann müssen Sie sich tatsächlich nach leistungsfähigeren Systemen umschauen.

Vorurteil 2: Excel sorgt für Wildwuchs

Auswertungen mit reinem Excel führen schnell zu Wildwuchs. Anwender verstehen nicht, was der Vorgänger getan hat. Bleibt eine Analyse ein paar Wochen liegen, weißt selbst der Ersteller nicht mehr, was die Werte bedeuten sollen.

Der Wildwuchs kommt nicht durch die Datenmengen oder durch chaotische Benutzer, sondern durch die unüberschaubaren Verknüpfungen zwischen Arbeitsblättern und verschiedenen Excel-Dateien. Der Feind hier heißt SVerweis - eine berüchtige Formel in Excel zur Verknüpfung von Daten. Excel selbst war nie für komplexe Datenanalysen ausgelegt.

Mit dem bereits genannten, kostenfreien Werkzeug Power Pivot ist das Datenmodell aber explizit. Kein SVerweis, sondern saubere Diagramme mit verknüpften Tabellen. Auch wenn verschiedene Quellen wie Datenbanken, CSV-Dateien und manuelle Daten verknüpft werden.

Vorurteil 3: Unternehmen benötigen teure Werkzeuge

Niemand will Datenanalysen auf einem Blatt Papier durchführen. Aber teure Werkzeuge lösen nicht das eigentliche Problem. Denn: A fool with a tool is still a fool!

Die Erfahrung zeigt, dass eigentlich jedes BI-Werkzeug die geforderten Aufgaben löst. Aber auch ein teures BI-Werkzeug, mit dem man Diagramme darstellen, das Berichte über Nacht aufbereiten und sie automatisiert versenden kann, benötigt die richtigen Daten.

Daher: Warum nicht mit kostenfreien Produkten, wie Power Pivot Auswertungen erstellen? Es fließt keine Zeit in langwierige Werkzeug-Evaluationen und es muss kein Budget definiert werden. Man beschränkt sich auf die Lösung der echten Aufgaben: Welche Zahlen, welche Daten, welche Darstellung? Wer die Auswertungen sehen darf, oder ob diese automatisch verteilt werden, kann man später - wenn es dann überhaupt noch relevant ist - immer noch mit Hilfe spezialisierter BI-Werkzeuge regeln. Der Transfer von den bereits erstellen Auswertungen in ein komplexes BI-Werkzeug ist wenig Aufwand.

Vorurteil 4: Es fehlt der Data Scientist

Das Vorurteil, dass Mitarbeiter fehlen, die Daten analysieren können, stimmt nicht ganz. Wenn immer vom Excel-Wildwuchs gesprochen wird, dann muss es doch Mitarbeiter geben, die diesen produziert haben! Diese Mitarbeiter wissen bereits, wo Daten zu finden und welche Tabellen notwendig sind sowie welche Daten unbeachtet bleiben müssen. Vor allem wissen sie, welche Auswertungen notwendig sind und wie man vorhandene operative Prozesse messen sollte.

Diese Mitarbeiter sind also nicht die echte Ursache für den Wildwuchs. Warum befähigt man diese Mitarbeiter nicht, ihre Arbeit effizienter durchzuführen? Niemand kennt die Prozesse ihres Unternehmens besser als dessen Mitarbeiter. Externe Berater müssen aufwändig geschult werden - und sind danach wieder weg, inklusive des Wissens, das sie aufgebaut haben! Nutzen Sie externe Kräfte lieber zur Weiterbildung und Unterstützung Ihrer Mitarbeiter!

Zentrale Datenhaltung

Dies ist natürlich kein Appell gegen eine zentrale Datenhaltung. Man benötigt weiterhin zentrale, unternehmensweite Datenablagen für firmen- oder konzernweite Analysen. Fachabteilungen machen aber weiterhin eigenständige Datenanalysen.

Sehen wir dieses "Self Service BI" einfach im Sinne von Prototyping. Eigene Auswertungen genießen eine viel höhere Akzeptanz, weil sie aus dem Fachbereich selbst stammen. Zudem fördern sie den Blick der Mitarbeiter auf die Daten in Systemen: Welche dürfen wir löschen, welche müssen wir archivieren, bei welchen Daten müssen wir aufpassen, wenn wir Änderungen vornehmen, welchen Einfluss hat etwas auf bestehende Analysen? Und vielleicht sind die Auswertungen am Ende so stabil und nutzbringend, dass man sich unternehmensweit nutzen kann - definiert sind sie dann schon.

Der Appell

Technik ist ausreichend vorhanden. Jetzt geht es um Befähigung und Talent.