Fachkräfte für Big Data gesucht

Die 5 Typen von Data Scientists

09.07.2015
Von Dr. Angi Voss
Data-Scientist-Teams bestehen aus Business Developern, Data Analysten, Data Managern sowie Application Developern und Security Managern. Doch sie müssen erst geschult werden.
  • Business Developer blicken in die Geschäftsprozesse und verbinden Unternehmensziele mit Datenanalysen
  • Data Analysts beherrschen analytische Methoden, Data Mining und Datenvisualisierung.
  • Data Manager optimieren die Datenqualität und beschreiben die Daten mit Metadaten
  • Application Developer setzen Plattformen, auf der Daten integriert und Anwendungen entwickelt und installiert werden.
  • Security Manager sorgen für die Datensicherheit

Laut der Bitkom-Studie "Der Arbeitsmarkt für IT-Fachkräfte" vom November 2014 gibt es in Deutschland derzeit in Unternehmen der Informationstechnologie und Telekommunikation rund 16.500 freie Stellen, die zu drei Vierteln von Software-Entwicklern besetzt werden sollen. Diese sollten neben Fähigkeiten im Bereich Cloud Computing (53 Prozent) vor allem Kenntnisse im Bereich Big Data (44 Prozent) mitbringen.

Der Bedarf an gut ausgebildeten Fachkräften für Big Data zeigt, dass deutsche Unternehmen mittlerweile den hohen Wert von Daten erkannt haben und sich immer mehr zu "data-driven Companies" entwickeln. Hierfür benötigen sie spezielle Fachkräfte - Data Scientists - , die wissen, wie sie Big Data nutzen müssen, um automatisiert Ereignisse zu erkennen und einzuschätzen, Entwicklungen kurzfristig vorherzusagen und Entscheidungen zu treffen. Auf dieser Basis können Firmen dann ihre Unternehmensführung effizienter gestalten, neue individualisierte Dienstleistungen anbieten oder intelligente Produkte entwickeln.

Die Anforderungen an solche Spezialisten sind hoch. Sie bilden die Schnittstelle zwischen Technik und Business sowie Daten und Personen und verfügen zudem über umfassendes Wissen - sowohl über Big Data, als auch über ihr Unternehmen und die Branche, in der sie tätig sind.

5 Typen von Data Scientists

Spezialisten, die in allen Big Data-Bereichen gleich gut ausgebildet sind, findet man allerdings schwer. Deshalb bilden größere Unternehmen ITler, Physiker, Mathematiker und Betriebswirte zu einem Team an Data Scientists aus. Diese Experten greifen alle auf die gleichen Grundlagen zurück, haben sich jedoch auf verschiedene Big-Data-Bereiche spezialisiert. Solche Teams bestehen in der Regel aus Business Developern, Data Analysten, Data Managern und Application Developern. Die Arbeitsschritte der einzelnen Expertinnen und Experten gehen fließend ineinander über.

1. Aufgaben des Business Developer

Business Developer haben tiefe Einblicke in die Geschäftsprozesse und können Unternehmensziele mit Datenanalysen in Verbindung bringen. Sie entwickeln eine erste Fragestellung oder decken ein Problem auf, das anhand der erhobenen Daten gelöst werden soll, etwa das Problem von Kunden Kündigungen. Ein tieferes technisches Verständnis ist für den Business Developer unabdingbar, da er nur so die Machbarkeit seiner Ideen einschätzen kann. Als Schnittstelle zwischen Geschäftswelt und Technik kann er den Nutzen der Analyseergebnisse am besten einschätzen und arbeitet daher eng mit dem Data Analyst zusammen.

2. Aufgaben des Data Analyst

Der Data Analyst besitzt profunde Kenntnis über datengetriebene analytische Methoden, Data Mining-Verfahren und Techniken der Datenvisualisierung. Mit ihnen können Datensätze automatisch klassifiziert oder hinsichtlich ihrer Ähnlichkeit gruppiert werden. So kann der Data Analyst die Aussagekraft der Daten bewerten und relevante Muster und Auffälligkeiten in den Datenströmen erkennen. Ist er fündig geworden, prüft er, ob sich hinter den Mustern eine neue oder für die Fragestellung wichtige Erkenntnis verbirgt. Daraufhin kann er die Fragestellung mit dem Business Developer präzisieren oder in eine neue Richtung lenken.

Schließlich entscheidet der Data Analyst, welches statistische Modell am besten geeignet ist, um an die gewünschten Informationen zu gelangen. Für Kündigungsvorhersagen werden beispielsweise Assoziationsregeln erzeugt, die beschreiben, welche Kombination spezieller Eigenschaften ein Kunde besitzt, der bald kündigt. So kann das Modell eigenständig eine Warnung aussprechen, die beispielsweise dazu führt, dass dem Kunden ein günstigeres Angebot unterbreitet wird, um ihn zum Bleiben zu bewegen.

3. Aufgaben des Data Manager

Zuvor müssen die strukturierten und unstrukturierten Daten, die zum Teil aus heterogenen Quellen stammen, jedoch in eine gemeinsame Datenbank gebracht und integriert werden. Hier sorgt der Data Manager dafür, dass die Qualität der Daten langfristig optimiert wird und sie durch Metadaten ausreichend beschrieben werden. Dazu zählt, dass sich der Data Manager einen Überblick über die Nutzungsrechte verschafft und bei sensiblen Daten weiß, wofür diese verwendet werden dürfen.

4. Aufgaben des Application Developer

Der Application Developer setzt die Plattform auf, auf der die Daten integriert und die Anwendungen entwickelt und installiert werden. Er beherrscht verschiedene Werkzeuge zur Parallelisierung und Echtzeitverarbeitung, so dass die statistischen Modelle des Data Analysten auch auf großen Datenmengen genutzt werden können. Dabei muss der Application Developer den richtigen Mittelweg finden zwischen Antwortverhalten, Robustheit und Kosten des Systems.

5. Aufgaben des Security Manager

Im Hintergrund des kompletten Data-Mining Prozesses arbeitet der Security Manager, der für ein übergreifendes Sicherheitsmanagement im Unternehmen zuständig ist. Er sorgt dafür, dass die Zusammenführung, Anreicherung und Analyse von Daten keine Rückschlüsse auf Einzelpersonen zulässt und damit die Persönlichkeitsrechte verletzen könnte.

Der Security Manager muss also den Datenschutz organisatorisch und technisch umsetzen. Unter dem Stichwort "privacy-preserving" Analytik werden Daten komprimiert oder ausgedünnt, so dass daraus keine personenspezifischen Daten zurückgewonnen werden können.

Der Security Manager sorgt zudem dafür, dass Daten nicht in fremde Hände gelangen, also sicher übertragen und verwahrt werden. Dazu setzt er einschlägige Verschlüsselungs- und Schutzmechanismen ein und installiert Protokolle, die zeigen, welchen Weg die Daten im Unternehmen zurücklegen.