Roadmap zur Digitalisierung

Der Data Scientist ist für den CDO unverzichtbar

Dr. Wolfgang Martin ist Experte auf den Gebieten Big Data, Business Intelligence, Performance Management, Analytics, Business Process Management, Information Management, Information Governance sowie Cloud Computing (SaaS, PaaS). Sein Spezialgebiet sind die Wechselwirkungen technologischer Innovation auf das Business und damit auf die Organisation, die Unternehmenskultur, die Businessarchitekturen und die Geschäftsprozesse.
Big Data sowie Tools für BI und Analytik liefern zwar massenhaft Daten, doch viele Unternehmen wissen aus den unstrukturierten Informationen wenig Kapital zu schlagen. Das ist fatal, denn die digitale Transformation schafft immer mehr datengesteuerte Betriebe. Deshalb ist der Data Scientist gefragt, der bimodular mit Analytik-Werkzeugen und agilem Ansatz die Daten interpretiert und damit für eine bessere Wertschöpfung sorgt.

"Es ist nicht länger glaubhaft, auf Daten wie auf ein statisches Objekt in einem tiefen See zu blicken, statt sie als eine Ansammlung sich schnell bewegender Wirtschaftsgüter in einem reißenden Fluss zu betrachten. Im Jahr 2016 und darüber hinaus müssen Unternehmen auf die Daten schauen, die geschäftsrelevante Informationen für heute und morgen liefern."

Dieser Appell von Neil Jarvis, CIO Fujitsu America, bringt auf den Punkt, worum es heute geht: Digitale Unternehmen sind datengesteuert. Genau hier setzt auch die digitale Transformation an. Das heißt: Es muss eine Person zum Treiber der digitalen Transformation erkoren werden, die auch den eigentlichen Kern eines digitalen Unternehmens verantwortet, nämlich der Chief Data Officer (CDO).

Der Data Scientist schafft die für ein digitales Unternehmen wichtige Datenkultur und trägt damit wesentlich zur digitalen Transformation bei.
Der Data Scientist schafft die für ein digitales Unternehmen wichtige Datenkultur und trägt damit wesentlich zur digitalen Transformation bei.
Foto: www.BillionPhotos.com - shutterstock.co
Digital Leader aufgepasst! - Foto: IDG

Digital Leader aufgepasst!

Mit anderen Worten: Die digitale Transformation beginnt beim Information Management. Hier muss als Erstes aufgeräumt werden. Das aber erfordert ein Motivieren und Agieren nicht nur auf der C-Ebene, sondern auf allen Ebenen der Unternehmensorganisation. Hier wird der CDO von seinen Mitstreitern, den Data Scientists, den Data Brokern und den Data Stewards unterstützt. Grund genug, in diesem dritten Beitrag der Serie "Roadmap zur Digitalisierung" nach dem CDO und Data Steward einen Blick auf die Rolle des Data Scientist zu werfen.

Analytik ist auf dem Vormarsch

Der Job des Data Scientist wurde bereits im Jahr 2012 vom Harvard Business Review zum "sexiest job of the 21st Century" gekürt. Im letzten Jahr war laut einer Untersuchung des Rekrutierungsportals Glassdoor der Beruf des Data Scientist in den USA Job Nummer eins unter den technologiebezogenen Tätigkeiten. Im Jahr 2014 rangierte er noch auf Platz neun. Interessant in diesem Zusammenhang ist auch, dass der verwandte Job eines Analytik-Managers es 2015 von null auf Platz elf schaffte. Das unterstreicht: Analytik ist auf dem Vormarsch, denn digitale Unternehmen sind datengetrieben und datengesteuert. Da wird Kompetenz in Analytik schnell zum kritischen Erfolgsfaktor. Mitarbeiter mit entsprechender Ausbildung und Kompetenz werden daher dringend gesucht, nicht nur in den USA. Und sie sind nicht nur begehrt, sondern werden auch gut bezahlt. Ein leitender Analytik-Manager erhält in den USA im Durchschnitt ein Jahresgehalt von 150.000 Dollar, ein Data Scientist im Mittel 101.000 Dollar bei einer Spannweite von 75.000 bis 127.000 Dollar.

Das mag alles vor dem Hintergrund erstaunen, dass die Anbieter von Analytik- und Business-Intelligence-Werkzeugen angeblich immer einfacher zu bedienende und fachabteilungsgerechte Analytik-Plattformen und -Werkzeuge herausbringen. Self-Service-Business-Intelligence ist angesagt. Das ist zwar richtig, aber ohne Mathematik, Statistik und ein solides Wissen in Information Management geht nicht allzu viel in einem digitalen Unternehmen. Data Scientists sind daher unverzichtbar, um eine höhere Wertschöpfung aus den Unternehmensdaten zu erzielen.

Hinzu kommt, dass heutzutage in Sachen Big Data der größte Teil an Daten nicht strukturiert ist und als Datenstrom in Echtzeit abläuft. Hier sind traditionelle, relationale Datenbanken mit den herkömmlichen Analytik- und BI-Werkzeugen nicht mehr ausreichend. Die neuen, innovativen Tools, die jetzt vermehrt auf den Markt kommen, adressieren zunächst einmal Data Scientists und nicht die Mitarbeiter in den Fachabteilungen. Der Job eines Data Scientist ist daher keineswegs simpel, sondern erfordert viel Wissen und Erfahrung in Sachen Analytik und Information Management.

Was ist Data Science?

Die ersten Anfänge von Data Science liegen bereits gut 50 Jahre zurück. Als Beginn von Data Science gilt der 1962 erschienene Aufsatz von John Tukey "The Future of Data Analysis". Demnach ist Data Science ein "Lernen mit Daten beziehungsweise Lernen von Daten". Damit unterscheidet sich Data Science von der traditionellen Statistik. Nach dem Statistikwissenschaftler Leo Breiman lassen sich Data Science und Statistik jeweils unterschiedlichen Kulturen zuordnen.

• Ziel von Data Science sind vor allem prädiktive Modelle ("Prediction"): Welche auf die Zukunft bezogenen Antworten lassen sich aus zukünftigen Eingangsvariablen eines Modells ableiten?

• Dagegen sind generative Modelle Ziel der Statistik ("Inference"): Was ist der Zusammenhang zwischen den Eingangs- und Ausgangsvariablen eines Modells?

Aus dieser Positionierung von Data Science versus Statistik wurde dann das "Common Task Framework" (CTF) als Basismethodologie von Data Science entwickelt. Es hat zu bemerkenswerten Fortschritten in der prädiktiven Analytik geführt.

Was tut ein Data Scientist?

Wie die Data Stewards arbeiten auch die Data Scientists eng mit den Fachbereichen zusammen und unterstützen diese als Dienstleister in allen analytischen Fragestellungen. Sie profitieren dabei von der horizontalen Sicht über alle Daten, die von den Data Stewards geschaffen wird. Sie besitzen insbesondere ein hohes Maß an Kreativität, das heißt die Fähigkeit, Probleme mit anderen Augen zu sehen und anzugehen ("thinking out oft he box"). Gemeinsam mit den Data Stewards schaffen sie die für ein digitales Unternehmen wichtige Datenkultur. Data Scientists tragen so wesentlich zur digitalen Transformation bei.

Durch den Einsatz von Big-Data-Analytik schaffen die Data Scientists aus der Vielfalt der Unternehmensdaten in Kombination mit Big Data neue, unternehmensrelevante Information und Wissen. Nur so kann sich ein datengetriebenes und -gesteuertes Unternehmen entfalten.

Die Rolle des Data Scientist lässt sich folgendermaßen beschreiben:

• Er verantwortet die aus dem CTF abgeleitete Methodologie von Big-Data-Analytik im Unternehmen.

• Er arbeitet gemäß Donohos "Greater Data Science" (GDS), das heißt, er betreibt Datenexploration und -vorbereitung, Datenpräsentation und Transformation, Durchführung der notwendigen Rechenoperationen und Anwendung der entsprechenden Algorithmen, Datenmodellierung (im Rahmen der Data-Scientist-Projekte) sowie Datenvisualisierung.

• Er kommuniziert die Projektergebnisse in einfacher, klar verständlicher Sprache und liefert gut aufbereitete und nachvollziehbare Sachverhalte, die auf Fakten basierende Unternehmensentscheidungen erlauben.

• Er ist maßgeblich an der Auswahl von Technologien für Big-Data-Analytik beteiligt, die möglichst bimodal einsetzbar sein sollen. (siehe dazu den Abschnitt "Welche Technologien nutzen Data Scientists")

Data Scientists haben dazu auch eine Schnittstelle zum Datenschutzbeauftragten, der über die Einhaltung der gesetzlichen Regelungen bei der Datenbeschaffung und Analyse wacht. Gemeinsam sind sie auch Anwälte einer Big-Data-Ethik.

Die Aufgaben von Data Scientists sollten natürlich im Rahmen der unternehmensspezifischen Roadmap zur Digitalisierung priorisiert werden.

Der Chief Data Scientist berichtet an den CDO

Wie das Team der Data Stewards vernetzt sich auch das der Data Scientists im Unternehmen und identifiziert in den verschiedenen Fachabteilungen und in der IT dezidierte Ansprechpartner. Organisatorisch fasst man am besten das Team mit seinen Ansprechpartnern in den Fachabteilungen und der IT in einem Kompetenzzentrum zusammen. Es hat einen Leiter, der - wie schon eingangs gesagt - an den CDO berichtet: Der CDO stellt das Budget zur Verfügung und verantwortet das Programm der Data Scientist.

Wie bei jedem Kompetenzzentrum gibt es die Möglichkeit einer zentralen, einer eingebetteten oder einer integrierten Organisation:

• In der zentralen Organisation ist man ein reiner Dienstleister, der autonom arbeitet.

• Eingebettet heißt, dass Data Scientists dezidiert in Fachabteilungen im Sinne einer Matrixorganisation mit dem Leiter Data Science als Vorgesetztem eingebettet werden.

• Integriert bedeutet, dass die Data Scientists Mitglieder in den Fachabteilungen sind, wobei auch der Fachabteilungsleiter der Vorgesetzte ist. Hier macht der Leiter Data Science nur noch methodische Vorgaben und setzt die Unternehmensstandards für Data Science. Jede dieser drei Organisationsformen hat die bekannten Vor- und Nachteile.

Welches Organisationsmodell ist also das richtige für Ihr Unternehmen? Im Rahmen einer digitalen Transformation empfehle ich eine zentrale Organisation, denn so kann sie als autonomer Dienstleister im Unternehmen am besten den Wandel treiben, indem sie als dezidiertes Team die neuen Ideen von Big-Data-Analytik innovativ an das Unternehmen anpassen und in die Fachabteilungen tragen kann.

Technik muss bimodale und agile Arbeitsweise unterstützen

Die digitale Transformation braucht natürlich auch Technologien. Dazu gehören sowohl Technologien des Information Managements als auch Big-Data-Analytik. Wie schon erwähnt, sollte man hier besonders darauf achten, dass die von den Data Scientists eingesetzten Techniken eine bimodale Arbeitsweise erlauben: Werkzeuge und Plattformen müssen einen agilen Ansatz unterstützen, damit Data Scientists im Projekt schnell vorankommen und "Quick Wins" erzielen. Aber sie müssen auch einen traditionellen Ansatz unterstützen, der dann zum Tragen kommt, wenn Data-Scientist-Projekte zu Standardanalysen werden. Dann sollten die Systeme in einen "stabilen" Modus überführt werden, insbesondere wenn die Verfügbarkeit der neuen Anwendungen unternehmenskritisch wird oder es um die Integration mit traditionellen Systemen geht.

Was wird aus dem Data Scientist nach der digitalen Transformation?

Data Scientists blicken, wie schon gesagt, auf eine gut 50-jährige Geschichte zurück, aber so richtig in den Fokus kamen sie erst mit dem Aufkommen von Big Data und der jetzt einsetzenden Digitalisierung der Unternehmen. Die digitalen Weltunternehmen wie Amazon, Facebook und Alphabet (vormals Google) verdanken ihren Aufstieg zu einem großen Teil den Data Scientists. Durch deren Arbeit verschafften sich diese Konzerne nicht nur Wettbewerbsvorteile, sondern auch ganz neue Märkte. Das ist der Vorteil digitaler Unternehmen, die sich von traditionellen Unternehmen vor allem durch ihre Datenkultur unterscheiden: Sie sind eben datengetrieben und datengesteuert.

Das unterstreicht die Bedeutung von Data Scientists, deren Aufgabe auch nach einer digitalen Transformation genauso weiterbesteht. Sie sind wie die Data Stewards eine Unternehmensinstitution, die notwendig ist, um ein digitales Unternehmen am Leben zu halten. Man sollte aber prüfen, ob eine zentrale Organisation des Kompetenzzentrums der Data Scientists nach dem Wandel noch die beste Organisationsform für das Unternehmen darstellt, denn diese hängt im Wesentlichen von der eigenen Unternehmenskultur ab.

Im Gegensatz zur Rolle des CDO, der sich bei vollzogenem Wandel zum digitalen Unternehmen selbst abschafft, bleibt also die Rolle des Data Scientist bestehen. Nur berichtet dann der Leiter Data Science typischerweise direkt an den CEO, der ja in der Regel nach der digitalen Transformation per Metamorphose aus dem CDO entstanden ist. Unternehmen, die gleich als digitale Unternehmen gestartet sind wie Facebook und LinkedIn, machen es so.

Fazit

Treiber einer digitalen Transformation sind in besonderem Masse die Data Scientists. Gemeinsam mit den Data Stewards bauen sie eine Datenkultur auf, so dass das Unternehmen datengetrieben und -gesteuert wird. Daher muss nicht nur ein CDO als Treiber des digitalen Wandels in der C-Riege etabliert werden, sondern auch die Motivation und Unterstützung der Mitarbeiter in den Fachabteilungen erfolgen. Das ist nicht nur die Aufgabe der Data Stewards, sondern auch die der Data Scientists, die als Dienstleister in Sachen Big-Data-Analytik die Fachabteilungen mit Fakten und Wissen über den Markt und die Kunden versorgen. Wie die Data Stewards werden sie in einem Kompetenzzentrum organisiert, dass im Rahmen der digitalen Transformation autonom arbeiten sollte. Nach der erfolgten digitalen Transformation sollte sich dann die Organisation des Kompetenzzentrums an die im Unternehmen bestehenden Organisationsstrukturen ausrichten. Der Leiter Data Science sollte dann direkt an den CEO berichten. (pg)

Beiträge der Serie Roadmap zur Digitalisierung:

Der Chief Data Officer dirigiert die digitale Transformation (Teil 1)

Über die Rolle des Data Steward (Teil 2)