Testen Sie Ihr Know-how!

Was ein Data Scientist können muss

Hans Königes ist Ressortleiter Jobs & Karriere und damit zuständig für alle Themen rund um Arbeitsmarkt, Jobs, Berufe, Gehälter, Personalmanagement, Recruiting sowie Social Media im Berufsleben.
Mit der Online-Prüfung zum Data Scientist, zusammengestellt von Marcel Fiebelkorn von Analytics Endeavor, können sich ab sofort Interessenten in diesem Berufsbild testen lassen.

"Data Science ist keine Umbenennung des Bereiches `Business Intelligence` und ersetzt diesen nicht," stellt IT-Mann Marcel Fiebelkorn klar. Während BI mit Standardisierung (z.B. IFRS) oder andern definierten KPIs die Historie aufarbeitet, werde in Data Science experimentiert und versucht die zukünftige Entwicklung zu beschreiben, Sprache interpretiert und Digitalisierung/Automatisierung betrieben. Dies impliziere, dass der Bereich Data Science losgelöst von Scrum-Zyklen zu betrachten ist.

"Die Rolle des Data Scientist ist es, die Digitalisierung im Unternehmen voran zu treiben und über Prognosen und Schätzungen Aussagen auf Fakten basieren zu lassen und Volatilität in Prozessen zu senken", definiert Marcel Fiebelkorn die Aufgaben.
"Die Rolle des Data Scientist ist es, die Digitalisierung im Unternehmen voran zu treiben und über Prognosen und Schätzungen Aussagen auf Fakten basieren zu lassen und Volatilität in Prozessen zu senken", definiert Marcel Fiebelkorn die Aufgaben.
Foto: weedezign - shutterstock.com

Wie der Name schon sagt, ist es eine datengetriebene Wissenschaft - die Erforschung von Daten mit Systematik und mit Experimenten. Damit ist Data Science generell für Unternehmen aller Sektoren wichtig, aber auch für alle Abteilungen im jeweiligen Unternehmen ein Mittel, um Mehrwert aus Daten zu generieren.

"Die Rolle des Data Scientist ist es, die Digitalisierung im Unternehmen voran zu treiben und über Prognosen und Schätzungen Aussagen auf Fakten basieren zu lassen und Volatilität in Prozessen zu senken", definiert Fiebelkorn die Aufgaben. Damit erstreckt sich das Einsatzgebiet über alle Unternehmensbereich von der Zeitreihenanalyse im Finanzwesen über Kundensegmentierungen, Churn-Prediction und Recommendations bis hin zu Logistikoptimierung und IoT (z.B. Maschinenwartung).

Arbeiten in einem dynamischen Umfeld

"Das Umfeld, in dem sich der Data Scientist bewegt ist ausgesprochen groß, vielfältig und entwickelt sich sehr dynamisch", freut sich IT-Profi Fiebelkorn. Daher weicht diese Funktion von der "typischen Spezialisierung" ab. Es werde ein Generalist und weniger ein Spezialist benötigt. Als Data Scientist spannt man den Bogen von Logik und quantitativen Methoden über Programmiersprachen, Frameworks und Infrastrukturen bis hin zur Implementierung und Prozessen. Dazu kommt noch das Fünkchen Kreativität zur rechten Zeit.

Aus dieser Vielfalt und Dynamik resultieren hohe Anforderungen an die Fähigkeiten und Fertigkeiten sowie an die Persönlichkeit. Letzteres ist dabei das entscheidende Kriterium. "Wichtig sind hierbei offen für neue Erfahrungen und Technologien zu sein, Flexibilität im Denken und Handeln zu praktizieren sowie über Reflexion Zusammenhänge zwischen verschiedenen Themen zu erkennen und nutzen zu können", so Fiebelkorn. Der Austausch über aktuelle Trends und Möglichkeiten sei genauso bedeutsam wie die Retrospektive und damit das Lernen aus "Fehlern" (aus eigenen Fehlern aber auch aus den Fehlern von anderen).

Was muss man dafür alles können? Für Personen, die aus dem wissenschaftlichen Umfeld kommen, ist der Fokus auf die Implementierbarkeit statt auf die Exaktheit der Nachkommastelle oder die IT-Infrastruktur eventuell eine erste Hürde. Während für den Praktiker eventuell die statistischen Methoden die erste Herausforderung darstellen.

"Entscheidend ist nicht, was eine Person in der Vergangenheit gemacht hat, sondern das Potenzial und die intrinsische Motivation", betont er. Es gilt nicht nur aus den eigenen Erfahrungen zu lernen, sondern einen aktiven Wissensaustausch zu betreiben - etwa über Treffen (Meetups, Hackathons, ...), Workshops und Konferenzen, Literatur und Online Academies. Eine lernbereite Person mit Flexibilität, Leidenschaft für die Technik und Tatendrang sei unter Umständen agiler und anpassungsfähiger als ein Experte aus einem spezifischen Teilbereich der Data Science Disziplinen, welcher skeptisch gegenüber ihm unbekannten Techniken ist.

Programmiersprachen und Datenbanken

Grundsätzlich ist ein akademischer Hintergrund sicherlich hilfreich und umso mehr Programmiersprachen (Python, R, Scala, Java, JavaScript, Bash, RegEx, ...), Datenbanken (PostgreSQL, Cassandra, mongodb, neo4j, ..) und Infrastrukturen (VM, Cloud) man benutzt, desto einfacher sollte es für eine Person sein, Data Science zu betreiben.

Gewohnheiten ablegen und sich selbst, seine Arbeit aber auch die Arbeit der Kollegen kritisch zu reflektieren, neue unkonventionell Wege gehen, Methoden wie Test Driven Development ausprobieren und hinterher zu evaluieren, was in wieweit welche Wirkung hatte und daher wie zukünftig für das Team und das Unternehmen relevant sein könnte - das ist ein Weg, um sich selbst, das Team und damit das Unternehmen voranzubringen und womöglich disruptive Marktveränderungen anzuführen.

Die Zertifizierungstests erstrecken sich über die Bandbreite des Themengebietes Data Science (Data Thinking, Programmierung, Data Analysis, Supervised Learning und Unsupervised Learning). Der Zertifizierungstest-Bronze hat die wichtigen Wissensbestandteile im Fokus. Er ist für all diejenigen gedacht, die ein breites Basiswissen über Data Science erworben haben, unabhängig ob man ein Experte für ein spezifisches Teilgebiet ist, Data Analyst, Data Engineer, Database Administrator oder aus dem Business-Bereich kommt. Die Grenze zum Bestehen des Zertifizierungstest liegt bei 65 Prozent, sodass auch mit der ein oder anderen Schwäche jedem eine faire Möglichkeit geboten wird.

Weiterführend wird im Zertifizierungstest-Silber mit Bezug auf die Stärken und Schwächen der Methoden die Fähigkeit der Reflexion stärker miteinbezogen und im Gold-Level kommen die nötigen Soft-Skill eines Data Scientist hinzu. Aus Unternehmensperspektive eignen sich die Tests hervorragend, um ad-hoc ein Personal-Assessment vor dem Bewerbungsgespräch oder vor Ort durchführen zu können und ein adäquaten Überblick zu den Fähigkeiten und Fertigkeiten des Bewerbers zu erhalten.

Grundvoraussetzungen für Data Science im Unternehmen

Ein kritischer Punkt ist zum einen, dass Unternehmen Daten im ausreichenden Maß besitzen sollten, die zugänglich sind (oder gemacht werden) und zum anderen die Personalentwicklung. Das Tuning von Modellparametern ist wichtig, aber der Nutzen von zusätzlichen Daten kann weitaus größer sein. Deep Learning auf die Abverkaufstabelle, die das BI nutzt, ist grundsätzlich möglich, jedoch eventuell nicht erfolgsgekrönt.

Nachdem ein Unternehmen Personal eingestellt hat, ist die kontinuierliche Weiterentwicklung gefragt. Es bedarf einer langfristigen und intensiven Personalpolitik, um nicht durch kurzfristige Manöver den Anschluss langfristig zu verlieren. Statt dem Aufbau einer klassisch strukturierten Abteilung könnte ein "Data-Lab" eine vielversprechende Alternative sein. Ist heute noch (Un-)Supervised-Learning (ML) das Thema, ist es morgen Artificial Intelligence und übermorgen eventuell Reinforcement Learning? Jedes Thema setzt seine eigenen Akzente bezüglich der forcierten Programmiersprache, des Frameworks und der Infrastruktur.

In Deutschland haben immer mehr Unternehmen den Handlungsbedarf erkannt und bauen Abteilungen im Bereich Data Science auf und aus. Wer sich weiterentwickeln möchte, dem sollten einige Optionen zur Verfügung stehen. Die Herausforderung ist, dass die enorme Geschwindigkeit in den Bereichen Advandced Analytics und Big Data immer weiter zunimmt. Es gilt die Übersicht zu behalten und eine nachhaltige Strategie für das jeweilige Unternehmen zu entwickeln, welche einerseits die aktuell adäquatesten Methoden und Technologien implementiert aber zugleich die Flexibilität hat, zukünftig Teile dessen partiell ersetzen zu können.

Immer mehr Unternehmen bauen Data-Science-Abteilungen auf.
Immer mehr Unternehmen bauen Data-Science-Abteilungen auf.
Foto: Sergey Nivens - shutterstock.com

Certified by Professionals

"Certified by Professionals" oder kurz CeLS heißen neue Zertifikate, die IT-Experten für Experten entwickeln. Geprüft werden online alle für ein IT-Berufsbild wichtigen Fähigkeiten, Fachkenntnisse, Methoden und Soft Skills. Ganz wichtig dabei: Die Testinhalte liefern IT-Fachleute. Für die bisherigen CeLS-Zertifizierungen konnten erfahrene Profis ihres Fachs gewonnen werden, die gerne ihr Wissen mit der Community teilen möchten.

Zielgruppe der Zertifikate sind IT-Fachleute - festangestellt und freiberuflich, die ihre projektbezogenen Fähigkeiten inklusive der Soft Skills mit einem Zertifikat nachweisen möchten, um so ihre Chancen am Arbeitsmarkt zu verbessern. Für jedes Berufsbild existieren insgesamt drei Tests für Einsteiger und Fortgeschrittene. Der neue Standard ist als herstellerunabhängiger Test gedacht und soll sich nicht mit den etablierten Herstellern messen, die meist ihre eigenen Produkte punktuell zertifizieren.

Den aktuellen Test zum Data Scientist hat Marcel Fiebelkorn entwickelt. Er war als IT-Consultant und als Data Scientist tätig und befasst sich seit 2015 mit den Themen Big Data und Advanced Analytics. Er ist Geschäftsführer des Unternehmens Analytics Endeavor, welche Beratungsleistungen bei der Integration von Plattformen, Frameworks und quantitativen Methoden in bestehende Infrastruktur und Prozesse anbietet.