Stammdatenmanagement trifft Big Data

Die Rollen von Data Stewards und Data Scientists müssen zusammenpassen

17.04.2014
Von 
Dr. Wolfgang Martin ist Experte auf den Gebieten Big Data, Business Intelligence, Performance Management, Analytics, Business Process Management, Information Management, Information Governance sowie Cloud Computing (SaaS, PaaS). Sein Spezialgebiet sind die Wechselwirkungen technologischer Innovation auf das Business und damit auf die Organisation, die Unternehmenskultur, die Businessarchitekturen und die Geschäftsprozesse.
Richtig mit Informationen im Big-Data-Zeitalter umzugehen, ist nicht allein eine Sache der Technik. Unternehmen müssen auch ihre Organisation auf die wachsenden Datenmengen einstellen. Dazu gehören eine ganze reihe neuer Rollen, die im Team gut zusammenspielen müssen.

Bereits vor dem Zeitalter von Big Data war die Frage, wer für welche Daten und ihre Qualität im Unternehmen verantwortlich ist, mehr als essentiell, denn Information entscheidet alles. Es ging schon immer darum, dem richtigen Kunden rechtzeitig das richtige Produkt mit der richtigen Rechnung an den richtigen Ort zur richtigen Zeit in der richtigen Menge zu liefern. Das war und ist die Zielsetzung von Informationsmanagement. Die Wichtigkeit von Informationsmanagement wurde und wird aber nicht immer anerkannt. Wenn Information nicht korrekt, vollständig und rechtzeitig zur Verfügung steht, dann gibt es Prozessabbrüche oder -verzögerungen, Stornos, Retouren, Stillstand, Verärgerung auf der Kundenseite und einiges an Unbequemem und Ärgerlichem mehr.

Nicht die richtige Information zu haben kostet viel Geld, Umsatz und verursacht auch noch Kosten. Prozesse können nur dann (optimal) ablaufen, wenn die Information stimmt. Informationsmanagement tut also Not. Bleibt die Frage, wer für Informationsmanagement zuständig und folglich verantwortlich ist, wenn die Information nicht stimmt.

Foto: Creativa - Fotolia.com

Die Aufgaben von Data Stewards

Die Aufgaben des Informationsmanagements und der Qualitätssicherung von Daten im Unternehmen nehmen immer häufiger Data Stewards wahr. Sie arbeiten im Kontext von Information Governance, die die Regeln und Prozesse definiert, die im Informationsmanagement gelten beziehungsweise ablaufen. So soll sichergestellt werden, dass Information korrekt, konsistent und durchgängig im ganzen Unternehmen angelegt, gemanagt und genutzt wird.

Data Stewards sorgen dafür, dass die Information Governance von allen im Unternehmen bei allen Tätigkeiten beachtet und umgesetzt wird. Diese Aufgabe sollten sie nicht als polizeiliche Kontrollinstanz erfüllen, sondern im Gegenteil als Dienstleister für die Fachabteilungen. Dazu gehören unterschiedliche Tätigkeiten. Data Stewards sollten eine führende Rolle bei der Entwicklung von Datendefinitionen einnehmen. Sie sollten Data Profiling unterstützen, um Fehler in Daten aufzudecken und die Auswirkungen solcher Fehler abschätzen. Sie sollten die Nutzung von Daten propagieren und für Datensicherheit sorgen. Sie sollten auch über die Einhaltung aller Regeln und über die Qualität der Daten mittels Monitoring wachen. Sie sind auch beteiligt, wenn es um die Priorisierung von Datenqualitäts-Maßnahmen geht.

Die Aufgaben von Data Stewards sollten natürlich auch im Rahmen der Unternehmensstrategie und der Unternehmensziele priorisiert werden. So sollte beispielsweise ein Softwareunternehmen, wie es die in Pforzheim ansässige Uniserv praktiziert, den Schwerpunkt der Arbeit von Data Stewards auf die Kundendaten legen, die in den Vertriebs- und Marketing-Prozessen genutzt werden, auf denen das Unternehmen aktuell einen Fokus gelegt hat. Einen Fokus auf Kundendaten ganz allgemein zu legen, wäre hier eine zu unscharfe Vorgabe, die in der Regel nicht zum Erfolg führen wird.

Die Organisation von Data Stewards

Data Stewards können mit ihrer Arbeit im Unternehmen starten, auch wenn noch keine ausgefeilte Information Governance besteht. Ein kleines gemischtes Team aus Fachabteilungen und der IT kann mit der Formalisierung von Datendefinitionen und Informationsmanagement-Prozessen und Nutzungsregeln beginnen. Die Mitarbeiter/innen sollten gute Kommunikatoren und Vermittler sein sowie geschickt verhandeln können. Sie müssen nicht unbedingt Vollzeit in das Team delegiert werden, aber man sollte darauf achten, dass genügend Zeit für die Tätigkeit als Data Steward eingeplant wird. Das Einstellen neuer Mitarbeiter für diese Aufgaben hat sich in der Regel nicht bewährt, da Data Stewards das Unternehmen inklusive der informellen Informationskanäle gut kennen müssen, um erfolgreich arbeiten zu können.

Das Team vernetzt sich dann im Unternehmen und identifiziert in den verschiedenen Fachabteilungen und in der IT dezidierte Ansprechpartner. Es hat auf diese Weise auch die Aufgabe, eine funktionierende Partnerschaft zwischen den Fachabteilungen und der IT zu etablieren. Organisatorisch fasst man am besten das Team mit seinen Ansprechpartnern in den Fachabteilungen und der IT in einem Kompetenzzentrum zusammen. Ein solches hat einen Sponsor auf der Führungsebene des Unternehmens und wird von einer Doppelspitze geleitet, einem Mitarbeiter aus der Fachabteilung der als Primus inter Pares agiert, und einem Mitarbeiter aus der IT. Es hat ein Budget, verantwortet das Programm und entwickelt seine Methodologie, die Information Governance.

Data-Steward-Programme stoßen mitunter im Unternehmen auf kulturelle Probleme. Beispielsweise wollen manchmal von einer Fachabteilung Probleme mit schlechter Datenqualität nicht gesehen werden, weil in dieser Fachabteilung die Daten zwar entstehen, aber hauptsächlich an anderer Stelle genutzt werden. Daher hat eine solche Fachabteilung möglicherweise wenig Interesse, in Datenqualität zu investieren. Hier können Data Stewards für Transparenz sorgen und aufzeigen, welche Probleme dem Gesamtunternehmen entstehen und wie man diese Fachabteilung in Sachen Datenqualität unterstützen kann.

Big Data-Analytik

Data Stewards haben die Verantwortung für die Unternehmensdaten und/oder - im jeweiligen Umfang - für Daten aus den Fachabteilungen. Jetzt kommt Big Data. Wie beeinflusst das Management von Big Data die bisherigen Aufgaben und Zielsetzungen von Data Stewards? Schauen wir zuerst auf die Anforderungen von Big-Data-Analytik. Sie erfordert gegenüber der traditionellen Analytik neue Skills und Rollen, die sich organisatorisch gesehen am besten in einem erweiterten BI-Kompetenzzentrum ansiedeln lassen. In einigen Unternehmen wie Amazon, eBay, Facebook, Google, Twitter und anderen, die sich schon einige Zeit mit Big Data beschäftigen, haben sich solche neuen Rollen gebildet, die zusammen ein Big Data-Team ausmachen. Die fünf wichtigsten Rollen in einem solchen Team findet man in einem Vorschlag von McKinsey & Company. Dieser Beitrag beschäftigt sich zwar mehr mit Big Data-Marketingprojekten, aber er ist allgemein genug geschrieben, um auf andere Big Data-Projekttypen übertragen werden zu können. Insbesondere identifiziert der McKinsey-Ansatz Rollen statt Job-Bezeichnungen. Daraus lassen sich dann direkt die notwendige Expertise und die Job-Beschreibung ableiten. Es geht um die fünf folgenden Rollen (Ich habe die amerikanischen Bezeichnungen stehen gelassen):

  • Data Hygienists stellen sicher, dass die Daten bereinigt und richtig sind und auch über den Lebenszyklus der Daten so bleiben. Dieses Data Profiling und Cleansing beginnt ganz am Anfang des Projektes, wenn die ersten Daten erfasst werden. Daran sind alle Team-Mitglieder beteiligt, die diese Daten nutzen wollen.

  • Data Explorers durchsuchen das Big-Data-Universum, um die Daten aufzufinden, die man im Projekt braucht. Dazu gehört auch die Aufbereitung der Daten für das Projekt, denn die meisten Daten draußen waren niemals erzeugt, um analytisch untersucht zu werden, sind also weder für eine Analyse geeignet noch gespeichert noch organisiert.

  • Business Solution Architects haben die Aufgabe, die identifizierten Daten zusammenzustellen und für die Analyse vorzubereiten. Dazu werden die Daten auch für die erwarteten Abfragen strukturiert. Daten, die im Minuten- oder Stundentakt benötigt werden, müssen dann auch entsprechend aufgefrischt werden.

  • Data Scientists übernehmen das Organisieren der Daten und das Bauen von analytischen Modellen im Rahmen des Projektes. Dazu gehört auch das Überprüfen, Ändern und Ersetzen von Modellen, wenn notwendig, sowie die Kommunikation von analytischen Resultaten gegenüber dem Vorstand und dem gesamten Unternehmen.

  • Campaign Experts haben die Aufgaben des Interpretierens der Ergebnisse und dem entsprechenden Umsetzen in Aktionen. Dazu gehören auch das Priorisieren von Kanälen und das Festlegen der Kampagnen-Sequenzen.

Die Rollen der Data Explorers und Campaign Experts benötigen Expertisen wie Cognitive Scientists und Behavioral Economists. Solche Expertise ist notwendig, um zu identifizieren, welche Daten für das Projekt wichtig sind und welche nicht. Sie ist auch von großer Hilfe in der Interpretation von Ergebnissen und entsprechenden Umsetzungen. Daher ist McKinseys Rollenmodell so wichtig. Wenn man Aufgaben und Rollen verstanden hat, weiß man, welche Experten man im Projekt braucht.