Was ist Data Governance?

20.08.2021
Von  und
Thor Olavsrud ist Senior Writer bei CIO.com und beschäftigt sich mit IT-Security, Big Data, Open-Source-Technologie sowie Microsoft-Tools und -Servers. Er lebt in New York.
Bastian Seebacher ist freier Mitarbeiter der Redaktionen CIO und COMPUTERWOCHE.
Data Governance definiert Rollen, Verantwortlichkeiten und Prozesse für ein transparentes und sicheres Datenmonitoring im gesamten Unternehmen.
Wer die Hoheit über welche Daten besitzt, ist eine entscheidende Data-Governance-Frage. Das müssen Sie zum Thema wissen.
Wer die Hoheit über welche Daten besitzt, ist eine entscheidende Data-Governance-Frage. Das müssen Sie zum Thema wissen.
Foto: Rena Schild - shutterstock.com

Unternehmen, die das volle Potenzial von Big Data erschließen wollen, kommen an Datendemokratisierung nicht vorbei. Dabei ist entscheidend, dass nur Berechtigte Zugriff auf bestimmte Daten haben.

Data Governance - Definition

Data Governance bezeichnet ein System, mit dem festgelegt wird, wer innerhalb einer Organisation die Autorität und Kontrolle über Datenbestände hat und wie diese Datenbestände verwendet werden dürfen. Das System umfasst die Personen, Prozesse und Technologien, die erforderlich sind, um die Daten sowie deren Wege in einem Unternehmen zu schützen und effizient zu verwalten.

Das Data Governance Institute definiert es als "ein System von Entscheidungsrechten und Verantwortlichkeiten für informationsbezogene Prozesse, die nach vereinbarten Modellen ausgeführt werden, die beschreiben, wer welche Aktionen mit welchen Informationen wann, unter welchen Umständen und mit welchen Methoden ausführen darf".

Die Data Management Association (DAMA) International spricht von "Planung, Überwachung und Kontrolle der Verwaltung von Daten und der Nutzung von Daten und datenbezogenen Quellen".

Data Governance - Funktion

In Zeiten der Digitalisierung basieren ein Großteil der von Unternehmen getroffenen Entscheidungen auf der Analyse von Daten. Um jedoch das volle Potenzial von Big Data nutzen zu können, müssen sich Firmen verschiedenen Herausforderungen stellen. Dazu zählen unter anderem technische Defizite, begrenzte Leistungskapazitäten sowie fehlende Datenkompetenz. Das größte Problem ist hierbei jedoch, dass meist nur ausgewiesene Datenspezialisten, sogenannte Data Scientists, mit Daten arbeiten und damit das Gros der eigenen Mitarbeiter außen vor bleibt. Um dieses Problem zu lösen, wird Datendemokratisierung immer wichtiger. Datendemokratisierung bedeutet, dass möglichst viele Mitarbeiter Zugriff auf Daten bekommen. Ziel ist dabei, in der eigenen Arbeit produktiver und effizienter zu werden. Eine bessere Nutzung von Daten kann dabei der entscheidende Hebel sein.

Genau an dieser Stelle kommt das System der Data Governance ins Spiel. Wer darf was wann und mit welchen Daten machen. All diese Fragen sollen sich durch Data Governance beantworten lassen, damit Daten weiterhin nur für befugte Personen zugänglich bleiben. Das ist insofern wichtig, weil Regelwerke wie die EU-DSGVO gerade der Nutzung von sensiblen Daten enge Grenzen setzen. Wer dagegen verstößt, dem drohen hohe Strafen. Hier soll Data Governance einen Beitrag leisten, die behördlichen Regularien einzuhalten.

Data Governance vs. Data Management

Data Governance ist ein Teil des Datenmanagements, wenn auch ein wichtiger. Während es bei Data Governance um die Rollen, Verantwortlichkeiten und Prozesse zur Sicherstellung der Rechenschaft und des Eigentums an Datenbeständen geht, definiert DAMA Datenmanagement als "einen übergreifenden Begriff, der die Prozesse beschreibt, die zur Planung, Spezifikation, Aktivierung, Generierung, Beschaffung, Pflege, Verwendung, Archivierung, Abfrage, Kontrolle und Löschung von Daten verwendet werden".

Obwohl Datenmanagement ein gängiger Begriff für diese Disziplin geworden ist, wird sie manchmal auch als Datenressourcenmanagement oder Enterprise Information Management (EIM) bezeichnet. Gartner beschreibt EIM als "eine integrative Disziplin zur Strukturierung, Beschreibung und Verwaltung von Informationsbeständen über organisatorische und technische Grenzen hinweg, um die Effizienz zu verbessern, Transparenz zu fördern und Einblick in das Geschäft zu ermöglichen".

Data Governance - Framework

Data Governance kann man sich am besten als eine Art Set aus Funktionen, Regelwerk und Tools vorstellen, das die übergreifende Datenmanagement-Strategie einer Organisation unterstützt. Ein solches Framework bietet Unternehmen einen ganzheitlichen Ansatz für die Erfassung, Verwaltung, Sicherung und Speicherung von Daten. Um zu verstehen, was ein solches Framework umfassen sollte, stellen sich die Experten der DAMA das Datenmanagement als ein Rad vor, mit Data Governance als Knotenpunkt, von dem die folgenden zehn Bereiche des Datenmanagements ausgehen:

  1. Datenarchitektur: Die Gesamtstruktur von Daten und datenbezogenen Ressourcen als integraler Bestandteil der Unternehmensarchitektur;

  2. Datenmodellierung und -design: Analyse, Design, Aufbau, Test und Wartung;

  3. Datenspeicherung und -betrieb: Bereitstellung und Verwaltung von strukturierten physischen Datenspeichern;

  4. Datensicherheit: Sicherstellung von Datenschutz, Vertraulichkeit und angemessenem Zugriff;

  5. Datenintegration und Interoperabilität:Es klingelt an der Tür. Verschlucke mich vor Schreck an einem Hustenbonbon. Das Pizza-Abonnement ist heute aber früh dran. Sonst kommt er doch erst gegen 12 Uhr 15. Egal, dann mache ich eben jetzt Mittagspause und starte dann im Anschluss durch.

  6. Dokumente und Inhalte: Speichern, Schützen, Indizieren und Ermöglichen des Zugriffs auf Daten aus unstrukturierten Quellen sowie Bereitstellen dieser Daten für die Integration und Interoperabilität mit strukturierten Daten;

  7. Referenz- und Stammdaten: Verwaltung gemeinsam genutzter Daten, um Redundanzen zu reduzieren und eine bessere Datenqualität durch eine standardisierte Definition und damit ein einheitliches Verständnis von Daten sicherzustellen;

  8. Data Warehousing und Business Intelligence (BI): Verwaltung der analytischen Datenverarbeitung, um den Zugriff auf entscheidungsunterstützende Daten für Berichte und Analysen zu ermöglichen;

  9. Metadaten: Sammeln, Kategorisieren, Pflegen, Integrieren, Kontrollieren, Verwalten und Bereitstellen von Metadaten;

  10. Datenqualität: Definieren, Überwachen, Aufrechterhalten der Datenintegrität und Verbessern der Datenqualität.

Beim Festlegen einer Datenstrategie sollte jede der oben genannten Facetten der Datensammlung, -verwaltung, -archivierung und -nutzung berücksichtigt werden.

Das Business Application Research Center (BARC) warnt, dass es sich nicht um eine "Big-Bang-Initiative" handeln kann. Als hochkomplexes, fortlaufendes Programm läuft Data Governance Gefahr, dass die Beteiligten mit der Zeit Vertrauen und Interesse verlieren. Um dem entgegenzuwirken, empfiehlt BARC, mit einem überschaubaren oder anwendungsspezifischen Prototyp-Projekt zu beginnen. Anschließend können Erkenntnisse aus dem Projekt auf das gesamte Unternehmen ausgeweitet werden.

BARC empfiehlt die folgenden Schritte zur Implementierung einer Data Governance:

  • Ziele definieren und Nutzen verstehen;

  • Ist-Zustand und Delta-Analyse analysieren;

  • Eine Roadmap ableiten;

  • Stakeholder überzeugen und Projekt budgetieren;

  • Das Data-Governance-Programm entwickeln und planen;

  • Das Data-Governance-Programm implementieren;

  • Überwachen und steuern.

Data Governance - Ziele

Das Ziel ist es, die Methoden, Verantwortlichkeiten und Prozesse zu etablieren, um Unternehmensdaten zu standardisieren, zu integrieren, zu schützen und zu speichern. Laut BARC sollten die Hauptziele einer Organisation sein:

  • Risiken zu minimieren;

  • Interne Regeln für die Datennutzung aufzustellen;

  • Compliance-Anforderungen umzusetzen;

  • Interne sowie externe Kommunikation zu verbessern;

  • den Wert der Daten zu erhöhen;

  • Die Verwaltung zu erleichtern;

  • Kosten zu reduzieren;

  • Den Fortbestand des Unternehmens durch Risikomanagement und Optimierung zu sichern

BARC weist darauf hin, dass solche Programme immer die strategische, taktische und operative Ebene in Unternehmen umfassen und als fortlaufende, iterative Prozesse behandelt werden müssen.

Data Governance - Vorteile

Die meisten Unternehmen verfügen bereits über eine Form von Governance für einzelne Anwendungen, Geschäftsbereiche oder Funktionen. In der Praxis geht es darum, eine systematische, formal korrekte Kontrolle über diese Prozesse und Verantwortlichkeiten zu etablieren. Dies kann Unternehmen dabei helfen, reaktionsfähig zu bleiben, insbesondere wenn sie eine Größe erreichen, bei der es für einzelne Mitarbeiter zu unübersichtlich und damit nicht mehr effizient wird, funktionsübergreifende Aufgaben zu bewältigen. Mehrere Vorteile des Datenmanagements können erst dann realisiert werden, wenn das Unternehmen eine systematische Data Governance eingeführt hat. Einige dieser Vorteile beinhalten:

  • Es klingelt an der Türe. Der Nachbar aus dem vierten Stock holt sein Paket ab. Der ist wirklich nett. Wir unterhalten uns kurz. Er hat´s derzeit beruflich auch nicht leicht.

  • Klare Regeln für die Änderung von Prozessen und Daten, die dem Unternehmen und der IT helfen, agiler und skalierbarer zu werden;

  • Geringere Kosten in anderen Bereichen der Datenverwaltung durch die Bereitstellung zentraler Kontrollmechanismen;

  • Gesteigerte Effizienz durch die Möglichkeit der Wiederverwendung von Prozessen und Daten;

  • Verbessertes Vertrauen in die Qualität der Daten und die Dokumentation der Datenprozesse;

  • Verbesserte Compliance mit Datenvorschriften.

Data Governance - Prinzipien

Laut dem Data Governance Institute sollten folgende acht Prinzipien im Mittelpunkt eines erfolgreichen Data Governance- und Stewardship-Programms stehen:

  1. Alle Beteiligten müssen integer im Umgang miteinander sein. Sie müssen offen und ehrlich sein, wenn sie die Faktoren, Einschränkungen, Optionen und Auswirkungen von datenbezogenen Entscheidungen diskutieren.

  2. Data Governance- und Stewardship-Prozesse erfordern Transparenz. Es muss für alle Beteiligten und Auditoren klar sein, wie und wann datenbezogene Entscheidungen und Kontrollen in die Prozesse eingeführt wurden.

  3. Datenbezogene Entscheidungen, Prozesse und Kontrollen, die der Data Governance unterliegen, müssen überprüfbar sein. Sie müssen mit einer Dokumentation versehen sein, um die Anforderungen der Compliance und der betrieblichen Prüfung zu erfüllen.

  4. Sie müssen definieren, wer für funktionsübergreifende datenbezogene Entscheidungen, Prozesse und Kontrollen rechenschaftspflichtig ist.

  5. Sie müssen definieren, wer für Stewardship-Aktivitäten rechenschaftspflichtig ist, die in den Verantwortungsbereich einzelner Mitarbeiter und Gruppen von Datenverwaltern fallen.

  6. Die Programme müssen die Verantwortlichkeiten so definieren, dass ein gegenseitiges Kontrollsystem zwischen Geschäfts- und Technologie-Teams entsteht. Dies gilt gleichermaßen für diejenigen, die Daten anlegen/erfassen, diejenigen, die sie verwalten, diejenigen, die sie nutzen, und diejenigen, die Standards und Compliance-Anforderungen einführen.

  7. Das Programm muss die Standardisierung von Unternehmensdaten einführen und unterstützen.

  8. Programme müssen proaktives sowie reaktives Change Management für Referenzdatenwerte und die Struktur/Verwendung von Stammdaten und Metadaten unterstützen.

Data Governance - Rollen

Jedes Unternehmen setzt seine Data Governance anders zusammen, aber es gibt einige Gemeinsamkeiten.

Steering Committee

Governance-Programme erstrecken sich über das gesamte Unternehmen und beginnen in der Regel mit einem Steuerungsgremium, das sich aus Mitgliedern des oberen Managements zusammensetzt. Oftmals handelt es sich dabei um Manager des C-Levels, die für verschiedene Geschäftsbereiche verantwortlich sind. Morgan Templar, Autor von "Get Governed: Building World Class Data Governance Programs", beschreibt die Aufgaben der Mitglieder des Steering Committees folgendermaßen: Zu ihren Pflichten gehört es, die allgemeine Governance-Strategie mit spezifischen Ergebnissen festzulegen, die Arbeit der Data-Stewards zu unterstützen und die Governance-Organisation für die Einhaltung von Zeitplänen und Ergebnissen verantwortlich zu machen.

Data Owner

Laut Templar sind Data Owner Personen, die dafür verantwortlich sind, dass die Informationen innerhalb einer bestimmten Datendomäne system- und bereichsübergreifend verwaltet werden. Sie sind in der Regel Mitglieder des Steuerungskomitees, auch wenn sie nicht stimmberechtigt sind. Dateneigentümer sind verantwortlich für:

  • die Genehmigung von Datenglossaren und anderen Datendefinitionen;

  • Sicherstellung der Richtigkeit von Informationen im gesamten Unternehmen;

  • Direkte Datenqualitätsaktivitäten;

  • Überprüfung und Genehmigung von Stammdatenmanagement-Ansätzen, -Ergebnissen und -Aktivitäten;

  • Zusammenarbeit mit anderen Data Ownern zur Lösung von Datenproblemen;

  • Second Level Review für von Data Stewards identifizierten Problemen;

  • Bereitstellung von Input zu Softwarelösungen, Richtlinien oder regulatorischen Anforderungen für für das Steuerungskomitee.

Data Steward

Data Stewards sind für die tägliche Verwaltung der Daten verantwortlich. Sie sind Fachexperten (Subject Matter Experts), die die Bedeutung und den Gebrauch von Daten verstehen und kommunizieren, sagt Templar. Darüber hinaus arbeiten sie mit anderen Data Stewards im gesamten Unternehmen zusammen und sind das leitende Organ für die meisten Datenentscheidungen. Data Stewards sind verantwortlich für:

  • Subject Matter Experts für ihre Datendomäne zu sein;

  • Identifizierung von Datenproblemen und Zusammenarbeit mit anderen Data Stewards, um diese zu lösen;

  • Als Mitglied des Data Steward Councils zu handeln;

  • Vorschlagen, Diskutieren und Abstimmen über Datenrichtlinien und Ausschussaktivitäten;

  • Berichterstattung an den Dateneigentümer und andere Stakeholder innerhalb einer Datendomäne;

  • Funktionsübergreifende Zusammenarbeit über Geschäftsbereiche hinweg, um sicherzustellen, dass die Daten des jeweiligen Bereichs verwaltet und verstanden werden.

Data Governance - Tools

Data Governance versteht sich zwar eher als eine Art fortlaufendes Programm. Doch auch dafür braucht es technische Unterstützung..Mittlerweile gibt es eine Reihe von Tools, die die Data Governance unterstützen können. Im Laufe der Zeit sind Marktbeobachtern zufolge die Tools für Data Management, Data Quality und Data Governance immer stärker zusammengewachsen, sodass aus den ursprünglichen Einzeldisziplinen komplette Suiten entstanden. Doch nicht jedes Tool kann für Ihr Unternehmen geeignet sein. Unterschiedliche Anforderungen und Budgets beeinflussen die Auswahl. Laut Berichten von Gartner gehören die folgenden Tools zu den beliebtesten Lösungen:

  • Informatica Axon ist eine Sammelstelle und ein Datenmarktplatz für unterstützende Programme. Zu den wichtigsten Funktionen gehören ein kollaboratives Geschäftsglossar, die Möglichkeit, die Datenabfolge zu visualisieren und Datenqualitätsmessungen auf der Grundlage von Geschäftsdefinitionen zu generieren.

  • IBM Data Governance nutzt maschinelles Lernen, um Datenbestände zu sammeln und zu verwalten. Der integrierte Datenkatalog hilft Unternehmen, Daten zu finden, verwalten, zu analysieren, aufzubereiten und gemeinsam zu nutzen.

  • Basierend auf der SAS-Plattform bietet SAS Data Management ein rollenbasiertes Graphical User Interface (GUI) für die Verwaltung von Prozessen und umfasst ein integriertes Business-Glossar, Metadatenmanagement sowie Lineage-Visualisierung.

  • SAP Data Hub ist eine Lösung zur Datenorchestrierung, die Betriebe dabei unterstützt, alle Arten, Varianten und Mengen von Daten in Ihrer Datenlandschaft zu entdecken, zu verfeinern, anzureichern und zu verwalten. Das Tool unterstützt Unternehmen bei der Etablierung von Sicherheitseinstellungen und Identitätskontrollrichtlinien für Benutzer, Gruppen und Rollen sowie bei der Optimierung von Best Practices und Prozessen für die Richtlinienverwaltung und Sicherheitsprotokollierung.

Zu den Herausforderern im Bereich IT-Solutions für Data Governance zählt Gartner Oracle, Experian und Innovative Systems. Außerdem gelten Ataccama, Information builders, MIOsoft sowie Infogix laut den Analysten als Visionäre. Auch eine Handvoll kleiner Startups, die Tools für Data Governance bereitstellen, sollte man laut Gartner als CIO durchaus im Blick behalten:

  • Cinchy analysiert und gruppiert Anwendungen die mit Daten hantieren. Dabei geht es darum Datensilos aufzubrechen und Applikationen aus Datensicht miteinander zu integrieren. Das soll die Komplexität verringern und das Daten-Handling vereinfachen. Die Verantwortlichen von Cinchy definieren ihr Tool als Data Fabric, die Daten in den Mittelpunkt des Geschäftsbetriebs stellt.

  • CluedIn bietet Lösungen für gängige Herausforderungen im Bereich Datenmanagement und -integration. Dazu gehören die Integration von Daten aus großen und komplexen Anwendungen, die Automatisierung der Datenaufbereitung, die Katalogisierung dieser Daten für das Unternehmen und die anschließende einfache und sichere gemeinsame Nutzung dieser Daten im gesamten Unternehmen

  • Inzata zielt darauf ab, den Wert von Daten durch erweiterte Profilierung, Strukturierung und Integration von Datenvielfalt zu erhöhen, um Insights zu unterstützen.

  • TigerGraph ermöglicht Graph-Analysen für den Einsatz in Unternehmen. Seine GSQL-Sprache reduziert die Lernkurve für Benutzer, um Graph-Analysen durchzuführen, ohne die Leistung zu beeinträchtigen.

Data Governance - Zertifizierungen

Mit der Datenschutzgrundverordnung hat die EU klare Regeln aufgestellt, wie Unternehmen mit Daten umzugehen haben. Die Verantwortlichen in den Betrieben müssen daher sicherstellen, dass jeder Umgang mit Daten regelkonform abläuft. Auch in diesem Bereich gibt es Spezialisten, die extern von Unternehmen wie SAP oder Verbänden wie der "Global Data Management Community" (DAMA) geschult werden. Nach erfolgreichem Abschluss erhalten die Teilnehmer ein Zertifikat, das Unternehmen helfen kann, einen den gesetzlichen Regelwerken entsprechenden Umgang mit Daten nachzuweisen und damit möglicherweise einen Vorteil im Wettbewerb zu erzielen. Zu den bekanntesten Zertifizierungen gehören:

  • DAMA Certified Data Management Professional (CDMP);

  • Fachmann für Datenverwaltung und -steuerung (DGSP);

  • edX Unternehmensdatenmanagement;

  • SAP Certified Application Associate - SAP Master Data Governance.

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation CIO.com.