Data Ownership

Wie man Daten besitzt und gleichzeitig zur Verfügung stellt

23.01.2023
Anzeige  In einem Data-Mesh liegt die Verantwortung für Daten dezentral in den einzelnen Fachbereichen, werden aber im gesamten Unternehmen genutzt.

In einer Data-Mesh-Struktur liegt die Verantwortung für Daten nicht bei einem zentralen Data-Team, sondern dezentral in den einzelnen Fachbereichen. Data Ownership bedeutet, dass die hier produzierten Daten unter der Verantwortung der jeweiligen Abteilungen bleiben, während sie, qualitätsgeprüft durch zentrale Governance, als Produkt im gesamten Unternehmen genutzt werden.

Zentralisierte Datenverwaltungsstrukturen können zu Ineffizienz und mangelnder Agilität bei der datengesteuerten Entscheidungsfindung sowie zu Problemen mit der Datenqualität führen. Data Mesh zielt darauf ab, diese Herausforderungen zu bewältigen, indem die Verantwortung für die Daten dezentralisiert und den Geschäftsabteilungen übertragen wird, die am nächsten an den Daten dran sind und den meisten Kontext für ihre Nutzung haben.

In den meisten Unternehmen bemüht sich ein spezielles Team, alle Daten in einem zentralen Depot zu integrieren. Oft fehlt jedoch Wissen über fachliche Inhalte, worunter Qualität wie Agilität leiden.
In den meisten Unternehmen bemüht sich ein spezielles Team, alle Daten in einem zentralen Depot zu integrieren. Oft fehlt jedoch Wissen über fachliche Inhalte, worunter Qualität wie Agilität leiden.
Foto: Gorodenkoff - shutterstock.com

Serie Data Mesh

Erfahren Sie in dieser vierteiligen Themenreihe, wie das neue Konzept „Data Mesh“ funktioniert und welche Datenprobleme es löst. Per Klick können Sie direkt zu einem Beitrag zu springen. Verfasst wurde die Serie von Snowflake, einem Cloud-basierten Software-as-a-Service-Unternehmen aus den USA.

Teil 1: Data Ownership: Die Trennung von Datenbesitz und Dezentralisierung

Teil 2: Data Product: Umdenken beim Thema Daten, Wandel in Mindset und Unternehmenskultur

Teil 3: Erfolgreiche Transformation: Schlüsselprinzipien einer erfolgreichen Data-Mesh-Strategie, DATSIS und nötige Transformation

Teil 4: Umsetzung: Wie eine gute Data-Mesh-Plattform aussieht und wie Sie Ihre Infrastruktur darauf ausrichten.

Der Begriff "Data Mesh" bezeichnet eine dezentrale Datenstruktur, in der die Verantwortung für die Daten nicht zentral bei der IT oder einem einzelnen Data Team liegt, sondern bei den Unternehmensabteilungen selbst, die Daten generieren und nutzen. Die Abteilungen übernehmen selbst die Data Ownership und behandeln Daten wie ein Produkt, für das sie mitverantwortlich sind. Das Konzept geht zurück auf die Informatikerin Zhamak Dehghani, die 2019 das Konzept Data Mesh in einem Artikel prägte.

Was ist das Problem?

Im Zeitalter der Digitalisierung gehören Daten zum essenziellen Betriebsvermögen. Unternehmen wollen datengetrieben arbeiten, sammeln aus internen und externen Quellen, verwalten, verwerten, analysieren und verkaufen Daten. Die Anzahl der datenbezogenen Initiativen in Unternehmen wächst beinahe ebenso schnell die verfügbare Datenmenge. Die Folge: Diejenigen Teams, die mit der Kontrolle und Verwaltung der Daten betraut sind, sind überlastet. Von ihnen wird heute verlangt, das ganze Unternehmen flexibler, digitaler und wettbewerbsfähiger zu machen.

Der Druck rührt von der Marktanforderung an Unternehmen her, agiler und vernetzter zu arbeiten. Die junge Konkurrenz, vielfach ohne Legacy-Last gegründet, reagiert schneller auf Veränderungen und bietet innovative, datengesteuerte Dienstleistungen an, mit denen sie passgenau auf die Kundenanforderungen eingehen und sogar neue Geschäftsmodelle erproben können. Doch all das erfordert zunächst eines: Agilität. Der schnelle Umgang mit Daten will nicht gelingen, wenn die Datenlandschaft zentralisiert ist und jeder Versuch der Anpassung zunächst über zentrale Strukturen laufen muss.

Zentralisierung führte zu Wildwuchs und Schatten-IT

Zentralisierte Strukturen haben durchaus wichtige Vorteile, auch wenn es um die Verwaltung von Daten geht: Standardisierung, gemeinsame Methodik, zentralisierte Datenkompetenz und Fachwissen, Synergien zwischen den Initiativen und so weiter. Zentralisierung ist also nicht grundlegend falsch, im Gegenteil ist sie sehr hilfreich. Doch Zentralisierung hat ihre Grenzen - und diese sind schnell erreicht, wenn Volumen, Geschwindigkeit und Vielfalt der Daten (und Datenquellen) explosionsartig zunehmen.

Bis vor etwa fünf Jahren wurde in vielen Unternehmen die Datengewinnung und Datenanalyse in der Regel von der IT-Abteilung durchgeführt. Als jedoch die Nachfrage stieg, führte dies häufig zu isolierten Initiativen innerhalb verschiedener Geschäftsbereiche, der sogenannten Schatten-IT, was zu einer Mischung aus miteinander verflochtenen, inkonsistenten, ineffizienten und nicht verwalteten Datenlösungen führte.

Als Reaktion auf das ungeordnete Wachstum eigener Initiativen reagierten Unternehmen mit mehr Zentralisierung. Die Idee war, neben der IT-Abteilung ein Datenteam zu schaffen, das alle Daten und Dateninitiativen verwalten sollte. Daten sollten zentral in Data Warehouses bereitgestellt werden. Das neue zentrale Team sollte den übergreifenden Bedarf an Business Intelligence und Analysen konzentriert decken und die Konsistenz und Zuverlässigkeit der Daten im gesamten Unternehmen gewährleisten.

Mehr Zentralisierung kann nicht die Antwort sein

Die zentrale Datenverwaltung führte jedoch nicht zu der erwünschten Entlastung der IT und Konsistenz, sondern zu erneutem Wildwuchs in den Fachabteilungen. Was war geschehen? Zu den technischen Herausforderungen - rasant steigende Anfragen mit komplexen, unterschiedlichen Anforderungen durch eine zentrale, monolithische Struktur abbilden und bedienen zu wollen - gesellte sich ein Flaschenhals in der Kompetenz. Kein zentrales Datenteam kann alle Business-Aspekte der Daten verstehen, die den spezifischen Geschäftsbereichen eigen sind. Marketing, Sales, Produktion und HR haben völlig unterschiedliche Anforderungen an Datenauswertungen und kein zentraler Data Manager kann alle diese Anforderungen kompetent erfüllen.

Die Folge war, dass die Geschäftsbereiche wieder selbst tätig wurden und eigene Prozesse einrichteten - was zu weiterem Chaos im Unternehmen und Inkonsistenz in der Datenverwaltung führte. Es zeigte sich, dass ein zentraler Datenbestand, der mit sehr unterschiedlichen abteilungsübergreifenden Besonderheiten, Prioritäten und Visionen zurechtkommen muss, zu mehr Bottlenecks und weniger Agilität führt.

Data Ownership - Verantwortung übernehmen

Eine praktische Antwort auf die Herausforderung durch explodierende Datenmengen und bremsende Zentralstrukturen liegt im Konzept der Data Ownership. Die Entkopplung von zentral gesteuerten Datenteams und Unternehmensabteilungen kommt unter anderem dadurch zustande, dass die Abteilungen die Daten besitzen, während das Datenteam sie verwalten soll.

Mit dem Abtreten der Daten an das zentrale Team geben Abteilungen gerne auch die Verantwortung ab. Doch damit sind Datenteams überlastet, denn sie können die Hintergründe der Datenerfassung, die spezifischen Ziele der Abteilung nicht kennen. Kein zentrales Team kann alle Zusammenhänge erfassen. Die Abteilungen kommen nicht darum herum, die Data Ownership zu behalten.

Das Data-Mesh-Konzept löst die Herausforderungen der Zentralisierung und sorgt für mehr Flexibilität und eine schnellere Markteinführung, indem es die Datenverwaltung auf der Ebene der Geschäftsbereiche demokratisiert. Dieses bereichsorientierte Design ist das wichtigste Mittel zur Strukturierung der Datennutzung und des Datenaustauschs sowie der vollständigen End-to-End-Verantwortung.

Lokale Produktion, Zentrale Verwaltung

Jeder Bereich bzw. jede Abteilung baut eine eigene "Datenfabrik" auf, eine eigene Datenabteilung. Dieses lokale Team besteht aus unterschiedlichen Rollen, etwa den Data Engineers, Data Analysts, Reporting Analysts, Data Scientists und so weiter. Diese Datenfabrik verwaltet die Daten ihres Bereichs.

Innerhalb jedes Domänenteams wird eine Datenfabrik von einem oder mehreren Data Ownern beaufsichtigt, die für ihre eigenen Geschäftsbereiche verantwortlich sind, einschließlich der Stammdatendefinitionen der Domäne, der Datenqualität und der Einhaltung von Richtlinien. Die Data Owner müssen sich an die von der zentralen Verwaltung herausgegebenen Richtlinien halten, um eine Standardisierung im gesamten Unternehmen zu gewährleisten.

So behalten Abteilungen und Geschäftsbereiche die Ownership ihrer Daten, während zentrale Datenteams dafür sorgen, dass alle Daten interoperabel bleiben und alle Abteilungen die gleichen Richtlinien einhalten. Die Fachkompetenz liegt weiter in den Fachbereichen, wo in kleinen Datenteams lokal die Spezialisierung der Abteilung auf Datenkompetenz trifft. Die zentralen Teams stellen lediglich die Infrastruktur und sorgen für Governance. So können Unternehmen schneller auf Anforderungen von außen und innen reagieren, kompetent mit Daten umgehen und dennoch eine hohe Datenqualität sicherstellen.

„Data Mesh“ geht zurück auf die Informatikerin Zhamak Dehghani, die den Begriff 2019 in einem viel beachteten Artikel prägte und das Konzept in diesem Video vorstellt.

Nächster Artikel: "Wie der kulturelle Wandel beim Thema Daten gelingt"

Dies ist der erste Teil der Artikelserie zum Thema Data Mesh von Snowflake. Im nächsten Artikel geht es um das Thema "Data Product: Wie der kulturelle Wandel gelingt". Darin: Umdenken beim Thema Daten - Wandel im Mindset und Unternehmenskultur.