SOA-Mythen im Reality Check

06.08.2007
Von Dieter Masak und Kerstin Kaiser

Mythos 5: Datenqualität

Der Traum aller Business-Intelligence- und Datawarehouse-Anhänger wird wahr: Durch die Einführung von SOA wird die Daten- und Informationsqualität deutlich erhöht. Das zumindest predigen SOA-Befürworter immer wieder. Mit SOA soll die Qualität steigen! Dabei ist die Qualitätsmisere im Datensektor mindestens so alt wie die IT. Wie will da eine SOA spontan die Wende bringen?

Kernaussagen

  • Datenqualität hat nichts mit SOA zu tun.

  • Datenqualität ist primär ein organisatorisches, menschliches Problem.

  • SOA kann die bestehende Qualität sogar gefährden.

Nach der SOA-Idee erzwingt das Benützen von Interfaces eine hohe Datenqualität. Doch wo liegt der Unterschied zu gängiger Software, die nichts mit SOA zu tun hat? Ein einfacher Call in Java oder C# erzwingt auch, dass die Datentypen zueinander passen, sonst reagiert das System mit einem Fehler. Wieso haben wir dann heute trotzdem so eine schlechte Datenqualität?

Die aktuelle Situation hat zwei Gründe: Zum einen gibt es für die Erzeuger von Daten (die Personen, die die Daten eingeben) in den Unternehmen keine Anreize für eine hohe Qualität. Zum anderen hat die IT in der Vergangenheit stets Krücken gebaut, um doch noch in der Lage zu sein, schlechte Daten verarbeiten zu können.

Beide Ursachen werden nicht wirklich durch eine SOA adressiert. Die Qualität wird sich erst durch Verhaltensänderungen in den Fachbereichen und in der Entwicklung ändern und nicht durch eine Architektur. Datenqualität ist ein organisatorisches und zum Teil disziplinarisches Problem, aber kein originäres Architekturthema.

Dessen ungeachtet kann eine SOA die Qualität sogar implizit senken. Wenn ein Unternehmen SOA einsetzt, dann wissen die einzelnen Services nicht voneinander, die Objekte werden nicht mehr zentral gehalten und können durchaus redundant auftauchen. Jede Redundanz aber führt zum Risiko einer Qualitätsverschlechterung, denn es gibt jetzt die Möglichkeit widersprüchlicher Daten. Außerdem kann eine Software, die aus vielen zum Teil nicht zuverlässigen Services aufgebaut ist, schnell unvollständige Datensätze speichern. Auch dadurch sinkt die Datenqualität.

Auch sogenannte Datenqualitätswerkzeuge können die Misere nicht wirklich beseitigen, da sie primär auf syntaktische und nicht auf semantische Qualität ausgerichtet sind. Zwar ist die syntaktische Qualität eine der Voraussetzungen für den Einstieg in eine SOA; eine semantische Qualität wird dadurch aber nicht erreicht. Im Gegenteil: einfache syntaktische Korrekturen suggerieren eine Semantik, die eventuell gar nicht vorhanden ist!

Fazit: SOA wird die Datenqualität nicht erhöhen, sondern vielleicht sogar verschlechtern!