Data Warehousing/

Wichtig ist sauberes Daten-Management

05.07.1996

CW: Gab es vor dem jetzigen Data-Warehouse-Projekt bei der Sparkassenversicherung ähnliche Versuche?

Giersch: Nein. Es gab nur die herkömmlichen Statistiken mit den üblichen Problemen bei überwiegend stichtagsbezogenen Auswertungen. Das hat des öfteren dazu geführt, daß zum gleichen Sachverhalt unterschiedliche Ergebnisse vorlagen.

CW: Wer gab den Anstoß für das jetzige Projekt?

Giersch: Der Vertrieb hatte seit längerem Anforderungen gestellt. Um Insellösungen zu vermeiden, gab die DV-Leitung eine umfassende Studie in Auftrag, die die Anforderungen insgesamt abklären sollte. Außerdem sollten Lösungsansätze einschließlich Tool-Auswahl und einer Kosten-Nutzen-Betrachtung dargestellt werden.

CW: Welche Abteilungen und hierarchischen Ebenen eines Unternehmens müssen nach Ihren Erfahrungen in die Entscheidung und Vorbereitung eines Data-Warehouse-Projekts einbezogen werden?

Giersch: Die grundsätzliche Entscheidung müssen der Vorstand und die nächste Führungsebene tragen - und zwar quer durch alle Ressorts, nicht nur der DV-Bereich. Bei der Realisierung ist enge Abstimmung mit den Fachbereichen unbedingt erforderlich.

CW: Wie umfassend und weitreichend, auch in finanziellen und zeitlichen Dimensionen, muß der Beschluß sein?

Giersch: Wir haben zunächst eine Planung über fünf Jahre aufgestellt, die die Kosten für den grundsätzlichen Aufbau des Führungsinformationssystems (FIS) und - soweit schon erkennbar - für die Realisierung von Informationsprodukten berücksichtigt. Allerdings ist das FIS eine Anwendung, die sich ständig weiterentwickelt und von daher keinen Endtermin haben kann. Es werden laufend neue Informationsbedürfnisse entstehen und zu befriedigen sein.

CW: Wann fiel die Entscheidung für das Projekt?

Giersch: Im Januar 1995 wurde die Studie durch eine Vorstandsvorlage genehmigt. Mitte 1995 hat der Vorstand dann beschlossen, die Vorschläge in der Studie im Rahmen eines Projekts umzusetzen.

CW: Wie sehen die Projektpläne denn nun konkret aus?

Giersch: Wir haben parallel einen theoretischen und einen praktischen Teil gestartet. Zum einen wird auf Basis eines logischen Datenmodells schrittweise ein physisches Modell entwickelt und dann über Schnittstellen aus den operativen Anwendungen mit Daten versorgt. Außerdem wird ein Client-Server-Konzept für die Datenverteilung und für die Kommunikation zwischen den einzelnen Lokationen entwickelt. Zum praktischen Teil gehört die Erstellung konkreter Informationsprodukte, soweit die Daten das jeweils hergeben.

CW: Wie sieht der Zeitrahmen aus?

Giersch: Bis Mitte 1997 wollen wir die Entwicklung noch in Form eines Projekts weiterführen. Dann können die Administration und die Weiterentwicklung sowohl in der DV als auch in den Fachbereichen in die normale Aufbau- und Ablauforganisation eingebunden werden.

CW: Ziehen Sie einen großangelegten Plan durch, oder gehen Sie schrittweise mit kleineren Lösungen voran?

Giersch: Wir haben ein umfassendes Konzept zur Einbindung aller Bereiche der beteiligten Unternehmen, realisieren aber Datenumfang und Auswertung schrittweise, um Erfahrungen zu sammeln. Das hat den großen Vorteil, daß wir bei jedem Teilschritt besser werden, sowohl in den grundlegenden Data-Warehouse-Funktionen als auch bei den Informationsprodukten.

CW: Welche Datenmenge haben Sie zur Zeit im Data-Warehouse, und was ist das Ziel?

Giersch: Im Moment sind zirka 6 GB gespeichert. Alle geplanten Einzelbestände einschließlich der Verdichtungsstufen werden einmal etwa 50 GB ausmachen.

CW: Wie ist das Projekt bei der Sparkassenversicherung eingebunden?

Giersch: Es gibt eine gut funktionierende Projektorganisation im Hause mit einem entsprechenden Berichtswesen und verschiedenen Controlling-Gremien. In regelmäßigen Abständen berichtet der Projektleiter über Arbeitsstand, Budget, Termine und Probleme.

CW: Was sind die wichtigsten Maßnahmen in der Startphase?

Giersch: Das Projekt muß in den Führungsebenen eines Unternehmens verkauft werden. Die Führungskräfte müssen sich - abgeleitet aus den Unternehmenszielen - über die Anforderungen und über die Ausrichtung des Systems Gedanken machen. Damit werden Rahmenbedingungen gesetzt, und es entsteht kein Datenfriedhof, der schwerfällig und unwirtschaftlich ist.

CW: Wie sind Sie bei der Realisierung vorgegangen?

Giersch: Ich habe die Zweigleisigkeit schon angesprochen: Neben Konzepten für das Daten-Management und für die Client-Server-Architektur wurden die ersten Informationsprodukte für den Vertrieb realisiert. Entscheidend war dabei die Datenversorgung, insbesondere die Automatisierung der monatlichen Übernahme der Produktionsdaten aus allen Häusern. Außerdem gehört dazu die Bestimmung von Dimensionen und Analysevariablen sowie deren Abbildung in den Benutzeroberflächen.

CW: Also ist das Daten-Management das Wichtigste?

Giersch: Absolut. Wir haben in einem anderen Teilbereich auch gemerkt, daß ohne eine saubere, auf dispositive Belange abgestimmte Datenbasis nichts geht.

CW: Nutzen Sie externe Informationen?

Giersch: Das ist vom Konzept her vorgesehen. Zum Beispiel werden wir Daten von den Sparkassen einbinden. Man muß dabei aber beachten, daß die externen Dateninhalte mit den internen Begrifflichkeiten synchronisiert werden. Wir bemühen uns jetzt schon, Schlüssel und Begrifflichkeiten zu verwenden, die im Versicherungswesen einheitlich festgelegt sind, zum Beispiel Spartenbezeichnungen.

CW: Welche DV-technischen Erfahrungen gibt es bereits?

Giersch: Wir haben entschieden, die Datenbestände in einem eigenständigen, auf dispositive Belange optimierten Datenbanksystem, nämlich dem SAS-internen, zentral zu halten. Damit vermeidet man Probleme, die heute immer noch bei automatisierter Verteilung von Teildatenbeständen auftreten - ganz abgesehen von der dann schwierigen Qualitätssicherung der Daten. Die Applikationen werden indes dezentral in den Lokationen vorgehalten. Damit haben wir bisher ein sehr gutes Antwortzeitverhalten erreicht.

CW: Welche Einzelaufgaben haben sich als besonders schwierig erwiesen?

Giersch: Aufwendig, aber nicht schwieriger als erwartet, war das Daten-Management. Auch zunächst sehr sauber definierte Datenstrukturen im operativen Bereich werden im Laufe der Zeit verändert. Felder werden sozusagen mißbraucht, und dann findet man bei der Übernahme in das Data-Warehouse plötzlich unerwartete Werte. Ein großer Vorteil war allerdings, daß in diesem Hause einheitlich Adabas verwendet wird. Wir müssen hier also keine Daten aus heterogenen Systemen übernehmen.

CW: Welche Aufgaben waren schwieriger als anfangs erwartet?

Giersch: Schwieriger ist in diesem Fall der Aufbau der Client-Server-Umgebung. Das hängt aber damit zusammen, daß diesbezüglich bisher wenig Erfahrung im Haus vorliegt die produktiven Anwendungen sind fast alle Host-basiert. Hier müssen, auch unabhängig vom FIS, noch Grundlagen erarbeitet werden.

CW: War es notwendig, in einigen Punkten aufgrund schlechter Erfahrungen oder neuer DV-technischer Entwicklungen vom ursprünglichen Plan abzuweichen?

Giersch: Wir haben für verschiedene Punkte wie Datenhaltung oder -versorgung alternative Lösungen ausprobiert und uns dann für den besten Ansatz entschieden. Das Datenbanksystem sollte man unabhängig von dem in der Produktion verwendeten System nur nach dispositiven Aspekten festlegen. Viele Standard-Datenbankfunktionen sind dann nicht erforderlich, verursachen aber Verwaltungsaufwand. Deshalb haben wir auf das für die tägliche Produktion sehr gut geeignete Adabas verzichtet und verwenden die SAS-interne einfache und dadurch sehr schnelle Tabellenorganisation.

CW: Haben sich Zeitverzögerungen oder höhere finanzielle Anforderungen im Projekt ergeben?

Giersch: Keine nennenswerten. Im Projektplan ist der Test alternativer Techniken vorgesehen.

CW: Was sind die Abfragegebiete im Data-Warehouse, und wer bestimmt sie?

Giersch: Das FIS soll den gesamten dispositiven Informationsbedarf der Sparkassenversicherungsgruppe abdecken. Über die Realisierungsreihenfolge wird in einem sogenannten Review nach Kosten-Nutzen-Aspekten entschieden. Die Grundlage dafür bilden aber die Anforderungen in der Studie.

CW: Hat sich der Bedarf inzwischen nicht verändert?

Giersch: Der Bedarf ändert sich laufend. Man muß die neuen Produkte in das Portfolio eingliedern damit kann sich auch die Reihenfolge ändern.

CW: Wer sind die Anwender des Data-Warehouse?

Giersch: Hauptzielgruppe für die Informationen sind natürlich die Führungskräfte. Benutzt wird das System aber überwiegend von speziellen Servicegruppen innerhalb der Ressorts, die die Anforderungen mit Ad-hoc-Abfragen und Simulationen aufbereiten und umsetzen. Die fertigen Informationsprodukte werden natürlich auch direkt von den Führungskräften am PC abgerufen. Ziel ist es, die DV soweit wie möglich zu entlasten. Nur das Daten-Management und der Aufbau komplexer Teilmodelle wird in der DV verbleiben. In der Anwendung selbst sollen die Abteilungen und Ressorts möglichst früh ohne Hilfe der DV auskommen können.

CW: Wie viele Endanwender sind es jetzt, und was ist geplant?

Giersch: Außer DV- und Projektmitarbeitern haben wir derzeit zwölf Anwender. Einschließlich der externen Vertriebsstellen, den Filialdirektionen, rechnen wir bis Ende 1997 mit zirka 80 bis 100 Nutzern.

CW: Welche Abfragemöglichkeiten wird es geben?

Giersch: Wir entwickeln komplette betriebswirtschaftliche Teilmodelle mit verschiedenen Dimensionen und Analysevariablen, in denen man im Rahmen eines vorgegebenen Datenvolumens navigieren kann. Daneben gibt es Standardreports, die mit einem definierten Layout erstellt werden. Außerdem gibt es die Möglichkeit, alle Daten in sogenannten Ad-hoc-Abfragen verknüpft auszuwerten.

CW: Wie steht es um die Akzeptanz des Systems?

Giersch: Wegen der Komplexität und des Umfangs der SAS-Tools waren wir zunächst skeptisch bezüglich der Dauer des Gewöhnungsprozesses.

Inzwischen haben wir die Erfahrung gemacht, daß die Anwender sich sehr schnell in die Tools einarbeiten. Vor allem wird positiv gesehen, daß die Fachbereiche jetzt wesentlich unabhängiger von der zentralen DV agieren können. Die Akzeptanz der Informationsprodukte hängt wesentlich von der Datenqualität ab. Deswegen investieren wir da viel.

CW: In welchem Umfang ist Schulung nötig?

Giersch: Das hängt von den Anwendern ab. Für die Führungskräfte muß eine kurze Einweisung in die fertigen Produkte ausreichen, sonst sollte man das Design der Benutzeroberfläche überprüfen. Die Servicegruppen werden in Kursen bei SAS mit Grundlagen, unter anderem auch SQL-Grundkenntnissen, vertraut gemacht. Die DV-Administratoren erhalten ebenfalls extern eine umfassende Ausbildung in den Tools. Alternativ wollen wir auch den Einsatz von Lernsoftware testen. Damit kann der einzelne Anwender das Lernen individuell steuern und bei konkreten Problemen direkte Hilfe erhalten.

CW: Haben sich durch das FIS schon unmittelbare Vorteile für geschäftliche Entwicklungen der Sparkassenversicherung ergeben?

Giersch: Das Data-Warehouse und die Informationsprodukte sind ja noch im Aufbau. Trotzdem konnten wir bereits die Produktentwicklung im Bereich Kraftfahrt wirkungsvoll unterstützen. Wir haben eine Simula- tionsumgebung aufgebaut, die gegenüber früher wesentlich exaktere Daten geliefert hat. Auch Controlling-Funktionen im Zusammenhang mit der Fusion werden besser unterstützt.

CW: Wann soll der Vollausbau erreicht sein?

Giersch: Wegen der ständig neuen Anforderungen wird es einen Abschluß in der Art normaler DV-Projekte nicht geben. Allerdings soll die Übernahme aller wesentlichen Datenbestände bis Mitte 1997 abgeschlossen sein.

CW: Wie begründen Sie den Nutzen eines Data-Warehouse?

Giersch: Wir können erstens Informationen schneller und besser zur Verfügung stellen, zum Beispiel durch mehrdimensionale Sichten. Zweitens können wir Informationen liefern, deren Bereitstellung bisher unwirtschaftlich gewesen wäre. Und wir entlasten drittens die DV. Konkreter bedeutet das zum Beispiel Unterstützung bei der Entwicklung neuer Versicherungsangebote, bei der Ermittlung lukrativer Zielgruppen, bei der Analyse von Schäden, bei der Risikoselektion und besseren Service für den Außendienst. Wir erwarten, daß wir Ende 1998 den Break-even-Point erreichen werden.

CW: Was bedeutet Nutzen durch Verwendung besserer Informationen in Mark und Pfennig?

Giersch: Der größte Kostenfaktor ist der Schadenaufwand. Wenn wir es schaffen, durch gezielte Markt- und Kundenanalysen, durch Unterstützung bei der Risikoselektion etc. die Schadenquote nur um ein Prozent im Jahr zu senken, dann können wir die Kosten im ersten Jahr der vollwertigen Nutzung des FIS wieder einspielen.

CW: Erfahren Sie durch das Data-Warehouse Nebeneffekte, die mit dem Projekt nicht unmittelbar angestrebt waren?

Giersch: Ein wichtiger Punkt ist, daß man durch die systematische Aufbereitung der Daten immer wieder unerwartete Dateninhalte findet. Durch die Bereinigung können sich erhebliche Nutzeneffekte in den operativen Anwendungen ergeben.

CW: Wie stark dürfen Wünsche der Anwender ein solches Projekt während der Aufbauphase beeinflussen?

Giersch: Wir wollen ja bewußt von Anfang an auch praktische Erfahrungen sammeln, das heißt, Informationswünsche befriedigen. Das eine oder andere muß man dabei schon kritisch betrachten, damit kein Sammelsurium von Einzellösungen entsteht. Denn gewisse Voraussetzungen in der Datenversorgung und -bereitstellung müssen immer erst geschaffen werden und stabil sein, bevor sich Informationsprodukte erzeugen lassen.

Bei aktuellem Bedarf prüfen wir aber schon, was machbar und vertretbar ist, ohne die gesamte Entwicklungsstrategie zu gefährden. Wir stellen auch fest, daß sich die Ansprüche von Informationen für die Führung hin zu allgemeineren Informationen bewegt. Das heißt, bei FIS wird das "F" kleiner und das "I" größer.

CW: Besteht nicht die Gefahr, daß das Data-Warehouse als quasi einzige Quelle der Wahrheit angesehen wird, und dadurch Faktoren wie Erfahrung, Kreativität und Fantasie als Grundlage für Entscheidungen unter den Tisch fallen?

Giersch: Das Data-Warehouse liefert keine Entscheidungen und Handlungsanweisungen, sondern nur die Grundlagen dafür. Der Entscheider muß weiterhin Alternativen abwägen und schließlich Maßnahmen festle- gen - allerdings auf einer verläß- licheren Basis. Dabei spielen die von Ihnen genannten Faktoren hoffentlich weiter eine wichtige Rolle.

Rolf Giersch

Jahrgang 1948, hat Betriebswirtschaft mit Abschluß Diplomkaufmann studiert. Seit 1976 ist er als Unternehmensberater mit dem Schwerpunkt DV-Anwendungen im Bereich Versicherungen tätig. 1990 wurde er Geschäftsführender Partner der Wiese + Partner Unternehmensberatung in Hamburg. Seit Januar 1995 leitet er als externer Projektleiter das Data-Warehouse-Projekt "Führungsinformationssystem" (FIS) bei der Sparkassenversicherung, Wiesbaden. Sein Arbeitsaufwand vor Ort im Rahmen dieses Projekts beträgt im Durchschnitt zwölf Manntage pro Monat.

Die Sparkassenversicherung

Die Sparkassenversicherung, Wiesbaden, ist ein Unternehmen der Sparkassen-Finanzgruppe Hessen-Thüringen. Sie besteht aus der Öffentlichen Lebensversicherungsanstalt Hessen-Nassau-Thüringen - Sparkassenversicherung (SV-LVA) und der Öffentlichen Versicherungsanstalt Hessen-Nassau-Thüringen - Sparkassenversicherung (SV-VA). Außerdem gehören zum Verbund die Hessisch-Thüringische Brandversicherungsanstalt Kassel-Erfurt (BK), die Nassauische Brandversicherungsanstalt Wiesbaden (NBVA) und die Hessische Brandversicherungsanstalt Darmstadt (HBVA).

Der Hauptgewährträger ist der Sparkassen- und Giroverband Hessen-Thüringen. Weiterhin sind der Sparkassen- und Giroverband Rheinland-Pfalz sowie die Länder Hessen, Thüringen und Rheinland-Pfalz als Gewährträger beteiligt. Die Unternehmen bereiten derzeit ihre Fusion vor.

Das Geschäftsgebiet umfaßt Hessen, Thüringen sowie Teile von Rheinland-Pfalz. Direktionsstandorte sind Wiesbaden, Kassel, Erfurt und Darmstadt. Es gibt zehn Filialdirektionen. Die Versicherungsunternehmen haben rund 1900 Angestellte im Innen- und 770 hauptberufliche Mitarbeiter im Außendienst.

Die fünf Unternehmen führen zusammen 2,7 Millionen Versicherungsverträge mit 2,2 Millionen Kunden. Das Beitragsvolumen beträgt 1,4 Milliarden Mark.

Die DV-Umgebung

DV-Umgebung allgemein:

Rechner: IBM 9121/7421 (bipolar) und IBM 9672 R22 (CMOS)

Betriebssystem: MVS/ESA, Release 5.1

Netzwerk: SNA und LAN-Server

Programmiersprachen: Cobol II, Natural

TP-Monitor: CICS

Datenhaltung: Adabas

Sonstige Tools: CMS, TSO, MSP-Method-Manager, CASE 4.0

DV-Mitarbeiter: 83 (ohne externe)

Data-Warehouse-Umgebung:

Operative Datenbestände: 80 GB (nur FIS-relevante)

Dispositive Datenbestände: 50 GB (inklusive Verdichtungsstufen, Planung bis Ende 1997)

DW-Tools: SAS Institute GmbH, Heidelberg

Auswahlgründe: durchgängige Lösung vom Host über MDT bis PC, sehr leistungsfähiges Datenhaltungssystem mit Schnittstellen zu allen gängigen Datenbanken, umfangreiche Funktionalität für Entwicklung und Auswertung sowie Investitionsschutz (spezialisierter Anbieter).

Datenhaltung: SAS-internes Datenbanksystem auf Host und PC (relationale Tabellen) Basis- und Einzeldaten auf dem Host verdichtete Datenstufen, Applikationen und individuelle Datenbestände auf PCs im Netz

FIS-Server: IBM 486/100, 48 MB RAM, Plattenkapazität bis 50 GB ausbaufähig, derzeit für bis zu 80 User ausgelegt

Betriebssystem: OS/2

Projektbesetzung: externer Projektleiter plus vier Anwendungsentwickler. Zusätzlich leisten Fachbereiche einen Beitrag von umgerechnet drei Fulltime-Jobs.