Mit dem Data Warehouse gegen Versicherungsbetrüger

28.09.2006
Von 
Karin Quack arbeitet als freie Autorin und Editorial Consultant vor allem zu IT-strategischen und Innovations-Themen. Zuvor war sie viele Jahre lang in leitender redaktioneller Position bei der COMPUTERWOCHE tätig.

Das ist umso bemerkenswerter, als damals noch unklar war, worauf diese Bemühungen hinauslaufen würden. Das Gesetz schrieb dem Bundesverband einige Aufgaben vor, die er hinsichtlich Datenzusammenführung und -aufbereitung für die Betriebskrankenkassen wahrnehmen musste; das war quasi der Grundstein des Data Warehouse. Doch welche Daten darüber hinaus wofür von Nutzen sein würden, stand keineswegs fest.

Hartmut Scholz, CIO des BKK Bundesverbands.
Hartmut Scholz, CIO des BKK Bundesverbands.

"Unter den Versicherungen herrschte große Verunsicherung", erinnert sich Scholz. "Wenn niemand weiß, wie sich die Situation entwickeln wird, ist es schwierig, proaktiv zu werden." Doch es zeichnete sich bereits ab, dass das Geheimnis des Wettbewerbsvorsprungs in der intelligenten Nutzung der verfügbaren Informationen liegen würde. Deshalb hielt es der Verband für wichtig, die 300 000 Input-Dateien, die er monatlich erhält, auf die ihnen innewohnenden Informationen abzuklopfen.

Ad-hoc-Abfragen waren entscheidend

Die notwendige Technik schrieb der BKK Bundesverband europaweit aus, denn es war klar, dass die Kosten sicher die 400000-Mark-Grenze übersteigen würden. Wie hoch sie tatsächlich ausfielen, verrät Scholz allerdings nicht. Neben dem "Hauslieferanten" Siemens bewarben sich seinerzeit auch SAS Institute auf DEC-Hardware sowie Teradata auf NCR um den Auftrag. Warum sich Teradata schließlich durchsetzte, begründet Scholz mit dem besseren Abschneiden bei den Ad-hoc-Auswertungen: Neben vorgefertigten Queries konfrontierte der Bundesverband die Bewerber auch mit spontanen Abfragen, die innerhalb einer festgelegten Zeit zu einer Antwort führen mussten.

Projektsteckbrief

  • Projektart: Einführung und Ausbau eines Data Warehouse ("InfoNet")

  • Umfang: Für derzeit 1275 Nutzer; 10 TB Kapazität, die größte Tabelle umfasst 760 GB mit knapp 3 Milliarden Datensätzen.

  • Branchen: Versicherungen, Gesundheitswesen, öffentliche Körperschaft.

  • Zeitrahmen: von 1996 bis zur Gegenwart.

  • Stand heute: der Umstieg auf die 2002 in Angriff genommene Web-Version ist auch in der Breite nahezu vollzogen.

  • Produkte: Teradata V2R6.1, Cognos ReportNet, BI Query von Hummingbird (Auslaufmodell).

  • Dienstleister: für die Einführung hauptsächlich Teradata, der Betrieb erfolgt inhouse.

  • Aufwand: internes Team aus zehn bis zwölf Mitarbeitern plus sechs bis acht externe Projektmitglieder.

  • Herausforderungen: Schwierigkeiten mit dem Web-Front-end-Werkzeug; problematische Datenqualität.