Business Intelligence/Datenintegration bei der Deutschen Bahn AG

Freie Fahrt dank Business Intelligence

18.07.2003
Beim Umbau der Deutschen Bahn AG von einem Staatsbetrieb zu einem Transport- und Logistikunternehmen sollen Business-Intelligence-Projekte die Geschäftsaktivitäten effektiver machen. Die nötige korrekte und konsistente Datenbasis wird jetzt mit Hilfe eines Integrationsprojekts geschaffen.Von Thomas von Zelewski*

Wie viele Unternehmen hat auch die Deutsche Bahn bei Business Intelligence lange Jahre auf eine individualprogrammierte Lösung gesetzt. Von der Datenintegration, der die Daten aus den operativen Systemen in das Data Warehouse brachte, über die Datenbankmodellierung bis zum Aufsetzen des Frontends zur Ausgabe von Berichten sorgten in der Regel handcodierte Anwendungen für die Funktionen, für die es bis dato keine Standardlösung gab. Mit der Zeit stiegen jedoch die Anforderungen an die Lösung, da die Datenvolumina wuchsen, Verarbeitungsprozesse zu lang dauerten und es immer mehr Ladeprozeduren gab. Zudem mussten zahlreiche IT-Anwendungen als potenzielle Quellsysteme für das Data Warehouse angeschlossen werden, wobei deren Bandbreite funktional von höchst komplexen Verfahren wie dem neuen Preissystem bis hinunter zu Einzelplatzanwendungen in "Access" reicht.

Angesichts dieser Vielfalt und des zunehmenden Entwicklungs- und Administrationsaufwands entschied sich DB Systems, das Beratungs- und Systemhaus der Bahn, im Jahr 2000 gängige Standardwerkzeuge einzuführen. Doch es ließen sich im Markt nicht die passenden Produkte finden. Daher wurde zunächst in einem Einzelprojekt nur ein Werkzeug für die Extraktion, Transformation und das Laden (ETL) des Data Warehouse eingesetzt, während es im Übrigen bei der Individualprogrammierung blieb. Erst im vorigen Jahr wurde ein Plattformwechsel auf das SAP Business Information Warehouse (SAP BW) beschlossen.

Technik von SAP reicht nicht aus

Da das Data Warehouse neben Daten aus verschiedenen SAP-R/3-Anwendungen auch Informationen aus anderen Systemen einbeziehen und aufbereiten soll, entschloss sich DB Systems, ein Datenintegrationswerkzeug anzuschaffen. Dieses soll eine gute Performance in den Verarbeitungsprozessen sicherstellen, aber auch neue Funktionen für das Metadaten-Management oder eine Steigerung der Datenqualität bieten können. Weitere Anforderungen waren die Plattform- und Datenbankunabhängigkeit der Lösung sowie hohe Benutzerfreundlichkeit, um einen größeren Schulungsaufwand zu vermeiden.

Vor allem die Datenqualität spielt für die Deutsche Bahn eine wichtige Rolle, da die schönsten Analyseberichte nichts nutzen, wenn sie auf falschen oder veralteten Daten basieren. Soll die Fachabteilung die BI-Lösung annehmen, müssen die Daten stimmen. Qualitätsverluste durch unterschiedliche Datenformate, versteckte Informationen in Freiformfeldern, uneinheitliche Sichtweisen auf Daten oder komplexe Datenanomalien sind für das Geschäft der Bahn nicht vertretbar. Eine manuelle Identifikation von Duplikaten, die semantische Bereinigung und Validierung sowie eine Integration zusätzlicher Datenquellen zur Überprüfung verursachen zudem hohe Kosten.

Nach einer weiteren detaillierten Evaluierung fiel schließlich Ende 2002 die Wahl auf die "Ascential Enterprise Integration Suite" von Ascential Software. Ausschlaggebend waren neben dem Funktionsumfang und einer Empfehlung durch die SAP das Preis-Leistungs-Verhältnis und der Support. Die Produkte sollen nun zunächst bei einer BI-Lösung zur technischen Schwachstellenanalyse von Fahrzeugen und Fahrweg eingesetzt werden und Informationen aus bis zu 25 verschiedenen operativen Systemen einspielen. So liegen Gewährleistungsdaten von Herstellern meist als strukturierte Flat Files vor, die Instandhaltungsinformationen kommen aus dem SAP-R/3-System, während kaufmännische Informationen aus anderen Host- und SAP-Systemen stammen. Zusätzliche Analyseinformationen werden in strukturierter Form aus dem SAP BW oder dem Analyseprodukt "Applix TM1" geladen oder liegen durch Text-Mining oder Internet-Recherchen unstrukturiert vor.

200 Gigabyte neue Daten pro Tag

Täglich fallen etwa 200 GB Daten an, die beispielsweise Informationen zu etwa 6300 Lokomotiven, 7200 Trieb- sowie 12 700 Reisezug- und 128 000 Güterwagen enthalten. Hinzu kommen Daten zum gesamten Streckennetz der Bahn mit rund 38 000 Kilometer Gleisen, 5800 Personenbahnhöfen, 6400 Stellwerken, 89 000 Weichen, 32 000 Brücken und 770 Tunneln. Die Informationen werden fachabteilungsübergreifend gesammelt, bereinigt, aufbereitet und ausgewertet. Dabei müssen teilweise völlig unterschiedliche Sachverhalte zusammengebracht werden. So zum Beispiel Angaben zu den Arbeiten an einem stehenden Fahrzeug in der Wartung mit den Betriebsdaten darüber, wann die Lokomotive fährt, welche Strecke sie zurücklegt und zu welchen Uhrzeiten sie unterwegs ist. Die konsolidierten Informationen im Data Warehouse erlauben viele Verbesserungen. So lässt sich beispielsweise bei der Analyse feststellen, warum ein Zug unpünktlich war, wie sich Qualitätsunterschiede von Bauteilen auswirken und ob Instandhaltungsaufgaben in direkter Relation zueinander stehen. Künftig möchte DB Systems unter anderem mit Hilfe des Systems und des auf ihm basierenden Berichtswesens das komplette Produkt-Lebenszyklus-Management der Schienenfahrzeuge transparent überwachen.

Komplexe Sachverhalte werden transparent

Derzeit sind drei Datenquellen an das Data Warehouse angeschlossen, weitere sollen sukzessive folgen. Zudem läuft ein zweites Projekt, in dem bestehende ETL-Prozesse, die DB Systems in PL/SQL geschrieben hatte, auf die neue Software migriert werden. Diese soll in Zukunft für den unternehmensweiten Einsatz eingepasst werden und somit die zentrale Plattform für alle Aufgaben der Datenintegration und des Datenqualitäts-Managements bei der Deutschen Bahn stellen.

Die ersten Erfahrungen der Systembetreuer, die etwa für die Instandhaltung von ICEs oder E-Lokomotiven verantwortlich sind, sind durchweg positiv. So können Mitarbeiter schneller auf ihre Berichte zugreifen und erhalten tagesaktuell per Knopfdruck komplexe Sachverhalte angezeigt, die sie sich bisher aufwändig zusammensuchen mussten. Per Drilldown in TM1 lassen sich ferner die darunter liegenden Aggregationsebenen auswerten, was früher nur mit gesonderten Berichten möglich war. Feldversuche zeigten zudem, dass sich die Datenqualität verbessern ließ. (as)

*Thomas von Zelewski ist Abteilungsleiter Business Intelligence bei DB Systems, dem IT-Dienstleister der Deutschen Bahn.

Angeklickt

- Ziel: Optimierung der Business-Intelligence-Projekte durch Einsatz eines Standard-Tools zur Datenintegration sowie Erhöhung der Datenqualität im Data Warehouse.

- Technische Basis: Sun Solaris, SAP Business Warehouse, RDBMS (Oracle oder DB2) für Datenhaltung und Tools für Präsentation/Reporting, Ascential Enterprise Integration Suite, "Applix TM1" mit Excel-Front-end sowie Web-basierendem Frontend (Scorecard).

- Stand heute: Einsatz in zwei Projekten.

- Nächster Schritt: Weitere Projekte mit der Datenintegrationslösung bis hin zum unternehmensweiten Einsatz.