Datenintegration: IBM meldet sich zurück

26.06.2006
Die ehemaligen Ascential-Produkte und IBMs "Information Integrator" werden zu einer Plattform vereint.
Der Information Server ist modular aufgebaut und soll laut IBM alle Aufgaben bei der Datenintegration abdecken können.
Der Information Server ist modular aufgebaut und soll laut IBM alle Aufgaben bei der Datenintegration abdecken können.

Anfang 2005 hatte IBM den Kauf des Anbieters von Datenintegrationssoftware Ascential für 1,1 Milliarden Dollar angekündigt. Dann wurde es still um den Deal. Lange war nicht klar, wie die Ascential-Produkte, die bis dato vor allem im Data Warehousing zum Einsatz kommen, in Big Blues ausuferndes Portfolio für Information-Management eingebunden werden sollten. Zudem hatte Ascential durch Zukäufe insbesondere von Software für das Datenqualitäts-Management eigene Integrationsprobleme, die erst in einem späteren Release des Produktflaggschiffs "Datastage" (Codename "Hawk") beseitigt werden sollten.

Hier lesen Sie …

Mehr zum Thema

www.computerwoche.de/

557827: Fahrplan Datenintegration;

1051479: Ascential und Data Warehousing;

1050859: IBM kauft Ascential.

Nach der Übernahme kündigte IBM an, Hawk bis Ende 2005 zu liefern. Doch dann wurden laut Rüdiger Schickhaus, IT Specialist, IBM Information Management, derart viele Anpassungen zwischen den Produkten nötig, dass der Code von Hawk erst im März "eingefroren" wurde und aktuell in einem zweiten Beta-Release vorliegt. Vor allem aber sorgte ein Umdenken bei IBM für den Verzug: Der Hersteller entschied, seine erst 2003 aus diversen Datenbankwerkzeugen hervorgegangene Technik "Information Integrator", die dem föderierten/virtuellen Zugriff auf Quellsysteme dient, mit Hawk zu vereinen. Das Ziel ist eine integrierte Softwareplattform, die eine Datenbewirtschaftung im Data Warehousing ebenso unterstützt wie beispielsweise die Datenmigration und -synchronisation bei Fusionen, Übernahmen oder der Einführung von CRM-Systemen.

Zugleich hält nun auch auf diesem Gebiet das Konzept einer Service-orientierten Architektur (SOA) Einzug, indem sich Datenbewirtschaftungskomponenten künftig als Dienst (Service) in Unternehmensprozesse einbeziehen lassen sollen. Damit folgt IBM einem Trend in der Produktentwicklung und -strategie bei Datenintegrationstechnik, dem sich beispielsweise auch die Ascential-Konkurrenten Informatica, Business Objects und SAS Institute, Anbieter von Prozess-Management-Software wie Tibco sowie Softwareriesen wie SAP, Oracle und Microsoft in ihren Infrastrukturen anschließen.

IBMs neues Angebot soll als "Websphere Information Server" im vierten Quartal 2006 auf den Markt kommen. Er kann zunächst nur den "Websphere Application Server" als Laufzeitumgebung verwenden und bietet ein zentrales Metadaten-Repository, den "Websphere Metadata Server", sowie Anwendungs- und Protokolladapter. Ihm zur Seite kann der Anwender das Modul "Websphere Business Glossary" stellen, das Metadatendefinitionen verstehen, hinterlegen und suchen hilft.

Parallele Job-Verarbeitung

Eine Kernkomponente ist die Hawk-Engine "Websphere Datastage". Sie dient insbesondere zur Extraktion, Tranformation und dem Laden von Daten (ETL) und bildet ihrerseits künftig die Basis für die übrigen Module des Information Servers für das Datenqualitäts-Management (siehe unten). Dadurch lassen sich beispielsweise Profiling-Informationen aus diesen Tools unmittelbar in die Datentransformation einbeziehen. Gegenüber ihrer Vorgängerin kann Websphere Datastage nun externe Metainformation beispielsweise aus Repositories von Business Objects, Cognos oder marktgängigen Modellierungs-Tools importieren und gestattet eine parallele Job-Verarbeitung in der Datenbewirtschaftung. Letztere Option existierte vormals nur in der "Enterprise Edtion" von Ascential Datastage.

Hinter dem "Websphere Federation Server" verbirgt sich die bisherige Produktfamilie Information Integrator von IBM. Durch ihn erhält Datastage nativen Zugriff auf bisher nicht erreichbare Datenquellen wie IMS, Adabas, Lotus Notes/Domino oder Content-Management-Systeme. Zudem lassen sich beispielsweise JCA-Adapter entwickeln. Mit dem "Websphere Information Services Director" führt IBM zudem ein Modul ein, über das sich künftig Datenintegrationsdienste in einer SOA publizieren und wiederverwenden lassen. Es hat seinen Ursprung in Ascentials "RTI"-Funktionen" (Realtime Integration), die jedoch zur Daten- und nicht zur Anwendungsintegration dienten. Darüber hinaus besaß Datastage in erster Linie Datenbankkonnektoren und konnte Web-Services für Transformationen aufrufen, lesen und schreiben. Für andere Integrationsanforderungen waren Adapter des Integrationsspezialisten iWay Software in Lizenz nehmen.

Wie die genannten Server-Module so lassen sich auch die auf ihnen basierenden Systemmodule, die spezielle Aufgaben im Datenqualitäts-Management abdecken, einzeln erwerben. Das Modul "Websphere Information Analyzer" vereint die bisherigen Ascential-Produkte "Websphere Profile Stage" und "Websphere Audit Stage" unter einem neuen GUI, das laut Schickhaus künftig alle Module schmücken soll. Der Information Analyzer greift in erster Linie über eine ODBC-Schnittstelle auf Datenbanken zu und analysiert deren Metadaten auf Spalten-, Tabellen- und Cross-Tabellenebene. Ferner ist ein Zugriff über den Federation Server möglich. Das Modul hilft beim Mapping im Datenmodell, kann eine DDL (Data Definition Language) zur Generierung einer Datenbank erzeugen oder unterstützt ETL-Jobs mit Datastage.

Durch einen detaillierten Einblick in die Beschaffenheit der Daten könnten Anwender Qualitätsprobleme gezielter ausfindig machen, wirbt Schickhaus. "Allerdings wäre beispielsweise ein Profiling eines kompletten SAP-Systems mit Tausenden Tabellen (komplettes System) nicht sinnvoll, da der Anwender den Überblick verlieren würde." Daher sollte er sich einzelne SAP-Module oder Teilbereiche anschauen, um beispielsweise ein Customizing nachvollziehen zu können. Neben der Datenanalyse lassen sich mit dem Produkt Metriken oder Regeln für Daten-Audits hinterlegen, um die qualitative Entwicklung von Datenbeständen zu verfolgen und zu dokumentieren.

Datenbereinigung

Die diversen Aufgaben in der Datenbereinigung und Standardisierung von Daten übernimmt das Modul "Websphere Quality Stage". Anwender können hierbei Daten auch mit Hilfe mitgelieferter, aber erweiterbarer Regelwerke anpassen und korrigieren (beispielsweise Adressen oder E-Mail-Adressen). In den standardisierten Datensätzen kann beispielsweise im Zusammenhang mit einer Konsolidierung von Kundendaten nach Duplikaten gesucht, diese beseitigt oder zusammenführt werden, wenn sie unvollständig sind. Wie der Information Analyzer verfügte auch Quality Stage ursprünglich über eine eigene Engine, die nun zugunsten der Datastage-Engine von IBM aufgegeben wurde. Zudem erweitert Big Blue mit dem neuen Release den Produktfokus vom Data Warehousing auf Kunden-, Bewegungs- oder Stammdaten.

Nachlizenzierung erforderlich

Laut IBM soll der Umstieg von bisherigen Ascential- und IBM-Produkten auf den Information Server keinen großen Aufwand verursachen. So können Anwender Metadaten in das neue Repository übernehmen. Wer kein Interesse an den neuen Module hat, bekommt in etwa die gleichen Funktionen auf der neuen Plattform freigeschaltet und kann bisherige Engines weiter nutzen. Allerdings werde IBM versuchen, Kunden mit der Technik für Parallelverarbeitung zu locken und den Umstieg durch Migrationspakete zu vereinfachen. Wer hingegen die neuen Funktionen anwenden will, muss die Module nachlizenzieren. Unklar ist, welche Rolle der Information Server in IBMs Data-Warehouse-Strategie rund um die neue Datenbank "DB2 9" spielen wird. Diese verfügt in einer speziellen Edition über eigene, wenn auch laut Analysten limitierte ETL-Funktionen. Mit der noch für dieses Jahr angekündigten "DB2 Data Warehouse Edition 9" sollen diese nochmals erweitert werden.