Informatica dehnt Datenintegration auf unstrukturierte Quellen aus

28.11.2006
Mit dem Kauf der Firma Itemfield für 55 Millionen Dollar in bar will der Hersteller seine Datenintegrationstechnik universell einsetzbar machen.

Itemfield entwickelt mit "Contentmaster" Software, die unstrukturierte und halbstrukturierte Dokumente wie branchenspezifische Datenformate erfassen (parsen) und die dabei gewonnenen Metadaten umwandeln hilft. Neben Excel-Spreadsheets, Word, Powerpoint, Adobe Acrobat, Postscript, PCL, Sun Staroffice, AFP und HTML gehören hierzu die standardisierte Datenformate SWIFT, NACHA, ACORD, Rosettanet, HIPAA und HL7. Daneben soll die Software aber auch beliebige strukturierte Formate wie XSD, DTD, XDR und relationale Daten umsetzen können. Rund fünf Millionen Dollar Umsatz soll das privat geführte Unternehmen mit Sitz im kalifornischen San Mateo im vergangenen Jahr erwirtschaftet haben. Unter den offiziell 150 Kunden finden sich Konzerne wie American Airlines und Merryil Lynch aber auch die Software AG, Oracle, Microsoft und die SAP. Letztere liefert die Itemfield-Software zusammen mit ihrer "Netweaver"-Infrastruktur aus.

Informatica hatte die Technik im Rahmen eines Wiederverkäuferabkommens bisher als "Unstructured Data Option" zusammen mit seiner Datenintegrationssoftware "Powercenter 8" vertrieben. Durch die geplante Übernahme und Integration der Contentmaster-Produkte sieht sich der Hersteller nun auf besten Weg zum universellen Datenintegrator für Unternehmenskunden. Bisher lagen die Stärken von Powercenter in der Erfassung und Aufbereitung strukturierter Daten etwas aus Datenbanken. Künftig könnten Anwender nun auch die auf 80 Prozent des gesamten Datenbestands geschätzten halb- oder unstrukturierten Quellen einbeziehen und anderen Datenhaltungen und Anwendungen zur Verfügung stellen. Die gewünschten Transformationen sollen sich ohne Programmieraufwand definieren lassen. (as)