Für die Suche nach der Stecknadel im Heuhaufen

09.08.2005

MÜNCHEN (COMPUTERWOCHE) - Geschätzte vier Fünftel aller Unternehmensdaten passen nicht in klassische Datenbankstrukturen. Und die Menge der potenziell geschäftskritischen Äußerungen in Foren und Blogs auf dem Internet wuchert unüberschaubar vor sich hin. Wenn in irgendeinem Diskussionsforum ein erboster Kunde auf Produktmängel hinweist, könnte diese Information dem Hersteller helfen, eine eventuell notwendige Rückrufaktion früher zu starten, also Geld- und Imageverluste zu begrenzen. Doch mit herkömmlichen Analysewerkzeugen lassen sich derartige Quellen nicht kanalisieren.

Unternehmen wie Attensity Corp. mit Sitz in Palo Alto, Kalifornien, oder Intelliseek Inc. aus Cincinnati, Ohio, offerieren deshalb spezielle Tools für die Suche nach der sprichwörtlichen Nadel im Heuhaufen. Sie verbinden klassische Suchkomponenten mit semantischer Analyse. Auch die IBM ist auf diesen Markt aufmerksam geworden: Unter der Bezeichnung Unstructured Information Management Architecture (UIMA) bemüht sie sich, hier den technischen Standard zu setzen. Dabei handelt es sich um eine offene und erweiterbare Plattform, auf deren Basis Tool-Anbieter eigene Lösungen entwickeln, integrieren und bereitstellen sollen.

In der aktuellen Version seines Suchwerkzeugs "Websphere Information Integrator Omnifind Edition" hat der blaue IT-Riese die UIMA bereits implementiert. Ein Software Developer Kit für Java bietet er nun zum kostenlosen Download an - unter www.alphaworks.ibm.com/tech/uima. Mehr als ein Dutzend Softwareunternehmen haben bereits zugesagt, die Architektur unterstützen zu wollen. Dazu gehören zum einen Spezialisten für unstrukturierte Informationen wie Attensity und Factiva, ein Joint-Venture der Nachrichtendienste Dow Jones und Reuters, zum andern aber auch Analyseveteranen wie SAS Institute und SPSS.

In die vor etwa vier Jahren begonnene Entwicklung der UIMA waren sowohl akademische als auch militärische Kreise involviert. Neben Carnegie Mellon, Columbia und Stanford University sowie The University of Massachusetts Amherst steuerte auch die Defense Advanced Research Projects Agency (Darpa) ihr Know-how bei. Ende des Jahres will IBM die Technologie via www.sourceforge.net der Open-Source-Gemeinde präsentieren. (qua)