UIMA - freie Software für die Textanalyse

11.07.2006
Von Can Unal

Die Zukunft von UIMA

Die IBM setzt UIMA als Basistechnik für den "Websphere Information Integrator Omnifind" ein. Es verwendet für die Extraktion von Daten aus den unterschiedlichsten Quellen so genannte Konnektoren. Mit ihrer Hilfe und vorinstallierten Annotatoren lässt sich Omnifind als Suchmaschine einsetzen. Interessant ist aber auch die Möglichkeit, die Fähigkeiten von Omnifind mit Hilfe von selbst entwickelten Annotatoren zu erweitern und auf die eigenen Bedürfnisse anzupassen.

Nachdem die IBM das UIMA SDK für jedermann zugänglich gemacht hat, sind einige Lösungen speziell im Umfeld der Universitäten entstanden. Des Weiteren hat die US-Regierung 2005 die Bildung einer UIMA-Arbeitsgruppe finanziell unterstützt. Sie hat sich zum Ziel gesetzt, elementare Probleme der Verarbeitung natürlicher Sprache zu lösen, wie zum Beispiel die maschinelle Übersetzung.