computerwoche.de
Newsletter  |   CW-TV  |   Bilder-Galerien  |   Blogs & Forum  |   CW mobil  |   RSS  |   Aboshop


Business Intelligence

UIMA - freie Software für die Textanalyse

11.07.2006
Autor(en): Can Unal, Managing Director bei der iCore effective GmbH in Darmstadt.
Mit der Unstructured Information Management Architecture (UIMA) möchte die IBM einen Standard für maschinelle Verarbeitung von Dokumenten setzen.

Die Unstructured Information Management Architecture (UIMA) ist eine Analysesoftware, die Texte in Dokumenten und anderen Quellen aufspürt, analysiert und verarbeitet. Sie soll die versteckte Bedeutung, die Beziehungen und zugehörige Fakten zu einem Suchbegriff verstehen. UIMA bedient sich mehrerer Analysetechniken, wie etwa der statistischen und rollenbasierten Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), Information Retrieval (IR), Maschinen basierendes Lernen und Ontologien. Außerdem kann sie diese Prozesse mit Datenquellen, beispielsweise Datenbanken und Suchmaschinen, verknüpfen.

Eine UIMA-Anwendung durchläuft die Phasen Analysieren und Erzeugen.
Eine UIMA-Anwendung durchläuft die Phasen Analysieren und Erzeugen.

Damit könnte das Framework den heute bestehenden Graben zwischen Suchmaschinen und Business Intelligence überbrücken. Suchmaschinen sind auf Basis eines Begriffs nicht in der Lage, die Ergebnisse miteinander zu verknüpfen (sie bieten keine Möglichkeit, Objekte zu definieren und ihnen Attribute zuzuordnen). Umgekehrt können BI-Tools die in Texten enthaltenen Daten in der Regel nicht aufspüren.



Seite: 1 2 3 4 5 6  weiter


Leserkommentare 
(0 Beiträge), 
Kommentieren

Beitrag schreiben

Noch kein Forums-Mitglied?
Dann gleich hier anmelden.


BI & ECM: CW-REDAKTEURE EMPFEHLEN
SAPs BI-Strategie zwischen Umbau und Aufbruch SAPs BI-Strategie zwischen Umbau und Aufbruch Kunden von SAP-Software für Business Intelligence und Partnern wird Einiges abverlangt: Produkte sind abgekündigt, und nicht jeder Dienstleister bleib ... weiter
Mind Mapping verbindet Office, Datenbanken und Web Mind Mapping verbindet Office, Datenbanken und Web Mit MindManager 8 ermöglicht Marktführer Mindjet die Nutzung zusätzlicher Informationen und Inhalte in der Mind-Mapping-Software und verspricht mehr B ... weiter
Die HanseMerkur setzt im Online-Vertrieb auf Open Source Die HanseMerkur setzt im Online-Vertrieb auf Open Source Der Versicherer baute innerhalb weniger Monate drei Portale auf. Umsatz und Traffic ließen sich steigern. weiter
Stammdaten deutscher Firmen strotzen vor Fehlern Stammdaten deutscher Firmen strotzen vor Fehlern Laut einer aktuellen Umfrage hat nur jedes sechste Unternehmen seine Materialstammdaten im Griff.  weiter
EMC sucht die Allianz mit SAP und Microsoft EMC sucht die Allianz mit SAP und Microsoft Mark Lewis, EMCs President für Content Management und Archivierung, setzt auf Web-2.0-nullige Benutzeroberflächen und den Ausbau des Lösungsgeschäfts. ... weiter
SAPs BI-Strategie zwischen Umbau und Aufbruch Mind Mapping verbindet Office, Datenbanken und Web Die HanseMerkur setzt im Online-Vertrieb auf Open Source Stammdaten deutscher Firmen strotzen vor Fehlern EMC sucht die Allianz mit SAP und Microsoft
  • Top geklickt
  • Top verlinkt
Aktuelle Umfrage

Wie viele Tage haben Sie im vergangenen Jahr blau gemacht?

  • Whitepaper
FEATURED LINKS

KOSTENLOSE NEWSLETTER VON COMPUTERWOCHE
Nachrichten morgens
Whitepaper
Nachrichten mittags
CW-Mittelstand
Highlights der Woche
Hardware
Neu: SAP-Newsletter
Software
Job + Karriere
Open-Source
Stellenmarkt
Produkte + Techn.
Freiberufler
Security