Lernende Software spürt Wissen auf

30.11.2005
Von Albert Denz

Fuzzy Search und das Eingrenzen der Ergebnisse

Eine weitere Arbeitserleichterung eröffnet KI-basierende Software bei der Informationssuche. Neben Standardfunktionen wie der Booleschen Kombinatorik von Stichwörtern bieten selbst lernende Suchmaschinen eine unscharfe Suche (Fuzzy Search), die auch Wortvarianten findet und partielle Treffer anzeigt. Ebenso lassen sich beliebige Textstücke als Grundlage einer Anfrage verwenden. In allen Fällen gewichten derartige Maschinen die Ergebnisse nach der relativen Frequenz der Suchbegriffe in den jeweiligen Fundstellen. Um die Treffermenge weiter einzugrenzen, erhält der Benutzer zusätzlich die wichtigsten Kategorien aufgelistet, denen die gefundenen Texte im Vorfeld zugeordnet wurden. Nach Auswahl einer dieser Kategorien zeigt die Software dann nur noch diejenigen Dokumente an, die sowohl den Suchbegriff enthalten als auch der betreffenden Kategorie angehören.

Ihren größten Nutzen entfalten selbst lernende Suchmaschinen durch assoziative Suchmechanismen. Gibt der Benutzer beispielsweise "Arbeitsmarkt" ein, berechnet die Software dynamisch Assoziationen wie "Hartz" oder "Konjukturprognose". Dies sind Begriffe, die in einer signifikanten Beziehung zu dem ursprünglichen Suchwort stehen und zusammen mit diesem in einer Teilmenge der Dokumente auftreten. Durch Auswahl eines dieser Cluster und den erneuten Start einer assoziativen Suche lassen sich die Resultate sukzessiv verfeinern und 1000 oder mehr Fundstellen mit wenigen Mausklicks auf einige wenige Dokumente reduzieren. Die Navigation kann hierbei entweder über lineare Baumstrukturen erfolgen oder über sternförmige grafische Darstellungen.

Während die bisher genannten Suchstrategien maßgeblich einer Einschränkung des Suchraums dienen, ermöglicht die Ähnlichkeitssuche, diesen zu erweitern. Der Benutzer kann sich damit beispielsweise alle im Datenbestand verfügbaren Dokumente zu einem bereits identifizierten Textinhalt anzeigen lassen. Da praktisch der gesamte Inhalt des vorab ausgewählten Textes als Suchanfrage fungiert, ist sichergestellt, dass alle Dokumente gefunden werden, die mit ihm in einer näheren Beziehung stehen. Durch das Ranking der Ergebnisse, den Zusammenschnitt der zentralen Inhalte sowie die Markierung der wichtigsten Wörter und Begriffsvarianten erhält der Benutzer einen schnellen Überblick, welche Fundstellen die für sein Anliegen größte Relevanz besitzen.

Wollen Firmen erfolgreich am Markt agieren, ist ein aktuelles Wissen über das eigene Unternehmen, die Kunden, Markttendenzen und Konkurrenten von Vorteil. Mit KI-basierender Software lassen sich interne und externe Informationsquellen wie Web-Seiten, Foren und Newsletter, öffentliche und eigene Datenbestände sowie die Unternehmenskorrespondenz kontinuierlich beobachten und systematisch auswerten. Lernfähige Softwareagenten überprüfen auf Basis von Suchprofilen automatisch die vorab definierten Quellen, extrahieren wichtige Informationen, indizieren diese und speichern sie in einer Datenbank ab. Die Intelligenz der Systeme trennt dabei wichtige von unwichtigen Informationen und filtert Dubletten zuverlässig aus.

Im Wissenspool lässt sich schneller suchen

Die oben skizzierten Recherche-, Darstellungs- und Navigationsmöglichkeiten erlauben dem jeweiligen Benutzer dann, aus dem so entstehenden Wissenspool die für ihn relevanten Informationen schnell und gezielt herauszuziehen. Darüber hinaus kann der Anwender individuelle Suchprofile erstellen, die ihn regelmäßig mit wesentlichen Informationen versorgen. In beiden Fällen legt die Software automatisch inhaltliche Beziehungen offen, sodass verborgene Zusammenhänge zu Tage treten. Verfügen die Systeme über eine integrierte Dokumentenverwaltung, können die Texte und Inhalte zudem per Mausklick zu Ergebnisberichten zusammengefasst, editiert und anderen Benutzern zur Verfügung gestellt werden. Ebenso lassen sich eigene Informationen zu den bereits bestehenden Dokumenten hinzufügen.

Fazit

Software auf Basis von künstlicher Intelligenz und Sprachtechnologie hilft Unternehmen, das in den Datenbeständen gespeicherte Know-how effektiv zu nutzen. Die Lösungen extrahieren aus der Unmenge an unstrukturierten Dokumenten entscheidendes Wissen für die Geschäfts- und Entscheidungsprozesse. Detailinformationen wie Eigennamen, Ortsangaben oder Stammdaten werden zuverlässig identifiziert, übersichtlich strukturiert und transparent für die einzelnen Unternehmenssysteme wie zum Beispiel CRM-Anwendungen aufbereitet.