Lixto: Suchtechnik beobachtet den Wettbewerb

06.09.2007
Software vereint verteilte Informationen und bereitet sie nach Benutzervorgaben auf.

Von CW-Redakteur Sascha Alexander

Das Softwarehaus Lixto aus Wien entwickelt Lösungen auf der Basis eigener Suchtechnik, mit deren Hilfe Unternehmen Fakten und Zahlen über Märkte, Lieferanten, Kunden und Konkurrenten aus Web-Produktkatalogen, Web-Shops oder anderen Web-Portalen gewinnen und aufbereiten können. Statt laufend eine Flut verteilter Informationen im Internet oder Intranet beobachten und sichten zu müssen, kann der Anwender sich diese Angaben gezielt von der Software sammeln, auswerten und weiterleiten lassen. Anwendungsgebiete sind die Lieferantenbewertung, das Preis-Monitoring (Wettbewerbsbeobachtung) im Web und das Qualitäts-Management.

Auslesen von HTML-Seiten

Lixto bietet hierfür Werkzeuge zur Extraktion und Verteilung von Informationen, die als "Lixto Suite" erhältlich sind. Zu ihr gehört neben der Suchmaschine "Lixto Metasearch" die grafische Eclipse-basierende Entwicklungsumgebung "Lixto Visual Developer", mit der sich Extraktionsroutinen für HTML-Seiten erstellen lassen. Diese können anhand von Struktur, Layout und Inhalt der HTML-Seite die gewünschten Angaben auslesen und im XML-Format ablegen.

In der Laufzeitumgebung "Lixto Transformation Server" können die so gewonnenen XML-Strukturen beziehungsweise Teile von ihnen mit Hilfe benutzerdefinierter Transformationsregeln schrittweise formatiert und bereinigt, transformiert und im jeweils gewünschten Ausgabeformat an Endgeräte und Anwendungen zur Verarbeitung geschickt werden.

Unter der Haube nutzt der Server die standardisierte Sprache "XPath 2" zur Adressierung von Teilen eines XML-Dokuments sowie XSLT für die Transformation der Strukturen. Anwender können während des Verfahrens Daten selektieren, indem sie einen Vergleichsparameter für bestimmte XML-Datenelemente angeben, sowie Daten aus verschiedenen Quellen aggregieren, indem sie zwei XML-Dokument-arten in einer Operation zusammenfassen. Als Client dient ein Web-Browser (Mozilla).

Die mehrmals prämierte Lixto Suite gehört zur Klasse der Wrapper-Tools für die automatisierte Datenextraktion im Web. Neben einer Reihe von Open-Source-Projekten finden sich kommerzielle Produkte beispielsweise von IBM, Itemfield (jetzt bei Informatica), Connotate, Datamystic, Data Junction (jetzt bei Pervasive Software) oder Temis.

Designer macht den Unterschied

Laut Lixto-Geschäftsführer Gilbert Högel unterscheidet sich die Lixto Suite aber vor allem durch ihre grafische Entwicklungsumgebung vom Wettbewerb: "Jede Extraktion lässt sich in einem Wysiwyg-Editor betrachten." Während andere Tools nur durch den DOM-Tree navigieren würden, könne das eigene Produkt dank der Mozilla-Integration auch die gesamte Benutzerinteraktion (Mausklicks, Input, Navigation) sichtbar machen. Dadurch könne man auch dynamische Sites gut auswerten.

Zu den Kunden von Lixto gehören T-Mobile, ZF Friedrichshafen, Webasto und die staatliche Tourismusorganisation Österreich Werbung. Letztere ist ein Beispiel für eine Anwendung zur Marktbeobachtung: "Österreich Werbung kann heute im Rahmen einer einzigen Metasuche bis zu 90 Prozent der aktuell im Land verfügbaren Hotelzimmer auf den diversen Sites der lokalen Anbieter erfassen", erklärt Högel. Allerdings geht dies (offiziell) nur dann, wenn wie im Fall der Österreich Werbung ein unbeschränkter Zugriff auf die Online-Daten gewährt wird, weil beide Seiten an einem transparenten, aktuellen und möglichst vollständigen Angebot für Reisende interessiert sind.

Logistikintegration

Ein anderes Einsatzgebiet für die Lixto-Software bietet die Webbasierende Prozessintegration. Mit ihr extrahieren beispielsweise Autohersteller (nach einem automatischen Log-in) Daten aus den Web-Portalen ihrer Lieferan-ten, um geschäftskritische Informationen zu sammeln und eigenen Unternehmensanwendun-gen wie SAP zur Verfügung zu stellen. Diese Integration erleich-tert beispielsweise eine automatisierte Reklamationsabfrage über alle Lieferanten und die Übernahme der Auswertungen über die Idoc- oder Netweaver-Schnittstelle in das ERP-System. Voraussetzung ist aber auch hier, dass ein Zugriff auf die Daten von allen Beteiligten unterstützt wird.