Digital und Netscape im Vergleich

Intranet-Suchmaschinen helfen bei der Recherche

06.03.1998

Unablässig wird das Internet von merkwürdigen Programmen heimgesucht, den Crawlern, auch Worms, Robots, Spiders oder Wanderers genannt. Sie fischen neue Dokumente aus dem WWW und füttern damit diverse Suchmaschinen.

Was für das Internet gilt, hat sich auch bei Machern und Nutzern von Intranets herumgesprochen: Ab einer gewissen Dokumentenmenge sind Suchmaschinen unverzichtbar. Bereits bei 1000 elektronischen Schriftstücken wird die herkömmliche Suche sehr schwierig. Mit Search Engines recherchieren Anwender per Browser nach Firmeninformationen. Wesentliche Anforderungen sind dabei: gute Recherchemöglichkeiten, eine transparente Bedienung, komfortable Administration, netzübergreifende Suche (wenn sich das Intranet über verschiedene Standorte erstreckt) sowie Konverter für gängige Daten- und Textformate.

Eine der verbreitetsten Internet-Suchmaschinen, Digitals "Altavista", bietet diese Technik auch für Intranets an, und zwar unter dem Namen "Altavista Intranet Search Extension 97 Version 2.0". Netscape bringt seinerseits in Kürze den "Compass Server" aus der Server-Familie "Suitespot" auf den Markt. Diese Software ersetzt den "Catalog Server". Sowohl Netscapes neues Suchsystem als auch Digitals Produkt wurden auf einem Windows NT Server unter die Lupe genommen. Jedoch lag das Erzeugnis der Barksdale-Company als Beta-2-Ver- sion vor.

Von der grundlegenden Architektur her sind beide Systeme vergleichbar; sie beruhen im wesentlichen auf vier Komponenten: dem Crawler, der die Intranet-Dokumente einsammelt, dem Indizierer zur Vergabe von Schlagworten, der Benutzer-Schnittstelle sowie dem Web-Server. Trotz dieser Komplexität sind beide Programme schnell installiert.

Digital und Netscape liefern ihre Suchprogramme sowohl für diverse Unix-Plattformen als auch für Windows NT aus, so daß die Skalierbarkeit kein Problem darstellen dürfte.

Zwar lassen sich beide Werkzeuge über den Web-Browser administrieren, hier aber beginnen auch schon die Unterschiede.

Der Verwalter steuert die Netscape-Software ausnahmslos über den Web-Client und räumt ihm ausgefeilte Reporting- und Überwachungsmöglichkeiten ein. Auf diese Weise kann jeder Web-fähige Desktop das Management des Tools übernehmen.

Hingegen beschränkt sich der Bedienungskomfort beim Digital-Produkt auf das Konfigurieren, Starten und Stoppen des Roboters. Für das Monitoring etwa muß sich der Systemverwalter mit einer Listendarstellung im DOS-Fenster zufriedengeben.

Bei der Konfiguration des Roboters ziehen beide Hersteller wieder gleich. Automatisch begibt sich dieser auf die Suche nach neuen Dokumenten. Eine umfangreiche Sammlung von Daten- und Textkonvertern wandeln die gängigsten Informationsquellen in das Browser-gerechte Format Hypertext Markup Language (HTML) um. Besonders Altavista glänzt hier mit einer sehr umfassenden Auswahl an Datenformaten. Beide Roboter sind zudem Proxy-fähig und erreichen so auch Web-Server, die hinter einer Firewall liegen. Auf diese Weise können die Intranet-basierten Suchmaschinen auch Inhalte von Servern im Internet indizieren.

Wichtig bei komplexen Intranets sind Filter, mittels derer bestimmte Bereiche, Daten oder Server von der Indizierung ausgeschlossen werden können. Hierbei unterstützt der Compass Server den Systemverantwortlichen besonders gut: Das Netscape-Tool berücksichtigt bei der Index-Erstellung auch "Lotus-Notes"-Datenbanken.

In puncto Funktionsumfang bietet Netscape dem Administrator deutlich mehr Unterstützung. Dies macht sich beim Indizieren und Verwalten eines Intranet mit vielen Servern bezahlt. So kann der Web-Master beliebig viele Startpunkte für die Suche mit unterschiedlichen Parametern definieren, zum Beispiel diverse Filter oder unterschiedliche Suchtiefen. Ferner erlaubt die Lösung dem Web-Experten, mehrere Suchmaschinen und Indizes parallel einzurichten und zu betreiben. Fehlerhafte Roboterläufe lassen sich weitgehend ausschließen, wenn der Verwalter den integrierten Simulator einsetzt. Mit diesem Tool überprüft der Systemverantwortliche, ob definierte Startpunkte erreichbar sind, die Filter korrekt gesetzt wurden und die Zugriffsrechte stimmen.

Negativ fiel beim Netscape-Produkt das Ressourcen-Management des Roboters auf. Zwar bietet das Verwaltungswerkzeug verschiedene Parameter, um den CPU- und Speicherhunger zu bändigen, trotzdem belastete die Roboter-Task die Performance des verwendeten NT-Servers unverhältnismäßig stark. Hier muß der Hersteller noch nachbessern, was aber bei einer Betaversion nicht verwunderlich ist.

Altavista geht zwar deutlich schonender mit den Systemressourcen um, agiert aber auch viel gemächlicher. Ob bei diesem Tempo ein großes Intranet innerhalb einer Nacht indiziert werden kann, ist fraglich.

Für umfangreiche Intranets, die sich zudem über mehrere Standorte erstrecken, erweisen sich die Import-Agenten des Compass Server als äußerst nützlich. Von einer lokalen Suchmaschine erstellte Indizes werden von einer zentralen Search Engine gesammelt und zu einem gemeinsamen Index zusammengefügt. Dies wirkt sich positiv auf die Geschwindigkeit der Indizierung aus. Außerdem verringert dieser Ansatz die Netzbelastung, da das System jeweils nur den Index transferiert und nicht die Dokumente.

Netscapes Compass Server und Digitals Altavista helfen dem Endanwender beim Auffinden von Informationen mit Volltextsuchfunktionen. Zusätzlich erlaubt das Produkt der Barksdale-Company das automatische Erstellen eines hierarchischen Katalogs. Die Benutzer können in diesem Verzeichnis blättern und die Volltextrecherche auf bestimmte Inhalte eingrenzen. Hierzu muß der Administrator ein Kategorienschema definieren. Mit Hilfe von Regeln, Meta-Tags und Attributen lassen sich so die vorhandenen Dokumente den Kategorien zuordnen. Meta-Tags können Metadaten enthalten, beispielsweise "Author".

Was die Bedienung anbetrifft, dürften beide Systeme auch für unbedarfte Endanwender kein Hindernis darstellen. Altavista Intranet Search präsentiert sich dem User so wie das große Vorbild im Internet und bietet damit einen gewissen Wiedererkennungseffekt. Beide Programme geben dem Benutzer eine Fülle von Suchoptionen an die Hand, wie etwa die verknüpfte Suche, Abstandsoperatoren sowie kategorienbezogene Suche.

Nutzer der Netscape-Software können bei der erweiterten Suche alle Optionen per Mausklick wählen. So lassen sich auch ohne Studium der Bedienungshinweise schnell komplexe Abfragen zusammenstellen. Bei Altavista muß der Anwender hier viel von Hand einstellen. Letztendlich fischen aber beide Systeme die gewünschten Informationen aus dem Netz.

Mit "My Compass" offeriert Netscape einen automatisierten Informationsdienst. User erstellen individuelle Interessenprofile und erhalten die darauf zutreffenden Inhalte in festgelegten Intervallen als URL-Liste per Mail zugesandt. Zum Beispiel könnte sich ein Mitarbeiter so über alle neu hinzugekommenen Dokumente informieren lassen.

Darüber hinaus erlaubt es das System den Benutzern, alle aus dieser Liste besichtigten Seiten online zu bewerten - ein inter- essantes Rating-Instrument für die Intranet-Betreiber. Auch Digital hat eine Sonderfunktion für die Endbenutzer parat. Sie dürfen selbständig Universal Resource Locators (URLs) eingeben, die dann die Suchmaschine indiziert.

Damit der Betreiber das Nutzerverhalten studieren kann, protokollieren beide Systeme alle Zugriffe und erstellen auf Wunsch entsprechende Reports. Hier kann sich der Intranet-Betreiber wertvolle Hinweise auf die Verbesserung sowohl des Suchdienstes als auch der inhaltlichen Gestaltung holen.

Ein Pluspunkt geht an Altavista für die in vielen Sprachen verfügbare Benutzer-Schnittstelle. Net- scape begnügt sich hier mit einer englischen Ausführung. Beim Sammeln und Indizieren von Dokumenten leisten beide Kontrahenten vergleichbar gute Dienste. Jedoch liegt das Netscape-Produkt beim Funktionsumfang sowie bei der Administration deutlich vorn.

*Andrej Radonic (arqtextware.de) arbeitet als freier Autor in Köln.