CW-Test: Microsofts Search Server Express

01.09.2008
Von Markus Franz
Suchlösungen für Unternehmen sind ein junger Markt, den sich bislang wenige, meist große Anbieter teilen. Microsoft bedient ihn mit dem "Search Server 2008", dessen kostenlose Express-Version die COMPUTERWOCHE geprüft hat.

Enterprise Search ist ein Spezialgebiet der Suchmaschinentechnik: Man versteht darunter alle Verfahren, über die Dateien und andere Daten in Unternehmen durchsucht werden können. Die Suche erfolgt jedoch in der Regel nicht direkt in den ursprünglichen Datenquellen, sondern auf einem Suchindex. Dieser beinhaltet primär interne Datenquellen wie Dokumente von verschiedenen Datenbanken und Einträge von Dateisystemen. Für Enterprise Search kommt es weniger auf ein absolut perfektes Ranking wie bei Suchmaschinen im World Wide Web an, sondern vielmehr auf eine Integration in die Geschäftssoftware und ein ausgefeiltes Rechte-Management, denn die im Content-Management- oder ERP-System nur eingeschränkt lesbaren Daten sollen ja nicht durch die Suchfunktion für jeden Mitarbeiter zugänglich werden. Ein gutes Enterprise-Search-System muss deshalb zahlreiche Schnittstellen für unterschiedliche Dateiformate und Datenbanken unterstützen, damit die vorhandenen Informationsbestände problemlos angebunden und indexiert werden können.

Microsofts Einsteigerprodukt für diesen Markt ist der Search Server 2008 Express. Er setzt zwingend ein Betriebssystem der Server-Reihe voraus - es muss mindestens Windows Server 2003 oder besser Windows Server 2008 vorhanden sein. Im Test funktionierte aber auch die Installation auf Windows Vista problemlos, abgesehen von einigen kleineren Fehlermeldungen. Mit 2,5 Gigahertz Taktrate der CPU und mehr als 2 GB freiem Festplattenspeicher ist auch sonst der Ressourcenhunger der Anwendung recht groß. Das empfohlene Volumen an freiem Arbeitsspeicher liegt sogar bei 4 GB. Der Search Server läuft derzeit nur mit einem installierten .NET-Framework 3.0 oder höher sowie in einer mit dem Dateisystem NTFS formatierten Partition. Da später das Such-Frontend Webbasierend arbeitet, muss Microsofts Web-Server IIS mit ASP.NET-Unterstützung aktiviert sein.

Die von der Standardausführung des Search Server 2008 verfügbare Testversion unterstützt 32- und 64-Bit-Architekturen (Microsoft-Jargon: x86 und x64). Dies gilt auch für das Express-Release, dessen Installationspaket 250 MB umfasst und lokalisiert in zahlreichen Sprachen, darunter Deutsch, bereitsteht. Beide Server können derzeit aber nur auf einem Rechner installiert werden: Microsoft weist darauf hin, dass der Search Server Express zwar mehrere Server für die Bereitstellung des Such-Frontends "Query Server" unterstützt, aber nur ein Applikations-Server laufen kann. Die Möglichkeit, eine Farm aufzubauen, gibt es erst im vollwertigen Search Server. Für Unternehmen, die nur die Express-Variante einsetzen, enden damit die Kapazitäten für interne Enterprise Search an den Grenzen der verwendeten Hardware.

Installation und Konfiguration

Die Installation selbst erfolgt in wenigen Schritten: Zunächst prüft ein Assistent die Systemumgebung, ob sie alle Anforderungen zum Deployment des Search Server Express erfüllt. Dabei wird automatisch auch der Internet Information Server (IIS) als Server-Role installiert und mit ASP aktiviert, sollte dies noch nicht manuell geschehen sein. Es ist also ratsam, vor der Installation die IIS-Konfiguration genau auf Konflikte mit anderen Web-Anwendungen oder Web-Servern zu prüfen, sofern Search Server Express nicht auf einem dedizierten System läuft. Wenn das so genannte Preparation-Tool seine Arbeit erledigt hat, kann die eigentliche Installation beginnen - entweder im Basic- oder im Advanced-Modus. Ersterer hilft beim Einrichten der SQL-Datenbank weiter, die als Backend für den Suchindex dient. Weitere Optionen gibt es nur im erweiterten Modus: Hier wird der Search Server mit einer bestehenden Server-Farm verbunden oder die Verknüpfung zu Sharepoint hergestellt. Das Aufspielen der Programmdateien benötigt dann nur noch wenige Minuten, bis im Browser das Such-Frontend erscheint.

Index- und Query-Server

Im Anschluss an die Installation müssen Index Server und Query Server eingerichtet werden - jeweils über das zentrale Web-gestützte Interface. Dabei dreht sich alles um das Status-Tab, das aktuelle Informationen zu Office Sharepoint Server Search beinhaltet. Der Search Server kann ohne zusätzliche Erweiterungen reine Dateisysteme (alle gängigen Dateiformate inklusive Microsoft Office und Adobe PDF) sowie Sharepoint-Seiten indexieren. Letztere werden über die Start-URL im Index Server angegeben, der sich dann von Link zu Link durch das Material hangelt. Das funktioniert auch mit externen Websites, also zum Beispiel mit der eigenen Corporate Website im Unternehmen oder beliebigen anderen Quellen im Web. Standardmäßig lassen sich auch öffentliche Exchange-Ordner als Datenquelle angeben. IBM Lotus Notes dagegen lässt sich nur schwer einbinden: Zunächst muss der Search Server zwingend auf einem x86-System laufen und der Domino Server, dessen Datenbank indexiert werden soll, aktiv sein. Über den Notes-Client und das Notes-C++-API sowie einen eigenen Benutzer-Account für das Crawling können dann auch dort Inhalte durchsucht werden.

Erweiterte Konfiguration und Plug-ins

Derzeit ist nicht nur eine Vielzahl an Dateiformaten als Datenquelle für den Suchindex möglich, sondern auch eine sprachabhängige Indexierung: Über Language Packs lernt der Search Server, wie mit Texten in verschiedenen Sprachen umgegangen wird. So werden Stemming und andere Suchtechniken für die jeweilige Sprache der Inhalte korrekt vorgenommen, und es gibt keine Probleme mit Umlauten und Sonderzeichen. Im Test glänzte Search Server Express hier durch absolute Stabilität.

Externe Datenquellen

Möchte man über die vorgegebene Ausstattung hinaus weitere Datenquellen in die Suche einbinden, stehen zwei Verfahren offen: die Federated Search Plug-ins und die Index Connectors. Erstere sind praktisch eine Metasuche, die Suchergebnisse externer Anbieter integriert. Eine Suchanfrage wird dazu an den Quelldienst weitergeleitet, und dessen Ergebnisse werden aufgesammelt. Für viele Anbieter gibt es dazu bereits eine FLD-Datei, die den Zugriff regelt. Das gesamte Verfahren basiert auf dem Open-Search-Standard, der einheitliche Schnittstellen für Suchmaschinen definiert. Die Indexierung der externen Datenquellen erfolgt über die Index Connectors. Für unstrukturierte Daten bietet Microsoft eine Anleitung, die dem Search Server neue Protokolle beibringt. Für strukturierte Daten gibt es Plug-ins als Business Data Catalog, die über Definitionsdateien auch von externen Anbietern bereitgestellt werden.

Fazit

Der Microsoft Search Server 2008 ist in jedem Fall einen Blick wert. Besonders gelungen ist naturgemäß die Integration mit den Microsoft-Produkten. Aber auch im heterogenen Umfeld schlägt sich der Search Server wacker, die Konnektoren zu externen Datenquellen machen es möglich.

Vernachlässigt im Vergleich zu Konkurrenzlösungen hat Microsoft allerdings das Rechte-Management. (ue)

Microsofts Search-Produkte

Microsoft bietet drei Produkte für die Suche:

  • Der "Search Server 2008 Express" ist das Einsteigerprodukt ohne Lizenzkosten.

  • Der große Bruder "Search Server 2008" schlägt je nach Supportvertrag und Laufzeit mit etwa 7000 Dollar pro Jahr zu Buche.

  • Daneben gibt es noch den "Office Sharepoint Server 2007", der als Plattform für das Intranet ebenfalls Suchfunktionen enthält - ein Feature-Pack von Microsoft macht es möglich. Die Lizenzkosten steigen hier aber nochmals deutlich an.

Die Unterschiede

Die drei Editionen unterscheiden sich nur in wenigen Punkten:

  • Der Search Server Express beinhaltet zum Beispiel keine Features für Hochverfügbarkeit oder Lastverteilung. Auch kann er keine Personensuche vornehmen, die automatisch soziale Verbindungen und vernetzte Benutzerprofile einbindet. Ferner steht die als Business Data Catalog bezeichnete Funktion nicht zur Verfügung, über die in der Suche direkt mit Daten aus Siebel- oder SAP-Systemen gearbeitet werden kann. Schließlich ist in der Express-Variante die für Unternehmen wichtige Anbindung an Sharepoint eingeschränkt, so dass die Informationen dort nicht indexiert werden können.

  • Der normale Search Server umfasst alle Features der Express-Variante plus Hochverfügbarkeitsfähigkeiten.

  • Den vollen Funktionsumfang erhält man aber nur mit dem Spitzenprodukt im Sharepoint Server.

Upgrade auf Search Server

Nicht wenige Anwender möchten vielleicht den Search Server in der Express-Variante testen, um danach auf die kostenpflichtige Vollversion zu wechseln. Dafür hat sich Microsoft eine intelligente und unkomplizierte Lösung einfallen lassen:

Wer sich eine Lizenz für den Search Server gekauft hat, kann einfach die Installation von den Medien neu starten. Der Assistent richtet die uneingeschränkt nutzbare Fassung dann basierend auf den Vorgaben des bereits vorhandenen Search Server Express neu ein. Das ist alles, es sind keine weiteren Schritte notwendig.

Der Installer erkennt auch automatisch eine Umgebung mit Windows Sharepoint Services 3.0, die zum Search Server oder Search Server Express hochgerüstet werden kann. Dazu muss auf jeder Maschine im Sharepoint-Deployment der neue Search-Server-Installationsassistent ausgeführt werden.

Zwingende Voraussetzung ist hier aber das Service Pack 1 für die Windows Sharepoint Services 3.0. Anschließend lassen sich die Systeme wie gewohnt zu einer Suchfarm verbinden oder mehrere Query Server anlegen.