Datability

Wer suchet, der findet

13.03.2014
Von 
Alexander Drechsler ist Head of Enterprise Portals & Search Technologies bei T-Systems Multimedia Solutions.
Mit Enterprise-Search-Lösungen sind Mitarbeiter in der Lage, schnell und unkompliziert Informationen aus unterschiedlichen Quellen des Firmennetzwerks zu recherchieren. Immer mehr Firmen lassen deshalb ihren Datenbestand von speziellen Suchmaschinen durchforsten. Denn die Lösungen können Informationssilos überwinden, Prozesse verschlanken und Kosten senken.
Nicht selten bleibt die Suche nach bestimmten Daten ohne Erfolg.
Nicht selten bleibt die Suche nach bestimmten Daten ohne Erfolg.
Foto: Claudia Hautumm / pixelio.de

Der Chef will die Präsentation haben - natürlich sofort. Hektisch klickt sich der damit beauftragte Mitarbeiter durch die Ordnerstruktur des Dateisystems - nichts. Auch die Suchfunktion des Betriebssystems bringt kein Ergebnis. Dann vielleicht die Intranet-Suche? Auch keine Treffer. Zunehmend nervöser greift er zum Hörer und ruft einen Kollegen an - ebenfalls ohne Erfolg. Doch der Chef will jetzt endlich Feedback. Nach einer letzten verzweifelten Suche im Mail-Client muss der Mitarbeiter schließlich kleinlaut eingestehen, dass das Dokument nicht aufzufinden ist - sehr zum Missfallen seines Vorgesetzten.

Solche Situationen gehören heute leider zum Alltag. Den Analysten von IDC zufolge sind die sogenannten ‚Knowledge Worker‘ in Unternehmen wöchentlich fast zehn Stunden mit dem Suchen, weitere acht Stunden mit dem Sammeln und rund drei Stunden mit dem Erstellen von bereits vorhandenen Inhalten beschäftigt. Als sei das nicht genug, dürfte die Informationssuche künftig noch schwieriger werden. Denn der weltweite Datenbestand verdoppelt sich nach Meinung der Marktforscher alle zwei Jahre. Doch viele Unternehmen sind nur unzureichend auf diese Entwicklung vorbereitet. Kein Wunder also, dass das Thema ‚Datability‘ - also die Fähigkeit große Datenmengen in hoher Geschwindigkeit auszuwerten und sinnvoll zu nutzen - immer wichtiger wird. Denn diese Fertigkeit wird den Unternehmenserfolg künftig mehr und mehr beeinflussen.

Enterprise Search statt Data-Warehouse

Mit den ‚Data Scientists‘ hat sich rund um die oben beschriebenen Aufgaben mittlerweile ein ganz neues Berufsbild entwickelt. Die Spezialisten widmen sich der Aufgabe, unternehmensinterne Daten und Dokumente schneller nutzbar zu machen. Je nach Grundlage kommen dafür unterschiedliche Werkzeuge zum Einsatz. Für strukturierte Daten eignen sich klassische Data-Warehouse- und Data-Mining-Lösungen. So gewinnen Unternehmen beispielsweise aus den Sensordaten einer Produktionsanlage Informationen über den Zustand von Verschleißteilen. Die Maschinenwärter wissen damit rechtzeitig, wann sie bestimmte Teile austauschen müssen, und können dies abseits der Produktionsphasen erledigen.

Für unstrukturierte Daten, wie Intranet-Artikel, Präsentationen, Bilder oder ähnliche Dokumente nutzen die Datenspezialisten dagegen vor allem Enterprise Search-Lösungen gepaart mit Big-Data-Ansätzen. Dabei handelt es sich um Suchmaschinen, die speziell auf die Arbeit mit unternehmensinternen Quellen ausgerichtet sind. Die eingesetzten Techniken und Algorithmen ähneln jenen, die auch bei der Internet-Suche zum Einsatz kommen. Beispielsweise werden die Informationen ebenfalls mithilfe von Crawlern erfasst, in Indizes aufgenommen und nach einer Suchanfrage anhand bestimmter Relevanzkriterien sortiert.

Hohe Erwartungen an die unternehmensinterne Suche

Auch das Frontend und dessen Handhabung ähneln den klassischen Suchmaschinen, die Anwender aus dem World Wide Web kennen. Grund dafür ist die durch die Internetsuche geprägte Erwartungshaltung der Mitarbeiter: Enterprise Search-Lösungen sollen optisch möglichst Google, Bing & Co. ähneln und das gewünschte Suchergebnis im Daten-Pool der eigenen Firma genauso schnell und verlässlich liefern wie aus dem Internet. Außerdem wollen die Mitarbeiter sowohl über den Rechner im Büro als auch über das Smartphone oder Tablet auf die Suchmaschine zugreifen können.

Während Internetsuchmaschinen auf Webserver ausgerichtet sind, müssen Enterprise-Search-Lösungen einen differenzierteren Ansatz verfolgen. Sie indexieren täglich mehrere Milliarden Dokumente aus heterogenen Quellen. Neben Webservern durchsuchen sie beispielsweise Cloud-Anwendungen, Netzlaufwerke, Intranet-Lösungen, E-Mail-Systeme, lokale Datenträger sowie Wechseldatenträger.

Hohe Dateityp- und Schnittstellen-Kompatibilität gefordert

Enterprise Search-Lösungen müssen deshalb unterschiedlichste Dateitypen und Schnittstellen unterstützten. Denn nur so können sie SharePoint- und ERP-Systeme mit in die Suche integrieren. Liefert der Suchmaschinenanbieter den passenden Konnektor nicht ab Werk, müssen ihn IT-Dienstleister entsprechend programmieren.

Die größere Herausforderung - auch hier zeigen sich wieder Parallelen zu Internetsuchmaschinen - liegt bisher in der Relevanz der Ergebnisse. Die Algorithmen sind in aller Regel von den Anbietern vorkonfiguriert. Administratoren passen darüber hinaus verschiedene Parameter auf den Bedarf des Unternehmens an. So gewichten sie beispielsweise Quellen und Metadaten für unterschiedliche Abteilungen anders. Selbstlernende Scorer können zudem die Genauigkeit automatisch steigern. Dafür analysieren sie Links und das Nutzerverhalten. Wenn die Nutzer das fünfte Suchergebnis beispielsweise in der Liste häufiger anklicken als die ersten vier, wird dieses Ergebnis nach einiger Zeit höher eingestuft. Die Nutzer können die Ergebnisse im Frontend anhand verschiedener Kategorien oder Schlagwörter eingrenzen.

Klare Sicht im Informationsdickicht

Enterprise Search-Lösungen können aber noch mehr. Sie verwandeln das unstrukturierte Informationsdickicht, welches aus einer schier unendlichen Menge von Mails, Dokumenten, Videos, Fotos und Audiodateien besteht, in eine strukturierte, maschinenlesbare Form. In diesem Bereich haben verschiedene Anbieter in der jüngeren Vergangenheit viele hilfreiche Techniken entwickelt.

Mithilfe der Expertensuche lassen sich beispielsweise schnell unternehmensinterne Fachleute für bestimmte Themen identifizieren. Dafür werden Sharepoint-Profile, das Lightweight Directory Access Protocol (LDAP) und sonstige Profil-Datenbanken gecrawlt und anschließend analysiert. Hat ein Kunde eine komplexe Frage, findet der Servicemitarbeiter mit seiner Suchanfrage schnell den richtigen Ansprechpartner. Das Unternehmen verbessert so seinen Kundenservice und senkt durch die schlankeren Prozesse gleichzeitig seine Kosten.

Automatische Identifikation von Entitäten

Ein weiteres Feature vieler Enterprise-Search-Lösungen ist die Erkennung von Entitäten. Die Funktion extrahiert dafür Inhaltsattribute, beispielsweise das Datum oder den Autor eines Dokuments. Das ist selbst dann möglich, wenn die Metadaten nicht eingepflegt worden sind. Die Lösung hilft dem Nutzer zudem dabei, Dokumente zu klassifizieren. Kommen in einem Textdokument beispielsweise häufig Fußnoten vor, ordnet die Suchmaschine den Beitrag automatisch der Kategorie "Wissenschaftliche Publikationen" zu. Nutzer können diese Attribute in Form von dynamischen Navigationselementen verwenden, um ihre Suchanfrage zu präzisieren.

Für Anwender haben solche Enterprise-Search-Lösungen etliche Vorteile. Ein Beispiel: Die Berliner Wasserbetriebe verfügen über riesige Daten- und Dokumentenbestände. Um die internationalen Normen, Management-Handbücher, Verfahrensanweisungen, Straßenverzeichnisse sowie Wissens- und Formular-Datenbanken aus unterschiedlichen Datenquellen durchsuchbar zu machen, implementierte T-Systems Multimedia Solutions deshalb eine Enterprise Search-Lösung. Diese Lösung hat Text- und dokumentenbezogene Prozesse verschlankt und damit verbunden Kosten gesenkt. Gleichzeitig profitieren die Kunden des Berliner Unternehmens. Denn das Servicepersonal greift dank der Lösung wesentlich schneller auf die relevanten Informationen zu.

Rechteverwaltung ermöglicht individuelle Suchergebnisse

Vielversprechend ist der Einsatz von Enterprise Search-Lösungen beispielsweise auch für Städte und Kommunen. Die Verwaltung kann die Lösung beispielsweise nutzen, um zu prüfen, ob ein Baugutachten bereits vorliegt. Gleichzeitig gewährt sie auch den Bürgern Zugriff auf die Suchmaschine. Diese finden Informationen wesentlich schneller und müssen keinen Mitarbeiter der Verwaltung zurate ziehen.

Möglich macht das die in vielen Lösungen integrierte Rechteverwaltung. Anwender finden so nur die Daten, auf die sie auch zugreifen dürfen. Die Verantwortlichen müssen ihre Datenquellen vorab freigeben. Dabei müssen sie allerdings die geltenden Bestimmungen und Regeln im Unternehmen sowie Datenschutzrichtlinien einhalten. Denn die Autorisierung der Benutzer von Dateien und Ordner muss innerhalb der Organisation sichergestellt werden, um dem Missbrauch von Daten im Unternehmen sowie außerhalb davon vorzubeugen.

Bisher nutzen einer Studie von DATACOM Research aus dem Jahr 2013 zufolge 23 Prozent der Unternehmen interne Suchtechnologien. Um sich gegenüber Wettbewerbern zu behaupten, wird der Einsatz solcher Lösungen aber nicht nur für Unternehmen mit hohem Anteil an Wissensarbeitern wichtig. Vielmehr werden künftig fast alle Unternehmen, getrieben von der steigenden Informationsflut, auf Enterprise Search-Lösungen setzen. (ba/sh)

Anforderungen an Enterprise Search:

Enterprise Search-Lösungen sollen optisch möglichst Google, Bing & Co. ähneln und das gewünschte Suchergebnis im Daten-Pool der eigenen Firma genauso schnell und verlässlich liefern wie aus dem Internet.
Neben Webservern durchsuchen müssen die Lösungen Cloud-Anwendungen, Netzlaufwerke, Intranet-Lösungen, E-Mail-Systeme, lokale Datenträger sowie Wechseldatenträger durchsuchen können, und müssen deshalb unterschiedlichste Dateitypen und Schnittstellen unterstützten.
Neben den vom Anbieter integrierten Algorithmen sollen sich die Lösungen durch Parametrisierung an die Bedürfnisse der Anwenderunternehmen anpassen lassen. Selbstlernende Scorer können die Genauigkeit zudem automatisch steigern. Dafür analysieren sie beispielsweise Links und das Nutzerverhalten.
Die Lösungen extrahieren dafür Inhaltsattribute, beispielsweise das Datum oder den Autor eines Dokuments. Das ist selbst dann möglich, wenn die Metadaten nicht eingepflegt worden sind. Die Lösung kann Nutzern zudem dabei helfen, Dokumente zu klassifizieren.
Anwender finden nur die Daten, auf die sie auch zugreifen dürfen. Die Verantwortlichen müssen ihre Datenquellen vorab freigeben. Dabei müssen sie allerdings die geltenden Bestimmungen und Regeln im Unternehmen sowie Datenschutzrichtlinien einhalten.