Effizienter Umgang mit Information ist im Business entscheidend Gesucht: Knowledge-Navigator im Ozean der Informationen

12.08.1994

Von Ulrich Schneider

Die globalen Informationsdienste finden innerhalb der Unternehmen ihre mehr oder weniger strukturierten Pendants. In dieser Business-orientierten IT-Welt mit ihrer Vielfalt von Datenbanken und wachsenden Zahl an Dokumenten-Management-Systemen geht es darum, dass die richtige Person zur richtigen Zeit auf die richtige Information zugreifen kann. Dazu ist (noch) Disziplin gefordert.

In ihrem Bestseller "The Virtual Corporation" (1992) entwerfen die Autoren William H. Davidow & Michael S. Malone das Bild von Unternehmen, die in der Lage sind, sich flexibel und innerhalb kuerzester Zeit auf sich staendig aendernden Bedingungen des Markts einzustellen. Deren Geheimnis liegt aber nicht etwa in einem erfolgreichen Re-Engineering ihrer Geschaeftsstrukturen und - prozesse. Vielmehr zeichnen sich die aufgefuehrten Beispiele durch einen besonders effizienten Umgang mit Informationen aus. Dies fuehrt die Autoren zu dem Schluss, dass die eigentliche "Natur des Geschaefts" Information ist und der Grad des Fortschritts in der modernen Geschaeftswelt direkt von ihrer Faehigkeit abhaengt, Informationen zu erzeugen und zu verarbeiten.

In unserer Informationsgesellschaft wird selbst in typischen Industriebetrieben nur noch zu einem kleinen Teil physisch gearbeitet. Die Mehrzahl der Angestellten ist mit dem Sammeln, Generieren und Verarbeiten von Informationen beschaeftigt. Dies gilt fuer den staendig wachsenden Dienstleistungsbereich freilich in noch groesserem Masse. Daher ist der Verweis auf die kritische Bedeutung der Information fuer den Unternehmenserfolg berechtigt - Information als "vierter Produktionsfaktor". Um in einem globalen Markt, der sich in immer kuerzeren Zyklen veraendert, bestehen zu koennen, ist es aeusserst relevant, die Reaktionszeiten zu verringern. Dies bedeutet, dass die fuer Entscheidungen benoetigten und massgeblichen Informationen parat sein muessen.

"Wir produzieren 6 GB Informationen pro Stunde", so Curt Murhed von British Telecom. Es handelt sich um eine schwer vorstellbare Datenmenge, die mit grossen Wachstumsraten taeglich erzeugt wird. Dazu gehoeren strukturierte und unstrukturierte Daten, solche mit absolut kritischem Informationsgehalt und unuebersehbare Berge von Datenschrott, aus dem wohl nie wieder jemand nuetzliches Wissen destillieren wird.

Wir haben uns an einen "Informational White Noise" wie an das Grundrauschen benachbarter Schnellstrassen gewoehnt. Oeffentliche Datenbanken erweitern zusaetzlich die Informationsmoeglichkeiten der Unternehmen und erzeugen ein globales Netzwerk aehnlich der Utopie "Xanadu" von Ted Nelson aus den 60er Jahren: Das gesamte Wissen der Menschheit steht virtuell allen zur freien Verfuegung. In dieser leisen sozialen Revolution geht es dem Herrschaftswissen an den Kragen, dem letzten Repressionsmittel in der Informationsgesellschaft. Soweit die Vision.

In der realen IT-Welt versucht man mit einer Vielzahl von Informations-Management-Systemen der Informationsflut Herr zu werden. Solche Systeme sind klassische Datenbanken und in steigendem Masse Dokumenten-Management-Systeme. Denn Informationen sind nicht unbedingt nur strukturierte Daten, sondern sie zeigen sich immer in vielfaeltiger Art und in Dokumente eingebettet. Solche in Dokumenten geronnenen Informationen stehen mehr und mehr auch fuer den Remote-Zugriff und ueber oeffentliche Online-Dienste bereit. Moderne Informations-Management-Systeme sind dabei durchaus in der Lage, sehr grosse Informationsmengen sicher zu speichern und zu verwalten. Die Umsetzung der Vision bewegt sich auf eine Grenze zu: den Informationszugriff und dessen Optimierung. Egal ob wir uns in unternehmensweiten Dokumentenbibliotheken (Enterprise Libraries) bewegen, als mobiler Benutzer remote darauf zugreifen oder oeffentliche Informationsdienste befragen wollen - wir stehen vor dem gleichen Grundsatzproblem: Es kommt darauf an, dass die richtigen Personen zur richtigen Zeit auf die richtigen Informationen Zugriff haben. Es sind die relevanten Bezuege, die in Entscheidungen einfliessen und damit aus der reinen Information den kritischen Faktor des Unternehmenserfolgs machen. Daher sollen im folgenden einige Entwicklungstrends und deren technische Konsequenzen aufgezeigt werden - die Suche nach dem "Knowledge Navigator", wie einmal der Titel einer Apple-Vision lautete.

Elektronisches Abbild der klassischen Ablage

Die klassische Bueroablage versucht in ihrer elektronischen Form, die physische Registratur abzubilden: Alle Dokumente sind nach einem Klassifizierungsschema abgelegt, zum Beispiel nach der Nummernsystematik eines Aktenplans (wie besonders in Behoerden ueblich) oder eines Vorgangssystems. Es werden nur die benoetigten Attribute eines Dokuments wie Bearbeiter, Kunde, Auftragsart etc. erfasst und fuer das Wiederfinden (Retrieval) zur Verfuegung gestellt, nicht jedoch die Inhalte. Im Extremfall ist das einzige Attribut eine Nummer, die fuer den direkten Zugriff einzugeben ist.

In ein solches System lassen sich auch Verweise auf Dokumente integrieren, die weiterhin in Papierform in der Registratur lagern. Ablage wie Recherche erfordern dabei vom Anwender ein mehr oder minder intimes Know-how des Schemas, soweit dies nicht sinnvollerweise automatisch durch die benutzte Fachanwendung geschieht. Manuell falsch abgelegte Dokumente sind in der Regel fuer den Zugriff als verloren zu betrachten. Wegen der erforderlichen Kenntnis und Disziplin sind derartige Informations- Management-Systeme nicht fuer sporadisch und kreativ taetige Benutzer brauchbar. Der informationsorganisatorische Aufwand ist fuer den Betreiber eines solchen Systems aehnlich wie jener fuer die Geschaeftsprozessorganisation einzuschaetzen ("Document Re- Engineering").

Groesste Freiheit bei der Ablage und Suche gewaehrt vermutlich das klassische Volltext-Retrieval, das ein Dokument - sobald es dem System uebergeben ist - mit seinem kompletten Text fuer Recherchen nach einzelnen Begriffen oder Textpassagen bereitstellt. Die Ablage der Papierdokumente laesst sich darin allerdings nicht integrieren. Bei grossen Volumina fuehrt diese Informations- Management-Methode jedoch zu unzumutbar langen Antwortzeiten oder zu uebermaessigen Trefferquoten, wenn die Abfrage nicht ausreichend eingeschraenkt wurde. Damit befindet sich das "Fulltext- beziehungsweise Content-based Retrieval" (FTR/CBR) in einem aehnlichen Dilemma wie die relationalen Datenbanksysteme mit ihren SQL-Queries: Von einem ungeuebten oder sporadischen Benutzer wie dem durchschnittlichen Bueroanwender kann schwerlich die logische Stringenz erwartet werden, die fuer effiziente Recherchen erforderlich ist. Daher sind CBR-Pendants zu einem "Query-by- Mouse" entstanden, einer durch die Moeglichkeiten der grafischen Benutzer-Schnittstelle unterstuetzten Datenbankabfrage. Auf diese Weise kann der Anwender seine Suchabfrage nach Dokumenten samt Boolescher Logik mit der Maus "zusammenklicken". Hinzu kommt die Auswertung bedeutungsmaessiger (semantischer) Strukturen im Informationsbestand, so dass sich mit Hilfe von "Thesauri" und thematisch definierten Begriffsdomaenen ("Topics", "Clusters") nicht nur die explizit genannten Suchwoerter, sondern auch sinnvolle Synonyme oder andere im Zusammenhang relevante Begriffe beim Retrieval beruecksichtigen lassen. Ein automatisches und einstellbares "Relevancy Ranking" hilft zudem, die Menge der Treffer nach ihrer Bedeutung zu diskriminieren. Auch solche neueren Hilfsmittel fuer das CBR erfordern aber vom Anwender beziehungsweise im informationsorganisatorischen Vorlauf noch ein gewisses Mass an geistiger Disziplin: Die semantischen Strukturen sind moeglichst unternehmensweit, sorgfaeltig zu definieren und zu pflegen. Das genannte Dilemma fuehrt heute zu einem steigenden Interesse an der Entwicklung von Zugriffsmechanismen, die auch die Eingabe von logisch vagen beziehungsweise unscharf formulierten ("fuzzy") Abfragen erlauben.

Beispielhaft ist in diesem Zusammenhang der Ansatz eines kleinen US-Anbieters, mit Hilfe eines speziellen linguistischen Verfahrens einen semantisch "toleranteren" Zugriff zu ermoeglichen, der zugleich mit einem geringeren Document-Re-Engineering-Aufwand auskommt. Recherchen mit solchen Systemen fuehren manchmal nebenbei zu ueberraschenden Treffern, die aber durchaus neue, inhaltlich weiterfuehrende Aspekte eroeffnen koennen. Bei neueren Inhaltstypen - wie Images, Video und Sprachanmerkungen - versagen die fuer geschriebenen Text entwickelten semantischen Methoden jedoch. Damit sich auch solche Dokumentbestandteile beim Retrieval beruecksichtigen lassen, sind Mustererkennungsalgorithmen ("Pattern Recognition") im Einsatz.

Grafisch praesentierte Registraturhierarchie

Die dritte Methode ist die des direkten Zugriffs auf das gesuchte Dokument in einer moeglichst grafischen Abbildung der Ablagestruktur. Gaengige Metaphern fuer eine solche Abbildung sind wieder der physischen Registratur nachempfunden: Mappen, Ordner und Aktenschraenke, dargestellt als Icons in einer Baumhierarchie, aber ebenso der elektronische Schreibtisch oder Karteikaesten mit Informationen und Referenzen zu den Dokumenten, auch solchen in der konventionellen Registratur. Voraussetzung fuer eine effiziente Recherche ist hier allerdings eine durchdachte und sinnvoll strukturierte Ablage, etwa in Form eines Aktenplans. Ansonsten geraet das Retrieval zu einer zeitraubenden Suche wie in einer schlecht sortierten Bibliothek. Die grafisch praesentierte Ablagehierarchie ermoeglicht einen assoziativen Zugang, der dem kognitiven Verhalten des suchenden Anwenders entgegenkommt: "Ich weiss, dass irgendwo in jener Mappe das gesuchte Dokument, an dessen Titel ich mich nicht genau erinnern kann, liegt ..." Ein solches intuitives "Stoebern" ("Browsing") kann zu interessanten Zufallstreffern fuehren, wenn sich die semantische Naehe von Dokumenten in raeumlicher Naehe wiederfindet. Es birgt aber auch die Gefahr in sich, dass sich der Suchende in der Ablagehierarchie verliert. Daher ist das Vorhandensein von Rueckkehrpunkten unerlaesslich.

Bei allen Ansaetzen sind Teilrepraesentationen der Ablage hilfreich - vorgefertigte Queries mit freien Parametern oder iconisierte Hierarchiezweige - , um in grossen Systemen Recherchemuster schnell und mehrfach wiederverwenden zu koennen. Mit neueren Metaphern wird darueber hinaus versucht, die bisherigen Einschraenkungen und Probleme der Retrieval-Ansaetze zu ueberwinden. Die Hierarchie des Aktenplans erzwingt zum Beispiel Referenzierungstechniken, die die Informationen in verschiedenen Zusammenhaengen beziehungsweise Akten zuordnen, aber ohne mehrfach speichern zu muessen. Dazu werden unter anderem Hyperstrukturen mit ihren (Live) Link- Mechanismen aus dem Hypertext-Konzept uebertragen. Zum Einrichten und zur Pflege solcher semantischer Netze muss das System dem Betreiber Hilfsmittel an die Hand geben. Auch der Anwender benoetigt entsprechende grafische Recherche-Tools wie "Browsers" mit Zoom-in, Ueberblick und andere Orientierungshilfen fuer die Abbildung des Netzes, damit er sich bei der Navigation in den Informationsraeumen nicht verirrt: "Lost in Hyperspace" ist eine stehende Redensart aus der Hypertext-Welt. Ausserdem sind vielfaeltige "Viewers" notwendig, so dass der Benuetzer die gewuenschten Dokumente auch ohne die entsprechende Applikation, die ihm moeglicherweise gar nicht zur Verfuegung steht, inspizieren kann ("virtuelle Dokumente").

Solche neuen Metaphern sind etwa 3D-Baeume, um die man beim Browsing herumwandert, und tabellenartige "Info Walls", die den relationalen Ansatz der Datenbankwelt zur Repraesentation semantischer Verknuepfungen verwenden. Diese Konzepte stecken allerdings noch weitgehend im Forschungsstadium. Erste Produkte zeigen, dass diese Metaphern sowohl technisch als auch hinsichtlich der kognitiven Ergonomie noch nicht ausgereift sind. Die neueren Ansaetze sind fuer ein "natuerliches" Browsing geeignet, fuer den schnellen Zugriff auf umfangreiche Dokumentenbibliotheken ohne grossen Benutzeraufwand sind sie jedoch nur beschraenkt tauglich. Hier kommt ein anderer technologischer Trend zu Hilfe, naemlich "Software-Assistenten" beziehungsweise "Agents". Diese "intelligenten" Gehilfen kennen Ablagestrukturen und Retrieval- Methoden und koennen dadurch weitgehend selbsttaetig Recherchen fuer den Benutzer ausfuehren. Dabei stellt sich freilich das Problem, wie teilt man dem Assistenten einfach mit, was benoetigt wird? Solche Agents muessen daher einerseits Fuzzy-Techniken unterstuetzen, um aus natuerlichsprachlich formulierten, logisch oder semantisch ungenauen Wuenschen reale Recherchen zu generieren. Andererseits sollten sie mit Adaptionsalgorithmen ausgestattet sein, um durch die begleitende Beobachtung des individuellen menschlichen Retrieval-Verhaltens die spezifischen Recherchebeduerfnisse zu "erlernen" und ohne wesentliche Interaktion zur rechten Zeit umzusetzen. Die Selbstaendigkeit der Agents kann soweit gehen, dass sie auch in Abwesenheit des Benutzers die Informationsflut nach relevanten Begriffen filtern beziehungsweise anstehende Retrieval-Aufgaben ausfuehren. Eine entsprechende Script-Sprache laesst sich fuer die automatische Herstellung der notwendigen Kommunikationsverbindungen bei Remote- Zugriffen verwenden.

Die genannten Entwicklungen bringen mittelfristig auch Veraenderungen fuer den bisherigen Desktop-Ansatz mit sich, naemlich fuer die Abbildung des Dateisystems oder der physischen Bueroumgebung, wobei der elektronische Schreibtisch gleichzeitig die persoenliche und die Gruppenablage darstellt.

Der Zugriff auf Informationen steht immer mehr im Zentrum der Desktop-Entwicklungen, das heisst, eine individuelle Arbeitsumgebung mit "Groupware-Flavour" zu schaffen. Der Desktop entwickelt sich so zum "Personal View": der homogene Zugriff auf potentiell alle Informationen des Unternehmens in ihrer Heterogenitaet und auf oeffentliche Datenbanken von einer elektronischen Informationsdrehscheibe aus.

Der Prototyp "Conus" etwa aus den Siemens-Forschungslabors erweitert dabei die elektronische Abbildung der Arbeitsflaeche

(=Desktop) zum Beispiel durch eine Raummetapher virtuell. Auf diese Weise (vgl. Abbildung 1) lassen sich aufgabenspezifisch eingerichtete und gemeinsam nutzbare Desktops als Zugriffspunkt fuer die benoetigten Informationen legen. Wie in eine solche erweiterte zentrale Bueroarbeitsumgebung effiziente Informationszugriffe zu integrieren sind, bildet die Herausforderung fuer Forschung und Produkthersteller: Was ist die ergonomisch effektivste, dem kognitiven Verhalten am weitesten entgegenkommende und gleichzeitig technisch performanteste Loesung? Derzeit ist noch kein Kandidat fuer einen Standard erkennbar, wie er bisher etwa (bei aller Beschraenktheit) im Datei-Manager von Windows besteht. Allerdings werden gerade die neuen Systemplattformen wie "Chicago" (mit seinem "Explorer" und dem "Information Exchange"-Konzept), "Cairo" und vielleicht die OS/2 Workplace Shell Messlatte und Richtung fuer weitere Entwicklungen vorgeben.

Auf jeden Fall hat der 286er PC mit Vier-Zoll-Monitor nun endgueltig ausgedient, denn die neuen grafischen Ansaetze fuer Informationszugriffe tendieren dazu, die Hardware-Anforderungen fuer die Arbeitsplatzsysteme weiter hochzutreiben: Die ersten Prototypen solcher "Personal Views" sind auf RISC-Workstations mit Hochleistungsgrafik entwickelt worden. Andererseits stellt die Unterstuetzung von Personal Digital Assistants (PDAs) und anderer Arbeitsmittel fuer die wachsende Zahl mobiler Benutzer eine Herausforderung fuer die User-Interface-Designer dar. Die beschraenkten Hardwaremoeglichkeiten solcher Geraete zwingen die Anbieter, neue Navigations- und Zugriffsmechanismen optimal benutzerfreundlich und trotzdem schlank zu entwickeln. Davon werden auch die besser ausgeruesteten Office-Arbeitsplaetze profitieren (vgl. Abbildung 2). Bleibt schliesslich die Frage, welcher der drei genannten Zugriffsansaetze ist der beste, welcher wird sich durchsetzen? Die Antwort lautet, dass es fuer alle drei Ansaetze Anwendungsszenarien gibt, fuer die eine der Methoden die optimale darstellt. Die hochentwickelten Browsing-Tools zielen im wesentlichen auf die Recherchebeduerfnisse der relativ kleinen Anwendergruppe von stark kreativ arbeitenden "Knowledge Workers". Fuer die Mehrzahl der Sachbearbeiter-Arbeitsplaetze ist ein transparenter Zugriff ueber die Fachanwendung entscheidend, freizuegige Browsing-Tools wuerden eher als unerwuenschtes Spielzeug angesehen. Die Zugriffsbeduerfnisse sind demnach kognitiv wie technisch unterschiedlich zu differenzieren.

Dennoch ist fuer alle Bueroanwender das Vorhandensein von flexiblen, fuer die jeweiligen Beduerfnisse optimierten Mechanismen eines intelligenten Zugriffs auf das Unternehmenswissen

("Knowledge Repositories") wichtig. Dies gilt gerade auch angesichts der wachsenden Verbreitung geeigneter Kommunikationsinfrastrukturen alias "Information Super-Highways". Hier tut sich ein weites Betaetigungsfeld fuer die beschriebenen Retrieval-Systeme auf, die unbemerkt die Sisyphusarbeit des Informationszugriffs erledigen und mit dazu beitragen, dass nicht mehr so viel wertvolles Wissen, das heisst Kapital, brachliegt.

Dr. Ulrich Schneider ist verantwortlich fuer strategische Geschaeftsplanung im Sektor Bueroautomatisierung bei der Siemens- Nixdorf Informationssysteme AG in Muenchen.