Web 3.0 – die Wiederkehr der semantischen Vision

04.12.2007
Von Dr. Wolfgang Kemna
Das Web 2.0 ist zwar in den wenigsten Unternehmen schon Realität, aber Vordenker zerbrechen sich schon den Kopf darüber, wie sich die Informationsflut des Mitmach-Web bändigen lässt.

Das Web 2.0 bietet mit Wikis oder Foren zwar Plattformen, auf denen beispielsweise Mitarbeiter verschiedener Standorte eines Unternehmens Informationen austauschen können. Damit wird es den Forderungen des Managements nach einer effizienten Zusammenarbeit gerecht. Diese Informationen können in der Regel jedoch nur von Menschen, nicht aber von Computersystemen ausgewertet werden.

Das Web 2.0 hat dabei eine globale Dateninflation geschaffen: Nie zuvor standen Unternehmen so viele Informationen zur Verfügung und noch nie war es so schwierig, daraus das wirklich relevante Wissen zu filtern. Daneben entspringen anderen, schon länger etablierten Kommunikationsmitteln ebenfalls immer mehr Daten. So erhält eine Firma mit 5000 Mitarbeitern im Durchschnitt monatlich 6 Millionen E-Mails, deren informelle Essenz ihr kaum zugänglich ist. Das semantische Web, mittlerweile auch als Web 3.0 bezeichnet, soll die inhaltliche Bedeutung von strukturierten und unstrukturierten Daten mittels Metadaten aufschlüsseln und so das Tor für eine wertvolle Wissensvermittlung öffnen.

Ordnung in die Web-2.0-Daten bringen

Eine endgültige Definition von Web 3.0. gibt es noch nicht. Einigkeit besteht jedoch darin, dass es sich dabei nicht um eine einfache Weiterentwicklung von Web 2.0 handelt, sondern etwas grundsätzlich Neues geschaffen werden muss. Es wird auf die durch Web 2.0 geschaffenen Begebenheiten aufsetzen und den Nutzen von Informationen und Daten wieder in den Vordergrund stellt.

Die Vision des semantischen Web von Tim Berners-Lee, dem Begründer des World Wide Web, sieht eine Erweiterung des WWW um maschinenlesbare Daten vor, die die Bedeutung der Inhalte beschreiben. Hinter die sichtbaren Online-Daten soll also eine zweite unsichtbare Informationsebene treten. Diese liefert in einer für Computersysteme verständlichen Sprache semantische Annotationen, letztlich genaue Definitionen von den online publizierten Daten und deren Zusammenhänge.

Web 3.0-Technologien ermöglichen ein schnelles Aufspüren relevanter Daten aus firmeninternen Beständen und dem World Wide Web.
Web 3.0-Technologien ermöglichen ein schnelles Aufspüren relevanter Daten aus firmeninternen Beständen und dem World Wide Web.

Für die Erstellung der Annotationen selbst wurden verschiedene Standards entwickelt. Das Basisprinzip sind Ontologien, die zur Darstellung komplexer Wissensbeziehungen dienen. Dabei zählt das Ressource Description Framework (RDF) zu der wichtigsten Auszeichnungssprache für Metadaten. Die Web Ontology Language (OWL) baut auf RDF auf und bietet durch die Darstellung sehr komplexer Beziehungen einen extrem hohen Abstraktionsgrad. Durch den Einsatz von Metadaten sind die Informationen format- und kontextunabhängig. Für Computersysteme sind sie damit ohne vorheriges Wissen einfach zu verstehen und können unabhängig von ihrer Quelle verarbeitet werden. Damit werden Fehlinterpretationen seitens der Computersysteme reduziert und gleichzeitig der Austausch über Systemgrenzen hinweg gefördert.

Metadaten sind Trumpf

Für die Verwirklichung des semantischen Web bedarf es mithin maschinenlesbarer Daten, die den Computersystemen die Bedeutung sprachlicher Zeichen zur Einordnung der Informationen erlauben. Zur Ausrüstung dieser Informationen ist das Tagging hilfreich, eine in Web 2.0 weit verbreitete Methode zur näheren Beschreibung von Daten, die das Editieren von Metadaten erlaubt, ohne den eigentlichen Inhalt zu verändern.

Für die Verwirklichung des semantischen Webs bedarf es nicht nur guten Metainformationen, sondern auch intelligenter Systeme, die in der Lage sind, diese beschreibenden Daten zu erfassen. Mit der neuen Generation des World Wide Web sollen diese Hürden überwunden werden. Web 3.0 will den Unternehmen ein schnelles Aufspüren der relevanten Daten ermöglichen und präzise Ergebnisse liefern. Idealerweise muss der User nur eine einfache Frage stellen und erhält darauf eine exakte Antwort und nicht wie heute üblich, etliche Seiten mit irrelevanten Treffern.

Neben dieser optimierten Wissensverarbeitung unterstützt das semantische Web die Vernetzung und den Informationsaustausch im Unternehmen. User profitieren nicht nur von einem omnipräsenten Wissen, sondern auch von innovativen Wissensdarstellungen sowie medien- und plattformübergreifenden Applikationen.

Das semantische Web in der Praxis

Für die sogenannte Enterprise Search, die Inhalte unternehmensweit identifizieren und zugänglich machen will, bedeutet die Berücksichtigung semantischer und ontologischer Gesichtspunkte eine Erweiterung der herkömmlichen Mechanismen. Über eine assoziative Auswertung der Daten kann ein globales Wissen aufgebaut werden. Auch die so genannte Business Intelligence (BI), die Techniken für die Auswertung strukturierter, numerischer Daten über Firmenoperationen liefert, kann um semantische und statistische Analysen von unstrukturierten Ausgangsdaten ergänzt werden. So gehen Corporate-Intelligence-Applikationen über die rein zahlenbasierte BI hinaus und verhelfen Unternehmen zu einem ganzheitlicheren Wissen über die sie betreffenden Geschäftsfaktoren.

Die Einsatzmöglichkeiten sind vielfältig und reichen von der Wettbewerbsanalyse über Technologiebewertungen bis hin zur Effizienzmessung von Kampagnen. Die intelligente Suche erlaubt es Unternehmen zudem, die von Regierungsseite geforderten Governance, Risk Management und Compliance-Richtlinien zu erfüllen. Denn sie unterstützt die lückenlose Aufbereitung der relevanten Informationen und damit einen vollständigen Einblick in die Unternehmensprozesse.

Benutzer müssen mitspielen

Nachdem mit der Definition von Standards der erste Schritt in Richtung Web 3.0 vollzogen wurde, gilt es nun, diese umzusetzen. Technisch ist dies schon heute machbar, es bedarf jedoch eines Umdenkens und eines höheren Engagements auf Seiten der Benutzer. Während heute die Erstellung von Websites für den User sehr einfach ist, bedeutet hingegen die künftige Eingabe von reichen Metadaten einen zusätzlichen Aufwand. Den werden sie nur auf sich nehmen, wenn er sich auch lohnt. Zudem hält das Netz, auch wenn sich die Durchsetzung der Standards in naher Zukunft verwirklichen ließe, mit den bis heute erstellten Daten einen hohen Anteil an unstrukturierten Informationen bereit, deren inhaltliche Bedeutung für Computersysteme kaum zu knacken sein dürfte. (ws)