Diesen Artikel bewerten: 

Blog Intelligence

Die Blogosphäre als Prototyp für Social Media

Christoph Meinel (Univ.-Prof., Dr. sc. nat., Dr. rer. nat., *1954) ist CEO und Wissenschaftlicher Direktor des Hasso-Plattner-Instituts für Softwaresystemtechnik GmbH (HPI). Außerdem ist er ordentlicher Professor (C4) für Informatik am HPI und an der Universität Potsdam und hat einen Lehrstuhl für „Internet-Technologien und -Systeme“ inne. Seine Forschungsschwerpunkte liegen in den Bereichen Security Engineering, Knowledge Engineering und Web 3.0 sowie Semantic, Social, Servcie-Web und Design Thinking. Christoph Meinel ist Mitglied der Deutschen Akademie der Technikwissenschaften acatech, Gastprofessor an der TU Peking und in zahlreichen wissenschaftlichen Gremien und Aufsichtsräten tätig.
Das HPI untersucht mit modernster Software einzelne Blogs und deren Interaktion mit anderen Blogs sowie deren Beziehungen zu sozialen Netzwerken und News-Portalen. Die Suchfunktion spielt dabei eine zentrale Rolle.

Soziale Netzwerke wie Facebook und Twitter werden meist von einem zentralen Anbieter betrieben und gepflegt. Dies bietet den Vorteil, dass alle Interaktionen an einer Stelle stattfinden und sich so Nutzer schneller finden und interagieren können. Allerdings birgt dies auch Gefahren und Einschränkungen. Zum einen verfügt ein einziger Anbieter über alle ausgetauschten Daten und kann diese nach Belieben einsehen, auswerten und weitergeben. Zudem sind dem Nutzer Limitierung bezüglich der Gestaltung und der Funktionsweise seines Social Media Auftrittes gesetzt. Aus diesen Gründen haben Weblogs, besonders im journalistischen Bereich, nichts an ihrer Bedeutung verloren.

Weblogs bieten ebenso wie Social Media Profile eine Art Newsfeed. Ein Autor hat hier die Möglichkeit, in regelmäßigen Abständen neue Inhalte in Form von Posts zu publizieren. Im Gegensatz zu anderen Netzwerken können Blogs auf eigenen Servern betrieben werden und setzen keine Regeln für die Länge oder die Art des Inhalts. Der Charakter eines Netzwerks entsteht durch das gegenseitige Referenzieren der Blogs durch Weblinks oder sogenannte Trackbacks.

Da Blogs keinerlei Limitation bezüglich des Inhalts besitzen, können sie problemlos zur freien Kommunikation und Publikation genutzt werden. Daher sind sie nicht nur reicher an ausführlichen Artikeln, sondern auch frei zugänglich für jedermann. Während unserer Forschung benutzen wir die Gesamtheit der Weblogs als prototypisches soziales Netzwerk, da es alle Charakteristiken erfüllt, aber auch qualitativ hochwertigere Text bietet (vgl. Twitter).

Wie die Gesamtheit aller Weblogs - kurz Blogs - genannt technisch erschlossen, inhaltlich untersucht und die Ergebnisse visualisiert werden können, ist die Forschungsfrage des HPI BlogIntelligence Projekts. Auf den Hochleistungsrechnern unseres Future SOC Labs und mit modernster Software analysieren wir nicht nur einzelne Blogs, sondern auch ihre Interaktion mit anderen Blogs und ihre Beziehungen mit sozialen Netzwerken und News-Portalen.

Die Suche als Einstieg

Ein zentrales Konzept zum Verständnis von sozialen Netzwerken und den enthaltenen Meinungen ist das Anbieten einer Suche. Suchmaschinen wie Google fokussieren sich auf generische Web Dokumente, ohne die in den sozialen Netzwerken üblichen, speziellen Formate und Annotationen zu berücksichtigen.

Im Ergebnis unserer Forschung haben wir deshalb den Prototypen einer speziell auf die Blogosphäre angepassten Suchmaschine entwickelt und getestet (www.blog-intelligence.com). Neben der "normalen" Suche bieten wir dem Nutzer die Möglichkeit, die Resultate nach einem eigenen, maßgeschneiderten Ranking-Algorithmus sortiert angezeigt zu bekommen. Die konfigurierbaren Ranking-Algorithmen berücksichtigt nicht nur die eigentliche Relevanz des Textes, sondern auch die Wichtigkeit des Autors und des Blogs im Gefüge der Blogosphäre. Einflussfaktoren sind zum Beispiel: wie oft ein Autor postet, auf wie viele aktuelle Themen der Autor eingeht, wie fokussiert sich der Autor mit Themen auseinandersetzt und wie oft er von anderen wichtigen Autoren referenziert wird.

In unseren Nutzerbefragungen haben wir festgestellt, dass es den meisten Nutzern darauf ankommt zu verstehen, wie die Sortierung der Ergebnisse zu Stande kommt. Hierfür haben wir nicht nur unsere Rankingmetrik aufgeschlüsselt und jeden Nutzer in die Lage versetzt, einzelnen Einflussfaktoren "an" und "aus"zuschalten, um so die Auswirkung auf die Suchergebnisse direkt studieren zu können. Nutzer werden so in die Lage versetzt, besser experimentieren und verstehen zu können, wie die Suchmaschine die Sortierung vornimmt.

Suchen allein ist nicht genug

Noch greifbarer sind die Potenziale im Bereich der Visualisierungen. Das manuelle Erfassen von Suchergebnissen ohne visuelle Aufbereitung und Darstellung ist meist beschwerlich und vermindert den Blick auf das Große und Ganze. Das lässt sich gut am Anwendungsfall der Meinungsanalyse anschaulich machen.

Nehmen wir an, ein Nutzer hat die Aufgabe herauszufinden, wie die generelle Meinung zu einem Produkt ist und wie sie sich diese über die Zeit verändert. Ohne das Werkzeug der Visualisierungen müsste er dazu mühsam die Suchergebnisse durchforsten und sich selbst ein Verständnis erarbeiten. Mittels neuer Techniken der Themenextraktion und Gefühlsanalyse lässt sich dieser Prozess heute jedoch stark vereinfachen. Moderne Suchmaschinen sind in der Lage, anhand von sprachlichen Besonderheiten herauszufinden, ob ein Satz eine positive oder negative Äußerung enthält. Allein ist diese Analyse noch lange nicht zielführend. Allerdings kombiniert man das mit Karten-ähnlichen Visualisierungen, dann kann der Nutzer schnell negative Bereiche in der Blogosphäre identifizieren. Hierzu kombinieren wir alle Blogposts eines Tages, um die "Gesamt"meinung des Tages zu berechnen, und visualisieren diese als roten (negativ) bzw. grünen (positiv) Punkt auf einer Zeitachse. Stellt der Nutzer nun Häufungen von negativen Äußerungen fest, kann er genau untersuchen, was in diesem Zeitraum die Stimmung beeinflusst hat und evtl. darauf reagieren.

Negative (rot) und positive (grün) Meinungen auf einem Blick im Zeitverlauf erkennen
Negative (rot) und positive (grün) Meinungen auf einem Blick im Zeitverlauf erkennen
Foto: HPI