IT im Marketing/Bow-Tie-Theorie: Nur wer gut vernetzt ist, wird oft gefunden

Gesucht: Virtuelle Bestlage in Cybercity

04.05.2001
Die Bow-Tie-Theorie liefert Aufschlüsse über die Struktur des World Wide Web. Sie ist Grundlage für Services, die den Nutzen einer Web-Präsenz bewerten und durch "Hypermarketing" Web-Adressen "im Zentrum des Web" platzieren können. Eine Reise durch die virtuelle Welt. Von Wilhelm Weller*

Über wie viele Ecken ist Til Schweiger mit dem amerikanischen Schauspieler Kevin Bacon bekannt? Auf der Website www.cs.virginia.edu/oracle gibt ein "Orakel" die Antwort: über zwei Ecken. Til Schweiger spielte in "Judas Kiss" zusammen mit Joey Slotnick, dieser wiederum spielte in "Hollow Man" zusammen mit Kevin Bacon.

Ganz allgemein sollen zwei beliebige Erdenbürger über etwa sechs Ecken miteinander bekannt sein. Diese mathematische Annahme ist bekannt unter dem Namen "Six degrees of separation". Aber was hat das mit dem World Wide Web zu tun? Dieses umfasst derzeit mehr als drei Milliarden Seiten, deren "Bekanntschaft" sich durch Hyperlinks definiert, also Verweise, die per Mausklick zu einer anderen Web-Seite führen.

Der Physiker Barabasi hatte 1999 eine den "Six Degrees" analoge "19-Schritt-Hypothese" für das Web aufgestellt:

Zwei beliebige Internet-Adressen seien im Durchschnitt nur 19 Links voneinander entfernt. Die im Mai 2000 auf der 9. Internationalen WWW-Konferenz in Amsterdam vorgelegte Studie "Graph structure in the Web" revidierte die optimistische Hypothese von Barabasi. Ein Ergebnis lautete: Die Wahrscheinlichkeit, von einer zufällig gewählten Web-Seite allein über Links zu einer anderen zufällig gewählten Seite zu kommen, liegt bei nur 1:4.

Die von Forschern (IBM, Altavista) 1999 durchgeführte Studie basiert auf Ergebnissen zweier Netzdurchläufe, so genannte "Crawls", bei denen sich ein Programm anstelle eines menschlichen Surfers von Link zu Link durch das Netz hangelt.

Untersucht wurden dabei immerhin 200 Millionen Seiten mit 1,5 Milliarden Links.

Das Web beziehungsweise seine Vernetzungsstruktur ähnelt demnach in weiten Teilen dem Umriss einer Fliege. Diese besondere Art von Krawatte heißt im Englischen "bow tie", daher der Name dieser Theorie.

Bemerkenswert ist, dass sich diese Struktur aus den Daten beider Untersuchungen ableiten ließ, obwohl sie immerhin fünf Monate auseinander lagen - eine kleine Ewigkeit im Web, das täglich um zirka acht Millionen Seiten wächst. So ist anzunehmen, dass die "Bow-Tie-Struktur" des Web auch künftig erhalten bleibt. Der ständig expandierende Cyberspace scheint sich immer wieder neu in dieser Weise zu strukturieren, ähnlich wie Eisenspäne im Feld eines Magneten.

Das Web hat seine eigene GeografieDie Bow-Tie-Theorie ist Teil einer "Geografie" des Cyberspace, die Analogien zur realen Geografie - etwa einer Stadt - aufweist. So gibt es im Web ein Zentrum (Strongly Connected Core, SCC), das sich durch einen hohen Vernetzungsgrad auszeichnet. Freilich können Web-Seiten innerhalb dieses Zentrums - als Dateien - auf weit entfernten Rechnern liegen, die eine etwa in den USA und die andere in Deutschland.

Neben dem "Knoten" oder Zentrum (SCC) gehören zur Fliege noch zwei "Flügel" beziehungsweise Regionen, jeweils mit "In" und "Out" bezeichnet, die zusammen zirka 70 Prozent des gesamten Web ausmachen. Hinzu kommen noch Ranken, englisch "tendrils", mit denen zusammen die Bow Tie einen sehr großen "schwach zusammenhängenden Bereich" (WCC) bildet, auf den immerhin rund 91 Prozent des gesamten Web entfallen.

Alle Seiten innerhalb dieses WCC sind durch Links zwar auf "irgendeine" Weise miteinander verbunden, jedoch nicht so, dass darin jede Seite von jeder anderen über Links wirklich erreichbar ist; sonstige Web-Seiten werden "Disconnected Components" (DC) zugerechnet.

Die Beziehungen zwischen den Bereichen des Web lassen sich - salopp - mit folgender Gleichung beschreiben:

Web = SCC (28%) + Out (21%) + In (21%) + Tendrils (21%) + DC (9%).

Wie aber sind, neben ihrer Größe, die einzelnen Bereiche des World Wide Web charakterisiert?

- Das Zentrum zeichnet sich durch seine hochgradige Vernetzung aus: Für jede zweite beliebige Seite gibt es darin stets Linkpfade, über die sie wechselseitig erreichbar sind. Das Gleiche kann zwar auch für Bereiche außerhalb des SCC gelten, jedoch sind diese viel kleiner. Hauptseiten großer Portale wie Yahoo und MSN liegen sicher innerhalb des Knotens. Jede Seite im Zentrum ist von solchen prominenten und hochfrequentierten Adressen aus erreichbar. Die Integration in das SCC ähnelt daher einer City-Lage - und ist entsprechend erstrebenswert.

- Vergleichbar privilegiert sind nur noch Seiten im Out-Bereich. Auch diese sind allesamt vom Zentrum und weiteren "Gegenden" aus erreichbar, führen jedoch nicht mehr zu ihm zurück. Oft ist dies sogar beabsichtigt: Internet-Adressen von Firmen wollen zwar möglichst leicht erreichbar sein, möchten Besucher in der Regel jedoch innerhalb der eigenen Website halten - und nicht zu sonstigen Internet-Angeboten abwandern lassen.

- Völlig anders sieht es beim In-Bereich aus. Dieser steht in der Hierarchie des Web weiter unten. Dort befinden sich Seiten, die zwar Zugänge ins Zentrum anbieten, selbst jedoch weder vom Zentralbereich noch von anderen aus erreichbar sind. Es sind die "Kulis" des Internet - oder dessen Neulinge. Es genügt, auf einer Homepage einen Link etwa zu Yahoo zu setzen, um in diesen In-Bereich zu kommen.

Wechselseitiges Setzen von VerweisenWichtig ist aber, dass sich eine (kleine) In-Seite durch Links in das Zentrum inhaltlich aufwertet - ist dadurch doch schon das "halbe Web" (SCC und Out) prinzipiell von dieser Seite aus erreichbar.

Vor allem bietet sie sich so für "Cross-Linking" an, also für das wechselseitige Setzen von Verweisen. Und ein einziger Link von einer SCC-Seite zu einer In-Seite genügt, um auch diese unmittelbar in das Zentrum zu integrieren.

Nimmt man wieder das Bild einer Stadt, wäre der In-Bereich einem Vorort vergleichbar, dessen Übergänge an der Nahtstelle zum Zentrum "Einbahnstraßen" sind.

- In den Ranken schließlich liegen Seiten, die weder vom Zentrum aus erreichbar sind noch in dieses hineinführen, aber mit dem In- und Out-Bereich noch verbunden sind. Während die bisher aufgeführten Bereiche des World Wide Web so etwas wie eine große zusammenhängende "Landmasse" bilden, verteilen sich seine restlichen zirka neun Prozent auf "insulare" Gebilde, so genannte "disconnected components": Web-Seiten, die weder Ausgangspunkt noch Ziel von Verweisen sind, etwa inhaltlich anspruchslose Homepages beziehungsweise "digitale Visitenkarten". Oder Seiten, die zwar untereinander mehr oder weniger eng miteinander vernetzt, aber mit dem restlichen Web nicht verbunden sind - was von deren Betreibern vielleicht sogar gewünscht ist.

Das Marketing einer Web-PräsenzJedes Marketing einer Internet-Präsenz sollte diese (Infra-)Struktur des Web im Blick haben - in ähnlicher Weise, wie im realen Raum die Wahl eines Firmenstandortes dessen Infrastruktur berücksichtigen muss. Allerdings ist der virtuelle Standort im Web flüchtig, bestimmt durch seine Vernetzung, die sich tagtäglich ändern kann.

Ein geschicktes "Hypermarketing" wird eine Web-Adresse aber schon innerhalb kürzester Zeit im SCC "platzieren" können. Dieses Zentrum verspricht die höchsten Besucherströme und damit viele potenzielle Kunden.

Die Vernetzung einer Web-Adresse steht in direktem Zusammenhang mit ihrer Popularität. So sind Zahl und Güte der Web-Seiten, die mit Links zu ihr verweisen, bereits Ausdruck ihrer Popularität - jeder Link ist buchstäblich eine Referenz. Dieser einfach scheinende Umstand hat zudem weit reichende Konsequenzen: Viele große Suchmaschinen nutzen mittlerweile erfolgreich "Linkpopularität" als Relevanzkriterium bei der Sortierung von Treffern. An vorderster Stelle werden Adressen genannt, die einerseits inhaltlich mit dem Suchbegriff zu tun haben und andererseits durch eine hohe Linkpopularität Qualität verbürgen.

Da Suchmaschinen häufig Hunderte oder gar Tausende Treffer liefern und nur die ersten zwei bis drei Ergebnisseiten Beachtung finden, kann die Linkpopularität, neben weiteren Kriterien, darüber entscheiden, ob eine Adresse gefunden wird oder nicht.

Hinzu kommt, dass Suchmaschinen Internet-Adressen zumeist automatisch erfassen - durch so genannte Robots oder auch Crawler, die das Web entlang von Hyperlinks durchforsten und sich daher zumeist im gut vernetzten Zentrum des WWW tummeln. Nirgendwo sonst ist die Chance größer, von vielen Suchmaschinen automatisch und schnell erfasst zu werden.

Das Verkehrsleitsystem des WebEine optimale Vernetzung erzeugt damit auf zweierlei Weise Besucherströme beziehungsweise Traffic: Zum einen werden Surfer umso leichter und häufiger zu einer Internet-Adresse geführt, je besser diese mit Links in das "Verkehrsleitsystem" des Web integriert ist. Zum anderen wird sie auch in Suchmaschinen, die einen entscheidenden Anteil am Traffic haben, viel leichter und häufiger gefunden werden.

Vor allem: Bei solchen interessierten Surfern handelt es sich um potenziell "qualifizierte" Kunden, deren spätere Transaktionen (etwa Mitgliedschaft oder Käufe) mit dem Web-Anbieter erfahrungsgemäß deutlich umfangreicher sind als bei Personen, die mit konventioneller Werbung angesprochen werden.

Welche Seiten für ein Cross-Linking?Die Jaron Internet GmbH, Frankfurt, beispielsweise machte dies zur Geschäftsidee ihres Internet-Dienstes Popularix, einer technologisch gestützten Komplettlösung für E-Marketing. Im Internet selbst wird recherchiert, wie populär die Internet-Adresse eines Kunden ist: In welcher "Bow-Tie-Lage" befindet sie sich? Welche und wie viele Seiten verweisen zu ihr? Welche Qualität besitzen wiederum diese Seiten? Welche thematisch und qualitativ passenden sonstigen Seiten bieten sich für ein Cross-Linking an? In welchen Suchdiensten, an welcher Position und mit welchen Suchbegriffen ist eine Website auffindbar? Aus dieser Analyse leiten sich genau abgestimmte Marketing-Maßnahmen ab, unter anderem auch "affiliate programs", E-Mail-Kampagnen sowie Eintrag und Positionierung in Suchdiensten. Ziel ist die systematische Steigerung der Internet-Popularität, um einen dauerhaften und weiter steigende Besucherzahlen zu generieren.

Auf der Kundenseite werden Traffic und Transaktionen gemessen, die Honorierung ist erfolgsbasierend.

Einen ähnlichen Dienst bietet die amerikanische Firma "Word of Net". Sie führt für die Website eines Kunden eine "Visibility Analysis" durch und vergleicht dabei, ebenso wie Popularix, den Kunden mit seinen Konkurrenten. Visibility, also Sichtbarkeit, meint dabei das Gleiche wie Internet-Popularität: Einer kommerziellen Internet-Präsenz wird erst dann Leben eingehaucht, wenn sie für viele sichtbar beziehungsweise leicht auffindbar ist. Auch Word of Net analysiert dazu vor allem Suchdienste (search sites), Suchbegriffe (keywords) und Verweise (referring links). Relevante Daten werden aus dem Internet herausgefiltert und analysiert und fließen schließlich in einen "Visibility Index" ein, der die Bedeutung sowie den Erfolg einer Website beziffert.

Weitere Anbieter wie die ebenfalls in Frankfurt ansässige Firma Netbooster oder die 1999 in Konstanz gegründete Suchtreffer AG haben vornehmlich die Präsenz einer Internet-Adresse in Suchdiensten im Auge, die durch Eintrags- und Rankingservice gesteigert werden soll.

Allen Diensten gemeinsam ist das Ziel, den Traffic einer Web-Präsenz zu steigern. In einer "Ökonomie der Aufmerksamkeit", in der sehr viele von sehr vielen wahrgenommen werden wollen, ist dies eine immer bedeutsamer werdende Herausforderung und ein wichtiger Wettbewerbsfaktor.

*Wilhelm Weller ist wissenschaftlicher Mitarbeiter der Jaron Internet GmbH in Frankfurt am Main.

Abb.1: Die Struktur des Web

Die hier visualisierte Bow-Tie-Theorie ist Teil einer "Geografie" des Cyberspace, die Analogien zur realen Geografie - etwa einer Stadt - aufweist. Quelle: Jaron Internet GmbH

Abb.2: Was ist Web-Popularität?

Web-Popularität ist die Anzahl der im Web gefundenen Verweise auf eine definierte URL. Quelle: Popularix

Abb.3: E-Marketing-Kampagnen-Kreislauf

Mehr Web-Popularität durch E-Marketing. Quelle: Popularix