Web

 

Bei Google laufen alle Fäden zusammen

17.04.2003
Von 
Wolfgang Sommergut ist Betreiber der Online-Publikation WindowsPro.
Der Suchmaschinenbetreiber Google sammelt enormes Wissen über das Web und mausert sich zur wichtigsten Schaltstelle für den E-Commerce.

MÜNCHEN (COMPUTERWOCHE) - Der Markt für Suchdienste unterliegt einem rasanten Konzentrationsprozess. Insbesondere der Suchmaschinenbetreiber Google sammelt enormes Wissen über das Web und mausert sich zur wichtigsten Schaltstelle für den E-Commerce.

Suchdienste sind für die Nutzung des Internets längst unverzichtbar geworden, die Orientierung in den gigantischen Informationsmengen des globalen Netzes wäre ohne sie nicht denkbar. Dem Nutzer erscheinen sie als relativ unauffällige Helferlein, die sich auf den ersten Blick nur optisch voneinander unterscheiden. Für Web-Surfer könnte es fast so aussehen, als habe sich seit den Pionierzeiten von Altavista, Excite oder Hotbot nicht viel getan - abgesehen davon, dass die meisten Anwender längst zu Google gewechselt haben. Aber auch sonst täuscht der Eindruck, dass es sich bei den Suchmaschinen um einen relativ langweiligen Infrastrukturdienst handelt.

Dramatische Veränderungen zeichnen sich sowohl in den Geschäftsmodellen der Anbieter als auch in der Aufteilung des Marktes ab. Die Firmenübernahmen der letzten Monate lassen keinen Zweifel daran, dass bei Suchdiensten ein rasanter Konzentrationsprozess stattfindet. Aufgeschreckt durch die dominante Position von Google versuchen vor allem zwei Player, sich Anteile zu sichern. Overture Services Inc. schluckte innerhalb weniger Wochen die drei Unternehmen Altavista, Fast und Keylime Software. Das renommierte Internet-Portal Yahoo verleibte sich Ende letzten Jahres den Suchmaschinen-Spezialisten Inktomi ein.

Die Übernahmeserie hat neue Grenzziehungen zwischen den führenden Anbietern zur Folge. Mit dem Zukauf von Inktomi positioniert sich Yahoo als Konkurrent gegenüber dem bisherigen Partner Google und wird vermutlich bald auf dessen Leistungen verzichten. Gleichzeitig rief der Inktomi-Deal Microsoft auf den Plan, dessen Portal MSN bisher auf diesen Service baute. Der Softwareriese stellte die Entwicklung eigener Suchtechnologien in Aussicht, um von Yahoo unabhängig zu bleiben.

Nachdem Betreiber von Suchmaschinen über Jahre mit ihren Diensten kaum Gewinne erzielen konnten, stellt sich die Frage, wieso Firmen nun plötzlich bereit sind, für solche Übernahmen dreistellige Millionenbeträge hinzublättern. Offensichtlich sehen sie jetzt die Chance, ihre Services zum Dreh- und Angelpunkt für den E-Commerce auszubauen und daraus entsprechendes Kapital zu schlagen. Schon den etablierten Basisfunktionen kommt in dieser Hinsicht eine eminent wichtige Position zu, technische Fortschritte bei der Auswertung von Content eröffnen zudem ungeahnte neue Möglichkeiten.

Während Endbenutzer über Suchergebnisse schnell zu möglichst relevanten Seiten geführt werden möchten, will jeder Betreiber einer kommerziellen Website unbedingt in der Trefferliste ganz vorne auftauchen. Allein dieser Interessengegensatz gab immer wieder Anlass zu Spekulationen, ob die Resultate von Suchmaschinen zugunsten von Werbekunden manipuliert seien. Solches Misstrauen wurde lange durch unsaubere Praktiken von Anbietern genährt, die gesponserte Links nicht als solche kenntlich machten.

Viel stärker als Endnutzer betrachten Anbieter kommerzieller Inhalte die Sortierung von Suchergebnissen mit Argusaugen. Das ist nicht verwunderlich, weil in den meisten Fällen die Mehrzahl der Besucher über Suchmaschinen auf ihre Sites kommt. Aufgrund seines Beinahe-Monopols können besonders die Suchresultate von Google über den Erfolg eines Online-Business entscheiden.

Gradmesser ist die Zahl der Hyperlinks

Wie groß die Dominanz des so genannten Google-Opoly wirklich ausfällt, lässt sich nicht genau feststellen. Daniel Brandt von der Google-kritischen Initiative google-watch.org geht davon aus, dass bei den meisten Websites 75 Prozent der externen Rückverweise ("Referrer") von Google stammen. Summiert man die Zahlen des Marktforschers Nielsen Netratings, dann haben im Januar 2003 mehr als 80 Prozent der etwa 60.000 untersuchten Anwender Google oder einen von Google belieferten Dienst (AOL, Yahoo, Netscape) benutzt.

Die Analysten bescheinigen den Suchprofis zudem, die weltweit fünftgrößte Internet-Seite zu sein. Google selbst liefert einige eindrucksvolle Zahlen über seinen Service. So beantwortet die Suchmaschine pro Tag mehr als 200 Millionen Anfragen aus über drei Milliarden indizierten Seiten und berücksichtigt dabei 36 Sprachen.

Als wesentliche Gründe für den Erfolg der jungen Firma Google, die erst 1998 an den Start ging, gelten neben den extrem kurzen Antwortzeiten und der aufgeräumten Benutzeroberfläche vor allem die hochwertigen Suchergebnisse. Um die Relevanz einer Seite für eine bestimmte Suchanfrage zu ermessen, greift die Search Engine nicht bloß auf die Inhalte der Web-Dokumente zurück. Die Innovation von Google bestand darin, die Zahl der Hyperlinks, die auf ein Dokument gerichtet sind, als Gradmesser für dessen Relevanz zu betrachten. Der kalifornischen Company wurde kürzlich ein Patent auf Verfahren eingeräumt, die die Bedeutsamkeit von Inhalten anhand der Verbindung zu anderen relevanten Dokumenten ermitteln.

Werden die großen Sites bevorzugt?

Google sieht in seinem "Pagerank" genannten Algorithmus ein durch und durch demokratisches Instrument, weil er letztlich nur widerspiegle, was Anbieter von Inhalten für bedeutsam hielten. Jeder Online-Autor stimmt nach dieser Auffassung durch Setzen von Hyperlinks über die Wichtigkeit einzelner Seiten ab. Dieses Prinzip könnte aber dazu führen, dass auf Dauer die auffälligen und großen Sites überproportional an Aufmerksamkeit gewinnen.

Da sie in den Ergebnislisten von Google weit oben landen, haben sie größere Chancen, von Web-Autoren gefunden und verlinkt zu werden. Das würde in der Folge ihren hohen Pagerank weiter ausbauen. Kritiker bemängeln zudem, dass dieses Verfahren ähnlich wie die Einschaltquote im Fernsehen über die Qualität der Inhalte wenig aussage. Wie die Betreiber anderer Suchmaschinen lässt auch Google dem demokratischen Prinzip nicht ganz freien Lauf und betrachtet sein Verfahren zur detaillierten Bestimmung relevanter Web-Seiten als Firmengeheimnis.

Anhand von Cookies kann Google Suchpräferenzen scannen und Informationen über die Benutzer sammeln.

Da kommerzielle Websites darauf angewiesen sind, von Google gefunden und hoch gelistet zu werden, beschäftigen sich eigene Dienstleister damit, wie man in der Liste nach oben gelangen kann. Zu diesem Zweck scheuen Betreiber von Websites auch nicht vor Täuschungsmanövern zurück, indem sie die Suchmaschinen mit Spam in die Irre führen. Viele der teils kreativen Varianten verfangen bei Google aber nicht, da falsche Verschlagwortung oder unsichtbarer Text den Pagerank nicht hochtreiben, wenn die externen Links auf die betreffenden Inhalte fehlen. Aus diesem Grund organisieren Interessengemeinschaften oder einschlägige Agenturen so genannte Link-Farmen, die massenhaft Verweise auf die Seiten produzieren, deren Relevanzfaktor gehoben werden soll.

Google wehrt sich dagegen, indem die Company bei der allmonatlichen Neuberechnung des Pagerank für alle aufgerufenen Seiten solche Machenschaften auszuhebeln versucht. Schlagzeilen machte kürzlich Search King, nach eigenem Verständnis ein Advertising Network, weil es Google wegen der abrupten Absenkung des Pageranks verklagte. Die hatte nämlich zur Folge, dass die Besucherzahlen beim "Suchkönig" dramatisch zurückgingen. Google sah sich dem Vorwurf ausgesetzt, seine Monopolstellung auszunutzen und nicht den selbst propagierten demokratischen Prinzipien zu folgen.

Geld verdienen mit gesponserten Links

Auch wenn Google für Betreiber von Websites von großer wirtschaftlicher Bedeutung ist, so kann die Company selbst durch diesen öffentlichen Dienst nur begrenzt Geld verdienen. Deshalb versucht sie, aus ihrem enormen Wissen über das Web anderweitig Kapital zu schlagen. Eine wichtige Rolle spielen dabei gesponserte Links. In seiner einfachsten Form blendet Googles "Adwords"-Programm neben der normalen Trefferliste Werbeanzeigen ein, die zum Suchbegriff passen.

Weltweiter Marktführer bei derartigen "Paid Inclusions" ist bis dato Overture. Der Anbieter versorgt unter anderem MSN, Lycos und Yahoo mit solchen Diensten. Der neue Besitzer von Altavista und Alltheweb war es auch, der für Werbekunden ein Preismodell auf Auktionsbasis einführte. Wer viel bezahlt, rutscht in der Liste der gesponserten Links nach oben, wer zu wenig bietet, fällt schlimmstenfalls aus der Werbefläche hinaus. Google folgt mittlerweile auch diesem Ansatz, den in Europa E-Spotting Media erfolgreich praktiziert.

Durch Paid Inclusions treten Firmen wie Google und Overture als Mittler zwischen werbetreibender Wirtschaft und Anbietern von Websites auf. Die Herausforderung bei diesem Service besteht darin, zukünftig mehr zu bieten, als auf der Suchmaschine Anzeigen von jenen Kunden zu präsentieren, die einen bestimmten Suchbegriff gekauft haben. Durch Fortschritte semantischer Technologien lässt sich ziemlich verlässlich herausfinden, worum es in bestimmten Texten geht. Der Trend verläuft momentan dahin, dass die Suchspezialisten abhängig von den Inhalten einer Seite automatisch eine Werbung aus dem Pool geeigneter Anzeigenkunden einblenden.

Google gewann letzte Woche mit Amazon.com ein Schwergewicht des E-Commerce für eine derartige Kooperation (Computerwoche online berichtete). Wer sich beim Online-Händler beispielsweise nach einem Reiseführer umsieht, dem könnten zukünftig Anzeigen von Reiseveranstaltern präsentiert werden. Delikat an der Kooperation scheint, dass Amazon vor kurzem ein Patent zur Versteigerung von Web-Werbung zugesprochen bekam - ein Verfahren, das ja Google selbst praktiziert.

Die großen Drei unter den Suchmaschinen experimentieren derzeit noch fleißig mit Ideen und Konzepten, mit denen sie ihr enormes Wissen über das Web in klingende Münze verwandeln können. Als ein Betätigungsfeld haben sich Google und Yahoo die Content-Syndication auserkoren. Dabei werden Inhalte aus verschiedenen Quellen unter bestimmten Kriterien zusammengeführt und als eigenständige Angebote aufbereitet. Yahoo kündigte an, dass man auf Basis der Inktomi-Technik Informationen aus Websites extrahieren und direkt in das Suchergebnis integrieren wolle.

Die Google-Gründer Larry Page (links) und Sergey Brin sind noch nicht lange im Geschäft, haben aber einen Einfluss wie kein zweiter Suchdienst.

Die Suchmaschine würde sich also nicht darauf beschränken, Verweise auf Web-Seiten zu liefern, sondern Dokumente mit eigenem Nutzwert komponieren. Als Beispiele wurden Informationen aus Wetterdiensten oder Gelben Seiten genannt. Diese Pläne bestätigen die Einschätzung von Beobachtern, dass bei Yahoo der redaktionell betreute Web-Katalog in den Hintergrund treten wird. Aufgrund der Fortschritte Content-bezogener Techniken geraten manuell erzeugte Verzeichnisse zunehmend ins Hintertreffen. Konkurrenzfähigkeit verspricht hier höchstens ein Open-Source-Modell, wie es von Open Directory Project (DMOZ) unter Beteiligung von über 50.000 freiwilligen Redakteuren praktiziert wird.

Der englischsprachige Dienst von Google betreibt eine Betaversion des geplanten News-Dienstes, der sein Nachrichtenportal laufend aus 4500 Datenquellen speist. Mit zunehmender Fähigkeit, Dokumente maschinell kategorisieren zu können, könnten solche Services in Zukunft für jeden Benutzer persönlich angepasste Angebote zusammenstellen. Diesem Ansinnen kommen immer mehr News-Sites entgegen, indem sie ihre Inhalte über den XML-basierenden Syndication-Standard RSS beschreiben und so einer Auswertung besser zugänglich machen.

Die Value Web Broker kommen

In dieser Funktion nehmen Google und Yahoo die Position eines Value Web Brokers ein, wie sie von Petra Schubert, Dorian Selz und Patrick Haertsch in "Digital erfolgreich" beschrieben wird. Diese Funktion zeichnet sich dadurch aus, dass ein Broker sich die Rosinen aus bestehenden Wertschöpfungsketten pickt und dann als Wertvermittler auftritt.

Die Content-bezogenen Dienste versetzen Google & Co. schon heute gegenüber den Anbietern von Inhalten und Leistungen in eine mächtige Position. Das liegt einerseits daran, dass sie das Web als einen riesigen Hypertextkorpus betrachten und gegenüber den Betreibern einzelner Sites einen enormen Wissensvorsprung genießen. Zum anderen können sie daraus Dienste generieren, die auf große Nachfrage bei Benutzern stoßen.

Diese freilich machen sich durch den Gebrauch der komfortablen Services selbst immer stärker zum Objekt der wissbegierigen Datenhamster. Google hat bisher Vorwürfe nicht dementiert, wonach jede Suchanfrage inklusive IP-Adresse und Cookie-ID für unbeschränkte Zeit gespeichert wird. Je mehr die Benutzer angebotene Bequemlichkeits-Features in Anspruch nehmen, umso mehr geben sie ihre Surf-Gewohnheiten preis. So kann Google anhand des 35 Jahre lang gültigen Cookies individuelle Suchpräferenzen automatisch aktivieren - und gleichzeitig Informationen über den Benutzer aufhäufen. Die als Erweiterung von Microsofts "Internet Explorer" erhältliche "Google Bar" informiert über die Relevanz aller angesteuerten Seiten. Dies hilft bei der Bewertung von Inhalten, ohne dafür die Suchmaschine bemühen zu müssen, meldet jedoch absolut jede besuchte Adresse an Google.

Nährboden für Verschwörungstheorien

Das mag als harmloses Akkumulieren mäßig interessanter Daten erscheinen, da Google nicht den Namen von Benutzern, sondern nur eine beliebige ID kennt. Interessanter dürfte hingegen die Auswertung von Suchbegriffen sein, die über einen gewissen Zeitraum von den IP-Adressen einer bestimmten Firma aus getätigt wurden. Ein derartiges Data Mining könnte einigen Aufschluss darüber geben, an welchen Themen ein Unternehmen besonders interessiert ist, und Schlussfolgerungen über mögliche Projekte zulassen.

Wer sich wie Google an einer zentralen Schaltstelle des Web eine derart dominante Position erkämpft hat, sieht sich zwangsläufig Verdächtigungen ausgesetzt, die nach Verschwörungstheorie klingen. So unterstellt google-watch.org dem Suchriesen eine Zusammenarbeit mit amerikanischen Geheimdiensten. Auch wenn dies nicht der Fall sein sollte - bei Google könnten Spione ungeahnte Schätze heben.