Das Einmaleins der Web Analytics

20.04.2007
Von Marco Hassler
Daten über Online-Nutzer bergen eine Fülle wertvoller Informationen für Marketing und Vertrieb, die Anwender aufmerksamer beachten sollten.
Die Kunst beim Einsatz von Web Analytics besteht darin, die für die eigene Strategie passenden Kennzahlen zu finden.
Die Kunst beim Einsatz von Web Analytics besteht darin, die für die eigene Strategie passenden Kennzahlen zu finden.
Die Analysen und Kennzahlen sollten idealerweise zu einer ständigen Optimierung von Prozessen und Strategien beitragen.
Die Analysen und Kennzahlen sollten idealerweise zu einer ständigen Optimierung von Prozessen und Strategien beitragen.

Die meisten Unternehmen sammeln und analysieren heute technische Leistungsdaten ihrer Websites. Nur wenige versuchen aber auch, den Erfolg der Website als Vertriebskanal, Marketing-Instrument oder Serviceplattform anhand der Daten zu beurteilen. Dabei stehen mittlerweile leistungsfähige Tools für Web Analytics beziehungsweise Online Business Intelligence zur Verfügung, die dabei helfen können (siehe Kasten "Was sind Web Analytics?"). Beispiele sind "HBX Analytics" von Websidestory, "Visual Site" von Visual Scienes (von Websidestory gekauft), "Google Analytics" von Google, "Sitecatalyst" von Omniture, "Webtrend Analytics" von Webtrends oder "Sitestat" von Nedstat. Doch selbst dort, wo diese Tools im Einsatz sind, fristen sie ein Schattendasein, da nur IT-Abteilungen sie für ihre Zwecke verwenden. Sie produzieren mit ihnen vor allem Zahlenkolonnen und Grafiken, die sie stolz der Geschäftsleitung präsentieren: Hits, Page Views, Downloads und Bandbreite - Statistiken, die isoliert betrachtet allenfalls etwas über die Server-Auslastung in der Vergangenheit aussagen, aber nichts über zu erwartende Trends, das tatsächliche Nutzerverhalten oder gar das operative Geschäft.

Fehlerquellen

Faktoren, die die Erfolgsmessung von Web-Anwendungen verfälschen:

• Crawler von Suchmaschinen: Crawler sind Teile von Suchmaschinen, die automatisiert und regelmäßig Inhalte von Websites zusammentragen. Aus Sicht eines Web- Servers verhalten sie sich ähnlich wie Web-Browser und werden deshalb häufig in den Statistiken mitgezählt. Bei Client-seitiger Analyse ist dies nicht der Fall, weil Crawler kaum Javascript interpretieren und Cookies annehmen.

• Verfügbarkeitsmessung des Servers: Administratoren setzen Programme ein, die im Minutentakt Daten vom Web-Server anfordern, um zu prüfen, ob er erreichbar ist und störungsfrei läuft. Da jedes Mal ein Hit, Page View oder Visit entsteht, treibt das die Statistik nach oben. Diese Dienste lassen sich ebenso wie Crawler erkennen und herausfiltern, um aussagekräftige Analysedaten zu erhalten.

• Syndikatoren/Feed-Reader: Auch die meisten Feed- Reader besuchen ihre Quellen in regelmäßigen Abständen und generieren damit Traffic - unabhängig davon, ob sich neue Inhalte auf der Website finden oder nicht. Zwar führen die meisten Reader kein Javascript aus, dennoch ist die Aussagekraft der Statistiken insbesondere von Weblogs und allen Diensten, die einen Feed zum Beispiel als RSS oder Atom anbieten, beeinträchtigt.

• Inhouse Traffic: Hat ein Unternehmen die eigene Website standardmäßig als Startseite des Browsers vorgegeben, werden die eigenen Mitarbeiter bei der Erfolgsmessung mitgezählt. Ist dies nicht gewollt, sollte man die entsprechenden IP-Adressen herausfiltern.

• HTML-Frameset: Technisch gesehen generiert ein Frameset bei jeder Ansicht im Browser pro Frame einen zusätzlichen Seitenaufruf. Bei drei Frames vervierfacht sich also die Anzahl der Seitenansichten. Gegensteuern ist schwierig, da kaum alle Seiten gleich viele Frames haben.

• Reloads: Das Tag "Meta Refresh" bewirkt, dass der Client nach einer fest definierten Zeit eine Seite automatisch neu lädt. Dies wird vor allem bei Portalseiten eingesetzt, die ihre Inhalte in kurzen Intervallen aktualisieren. Nicht selten dient es aber auch dazu, den Traffic unsinnigerweise zu vervielfachen.

• Caching: Je nach IT-Infrastruktur werden gewisse Seiten oder Seitenelemente in vorgelagerten Proxies zwischengespeichert und lokal ausgeliefert. Das verringert das Datenaufkommen und erhöht die Effizienz, weshalb man diese Mechanismen auch nicht ohne triftigen Grund umgehen sollte. Die Folge für die Analyse: Am Web-Server und damit an den Logfiles gehen die Anfragen vorbei, Client-seitige Tools erfassen sie hingegen.

Was sind Web Analytics?

Web Analytics (auch Web-Controlling, Web-Analyse, Traffic-Analyse, Clickstream-Analyse) sammeln, analysieren und erstellen Informationen über die Nutzung einer Website. Typischerweise erfassen sie, woher die Besucher kommen, welche Bereiche sie aufsuchen oder wie oft welche Seiten angesehen werden. Die analysierten Informationen helfen die Effektivität eines Web-Auftritts und von Online-Initiativen zu verstehen beziehungsweise zu erhöhen (gemessen an häufigeren Besuchen, steigenden Seitenaufrufen, Bestellungen oder Newsletter-Abonnements). Web Analytics untersuchen nur allgemeine und anonyme Nutzer- informationen.

Die häufigsten Begriffe

Die grundlegenden Begriffe von Web Analytics werden oft falsch verwendet. Hier ein kleines Glossar:

• Eine "Page View" (PV) ist eine Seitenansicht, folglich eine im Browser vollständig geladene und durch den User "nutzbare" Seite. Der Begriff ist Synonym für Page Impression (PI) oder Impression. Das kleine Geheimnis ist wohl, dass technisch gesehen ein PV weder garantiert, dass die Seite visuell dargestellt (gerendert) wurde, noch dass der User genügend Zeit hatte, die Seite zu lesen und mit ihr zu interagieren. So ist ein Redirect (automatische Weiterleitung) auch ein PV, jedoch ein nutzloser. Gelegentlich klicken User auch auf den "Back"-Button, weil sie gar nicht auf die Seite wollten; der PV ist aber schon erfolgt. Dieser Zusammenhang zeigt sich oft, wenn man für Kunden erstellte Statistiken mit den von Werbeschaltern gemeldeten Zahlen vergleicht. Heikel sind PV-Messungen insbesondere auch bei einem HTML-Frameset, da meist jeder Frame als PV gezählt wird.

• Als "Visit" (auch Session) zählt ein Besuch einer Website, unabhängig davon, wie viele Seiten angesehen werden (PVs). Da das Kommunikationsprotokoll (http) zwischen Browser und Web-Server zustandslos ist, kann der Anwender technisch nur einen einzelnen Besuch zeitlich abgrenzen. Ob ein Besucher zwischen zwei Klicks die Seite betrachtet oder zum Beispiel in einem anderen Fenster arbeitet, ist nicht feststellbar. Als Visit wird damit ein Besucher am selben Computer gezählt, der mit demselben Browser mehrere Klicks gemacht hat, die nicht mehr als eine festgelegte Zahl von Minuten auseinander liegen (typischerweise 20 oder 30 Minuten). Wechselt jemand den Computer, löscht er die Cookies oder macht 21 Minuten lang zwischen zwei Klicks etwas anderes, so zählt dies als zwei Visits.

• Beim "Visitor", dem über die Zeit beziehungsweise mehrere Besuche eindeutigen Besucher, wird es noch schwieriger. Als Visitor gilt ein User am selben Computer mit demselben Browser (weil dieser die Cookies speichert), der weder die IP-Adresse wechselt (je nach Messart) noch die Cookies in der Zwischenzeit löscht. Benutzt er mehrere Geräte, werden folglich mehrere Besucher gezählt.

• Wenig hilfreich ist der "Hit" für die Erfolgsmessung. Eine Web-Seite besteht technisch aus mehreren Elementen. Auf eine URL-Eingabe oder bei einem Link-Klick liefert der Server zuerst die HTML-Grundseite (base page) aus. Darin finden sich Referenzen auf weitere Elemente wie beispielsweise Grafiken (GIF, PNG, JPEG), CSS-Stylesheet(s) und möglicherweise Javascript-Bibliotheken. Je nachdem, wie eine Seite codiert ist, können das mehrere Dutzend Elemente sein. Jeder Aufruf eines solchen Elements wird als einzelner Hit bezeichnet, einzelne Seiten können damit eine unterschiedliche Anzahl Hits generieren. Die Zahl der Hits macht somit höchstens eine Aussage über die Belastung des Servers, ist aber für die Analyse der Website irrelevant. Page Views, Visits, Visitors und Hits zusammengefasst bedeuten: Ein Visitor besucht eine Website in einem oder mehreren Visits und generiert dabei jedes Mal Page Views je betrachtete Seite. Jeder Page View wiederum verursacht eine bestimmte Anzahl Hits auf dem Server.

• Ein wichtiger Begriff ist der "Referrer". Dieser zeigt an, welches die Quellen des Traffics einer Seite sind, oft in Form von "referring URLs" oder "referring domains". Das Problem ist, dass Traffic, bei dem diese Information fehlt (Information kann Browser-seitig deaktiviert werden), grundsätzlich als "Bookmark" oder eine Direkteingabe der URL interpriert wird.

• Relativ weit verbreitet ist auch der Begriff der "Konversion" beziehungsweise der "Konversionsrate". Diese bezeichnet das Verhältnis der Anzahl Besucher, welche einen bestimmten Prozess durchlaufen haben, zur Anzahl der Besucher, die ihn begonnen haben. Dabei kann der Prozess beispielsweise mittels einer externen Anzeige beginnen und das Ziel der Abschluss eines Kaufs im Online-Shop sein. Dementsprechend bestehen unterschiedliche Konversionsraten je nach Definition von Anfang und Ende des Prozesses.

Hier lesen Sie ...

• was Web Analytics sind;

• wie sie sich einsetzen lassen;

• welche Rolle Kennzahlen dabei spielen;

• wo Fehlerquellen und Probleme lauern.

Mehr zum Thema

www.computerwoche.de/

575660: Markt für Web Analytics;

568599: Google Analytics;

565455: Dienstleister für Performance-Analysen.

Unternehmen leiden am Fieberkurvensyndrom

Unternehmen, die sich mit entsprechenden Kurvengrafiken begnügen und diese nicht hinterfragen, solange sie Monat für Monat ansteigen, leiden unter einem "Fieberkurven-Syndrom". Dabei gibt es nur wenige Interaktionsprozesse mit Kunden und anderen Interessengruppen, die sich so genau dokumentieren und auswerten lassen wie die, die online stattfinden. Es lohnt sich, diesen zyklischen Prozess mit durchdachten Kennzahlen zu untermauern und als strategisches Controlling- und Steuerungsinstrument mit klarer Verantwortlichkeit im operativen Geschäft zu verankern. Nur wer weiß, wie sich seine Zielgruppe verhält, kann Geschäftsprozesse optimal auf deren Bedürfnisse abstimmen und langfristig einen Return on Investment erzielen.

Grundsätzlich sind zwei Ansätze bei der Analyse von Websites zu unterscheiden. Herkömmliche Website-Statistiken basieren auf der Analyse von Server-Logfiles. Dazu protokolliert ein Web-Server die Zugriffe und Anfragen auf HTML-Seiten, Bilder oder Javascripts sowie Informationen über den Nutzer wie dessen IP-Adresse, den Browser-Typ, die Art des verwendeten Protokolls und die Referrer URL, also von welcher Domain der Nutzer kam.

Das Auswerten von Log-Files genügt nicht

Im Gegensatz zu solchen Server-seitigen Logfile-Analysen setzen moderne Web-Analytics-Tools auf der Seite des Clients an. Dazu bettet man bei der Programmierung der Website in jede auszuwertende Seite ein kleines, unsichtbares Bild plus einen Javascript-Code ein, die den Browser jedes Besuchers dazu veranlassen, Daten an ein Drittsystem zu übermitteln. Ein Cookie identifiziert den Nutzer. Intelligent eingesetzt, lassen sich so Informationen gewinnen, die Schlüsse auf die Wirksamkeit von Online-Maßnahmen und die Effizienz geschäftsrelevanter Prozesse auf einer Website zulassen. Sie bieten verlässliche Messgrößen zu Rentabilitätsvergleichen von Kampagnen, zu Konver- sionsraten von Interessenten zu Kunden und decken Schwachstellen zum Beispiel von Bestellprozessen auf.

Gleiche Frage, verschiedene Antworten

Beide Methoden führen bei gleicher Fragestellung zu Ergebnissen, die teilweise stark voneinander abweichen (siehe zudem den Kasten "Fehlerquellen"). Wer etwa wissen will, wie viele Besucher eine Website frequentieren, erhält bei der Logfile-Analyse aus verschiedenen Gründen in der Regel wesentlich höhere, wenn auch nicht aussagekräftigere Werte. So zählt die Log-Datei des Web-Servers als Besucher (Visitors) die Anzahl unterschiedlicher IP-Adressen, wodurch Besucher aus demselben Unternehmensnetz unter Umständen nur als ein Besucher wahrgenommen werden. Demgegenüber ermittelt die Client-seitige Lösung einzelne Besucher anhand von Cookies, vorausgesetzt, sie haben diese zuvor akzeptiert. Die Messung wird aber unscharf, sobald derselbe Nutzer mehrere Geräte oder verschiedene Browser verwendet. Ein einzelner Besuch (Visit, Session) lässt sich technisch nur zeitlich abgrenzen, da das Kommunikationsprotokoll (http) zwischen Browser und Web-Server zustandslos ist, also auf dem Client veränderte Zustände nicht an den Web-Server gesendet werden. Als Besuch wird ein Besucher am selben Computer gezählt, der mit demselben Browser mehrere Klicks gemacht hat, die nicht mehr als eine festgelegte Zeitspanne (typischerweise 20 bis 30 Minuten) auseinander liegen. Wechselt ein Besucher den Computer oder Browser, löscht die Cookies oder arbeitet in den 31 Minuten zwischen zwei Klicks in einem anderen Fenster, zählt dies als zwei Visits (zu den Grundbegriffen der Web-Analyse siehe den Kasten "Die häufigsten Begriffe").

Zielgruppen verstehen und steuern

Eine qualitative Analyse sollten Unternehmen machen, wenn sie wissen wollen, ob es sich um einen neuen oder einen wiederkehrenden Besucher handelt und wie viel Zeit zwischen seinen Besuchen verstreicht (Frequency). So kann ein hoher Prozentsatz neuer Besucher ein Indiz für eine erfolgreiche Werbekampagne sein. Der Aufwand dafür ist jedoch vergebens, wenn Interessenten auf der Website nicht die versprochenen Inhalte vorfinden, aufgrund unklarer Navigation frustriert die Website wieder verlassen, oder einen begonnenen Bestellprozess abbrechen. Für eine gute Qualität der Inhalte sprechen hingegen viele loyale Besucher, die die Website immer wieder aufsuchen. Je höher die durchschnittliche Anzahl besuchter Seiten je Besuch, umso mehr entspricht das Angebot den Bedürfnissen der Nutzer. Der Abstand zwischen den Besuchen wird dabei je nach Zweck der Website unterschiedlich bewertet: Während Nachrichtenportale eine möglichst hohe Frequenz (mindestens einmal am Tag) anstreben, kann es bei einer Shopping-Site genügen, wenn der Besucher nach wenigen Wochen wiederkehrt und etwas bestellt.

Anwender müssen schon vor dem Aufbau oder der Optimierung ihrer Website einige Kernfragen beantwortet haben: Welche Ziele verfolgt das Unternehmen? Welche strategische Rolle erfüllt dabei die Website? Soll darüber Geld verdient oder eingespart werden? Unterfüttert man die Antworten mit aussagekräftigen und messbaren Kennzahlen, schafft man die Basis für Web Analytics als effektives Controlling- und Steuerungsinstrument. Die Kunst besteht allerdings darin, die relevanten Kennzahlen (Key Performance Indicators = KPIs) zu identifizieren, konstant zu überwachen, bei Auffälligkeiten und Abweichungen die richtigen Schlüsse zu ziehen sowie Verbesserungsmaßnahmen einzuleiten (siehe Grafik "Vorgehensmethodik").

Mit Kennzahlen-Cockpit zum Erfolg

Es hat sich bewährt, die KPIs in einer Art Cockpit etwa nach dem typischen Zyklus von Kundenbeziehungen zu gruppieren (siehe Grafik "Die wichtigsten Messwerte"). Wird ein Online-Service oder ein Produkt neu eingeführt, muss der Anwender die zugehörige Website nutzen, um das Angebot im Internet zu verbreiten und bekannt zu machen. Die Aufmerksamkeit eines möglichst großen Publikums erreicht man etwa durch Kampagnen und Verlinkungen von Blogs oder Drittportalen. Aussagen über die Qualität solcher Traffic-Quellen liefern KPIs wie "Anzahl betrachtete Seiten je Besucher und Quelle" oder "Akquisitionskosten je Quelle". Eine der Herausforderungen besteht darin, den Nutzer einer konkreten Kampagne zuzuordnen. Dazu behält man dessen Herkunft im Auge, misst die Zugriffe auf spezielle "Landing Pages", die im Rahmen einer Aktion kommuniziert wurden, oder arbeitet mit Kampagnencodes. Existieren entsprechende Anreize, wird der Nutzer den Code sogar selbst übertragen und so eine medienübergreifende Zuordnung ermöglichen. Ein Vergleich von Konversionsraten unterschiedlicher Kampagnen, verschiedener Suchmaschinenbegriffe oder referenzierender Drittsites zeigt zudem auf, wo es sich lohnt, künftig zu investieren.

Nachdenken über Strategien zur Kundenbindung

Für die Website eines etablierten Produkts oder einer Dienstleistung kann es das Ziel sein, aus möglichst vielen Besuchern Käufer zu machen oder sie dazu zu bewegen, sich verbindlich für einen Service registrieren zu lassen (Konversion). Dabei ist wie bei allen Marketing-Maßnahmen zu fragen, wie viele Angehörige der Zielgruppe sich überhaupt auf diesem Weg erreichen und wie viele sich zu Kunden beziehungsweise Stammkunden machen lassen. Wie erfolgreich man damit ist, zeigen Kennzahlen wie "Anzahl der Bestellungen beziehungsweise Höhe des Bestellwerts" oder "Anzahl der ausgefüllten Kontaktformulare" - jeweils in Relation zum Aufwand für eine bestimmte Kampagne. Dazu muss der Anwender nicht nur wissen, woher der Besucher kommt, sondern vor allem, wie er sich durch die Website bewegt (Besucherfluss) und ob er den Bestell- oder Anmeldeprozess reibungslos abschließt.

Unterschiedliche Formen von Prozessanalysen können aufzeigen, wo Hindernisse und Unklarheiten den Abschluss behindern. Erfolgen auffallend viele Abbrüche nach dem Konsultieren der Seite mit den Allgemeinen Geschäftsbedingungen, lässt sich annehmen, dass der potenzielle Besteller damit nicht einverstanden war. Ist ein Dropdown-Feld für die Auswahl einer Zahlungsmöglichkeit ein häufiger Ausstiegsgrund, findet der Besucher seine favorisierte Zahlungsart nicht vor. Im Fall des Online-Shops eines internationalen Telekommunikationsunternehmens fiel nach einer kleinen inhaltlichen Modifikation auf, dass ein Großteil der Nutzer den begonnenen Bestellprozess nicht mehr abschloss. Sie brachen ab, als es darum ging, die E-Mail-Adresse anzugeben. Die Ursache war, dass der dazugehörige Hinweistext nicht mehr eindeutig erklärte, dass die Adresse nicht für Werbezwecke verwendet wird. Als das Unternehmen den Text korrigierte, stieg die Konversionsrate wieder auf ihr vorheriges Niveau. Schließlich wollen Unternehmen mit großen Kundenstämmen mit der Website zudem oft ihre Kosten für Kundenverwaltung, Support und Service kontrollieren. Verglichen mit einem Call-Center schneidet der Online-Kanal hier meist günstiger ab. Mögliche Kennzahlen wären dann "Zufriedenheit des Kunden bei der Anfrage im Verhältnis zu den Kosten". Entscheidend und messbar ist, ob und wie schnell der Kunde die gesuchte Information findet. (as)