Unstrukturierte Daten

Auf Datensuche mit Text Mining und Web Mining

20.05.2008
Von 
Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Userverhalten verstehen - Web Usage Mining

Im Gegensatz zu Web Content Mining, das auf die Inhalte zielt, versucht Web Usage Mining das Verhalten von Website-Nutzern besser zu verstehen: Wie etwa navigieren Besucher durch die Netzstruktur? Welche Inhalte bewegen sie zu welchem Handeln? Als Datenbasis dienen dabei in erster Linie die von den Webservern gespeicherten Zugriffsinformationen wie Server Logs und gegebenenfalls Informationen über die Benutzer selbst oder die Inhalte der Seiten, auf die zugegriffen wird.

Die Analyse dieser Daten ist aus verschiedensten Gründen sinnvoll. So erlaubt sie unter anderem, bestimmte Nutzergruppen gezielter anzusprechen und Informationen über ihre Interessen und Motivationen zu bekommen. Eine Analyse des Benutzerverhaltens kann beispielsweise aber auch helfen, die Struktur eines Webangebots zu verbessern und optimaler an Kundenbedürfnisse anzupassen.

Einfache Fragestellungen zum Web Usage Mining können schon durch simple Statistiken beantwortet werden. Beispielsweise kann die Häufigkeit der Zugriffe auf die Seiten einen Verknüpfungsfehler der Seiten untereinander aufdecken. Komplexere Fragen lassen sich mit den im Data Mining Beitrag angesprochenen Verfahren beantworten. Auch hier spielen wieder Clusteranalyse, Klassifikationsverfahren und Assoziationsregeln die Hauptrollen.