Ratgeber Text Mining

Aus unstrukturierten Daten werden Geschäftsinformationen

15.07.2008
Von 


Sascha Alexander ist seit vielen Jahren als Redakteur, Fachautor, Pressesprecher und Experte für Content-Strategien im Markt für Business Intelligence, Big Data und Advanced Analytics tätig. Stationen waren unter anderem das Marktforschungs- und Beratungshaus BARC, die "Computerwoche" sowie das von ihm gegründete Portal und Magazin für Finanzvorstände CFOWORLD. Seine Themenschwerpunkte sind: Business Intelligence, Data Warehousing, Datenmanagement, Big Data, Advanced Analytics und BI Organisation.
Mit Text Mining holen Unternehmen mehr aus ihren gesammelten Informationen und können fundierter entscheiden.

Forschungsberichte, Umfrageergebnisse, E-Mails, Präsentationen, Projektstudien: Massenhaft und unstrukturiert landen Informationen Tag für Tag in den Unternehmen weltweit. Laut einer Studie des Marktforschungsinstituts IDC wird das globale Datenvolumen im Jahr 2011 mit 1,8 Billionen Gigabyte zehnmal so groß sein wie 2006.

Um diese unterschiedlichsten Informationen möglichst effektiv, zeit- und kostensparend zu nutzen, setzen Unternehmen auf technische Hilfen wie Data Mining und Text Mining. Während Ersteres strukturierte Daten auswertet, filtert Text Mining (Text Analytics) mit statistischen und linguistischen Methoden Informationen aus unstrukturierten Texten heraus (siehe auch den beitrag über die Datensuche mit Text Mining und Data Mining.

Ein Einsatzgebiet ist das Kundenbeziehungs-Management. Hier kann Text Mining zusätzliche Einsichten und strukturierte Zusammenhänge vom Text zu den Kundendaten verschaffen, indem es Konzepte, Zusammenhänge und Stimmungen aus den freien Texten herausfiltert. Die Ergebnisse können zudem helfen, das Kundenverhalten in bestimmten Situationen genauer vorherzusagen. "Wichtig ist es aber, mit einer ebenso gängigen wie falschen Annahme aufzuräumen: Textanalysen funktionieren nicht wie Suchmaschinen", erklärt Michael Mors, Country Manager der SPSS GmbH Software, die entsprechende Produkte anbietet.

Der Text-Mining-Prozess

Das Vorgehen beim Text Mining lässt sich grob in folgende Arbeitsschritte untergliedern:

  • Vorbereiten des Texts für die Analyse;

  • Konzepte extrahieren;

  • Meinungen und Zusammenhänge aufdecken;

  • Klassifizieren;

  • Text Analytics-Modelle aufbauen;

  • Text Analytics-Modelle mit anderen Datenmodellen zusammenführen;

  • Ergebnisse entwickeln und Modelle vorhersagen.