Ratgeber Text Mining

Aus unstrukturierten Daten werden Geschäftsinformationen

Sascha Alexander ist Manager Marketing & Kommunikation bei der QUNIS GmbH, Neubeuern, die auf Beratung und Projekte in der Business Intelligence, Big Data und Advanced Analytics spezialisiert ist. Zuvor war der Autor als Director Communications bei den Marktforschungs- und Beratungsunternehmen BARC und PAC tätig. Als ehemaliger Redakteur der COMPUTERWOCHE sowie Gründer und Chefredakteur des Portals und Magazins für Finanzvorstände CFOWORLD verbindet ihn zudem eine lange gemeinsame Zeit mit IDG.
Seine Themenschwerpunkte sind: Business Intelligence, Data Warehousing, Datenmanagement, Big Data, Advanced Analytics und BI Organisation.
Mit Text Mining holen Unternehmen mehr aus ihren gesammelten Informationen und können fundierter entscheiden.

Forschungsberichte, Umfrageergebnisse, E-Mails, Präsentationen, Projektstudien: Massenhaft und unstrukturiert landen Informationen Tag für Tag in den Unternehmen weltweit. Laut einer Studie des Marktforschungsinstituts IDC wird das globale Datenvolumen im Jahr 2011 mit 1,8 Billionen Gigabyte zehnmal so groß sein wie 2006.

Um diese unterschiedlichsten Informationen möglichst effektiv, zeit- und kostensparend zu nutzen, setzen Unternehmen auf technische Hilfen wie Data Mining und Text Mining. Während Ersteres strukturierte Daten auswertet, filtert Text Mining (Text Analytics) mit statistischen und linguistischen Methoden Informationen aus unstrukturierten Texten heraus (siehe auch den beitrag über die Datensuche mit Text Mining und Data Mining.

Ein Einsatzgebiet ist das Kundenbeziehungs-Management. Hier kann Text Mining zusätzliche Einsichten und strukturierte Zusammenhänge vom Text zu den Kundendaten verschaffen, indem es Konzepte, Zusammenhänge und Stimmungen aus den freien Texten herausfiltert. Die Ergebnisse können zudem helfen, das Kundenverhalten in bestimmten Situationen genauer vorherzusagen. "Wichtig ist es aber, mit einer ebenso gängigen wie falschen Annahme aufzuräumen: Textanalysen funktionieren nicht wie Suchmaschinen", erklärt Michael Mors, Country Manager der SPSS GmbH Software, die entsprechende Produkte anbietet.

Der Text-Mining-Prozess

Das Vorgehen beim Text Mining lässt sich grob in folgende Arbeitsschritte untergliedern:

  • Vorbereiten des Texts für die Analyse;

  • Konzepte extrahieren;

  • Meinungen und Zusammenhänge aufdecken;

  • Klassifizieren;

  • Text Analytics-Modelle aufbauen;

  • Text Analytics-Modelle mit anderen Datenmodellen zusammenführen;

  • Ergebnisse entwickeln und Modelle vorhersagen.