CRM und Datenqualität

Unstrukturierte Daten sind ein ungehobener Schatz

26.06.2008
Von Christian Rodatus

Zusammenhänge aus Bruchstücken erkennen

Bei den statistischen Verfahren bleiben der Kontext und die Beziehungen zwischen den identifizierten Wörtern unbestimmt. An dieser Stelle setzen die linguistischen Ansätze mit einer Syntaxanalyse an, die Sätze in ihre einzelnen Bestandteile zerlegt. Das heißt: Die Information, wer was wann und wo unter welchen Begleitumständen tut, wird extrahiert, in eine Tabelle überführt und steht damit für weitere Analysen aufbereitet zur Verfügung. Die Kunst besteht dabei darin, über die einfache Spracherkennung hinaus Zusammenhänge zu erkennen, die stimmige Fakten und Ereignisse ergeben. Die Tabelle zu einem Hotline-Gespräch würde beispielsweise aussagen: "Ereignis: Beschwerde; Objekt: DSL-Verbindung; Agent: Kunde; Ursache: zu langsam."

In dieser semistrukturierten Form lassen sich die Daten für Analysen heranziehen. Die Unternehmen können auf diese Weise ihre Datenbasis enorm verbreitern - neben den schon erwähnten Call-Center-Gesprächen und anderen Spielarten des Kundendialogs bieten sich auch interne und öffentliche Web-Foren als relevante Quellen an, um etwa das Kunden-Feedback direkt oder indirekt einzufangen. Auch das Monitoring von Online-Nachrichten kann im Einzelfall zweckmäßig sein. Jedoch lassen sich ergiebige Analysen mit semistrukturierten Daten meist erst dann vornehmen, wenn sie mit den herkömmlichen, strukturierten Unternehmensdaten verknüpft werden: Wie kommt eine Produktbewertung im Internet zustande? Welche eigenen Handlungen haben sie beeinflusst - die Produktqualität, der Service oder Werbemaßnahmen? Und wie schlägt sich das vorgefundene Meinungsbild in der tatsächlichen Nachfrage nieder? Um solche Zusammenhänge zu untersuchen, müssen auch Daten des Qualitäts-, des Kunden-Managements und des Marketings herangezogen werden.

Voraussetzung für solche Analysen ist eine umfassende Datenbasis, die sämtliche Unternehmensdaten an zentraler Stelle integriert und verfügbar hält. Aufgrund der großen und zumeist schnell wachsenden Datenmengen stellt dies extrem hohe Anforderungen an das Daten-Management, denen nur skalierbare Data-Warehouse-Lösungen wie die von Teradata gerecht werden. Das gilt erst recht, wenn neben der üblichen anwendungsbezogenen auch semistrukturierte Daten eingeschlossen werden.