CW-Subnets     |     Executive Briefings     |     Blogs & Forum     |     CW-TV     |     Newsletter     |     RSS
Schließen
Dock ein-/ausblenden
Business Intelligence & Enterprise Content Management

Ratgeber Text Mining

Aus unstrukturierten Daten werden Geschäftsinformationen

Drucken |  Empfehlen |  PDF |  Merken

Ausarbeitung von Konzepten

Zur Konzeptfindung gehören neben der Zergliederung der Texte auch das Management linguistischer Ressourcen, die Extraktion von Begriffen, die Abgrenzung von Gattungen, das Bilden von Äquivalenz-Klassen sowie die Indizierung. Zusätzlich nutzen ausgereifte Produkte so genannte Fuzzy Logic: Hierbei werden ähnliche Begriffe ohne das Zutun benutzerdefinierter Quellen zusammengeführt. Die Software identifiziert beispielsweise Schreibvarianten indem sie Vokale oder doppelte Konsonanten entfernt und die Ähnlichkeiten vergleicht ("Möbel" oder "Möhbel" würden durch Fuzzy Logic zusammengeführt.). Diese Funktion ist besonders dann sehr hilfreich, wenn die Qualität des Textes zu wünschen übrig lässt wie bei manchen E-Mails oder CRM-Daten.

Ist das Konzept erarbeitet, haben Analysten die Möglichkeit, Beziehungen zwischen Entwürfen auf der Satzebene zu beschreiben - ebenso wie Meinungen oder Kennzeichen, die mit diesen Konzepten zusammenhängen. Eine Text-Link-Analyse erlaubt Analysten zugleich, positive und negative Tendenzen in Textantworten zu finden. Darüber hinaus werden Satzstrukturen auf mögliche positive oder negative Einstellungen untersucht. Organisationen können Daten wie diese beispielsweise nutzen, um vorherzusagen, welche Kunden sich am meisten für bestimmte Produkt- oder Servicefunktionen interessieren.

Konstruktion von Kategorien

Da jedes Datenset einzigartig ist, variiert auch die Auswahl an Techniken, die ein Analyst für jedes einzelne Projekt auswählt. In allen Fällen wiederholt sich aber der Klassifizierungsprozess: Ein Forscher wendet eine spezielle Technik an, evaluiert die Ergebnisse, passt die Techniken oder resultierenden Kategorien entsprechend an und verfeinert die Resultate. Automatische, linguistische Techniken enthalten Konzeptableitung, Konzepteinbindung, semantische Netzwerke und das Zusammentreffen von Regeln.

Bei der Kategorienbildung mit linguistisch basierenden Verfahren haben Anwender die Möglichkeit, spezielle Techniken auszuwählen und danach Parameter wie die Kategorienanzahl zu modifizieren. Um Kategorien zu verfeinern, bieten sich ebenfalls verschiedene Prozesse an. Der Analyst kann Meinungen zu einer Kategoriendefinition hinzufügen oder diese verändern, Kategorien zusammenfügen, verschieben oder löschen. Weitere Pluspunkte sind visuelle Graphen, die beispielsweise die Zusammenhänge zwischen den Kategorien veranschaulichen.

(0 Beiträge), 
Kommentieren

Beitrag schreiben

Noch kein Forums-Mitglied?
Dann gleich hier anmelden.

BI & ECM: CW-REDAKTEURE EMPFEHLEN
Die richtige ECM-Strategie (Foto: Blend Images/Fotolia) Die richtige ECM-Strategie Viele Unternehmen setzen auf Enterprise-Content-Management (ECM), um ihre Daten in den Griff zu bekommen. Lesen Sie, was dabei wichtig ist.
weiter
Mehr Nutzen durch schnelle BI (Foto: BARC) Mehr Nutzen durch schnelle BI Wer vom Start weg die verschiedenen Einflussfaktoren im Blick hat, kann den Nutzen seines BI-Systems erhöhen und Investitionen sichern.
weiter
Das neue BI (Foto: fotolia.com/Benicce) Das neue BI Mit Predictive Analytics wollen Unternehmen komplexe wirtschaftliche Zusammenhänge vorhersagen so bessere Entscheidungen treffen.
weiter
Best Practices SharePoint (Foto: Microsoft) Best Practices SharePoint Eine SharePoint-Integration wird allzu oft technisch begriffent. Der Erfolg kommt aber erst mit einem fundierten Organisations-Management.
weiter
Goldader Datenqualität (Foto: Deutsche Bank) Goldader Datenqualität Investitionen in Qualität und Zugänglichkeit von Daten werfen erkleckliche Renditen ab. Für große Firmen winken zusätzliche Millionen.
weiter
MEHR ZUM THEMA BI & ECM
  • Whitepaper
  • Top geklickt
Jobangebote
FEATURED LINKS

KOSTENLOSE NEWSLETTER VON COMPUTERWOCHE
Nachrichten morgens
Whitepaper
Nachrichten mittags
CW-Mittelstand
Highlights der Woche
Hardware
SAP-Newsletter
Software
Job + Karriere
Open-Source
Stellenmarkt
Produkte + Techn.
Freiberufler
Security
Server + Storage
Netzwerke
Mobile & Apps