Neuronales Netz

Wenn das System die Nachricht versteht

08.10.2013 von Karin Quack
Die Börsenhändler der Baader Bank AG, Stuttgart, nutzen eine Anwendung, die standardisierte Handelsnachrichten automatisch bewerten kann.

Auf einen Börsenhändler stürzen tagtäglich mehr als eine halbe Million Nachrichten ein - allein von professionellen Diensten wie Bloomberg und Reuters. So viel kann ein Mensch unmöglich verarbeiten. Und das muss er auch nicht. Denn es reicht, wenn er auf die News reagiert, die wirklich wichtig für ihn sind.

Foto: Baader Bank

Im Falle eines Börsenhändlers sind das solche Nachrichten, die eine Auswirkung auf das Marktgeschehen haben. Dazu gehören beispielsweise Gewinnwarnungen, Fusionen oder große Aufträge. Darüber hinaus interessiert sich der Händler vor allem für Unternehmen, deren Aktien in seinem Portfolio sind. Und je rascher er die relevanten Nachrichten findet, desto eher kann er reagieren. Wie diese Reaktion ausfällt, hängt selbstredend vom Inhalt der Nachricht ab, aber schnell sollte es gehen. Optimal wäre es, wenn er zumindest die Tendenz einer neuen Nachricht in Sekundenschnelle erfassen könnte.

Computer reagieren in den meisten Fällen unmittelbarer als Menschen. Allerdings sind sie nur in eng begrenztem Maße in der Lage, Inhalte wirklich zu "verstehen", also semantisch zu erfassen. Ihre Domäne sind eher quantitative Beurteilungen, nicht qualitative. Trotzdem gab es auch in der Vergangenheit immer wieder Versuche, Software für ein wie auch immer geartetes "Verständnis" von Textinhalten anzubieten. Meistens handelte es sich um probabilistische Ansätze, bei denen quasi Wörter gezählt werden, erläutert Volker Stümpflen, Vorstandsvorsitzender der Clueda AG, München. Er selbst propagiert eine Alternative namens Shallow Semantic Role Labelling.

Best in Big Data 2013 - Die Finalisten
Die COMPUTERWOCHE kürt zum zweiten Mal die besten Big-Data-Projekte und -Tools. Am 24. September stellen sich die Anbieter der Jury und dem Publikum. Lesen Sie auf den folgenden Seiten, welche Teilnehmer in den Ring treten.
Actuate: BIRT Analytics
Actuate geht mit „BIRT Analytics“, einem Tool für Big-Data- Analytics, Visual Data Mining und Predictive Analytics, an den Start. Das Werkzeug enthält neben den Analysefunktionen ein integriertes Workflowund Kampangen-Management.
Berliner Morgenpost: Flugrouten-Radar
Die „Berliner Morgenpost“ hat eine interaktive Datenjournalismus- Anwendung umgesetzt, die Informationen zu Flügen sowie Flugspurdaten rund um die Hauptstadt auswerten und visualisieren kann.
Clueda "News Analytics" - Lotse durch den Informationsstau im Handelsraum
Nachrichten treiben Börsen. Deshalb müssen Börsenhändler in der Lage sein, in kürzester Zeit die Tragweite einer Nachricht zu verstehen und Entscheidungen zu treffen. Die Münchner Big-Analytics-Spezialisten der Clueda AG haben gemeinsam mit ihrem Kunden, der Baader Bank AG, ein Analyse-System entwickelt, das aus großen unstrukturierten Textmengen alle relevanten Informationen und Stimmungen in Echtzeit herausfiltert und so die Handelsentscheidung erleichtert.
Delphit: Social Forecast
Delphit schickt sein Tool „Social Forecast“ ins Rennen um die diesjährigen Best-in-Big-Data- Awards. Das Werkzeug erstellt quantitative Prognosen auf Basis von Mitarbeitereinschätzungen, um Entscheidungen in Unternehmen zu unterstützen.
Empolis Competitive Intelligence hört auch die schwachen Signale
Um im Wettbewerb zu bestehen, müssen Unternehmen der Konkurrenz immer einen Schritt voraus sein. Empolis hat mit "Competitive Intelligence" ein Tool entwickelt, das mittels semantischer Technologien große Mengen an unstrukturierten Daten automatisch analysiert und dabei auch die entscheidenden "schwachen Signale" ermittelt.
HP Big Data Discovery Experience - Big Data richtig pilotieren, validieren und umsetzen
Hewlett-Packard unterstützt mit "HP Big Data Discovery Experience" Anwender dabei, einen Business Case für Big-Data-Projekte zu rechnen sowie Pilotumgebungen zügig produktiv zu setzen.
hfp Informationssysteme GmbH: hfp openAnalyzer
Der „openAnalyzer“ von hfp stellt eine Datenanalyse-Plattform dar, die App-basiert strukturierte und unstrukturierte Daten einlesen, verarbeiten und wieder ausgeben kann.
IBM Infosphere Streams filtert Datenströme in Echtzeit
Um Daten effizient analysieren und nutzen zu können, benötigen die Unternehmen heute neue Methoden und Werkzeuge. IBM hat mit "Infosphere Streams" ein Tool entwickelt, das Daten in Echtzeit analysieren kann, ohne dass diese gespeichert werden müssen.
Michulke & Ringsdorf: INTTRA
Mit „INTTRA“ wendet Michulke & Ringsdorf sein System künstlicher Intelligenzen auf den europäischen Energiemarkt an. Dort wird aufgrund der immer stärkeren Integration unstet produzierender Energieträger wie Sonne und Wind die Planung von Angebot und Nachfrage an Strom für Energiehändler, Übertragungsnetzbetreiber und Kraftwerksbetreiber immer schwieriger.
Mindbreeze: InSpire
Mindbreeze bietet „InSpire“ als vorkonfigurierte, aufeinander abgestimmte Komplettlösung aus Hardware-Appliance und Softwarepaket an – für eine schnelle und umfangreiche Suche in allen Unternehmensdatenquellen.
n3 data & software science: Immobilien bewerten
ImmobilienScout24 bietet für seine Kunden neben der Vermarktung auch ein Online-Immobilienbewertungssystem an. Ein großer Teil der Metadaten der darin enthaltenen Objekte – wie etwa Baujahr, Baustil oder Heizanlage – liegt allerdings in Form von Fließtext in unstrukturierten Freitextfeldern vor und ist damit nur schwierig zu verarbeiten.
Pentaho Business Analytics ordnet Sounds im Netz
Über 200 Millionen Musiker stellen ihre Stücke in die SoundCloud. Um diese Daten sinnvoll zu sortieren und zu ordnen benötigten die Betreiber effiziente und leistungsstarke Big-Data-Werkzeuge. Mit Pentaho Business Analytics kann SoundCloud gezielter auf Wünsche und Anforderungen seiner Nutzer eingehen.
r4apps: PerForm
r4apps verspricht Anwendern mit „PerForm“ schnelle, interaktive Analysen von massiven strukturierten und unstrukturierten Daten.
Splunk holt die Informationen aus den Maschinendaten
Um Betrieb und Geschäft möglichst effizient zu betreiben, müssen Unternehmen aus ihren Maschinendaten alle wichtigen Informationen herausholen. Splunk bietet mit "Splunk Enterprise" eine Lösung, die sich flexibel konfigurieren und anpassen lässt, um Daten zu erfassen, auszuwerten und darzustellen.
Synop Systems: Synop Analyzer
Mit dem „Synop Analyzer“ bietet Synop Systems eine modular aufgebaute Big-Data-Analysesoftware an, mit der Fachanwender und Data-Mining-Experten interaktiv Zusammenhänge und versteckte Muster entdecken sowie Prognosen erstellen können.
Tableau Software: Tableau Desktop und Server
Die hohe Kunst von Big Data heißt für die Anwender, viele unterschiedliche Daten aus verschiedenen Quellen in den Griff zu bekommen sowie in diesem komplexen Zusammenspiel auch noch den Durchblick zu behalten und zudem die richtigen Schlüsse zu ziehen.
Talend Open Studio verbindet Big-Data-Quelle und -Ziel
Mit Open Studio for Big Data bietet Talend Anwendern ein grafisches Tool, mit dessen Hilfe sich der Austausch von Big Data zwischen beliebigen Quellen und Zielen einfach konfigurieren lässt.
VMS AG: SCOOP
Die VMS AG bringt mit „SCOOP“ ein Big-Data-Werkzeug für Predictive Operational Analytics zum diesjährigen Best-in-Big- Data-Award an den Start. SCOOP steht für „Seeking Cash Opportunities in Operational Processes“.

Erfahrungen aus der Medizin

Clueda ist ein Spin-off des Helmholtz-Zentrums München. Zehn Jahre lang hatten der studierte Chemiker Stümpflen und sein Team bereits an Softwarelösungen zur semantischen und assoziativen Wissensverwertung im medizinischen und chemopharmazeutischen Bereich geforscht, als sie 2010 auf die Idee verfielen, ihre Ergebnisse auf die Finanzwirtschaft zu übertragen. In Uto Baader, dem Vorstandsvorsitzenden der auf den Börsenhandel spezialisierten Baader Bank aus Stuttgart, fanden die Ideen der Wissenschaftler gleichzeitig einen Investor und einen künftigen Kunden.

2012 gründeten Stümpflen und seine Mitstreiter die Clueda AG. Sie beschäftigt heute 22 Mitarbeiter. Über eine zehnprozentige Beteiligung ist sie mit der Baader Bank verbunden. "Eine höhere Beteiligung hätte die Unabhängigkeit von Clueda beeinträchtigt", erläutert deren Vorsitzender. "Zudem wollen wir ja nicht Software verkaufen, sondern anwenden."

Damit, dass andere Banken die Software ebenfalls nutzen können, habe er kein Problem, so der Gründer des nach ihm benannten Finanzdienstleisters: "Konkurrenz belebt das Geschäft." Außerdem sei die Baader Bank durch ihre Beteiligung an Clueda tiefer in die Entwicklung der Software involviert als andere. Das sei Vorsprung genug.

Die drei Systeme

- Bei der Baader Bank bereits im Einsatz ist der "Clueda.Trader".

- Voraussichtlich im November ist die "Bloomberg-App" verfügbar.

- Für den kommenden Februar ist der "Clueda.ResearchClient" angekündigt - als Rahmen für die anderen Produkte.

Drei Nachrichten pro Minute

Bei der Entwicklung handelt es sich genau genommen um drei unterschiedliche Systeme, von denen eines bereits einsatzfähig ist: der "Clueda.Trader". Er erledigt die Selektion von Börsennachrichten innerhalb von Mikrosekunden. Der Trader filtert redundante und irrelevante Nachrichten aus der täglichen Informationsflut heraus. Dazu nutzt er Filter, die der Händler selbst setzen kann. Laut Clueda werden dabei nicht nur die Überschriften ausgewertet. Vielmehr gehe die Analyse über den gesamten Text. "Das ist Big Data", freut sich Baader.

„Wir sparen mit der Software jeden Tag Tausende von Euros.“ Uto Baader, Baader Bank
Foto: Baader Bank

Für die Händler bedeutet der Einsatz der Software eine spürbare Arbeitsentlastung: Sie müssen sich nur noch um drei Meldungen pro Minute kümmern. Das ist allenfalls ein Zehntel der bisherigen Datenflut. Darüber hinaus sorgt die Software dafür, dass bei der Festsetzung der Aktienpreise ("Quoting") keine relevante Nachricht unberücksichtigt bleibt: Geht eine Order für ein Papier ein, poppt ein Fenster auf, das die in diesem Zusammenhang wichtigen aktuellen Nachrichten anzeigt. "Man mag es kaum glauben, wie viele Nachrichten uns gewöhnlich durch die Lappen gehen", erläutert Baader: "Mit der Software sparen wir jeden Tag Tausende von Euros."

Allerdings benötigt die Software viel Server-Power. Deshalb will Clueda zumindest für die Bloomberg-Nachrichten zum Ende dieses Jahres eine weniger aufwendige Alternative anbieten: Die "Bloomberg App" bietet direkten Zugang zum proprietären Informationssystem des Nachrichtendienstes.

Beziehungen statt Wortklauberei

Aber das ist noch nicht alles. Clueda arbeitet - gemeinsam mit den Spezialisten der Baader Bank - an einer weit interessanteren Entwicklung: Der "Clueda.ResearchClient" soll erkennen, was eine Nachricht für das betroffene Unternehmen und seine Aktien tatsächlich "bedeutet". Die Software zählt also keine Wörter, sondern zerlegt Sätze in ihre Bestandteile, kategorisiert diese und stellt Beziehungen her.

"Herkömmliche Concurrency-Systeme machen Fehler, beispielsweise wenn Begriffe im Zusammenhang mit Negationen auftauchen", so Stümpflen. Sätze wie "Unternehmen A, B und C haben gute Gewinne gemacht, Konkurrent D aber nicht", könnten diese Systeme nicht sauber interpretieren, sie würden im Zweifelsfall aus der räumlichen Beziehung von C und D folgern, dass es D ebenfalls gut gehe. Die Clueda-Software hingegen sei in der Lage, die Negation zu erkennen.

Immer nah am User

Sogar Satzzeichen könne das Program interpretieren, ergänzt Baader. "Der Mensch denkt, Gott lenkt", bedeutet schließlich etwas anderes als "Der Mensch denkt: Gott lenkt". Lediglich Ironie bleibe dem System verborgen, räumt Stümpflen ein. Aber Börsennachrichten enthielten sich dieses Stilmittels in den meisten Fällen ohnehin.

In dem Clueda-Team gibt es kaum Informatiker. Die meisten Mitarbeiter kommen aus der Naturwissenschaft; ein paar Linguisten sind auch darunter. Die Software wird zusammen mit den designierten Anwendern entwickelt. Dafür kommen agile Methoden zum Einsatz, so dass das System immer nah an der Realität der User bleibt.

Die Anwender wissen schließlich am besten, wo die Entwicklung hingehen soll. Beispielsweise sei es aus ihrer Sicht wichtig, dass neben den Blomberg- und Reuters-Nachrichten auch andere Quellen einbezogen werden können, sagt Thomas Lendle, Handlungsbevollmächtiger im Aktienhandel der Baader Bank.

Darüber hinaus werden die Anwender ja auch gebraucht, um das System "anzulernen". Zunächst müsse es auf ein initiales Vokabular trainiert werden, erläutert Stümpflen. Dann lerne es, selbständig damit umzugehen.

Neuronales Netz

Eines der Pfunde, mit denen Clueda wuchern kann, ist die Nutzung maschinenbasierender Lernprozesse, vor allem eines neuronalen Netzes. Dank dessen könne die Software aus den gewonnenen Informationen auch "Wissensnetzwerke" aufbauen, so Stümpflen. Die einmal identifizierten Beziehungen dienten als Grundlage, auf der sich weitere Assoziationen schaffen und verarbeiten ließen. So entstehe allmählich ein auf den jeweiligen Händler zugeschnittenes Informationssystem.

Nur handeln kann das System noch nicht. Bislang ist allenfalls geplant, dass es eine Handelsanwendung aufruft, sobald die jeweilige "Stimmung" einer Nachricht einen An- oder Verkauf von Papieren angeraten erscheinen lässt.

Stümpflens Andeutungen zufolge denken Clueda und Baader Bank über ein selbständig handelndes System aber durchaus schon nach. Das sei jedoch eine hochsensible Anwendung, die höchst sorgfältig abgesichert werden müsste. Oder wie der Clueda-Geschäftsführer es formuliert: "Dazu müssen noch eine ganze Reihe von Plausibilitätsprüfungen eingebaut werden."

Dem menschlichen Denken auf der Spur

Dave, darf ich Ihnen einmal eine persönliche Frage stellen?“ Mit dieser scheinbar harmlosen Phrase kündigt sich das Unheil an – jedenfalls in dem aus dem Jahr 1968 stammenden Filmklassiker „2001 – Odyssee im Weltall“.

Karin Quack. Redakteurin COMPUTERWOCHE

Gestellt wird die Frage vom Computersystem HAL 9000. Der Verfasser des Drehbuchs und der literarischen Filmvorlage („The Sentinel“), Arthur C. Clarke, löste das Akronym HAL als „H-euristic AL-gorithmic“ auf und betonte damit die Ähnlichkeit zwischen HALs Schlussfolgerungssystem und menschlicher Intelligenz. Etwa zeitgleich mit der Entstehung des Films entwickelte Joseph Weizenbaum am MIT das Computerprogramm Eliza, das einen Dialog zwischen Psychoanalytiker und Patient simulierte. Und ein paar Jahre später veröffentlichte Marvin Minsky (mit Simon Papert) seine Vorstellungen von „Artificial Intelligence“, die er 1989 in dem viel beachteten Werk „The Society of Mind“ (deutsch: „Mentopolis“) verfeinerte.

Diesen Ansätzen gemeinsam ist der Versuch, das menschliche Denken auf Prozesse und Mechanismen zurückzuführen, die sich von einer Maschine imitieren lassen. In der Folgezeit wurde der Begriff Künstliche Intelligenz oder KI zu dem, was man heute Buzzword nennt. In Spezialausprägungen wie Expertensystemen, Neuronalen Netzen und „Fuzzy Logic“ fanden die Erkenntnisse der KI-Forschung auch relativ schnell Niederschlag in praktischen Anwendungen. Die auf den Seiten 30/31 vorgestellte Anwendung fällt sicher ebenfalls in diese Kategorie.

Heute ist der Glanz der Künstlichen Intelligenz jedoch verblasst. Regelbasierte und selbstlernende Systeme sind quasi IT-Alltag geworden. Zudem sind die Unterschiede zwischen dem chaotisch-kreativen Denken der „Meat Machines“, wie Minsky unsere Denkwerkzeuge nannte, und den „Elektronenhirnen“ noch nicht ganz verwischt. Zum Glück! Zumindest bleiben den Computern damit unsere Neurosen erspart. (mhr)