Neuartige Analysetechnik

IBM InfoSphere Streams durchleuchtet Datenstöme

29.05.2009
Von 


Sascha Alexander ist seit vielen Jahren als Redakteur, Fachautor, Pressesprecher und Experte für Content-Strategien im Markt für Business Intelligence, Big Data und Advanced Analytics tätig. Stationen waren unter anderem das Marktforschungs- und Beratungshaus BARC, die "Computerwoche" sowie das von ihm gegründete Portal und Magazin für Finanzvorstände CFOWORLD. Seine Themenschwerpunkte sind: Business Intelligence, Data Warehousing, Datenmanagement, Big Data, Advanced Analytics und BI Organisation.
Als Software für "Stream Computing" bezeichnet IBM das neue Produkt InfoSphere Streams. Es soll in Echtzeit strukturierte, unstrukturierte und fehlerhafte Daten erkennen können.

InfoSphere Streams (zuvor auch System S genannt) wurde kürzlich erstmals einer breiteren Öffentlichkeit vorgestellt und kann laut Hersteller in beliebigen Industrien zum Einsatz kommen. Nach eigenen Aussagen ist die Software in der Lage tausende Datenströme (daher der Name stream computing) zeitgleich zu erfassen zu verarbeiten. Als Datenquellen kommen praktisch alle Datentypen in Frage: Bilder, Audio-Streams, Sprache, VoIP, Radio, Web-Traffic, E-Mail, Chat, GPS, Transaktionsdaten, Sensoren-, Satellitendaten und andere.

Ein Anwendungsgebiet ist das Gesundheitswesen. Hier haben IBM und das Institute of Technology der University of Ontario erprobt, ob sich physiologischer Messdaten schwerkranker frühgeborener Babys auf minimalste Änderungen hin umgehend auswerten lassen, um beispielsweise drohende Infektionen schnellst möglichst erkennen zu können. Im April hatte IBM zudem die Ergebnisse von Tests mit einem Prototypen für die Finanzindustrie veröffentlicht.

Steve Mills, Senior Vice President IBM Software (links) und Dr. John Kelly, Senior Vice President IBM Research, betrachten die neue Streaming-Technik.
Steve Mills, Senior Vice President IBM Software (links) und Dr. John Kelly, Senior Vice President IBM Research, betrachten die neue Streaming-Technik.
Foto: IBM

IBM arbeitet intern seit gut sechs Jahren an der neuen Systemarchitektur und den mathematischen Algorithmen für Stream Computing. Als Forschungs- und Testzentrum soll künftig IBMs neue European Stream Computing Center in Irland dienen. Ziel ist es, Daten unmittelbar bei ihrer Entstehen erfassen und auswerten zu können, statt sie zunächst beispielsweise in einem Data Warehouse aufbereiten zu müssen. Dabei soll es möglich sein, bereits vorhandene und laufend neu anfallende Daten bei der Analyse zu kombinieren.

Spade, Semantic Solver oder Eclipse

InfoSphere Streams ist ein reines Softwareangebot und Teil der IBM-Produktreihe InfoSphere. Laut Hersteller können Unternehmen auf verschiedenen Wegen Echtzeitdaten auswerten: Mit Hilfe der speziellen Programmiersprache und Framework Stream Processing Application Declarative Engine (Spade), oder dem integrierten "Semantic Solver", der Anfragen direkt interpretiert, oder mit Hilfe einer auf Eclipse basierenden Entwicklungsumgebung. Zehn Installationen sollen weltweit die futuristische Techniik bereits einsetzen.