Aus Spiel wird Ernst: Business Analytics mit IBM Watson

Kognitive künstliche Meetings intelligenter und effizienter planen

05.08.2015 von Klaus Hauptfleisch
IBM Watson ist ein fast menschlich kommunizierendes, kognitives Computerprogramm, das zunächst mit Daten gefüttert wurde, um in der US-Quizshow Jeopardy zu glänzen. Es wird aber auch schon in der Krebsforschung eingesetzt, lernt Japanisch und zu kochen.
Bei Jeopardy war Watson mit diesem Avatar vertreten, der bald zum Logo des Systems werden sollte. Im Februar 2011 hat es in der US-Quizshow die Supercracks Ken Jennings und Brad Rutter haushoch besiegt. Das hat aber etwas Anlauf gebraucht.
Foto: IBM

Viele Erfindungen der Weltgeschichte hatten ihr Debut als Attraktion auf dem Jahrmarkt, IBM Watson im Frühjahr 2011 in der Fernsehquizshow Jeopardy. Aber wenn ein Unternehmen bereit ist, nach so kurzer Zeit eine Milliarde Dollar zu investieren und ein Heer von 1.000 Mitarbeitern dafür aufzustellen, dann steckt sicherlich mehr dahinter als eine moderne Jahrmarktattraktion. Tatsächlich geht es um Cognitive Computing und die aus dem DeepQA-Forschungsprojekt weiterentwickelte natürliche Sprachverarbeitung für gestellte Fragen, auch Natural Language Question Answering Systems genannt, einer der wichtigsten Wachstumstrends für Big Blue.

Watson-Ratgeber und die Preisfrage

Das Hauptquartier von Watson befindet sich „standesgemäß“ am Aston Place, Teil von New Yorks Silicon Alley.
Foto: IBM

Ein solches QA-System wurde 1971 schon recht erfolgreich bei der Auswertung der von einem Apollo-Flug zurückgebrachten Mondgesteinsproben eingesetzt. IBM hat es nicht erfunden, sieht sich aber seit Jahrzehnten an der Front bei der Entwicklung von Spracherkennungs- und intelligenter Software. "Diese wird nun in der Watson Group zusammengefasst", erklärt Vertriebsleiter Wolfgang Hildesheim, der die Watson Group in Europa mit aufbaut. Im Vordergrund steht ihm zufolge die Software. Die Diskussion um Supercomputer und Flops geht ihm dabei völlig an Watson vorbei. Denn Grundlage für den Einsatz von Advisor genannten analytischen Modulen ist eine Softwarelizenz für den Watson Explorer 10.0 Advanced Edition. Diese Lizenz wird sowohl als Teil eines Komplettsystems mit einem leistungsstarken Rechnerverbund angeboten als auch als Software as a Service (SaaS) über die Cloud, um von jedem Gerät von überall auf der Welt darauf zugreifen zu können. Gerade erst Mitte April hat IBM eine neue Watson Health Unit auf den Weg gebracht.

"Es gibt eine Reihe von Watson-Modulen. Bei den größeren Watson-Applikationen wie dem Watson Oncology Advisor oder dem Watson Wealth Management Advisor sind viele der Module miteinander kombiniert", schickt Hildesheim der im Internet diskutierten Preisfrage voraus. Bei den beiden zuletzt genannten Anwendungen sind inklusive der Anlernkosten und unabhängig von der Betriebsart (im eigenen Rechenzentrum oder als SasS) mehrere Millionen Euro zu veranschlagen, bei einfacher Wissensverwaltung mit "customized" Arbeitsplätzen und semantischen Funktionalitäten würde sich so ein System schon für einen sechsstelligen Betrag realisieren lassen.

Gesundheit ist ein wichtiges Thema für IBM

"Bedenkt man, dass Krebs eine der schwersten und teuersten Krankheiten auf unserem Planeten ist, dann ist der Watson Oncology Advisor zur Unterstützung klinischer Tests und zur Bewertung von Behandlungsmethoden gar nicht mal so teuer", unterstreicht der Europavertriebschef.

Wie im März 2015 bekanntgegeben, will Big Blue mit Watson helfen, die Gesundheitsdaten von iPhone- und Apple-Watch-Nutzern auszuwerten, um diese Daten dann Forschungseinrichtungen und Kliniken zur Verfügung zu anzubieten. Die Grundlage dafür hat Apple mit HealthKit und der Open-Source-Plattform ResearchKit gelegt. Auf deren Basis sollen Forschungseinrichtungen und Universitätskliniken zur Erhebung von Gesundheits- und Fitnessdaten jeweils eigene Apps entwickeln können.

"Wir wollen das analytische Gehirn hinter HealthKit und ResearchKit sein", wird IBM-Manager John E. Kelly in den Medien zitiert. Der Pharmazie- und Konsumgüterhersteller Johnson & Johnson wolle Watson als Coaching-System für Übungen nach Rückenoperationen oder Einsatz künstlicher Gelenke einsetzen. Der Medizintechnik-Hersteller Medtronic plant smarte Insulinpumpen, die dem Nutzer jeweils die richtige Dosis verabreichen, so das Hamburger Wochenmagazin Zeit unlängst.

Mehr Anwendungsbeispiele - auch für Otto-Normal-Verbraucher - ergeben sich aus einem anderen Bereich, der künftig immer mehr Bedeutung erlangen dürfte. Gemeint ist das um Watson entstandene Ökosystem, das stetig wächst und um das sich nicht nur hochzahlte Entwickler versammeln, sondern auch Studenten oder einfach nur Enthusiasten, die sich selbst an Watson-Apps versuchen wollen.

Das Watson Headquarter
Das Hauptquartier von Watson befindet sich „standesgemäß“ am Aston Place, Teil von New Yorks Silicon Alley.
Watson-Avatar
Bei Jeopardy war Watson mit diesem Avatar vertreten, der bald zum Logo des Systems werden sollte. Im Februar 2011 hat es in der US-Quizshow die Supercracks Ken Jennings und Brad Rutter haushoch besiegt. Das hat aber etwas Anlauf gebraucht.
Holpriger Jeopardy-Start
Das Erscheinen des 74-fachen Jeopardy-Gewinners Jennings 2004 in einem Restaurant gilt als Geburtsstunde von Watson. Ein Jahr später hat man begonnen, das aus dem DeepQA-Projekt weiterentwickelte System mit früheren Jeopardy-Fragen und den richtigen Antworten zu füttern. Aber noch bis zum großen Sieg Anfang 2011 ist Watson immer wieder über Fangfragen und semantische oder kontextuelle Ungereimtheiten gestolpert.
Anfangs noch raumfüllend
Der 2011 bei Jeopardy für Watson eingesetzte Superrechner war damals noch mehr als schrankgroß. Denn er musste Platz für 90 IBM Power 70 Server mit Power7-Prozessoren bieten, die durch Multithreading 2.880 CPU-Kerne mit 16 Terabyte RAM zur Verfügung stellen, um in einer Sekunde 500 GB an Daten verarbeiten zu können.
Watson-Entscheidungsprozesse
Kognitiv weiß Watson, Sachverhalte zu beobachten, zu interpretieren und zu bewerten, um schließlich wie in der US-Quizshow Jeopardy eine Entscheidung zu treffen.
Watson Health Unit
Produktmanagerin Leanne LeBlanc zeigt hier, wie sich über eine Million Gigabyte an Gesundheitsdaten, die bei einem Menschen in seinem Leben zusammen kommen, über ein Tablet abrufen lassen.
Watson im Kampf gegen Leukämie
Am Andy Anderson Center der University of Texas MD Anderson Cancer Center nutzt die Leukämiespezialistin Courtney DiNardo Watson bei der Visite, um Einsicht in die Patientendaten zu nehmen.
Watson Analytics für jedermann
Wie Watson Analytics zu jedermann finden soll, zeigt dieses Bild.
Watson geht nach Japan
Anfang April 2015 wurde bekannt, dass Japans Mobilfunkriese SoftBank Mobile den Kundenservice in den Shops und im Callcenter mit IBM Watson vorantreiben will. Dazu ist aber nötig, dass das System Japanisch lernt, denn ohne dem geht nichts im Land der aufgehenden Sonne.
OCR-Fallen
Das komplexeste chinesische Zeichen besteht aus vier dieser Drachen mit jeweils 16 Strichen (s.o. links) und bedeutet schwatzhaft. Sind die chinesischen oder japanischen Kanji-Zeichen in Regelschrift und nicht zu klein ausgedruckt, sind sie ähnlich wie QR-Codes für OCR-Programme oft leichter lesbar als viele andere Schriften. Watson wird den Sinn wohl blitzschnell über den Kontext erfassen, auch wenn der rechte Strich jeweils nicht wie gepinselt aussieht.

Starker Zuwachs für die Watson Developer Cloud

IBM bleibe zwar eine B2B-Company und richte sich mit kognitiven Systemen in erster Linie an B2B-Kunden und an Anwender in Highend-Bereichen wie der Forschung und Krebstherapie. "Mit der Watson Developer Cloud als ‚Watson Ecosystem‘ verfolgen wir aber ebenso die Strategie, die Technologie auch in eine breitere Öffentlichkeit zu tragen", erklärt Hildesheim. Durch die Übernahme von AlchemyAPI hat die Watson Developer Cloud nicht nur rund 40.000 Entwickler hinzugewonnen. AlchemyAPI gilt auch als führender Anbieter von kognitiven, semantischen APIs (Programmierschnittstellen). Diese verhalten sich selbst wie kleine Apps und tragen dazu bei, dass heute Smartphone-Apps und PC-Anwendungen sehr viel schneller entwickelt werden können als mit herkömmlichen Programmiersprachen. Mit Anmeldung eines Zugangs zu IBM Bluemix als "digitale Plattform für Innovationen" über die Cloud kann sich jeder Interessierte an der Beta-Version versuchen, um seine eigene kognitive App zu erstellen.

In der App Gallery im Rahmen der Watson Developer Cloud finden sich so einige interessante Lösungen. Als Beta ist da zum Beispiel ein "Watson Spoken Healthcare" genannter Gesundheitsratgeber mit Frage und Antwort in natürlicher Sprache, eine "People in the News"-App, die die aktuell wichtigsten Personen in den Nachrichten zeigt, sowie eine andere App, die sich "Your Celebrity Match" nennt und über Twitter anzeigt, welcher bekannten Persönlichkeit man selbst am ähnlichsten ist.

Zu den auf der US-Website IBM Watson gezeigten bereits lauffähigen Beispielen gehören "MD Buyline", eine Beschaffungsplattform für das Gesundheitswesen, "Elance", eine Cloud-Lösung, über die App-Anbieter aus einem Pool von über drei Millionen freiberuflichen App-Entwicklern und Spezialisten schöpfen können, und ein "Fluid Expert Personal Shopper", der es dank Watson erlauben soll, in natürlicher Sprache Fragen zu stellen, wo man ein bestimmtes Produkt am besten beziehen kann und was beim Kauf zu beachten ist.

Was Watson kann und was nicht

Wie Watson Analytics zu jedermann finden soll, zeigt dieses Bild.
Foto: IBM

Eine Maus von einem Elefanten zu unterscheiden und entsprechend zu benennen, gehört noch zu den leichtesten kognitiven Übungen für IBM Watson. Das modular aufgebaute und erweiterbare Computerprogramm ist ein kognitives System, das durch hoch oder massiv parallelisiert ablaufende Softwareroutinen in der Lage ist, vorher eingegebene Informationen und unter anderem auch in menschlicher Sprache gestellte Fragen zu "verstehen", um daraus zu lernen und automatisiert Antworten zu geben. Hildesheim wehrt sich jedoch gegen die gerne in Deutschland aufgestellte Schreckensszenarien, "dass die Computer die Macht übernehmen und kreativer als die Menschen werden", um sie gar ihrer Jobs und Lebensgrundlage zu berauben.

"Watson macht letztendlich das, was Sie ihm beibringen. Es handelt sich um ein hochspezialisiertes System, das genau die Dinge analysiert, über die Sie eine tiefere Erkenntnis suchen. Es kann im Grunde auch nur über die Dinge ‚nachdenken‘, mit denen es vorher gefüttert wurde und welche Logik ihnen mitgegeben wurde", führt Hildesheim aus und als Beispiel Reparaturberichte in Kfz-Werkstätten an. Watson könne anhand von Vergleichsdaten Informationen liefern, dass zum Beispiel der Ausfall eines Sensors zu 80 Prozent Ursache des betreffenden Problems sein könnte.

Gerade die deutsche Automobilindustrie zeige sich daher sehr interessiert an Watson, sagt der IBM-Manager. Aber für die Fahrzeugentwicklung und das Design eigne sich Watson ebenso wenig wie zum "Schreiben von Aufsätzen oder gar Liebesgedichten", betont der promovierte Elementarteilchenphysiker.

Predictive-Eigenschaften

Am Andy Anderson Center der University of Texas MD Anderson Cancer Center nutzt die Leukämiespezialistin Courtney DiNardo Watson bei der Visite, um Einsicht in die Patientendaten zu nehmen.
Foto: IBM

Als solcher erklärt er das im Zusammenhang mit Watson oft genannte Predictive Computing mit den im Kern vor 20 Jahren in der Mathematik schon verwendeten Korrelations-Engines, die am Beispiel der Wetterverhältnisse Rückschlüsse oder Prognosen für die jeweilige Ausbeute bei der Sonnenenergie zulassen. IBM biete sehr schnelle Algorithmen, mit denen in multidimensionalen Räumen mit 50 oder gar 100 Parametern eine sehr komplexe Matrix entwickelt werden könne, um über Korrelationen und Wahrscheinlichkeitsrechnung zu Prognosen zu gelangen, um es einfach auszudrücken. Mehrere tausend Anwender an Universitäten nutzen bereits die STPS-Tools von IBM.

Watson-Anwendungen werden in natürlicher Sprache mit Informationen gefüttert, um von dem System "propabilistische Antworten" zu erhalten. Hildesheim zufolge könnte die Frage lauten, welches Präparat bei Brustkrebs mit einem bestimmten Befund und in einem bestimmten Stadium sich am besten eignet. Watson würde dann anhand von Vergleichsfällen gegebenenfalls antworten, dass zu 80 Prozent das Präparat der Firma XY mit dem Wirkstoff YZ am besten anschlage. So gesehen ist Watsons Prognose-Fähigkeit kein Hexenwerk. Wie tief und breit die Korrelationen in welcher Geschwindigkeit erfasst werden können, das hängt natürlich auch von der Hardware ab.

Die nichtige Flops-Debatte

Doch wie bereits erwähnt, geht Hildesheim die Diskussion um Supercomputer und Flops völlig an Watson vorbei. Denn je nach Transaktion und Nutzer lasse sich die Software auch auf einem Desktop-Computer oder auf einem ganz normalen Server betreiben. "Wie viele CPUs Sie für ein Watson-System brauchen, das hängt im Wesentlichen von der Zahl und Komplexität der erforderlichen Transaktionen ab und davon, wie sie aufgerufen werden", so der Manager.

Dabei reicht die unter anderem bei Jeopardy eingesetzte und durch einen Avatar ersetzte Hardware, die übrigens nicht ausschließlich für Watson entwickelt wurde, in Sachen Leistung durchaus an einen Supercomputer heran. Auch wenn sie weit weg von den heutigen Spitzenreitern wie IBMs Sequoia mit 17,17 Petaflops oder dem chinesischen Rekordhalter Tianhe-2 mit 33,86 Petaflops (Billiarden Fließkommaberechnungen pro Sekunde) liegt.

Wie im Februar 2014 beschrieben, handelt es sich bei dem "Watson-Computer" um einen über 10 Gigabit/s-Ethernet geclusterten Rechnerverbund aus 90 IBM-Power-750- Servern mit 3,5 GHz schnellen Power7-8-Kern-Prozessoren, von denen jeder gleichzeitig vier Threads ausführen kann. Somit stehen insgesamt 2.880 Kerne zur Verfügung sowie 16 Terabyte an RAM. Mit 80 Teraflops kann der nicht nur für Watson entwickelte Rechnerverbund 500 GB oder die Datenmenge von rund einer Millionen Büchern pro Sekunde verarbeiten. Aber Watson gibt es ja wie gesagt auch als Software und als SaaS-Lösung über die Cloud.

Die Module und Modelle

Mehrere der Watson-Module sind laut Hildesheim klassische On-Premise-Software, die man käuflich erwerben und auf seinen Rechner ziehen kann, um sie zu implementieren. So wie Watson für Jeopardy vom Internet abgetrennt war, geschieht dies auch bei medizinischen Zwecken, wo dies meist explizit gefordert wird. Oder bei der Vermögensberatung stehen nur auf den jeweiligen Kunden zugeschnittene Informationsfelder mit Finanzdaten etc. zur Verfügung. Einige Module laufen Hildesheim zufolge in der Cloud, weil sie sich dadurch auch sehr gut skalieren lassen. "Andererseits brauchen Sie auch sehr schnelle, clevere Algorithmen und Computer, die sich nicht jeder leisten kann oder will", fügt er hinzu. Da komme das Cloud-Modell mit kognitiven Frage-Antwortsystemen über APIs an den verschiedenen Watson-Rechenzentren manchen Kunden sehr entgegen. Zukünftig sei auch denkbar, Watson als eine Art Mietmodell mit Abrechnung auf Monats- und User-Basis anzubieten.

Anfang April 2015 wurde bekannt, dass Japans Mobilfunkriese SoftBank Mobile den Kundenservice in den Shops und im Callcenter mit IBM Watson vorantreiben will. Dazu ist aber nötig, dass das System Japanisch lernt, denn ohne dem geht nichts im Land der aufgehenden Sonne.
Foto: IBM

Die großen, sehr teuren Anwendungen wie die für die Krebstherapie oder die Vermögensverwaltung nennen sich Advisors, weil sie Experten und Expertensystemen beratend zur Seite stehen sollen. Dazu gehören neben den genannten auch der Watson Discovery Advisor als kognitives System, das in der Forschung schneller zu "Eureka-Momenten" führen soll, und der Watson Engagement Advisor, der als SaaS-Lösung wesentlich zur Verbesserung der Beziehungen zu Kunden und Partnern beitragen soll. Er ist in der Lage, mit Anrufern im Callcenter kontextbezogen in Dialog zu treten. Die ANZ Bank verspricht sich dadurch bessere und schnellere Ratschläge durch ihrer Finanzberater. Die USAA (United Services Automobile Association), die über zehn Millionen derzeitigen und ehemaligen US-Armeeangehörigen eine Heimat in Versicherungs-, Finanz- und Vermögensfragen sein will, kann entsprechende Fragen mit dem Watson Engagement Advisor schneller und effizienter beantworten, heißt es.

Watson will trainiert werden

Bevor es soweit ist, muss Watson aber erst trainiert, also mit Daten und Regeln gefüttert werden. So lernt er selbst, um im Laufe der Zeit immer schnellere und genauere Ergebnisse liefern zu können. "Watson ist nie so schlecht wie am ersten Tag und läuft manchmal nach drei bis vier Jahren erst so richtig zur Höchstform auf", so Hildesheim. Für den Projekterfolg an Krebskliniken ist in der Regel ein monatelanges Training durch Ober- und Chefärzte in enger Zusammenarbeit mit IBM erforderlich, was natürlich auch in der Kostenrechnung berücksichtig werden muss. Mit dem MD Anderson der Universität Texas und dem Memorial Sloan Kettering hat IBM unter anderem zwei der bedeutendsten Krebszentren der USA für Watson gewonnen. Der MD Andersons Oncology Expert Advisor ist laut Hildesheim 1:1 nach Thailand verkauft worden, was die Krebstherapie dort wesentlich vorangetrieben hat.

War Watson anfangs nur auf Englisch als Benutzersprache beschränkt, sind die sechs Basismodule heute in mehr oder weniger guter Qualität in 21 Sprachen verfügbar. Die deutsche Fassung liegt laut Hildesheim sogar in sehr guter Qualität vor, weil Deutschland führend bei der Content Analytics für die Textverarbeitung oder Text Mining sei. Einer der wichtigsten neuen Kunden ist der japanische Telekommunikations- und Medienriese Softbank. Dieser hat sich schon daran gemacht, Teile der Module in die Landessprache zu übersetzen. Dabei gehört Japanisch zu den komplexesten Sprachen der Welt, was auch Watson vor so manche Probe stellen dürfte.

Wie Hildesheim es sieht, sind die kognitiven Fähigkeiten von Watson und ähnlicher Systeme ein Muss für Deutschland, wenn die Bundesrepublik Exportmeister bleiben will, denn: "Es geht darum Expertenwissen anzuwenden und zu demokratisieren, um Industrien wettbewerbsfähiger zu machen."

Fazit

Entgegen aller Verschwörungstheorien und Sorgen, dass intelligente Maschinen sich wie HAL in Stanley Kubricks "2001: Odysee im Weltraum" plötzlich gegen die Menschen wenden, sollte man kognitive Systeme wie IBMs Watson als Riesenchance begreifen. Fragen der Sicherheit dürfen dabei aber ebenso wenig außeracht gelassen werden wie die der Ethik. Nicht alles, was machbar ist, darf auch sein. Die Auswertung von Fitness- und Gesundheitsdaten durch Dritte birgt die Gefahr, dass die Informationen auch an den Arbeitgeber gelangen könnten oder an die Krankenversicherung.