Die vier großen Player im Check

Machine Learning aus der Cloud

28.04.2016
Von 
Björn Böttcher ist Senior Analyst und Data Practice Lead bei Crisp Research mit dem Fokus auf Analytics, BI, datenbasierte Geschäftsmodelle und Künstliche Intelligenz. Mit mehr als 10 Jahren Berufserfahrung in der IT und einem wissenschaftlichen Hintergrund und Fokus stehen moderne Lösungen mit praktischem Nutzen im Fokus seiner Betrachtung.
Ob Predictive Analytics, die Informationsgewinnung aus neuen Datenquellen oder das Durchsuchen alter Bestandsdaten - überall werden Machine-Learning-Algorithmen eingesetzt. Doch was halten die Versprechen der großen Anbieter?

Dass Verfahren aus dem Bereich des Machine Learning immer mehr an Bedeutung gewinnen, zeigt unter anderem die aktuelle Ankündigung von Nvidia: Ein eigens für Deep Learning konzipierter Grafikprozessor betreibt demnächst den Supercomputer Nvidia DGX-1. Wer nicht so tief in die Tasche greifen möchte bei den Investitionen oder den Bedarf momentan noch nicht einschätzen kann, greift indes gerne zu Cloud-Lösungen. Amazon Web Services, Google Cloud Plattform, IBM BlueMix und Microsoft Azure sind momentan die Platzhirsche mit ihren Cloud-Plattformen und bieten mittlerweile auch "Machine Learning-as-a-Service" an.

Die passende Vorhersage

Warum brauchen wir Machine Learning-Algorithmen überhaupt? Nun, sicherlich möchte jeder von uns gerne das Leben möglichst einfach gestalten. Ein großer Schritt in diese Richtung ist die Verwendung von Machine-Learning-Algorithmen. Diese versuchen, Muster in vorhandenen Datenbeständen zu erkennen. Dabei ist es besonders wichtig, die richtigen Muster aufspüren zu wollen - denn man kann in nahezu allen Datenquellen Muster finden und auch Relationen herstellen zu anderen Ereignissen auf der Welt. Stets zu hinterfragen sind jedoch deren Plausibilität und Korrektheit. Wurden sinnvolle Muster erkannt, so kann mit Hilfe von mathematischen Modellen eine Vorhersage auf Grundlage dieser Muster für neue Daten erstellt werden. Das hilft in vielen Bereichen des Lebens und des Geschäfts. Im Leben, da wir uns nicht mehr allzu viel Mühe geben müssen bei der Suche nach neuer Musik, neuen Büchern oder Videos. Im geschäftlichen Umfeld helfen uns die Muster, den Absatz zu steigern, den Gewinn zu erhöhen oder einen besseren Service für die Kunden zu bieten.

Wo es zum Einsatz kommt

Die meisten Machine-Learning-Algorithmen lassen sich für die folgenden klassischen Anwendungsbereiche nutzen:

• Betrugserkennung bei Transaktionen

• Spamerkennung

• Personalisierung von Inhalten

• Dokumentenklassifizierung

• Prognose der Kundenabwanderung

• Automatisierte Lösungsempfehlung für den Kundendienst

• Sentiment-Analysen (beispielsweise positive / negative Meinungen oder Äußerungen)

• Routing-Entscheidungen von Nachrichten

• Analyse von Upselling-Möglichkeiten

• E-Mail-Klassifizierung

• Diagnosesysteme

• Empfehlungssysteme

• ...

Dem menschlichen Hirn bald ebenbürtig: Machine Learning kommt bereits in vielen Bereichen zum Einsatz.
Dem menschlichen Hirn bald ebenbürtig: Machine Learning kommt bereits in vielen Bereichen zum Einsatz.
Foto: a-image - www.shutterstock.com

Um die Anwendungsfälle entsprechend abbilden zu können, steht eine große Toolbox von Machine Learning-Verfahren zur Verfügung. Die gängigsten Verfahren für die oben genannten Einsatzbereiche sind:

• Hauptkomponentenanalyse (PCA)

• Support Vector Machinen (SVM)

• Multi-Klassen und Multi-Label Algorithmen

• Clustering-Verfahren

• Regressionen

• Statistische Funktionen

• Textanalyse

Es stellt sich nun die spannende Frage, welche der verschiedenen Verfahren die relevanten Cloud-Player auf ihren Plattformen in welchem Modell anbieten.

Vier Anbieter – vier Strategien?

Gibt es eine einfache Nutzung von Machine Learning-Verfahren in der Cloud? Dies ist die Frage, welche uns entweder zu einem mächtigen Werkzeug verhilft oder in die Tiefen der Anbieter drängt und unsere Abhängigkeit stärkt. Amazon Machine Learning, Microsoft Azure Machine Learning, IBM Bluemix und Google Prediction API sind die vier Angebote in der Cloud, welche nutzungsbasierten Zugang zu Machine-Learning-Diensten über die Public Cloud bieten.

Auffallend ist, dass alle Anbieter einen relativ einfachen und kostengünstigen Einstieg ermöglichen. Amazon bietet eine gute User Experience, wenn es um die Nutzung von Machine Learning-Diensten geht. Der Nutzer braucht wenig Wissen aus dem Bereich des Machine Learning und kann dennoch über die Weboberfläche Modelle erstellen, welche dann in die eigenen Produkte und Lösungen integriert werden können. Bei IBM und Google sind die Predictive-Dienste ein wenig Code-lastiger und auch die Auswahl von Features und Labels erfolgt hier über die API.

AWS verfolgt beim Machine Learning einen praxis- und entwicklerbezogenen Ansatz, während IBM, Google und vor allem Microsoft mehr in Richtung der Zielgruppe Data Scientists und des modellbezogenen Zugangs gehen.
AWS verfolgt beim Machine Learning einen praxis- und entwicklerbezogenen Ansatz, während IBM, Google und vor allem Microsoft mehr in Richtung der Zielgruppe Data Scientists und des modellbezogenen Zugangs gehen.
Foto: Crisp Research

Bei Microsoft funktioniert der Zugang nach einem anderen Ansatz. Hier bekommt der Nutzer ein graphisches Programmiermodell an die Hand, welches einen Zugang zu Prozessen von Machine Learning ermöglicht. Über Pipelines werden dann die einzelnen Schritte definiert und gegebenenfalls auch durch eigenen Code erweitert. Der fertige Workflow kann dann als Service gestartet werden und wartet dann, wie bei allen anderen Anbietern auch, auf frische Daten, damit das trainierte Modell seine Vorhersage treffen kann.

Ist Machine Learning als Dienst "Cloud-ready"?

In der Tat! Entwickler und Data Scientists können Ihre Machine-Learning-Verfahren für unterschiedliche Anwendungsszenarien direkt in der Cloud nutzen und ausführen. Je nach eigenem Bedarf bieten die Anbieter Zugriff auf die unterschiedlichen Algorithmen, die natürlich am liebsten aus den eigenen Storage-Angeboten befüllt werden.Microsoft bietet eine gute User Experience für Machine-Learning-Prozesse als graphisches Programmiermodell und ermöglicht den Eingriff an jeder Stelle der Pipeline. Damit hat Microsoft das umfangreichste und flexibelste Angebot aus dem Bereich Machine Learning.

AmazonMachine Learning versucht, Machine-Learning-Prozesse zu vermeiden und dem Entwickler eine Art Blackbox für Machine-Learning-Anwendungsszenarien anzubieten. Damit haben auch weniger erfahrene Entwickler die Möglichkeit je nach Anwendungsbereich einen entsprechenden Dienst auszugestalten und dann das Modell trainieren zu lassen und in die eigene Anwendung zu integrieren.

IBM und Googleermöglichen einen Zugang zum Machine Learning über APIs und setzen mehr Verständnis von der Materie voraus. Angemerkt sei noch, dass dieser Analyst View sich allein auf die Machine-Learning-Angebote beschränkt und beispielsweise nicht näher auf die kognitiven Dienste der Anbieter eingeht. Dies folgt in einem späteren Beitrag, der sich auch mit den definitorischen Abgrenzungen von Machine Learning, Deep Learning und Cognitive Computing auseinandersetzt.

Empfehlung für den Einstieg: Start small and scale

Zusammenfassend lässt sich konstatieren, dass es Digitalisierungsentscheider, Data Scientists und Cloud-Profis noch nie so leicht hatten, ihre dynamisch steigenden Datenmengen mit Verfahren des Machine Learning beziehungsweise der Künstlichen Intelligenz zu verarbeiten, zu analysieren und neue wertschöpfende Prozesse und Geschäftsmodelle zu etablieren. Die Einstiegshürde wird durch die Machine-Learning-Angebote der großen Public Cloud-Provider sehr niedrig gelegt. Die Angebote haben vor allem den Charme des "start small" und echter Skalierbarkeit.

Während die Berechnung des ROI (Return on Investment) für eine eigene Machine-Learning-Infrastruktur immer mit Risiken behaftet ist, lässt sich in der Cloud "gemütlich" nach oben oder unten skalieren - je nachdem wie erfolgreich die Analysen und Projekte im eigenen Unternehmen verlaufen. Trotzdem sollte man sich vor dem Einstieg noch intensiver mit den jeweiligen Plattformen und Dienste auseinandersetzen, da deren Angebote, Kostenstruktur und User Experience doch recht unterschiedlich ausfallen. (sh)