FAQ Machine Learning

Was Sie über Maschinelles Lernen wissen müssen

Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.
Das Thema Machine Learning ist in aller Munde. Doch was verbirgt sich hinter dem Begriff - und welche Chancen bieten sich für Unternehmen?

Maschinelles Lernen wird heute mehr und mehr zum Mainstream. Waren selbstlernende Programme noch bis vor wenigen Jahren ausschließlich ein Thema für Universitäten, Forschungseinrichtungen und einige Technologieunternehmen, finden sie heute zunehmend Eingang in ganz normale Produkte und Lösungen. Unser Alltag und unser Geschäftsleben wird immer mehr von intelligenten Programmen bestimmt, die aus Daten lernen und das Gelernte verallgemeinern.

Spracherkennung auf Mobiltelefonen wie dem iPhone oder den Google Handys wird beispielsweise wesentlich von Machine-Learning-Algorithmen gesteuert - ebenso wie Spam-Filter in PCs und Notebooks oder die Gesichtserkennung bei der Verwaltung von Fotos. Oft sind wir auch im Kontakt zu lernenden Systemen, ohne es zu wissen - etwa bei der personalisierten Online-Werbung. Und immer mehr Unternehmen erkennen den Wert von Machine Learning, wenn es darum geht, ihr Business zu optimieren und Kosten zu sparen.

Für die meisten IT-Anwender ist Machine Learning ein unübersichtliches Feld, weil es viele verschiedene konzeptuelle, methodische und theoretische Ansätze gibt. Diese FAQ klärt die wichtigsten Fragen und stellt die zentralen Begriffe, Methoden und Anwendungen vor.

Was ist Machine Learning?

Salopp gesagt ist maschinelles Lernen die Kunst, einen Computer nützliche Dinge tun zu lassen, ohne ihn ausdrücklich dafür zu programmieren. Etwas genauer formuliert ist maschinelles Lernen der Erwerb neuen Wissens durch ein künstliches System. Der Computer generiert analog wie ein Mensch selbstständig Wissen aus Erfahrung und kann eigenständig Lösungen für neue und unbekannte Probleme finden. Dazu analysiert ein Computerprogramm Beispiele und versucht mit Hilfe selbstlernender Algorithmen, in den Daten bestimmte Muster und Gesetzmäßigkeiten zu erkennen. Das Ziel von Machine Learning ist es, Daten intelligent miteinander zu verknüpfen, Zusammenhänge zu erkennen, Rückschlüsse zu ziehen und Vorhersagen zu treffen.

Wie funktioniert Machine Learning prinzipiell?

Im Prinzip so ähnlich wie menschliches Lernen. Analog wie beispielsweise ein Kind lernt, dass auf Bildern bestimmte Objekte zu sehen sind, kann auch ein Computer "lernen", Objekte zu identifizieren oder Personen zu unterscheiden. Dazu wird die Lernsoftware zunächst mit Daten gefüttert und trainiert. Beispielsweise sagen die Programmierer dem System, dass ein bestimmtes Objekt "ein Hund" und ein anderes "kein Hund" ist. Im Fortlauf erhält die Lernsoftware ständig Rückmeldungen vom Programmierer, die der Algorithmus nutzt, um das Modell anzupassen und zu optimieren: Mit jedem neuen Datensatz wird das Modell besser und kann schließlich eindeutig Hunde von Nicht-Hunden unterscheiden.

Computer können lernen, menschliche Gesichter zu unterscheiden. Facebook nutzt das für die automatische Gesichtserkennung.
Computer können lernen, menschliche Gesichter zu unterscheiden. Facebook nutzt das für die automatische Gesichtserkennung.
Foto: Facebook

Welche Vorteile bietet maschinelles Lernen?

Maschinelles Lernen hilft Menschen, effizienter und kreativer zu arbeiten. Zum Beispiel können sie maschinelles Lernen verwenden, um ihre Bilder schneller zu organisieren und zu bearbeiten. Mit Machine Learning können sie auch langweilige oder aufwändige Arbeiten dem Computer überlassen. Papierdokumente wie Rechnungen kann lernende Software selbständig scannen, speichern und ablegen.

Weiterbilden für die Digitalisierung! - Foto: agsandrew/shutterstock.com

Weiterbilden für die Digitalisierung!

Vor allem sind selbstlernende Maschinen in der Lage, für den Menschen sehr komplexe Aufgaben zu übernehmen - etwa die Erkennung von Fehlermustern oder mögliche Schäden in der Fertigung (Predictive Maintenance). Selbst bei der Erkennung von Krebstumoren in der Medizin und bei Therapieempfehlungen helfen inzwischen selbstlernende Programme - und übertreffen dabei oft die besten menschlichen Experten. Diese Fähigkeit, komplexe Zusammenhänge zwischen der Eingabe und der Ausgabe von großen Datenmengen verarbeiten zu können, ist einer der Hauptvorteile von Machine Learning.

Ist Machine Learning dasselbe wie Artificial Intelligence?

Nein. Machine Learning ist ein Teilgebiet von Artificial Intelligence (AI). Im gleichen Sinn sind Logik, Analysis und Stochastik Teilgebiete der Mathematik; Mechanik, Thermodynamik und Quantenphysik Teilgebiete der Physik. Die Artificial Intelligence selbst ist eine Teildisziplin der Informatik und beschäftigt sich allgemein mit der Automatisierung menschlichen intelligenten Verhaltens. Zur Künstlichen Intelligenz - so der deutsche Begriff - gehören neben dem Machine Learning Teilgebiete wie wissensbasierte (Experten-)Systeme, Mustererkennung, Robotik, die Verarbeitung natürlicher Sprache und maschinelles Übersetzen. Allerdings gilt Machine Learning zurzeit als eine der zentralen und erfolgreichsten Artificial-Intelligence-Disziplinen.

Anders als das Bild suggeriert ist Machine Learning ein Teilgebiet von Artificial Intelligence – allerdings ein sehr wichtiges.
Anders als das Bild suggeriert ist Machine Learning ein Teilgebiet von Artificial Intelligence – allerdings ein sehr wichtiges.
Foto: IBM

Warum erlebt Machine Learning gerade jetzt einen Höhenflug?

Maschinelles Lernen beruht auf Forschung im Bereich Mustererkennung, die bereits in den 80er Jahren durchgeführt wurde. Das Gebiet stagnierte dann aufgrund technischer Beschränkungen ziemlich lange. Erst vor wenigen Jahren erlebte Maschinelles Lernen einen Durchbruch mit der Möglichkeit, Daten parallel in Grafikprozessoren (GPUs) zu verarbeiten - die eigentlich für die Videospiele-Industrie entwickelt wurden. Grafikprozessoren besitzen Tausende von Recheneinheiten und sind im Vergleich zu Lösungen mit klassischen CPUs deutlich schneller.

Weitere Entwicklungen wie Multi-Core-Architekturen, verbesserte Algorithmen und superschnelle In-Memory-Datenbanken wie SAP HANA machen das maschinelle Lernen gerade auch für den Unternehmensbereich attraktiv. Ein weiterer wesentlicher Faktor ist die zunehmende Verfügbarkeit großer Mengen strukturierter und unstrukturierter Daten aus einer Vielzahl von Quellen, darunter Sensoren oder digitalisierte Dokumente und Bilder, mit denen sich die Lernalgorithmen "trainieren" lassen.

Die führenden Companies im Machine Learning nutzen für die parallele Verarbeitung der Daten Grafikprozessoren (GPUs) - etwa von Nvidia.
Die führenden Companies im Machine Learning nutzen für die parallele Verarbeitung der Daten Grafikprozessoren (GPUs) - etwa von Nvidia.
Foto: Nvidia

Welche Verfahren werden beim Machine Learning verwendet?

Maschinelles Lernen nutzt mathematische und statistische Modelle, um aus Datenbeständen zu lernen. Im Detail gibt es Dutzende unterschiedlicher Verfahren. Prinzipiell unterscheidet man beim maschinellen Lernen zwischen zwei Systemen: Erstens symbolische Ansätze wie aussagenlogische Systeme, in denen das Wissen - sowohl die Beispiele als auch die induzierten Regeln - explizit repräsentiert ist. Zweitens subsymbolische Systeme wie Künstliche Neuronale Netze, die nach dem Vorbild des menschlichen Gehirns funktionieren und in denen das Wissen implizit repräsentiert ist.

Die algorithmische Umsetzung von Machine Learning geschieht mit überwachtem oder unüberwachtem Lernen. Beim überwachten Lernen lernt das System aus gegebenen Paaren von Ein- und Ausgaben. Dabei stellt ein "Lehrer" während des Lernens den passenden bzw. korrekten Wert zu einer Eingabe bereit. Ziel beim überwachten Lernen ist, dass dem Netz nach mehreren Rechengängen mit unterschiedlichen Ein- und Ausgaben die Fähigkeit antrainiert wird, Verbindungen herzustellen. Beim unüberwachten Lernen erzeugt ein Algorithmus ein Modell, das die Eingaben beschreibt und Vorhersagen ermöglicht. Das Netz erstellt dann selbständig Klassifikatoren, nach denen es die Eingabemuster einteilt.

Wie funktioniert ein Künstliches Neuronales Netz?

Künstliche Neuronale Netze simulieren nach dem Vorbild des Gehirns ein Netzwerk aus miteinander verbundenen Neuronen. Sie lernen aus Erfahrung, indem sie die Verbindungsstärke der simulierten Neuronenverbindungen verändern. Auf diese Art und Weise können sich Maschinen Fähigkeiten wie Sehen, Hören, Sprechen, Lesen und Schreiben aneignen. Um sie für diese Fähigkeiten zu trainieren, werden Methoden des überwachten Lernens angewendet.

Der Lernprozess läuft grob gesagt wie folgt ab: Zunächst lernt das Netz in der Trainingsphase anhand des vorgegebenen Materials. Der "Trainer" gibt dem Netz eine Reihe von Beispielen und wiederholt das Ganze. Für jedes Beispiel ist bekannt, was die gewünschte Ausgabe sein soll. Stimmt die Ausgabe des Netzes für ein Beispiel mit dem gewünschten Output überein, dann braucht nichts weiter getan zu werden. Weichen tatsächliche und gewünschte Ausgabe voneinander ab, dann müssen die Verbindungsstärken bzw. Gewichte im Netz so verändert werden, dass sich der Fehler bei der Ausgabe verringert.

Je größer der Betrag des Gewichtes ist, desto größer ist der Einfluss eines Neurons auf ein anderes Neuron. Ein positives Gewicht übt auf ein anderes Neuron einen erregenden, verstärkenden Einfluss auf, ein negatives einen hemmenden. Das Gewicht der Verbindung bestimmt also maßgeblich, ob ein Neuron von einem anderen beeinflusst wird. Es ist einer der entscheidenden Faktoren für Lernvorgänge, man kann sagen: Das Wissen eines neuronalen Netzes ist in den Gewichten gespeichert. Dieser Trainings-Prozess erfolgt im Idealfall so lange, bis alle Beispiele richtig berechnet werden. Der ganze Lernprozess ist also ein iterativer Vorgang bei dem ein spezieller Algorithmus die Gewichte so einstellt, dass der Output möglichst genau dem bekannten Ergebnis entspricht.

Was ist Deep Learning?

Deep Learning ist die derzeit erfolgreichste Implementierung eines Künstlichen Neuronalen Netzes. Zugleich ist Deep Learning inzwischen auch das am weitesten verbreitete maschinelle Lernverfahren und wird von großen IT-Unternehmen wie Google, Apple oder Facebook eingesetzt. Die Spracherkennung von iPhone "Siri" basiert beispielsweise auf Deep Learning. Eines der wichtigsten Einsatzgebiete für Deep Learning ist neben der Sprachverarbeitung das Erkennen von Objekten in Bildern.

Das Verfahren macht viele Arbeitsschritte klassischer Neuronaler Netze überflüssig, weil der Computer alle Zwischenschritte übernimmt. Der Forscher muss dem Neuronalen Netzwerk lediglich Daten wie zum Beispiel Bilder präsentieren; wie diese zu identifizieren sind, findet das Netz dann ganz von allein heraus.

Deep Learning verwendet den analogen Mechanismus, wie ein Kleinkind beispielweise den Begriff "Hund" lernt: Zunächst werden dem Computerprogramm Trainingsdaten zur Verfügung gestellt, beispielsweise eine Reihe von Bildern, von denen ein Mensch jedes mit den Meta-Tags "Hund" oder "nicht Hund" markiert hat. Das Programm verwendet die Informationen, die es aus den Trainingsdaten erhält, um ein Feature-Set für Hunde zu erzeugen und ein Vorhersagemodell zu bauen.

Die Einheiten der ersten Ebene registrierten lediglich Helligkeitswerte der Pixel. Die nächste Ebene würde erkennen, dass einige der Pixel zu Linien verbunden sind, woraufhin die darauffolgende zwischen horizontalen und vertikalen Linien unterscheidet. Dies geht so weiter bis schließlich eine Ebene erreicht wird, in der Beine unterschieden werden können.

In einem weiteren Modell würde der Computer vielleicht vorhersagen, dass alles in einem Bild, das vier Beine hat, ein Hund ist, bis er schließlich soweit ist, Hunde von Nicht-Hunden unterscheiden zu können. Bei jeder Iteration wird das Vorhersagemodell, das der Computer erstellt, immer komplexer und genauer.

Deep Learning Verfahren lernen erst Low-Level Elemente wie Helligkeitswerte, dann Elemente auf mittlerer Ebene und schließlich High-Level Elemente wie ganze Gesichter.
Deep Learning Verfahren lernen erst Low-Level Elemente wie Helligkeitswerte, dann Elemente auf mittlerer Ebene und schließlich High-Level Elemente wie ganze Gesichter.
Foto: Nvidia

Kann Machine Learning mit menschlichen Lernen mithalten?

Ja. Das beweisen immer wieder Mensch-Maschine-Wettkämpfe, die höchste kognitive Fähigkeiten erfordern. So hat IBMs kognitives lernbasiertes System Watson in einem TV-Wissensquiz schon im Jahr 2011 die menschlichen Kandidaten klar geschlagen. Im letzten aufsehenerregenden Mensch-Maschine Wettkampf besiegte Googles AlphaGo Machine-Learning-System Anfang 2016 den amtierenden Go-Weltmeister in einem Spiel über fünf Runden deutlich mit 4:1. AlphaGo nutzte eine Variante des Deep-Learning-Verfahrens.

Das asiatische Strategiespiel galt bisher aufgrund seiner Komplexität als zu kompliziert für Computer, weil es eine nahezu unbegrenzte Zahl möglicher Positionen gibt. Die Spieler müssen sich daher meist auf ihre Intuition verlassen. Der entwickelte AlphaGo-Algorithmus hilft Google nun unter anderem beim Stromsparen. Mithilfe des Algorithmus konnte in Googles Rechenzentren der Energieverbrauch um 15 Prozent verringert werden.

Maschine schlägt Mensch: 2016 besiegte Googles Machine Learning System AlphaGo den Weltmeister im Spiel Go.
Maschine schlägt Mensch: 2016 besiegte Googles Machine Learning System AlphaGo den Weltmeister im Spiel Go.
Foto: Google

Was sind die populärsten Anwendungen maschinellen Lernens?

Maschinelles Lernen findet man bei den Empfehlungsdiensten von Amazon und Netflix ebenso wie bei der Gesichtserkennung von Facebook. Die Möglichkeit, einzelne Mitglieder mit ihren Namen auf Bildern zu markieren, hat bei Facebook zur weltweit größten Sammlung von Gesichtern in einer Datenbank geführt. Diese Daten kann Facebook nutzen, um Maschinen gezielt auf visuelle Erkennung zu schulen.

Auch hinter E-Mail-Anwendungen, die automatisch Spam erkennen, stecken maschinelle Lernverfahren. Der Computer analysiert die Daten, die in der E-Mail enthalten sind, und kategorisiert diese gemäß den erkannten Mustern als Spam oder Nicht-Spam. Wird eine Nachricht als Junk markiert, lernt der Rechner und kann dadurch Junk-Nachrichten noch besser identifizieren. Ebenfalls angewendet werden Lernverfahren bei der Abwehr von Computerattacken, der Bekämpfung von Internet-Kriminalität und dem Suchmaschinen-Ranking.

Wie lässt sich Machine Learning kommerziell anwenden?

Maschinelles Lernen verwandelt Business-Daten in bare Münze. Unternehmen, die maschinelle Lernverfahren nutzen, können sowohl ihren Umsatz als auch die Kundenzufriedenheit steigern und gleichzeitig Kosten reduzieren. So hilft Machine Learning beispielsweise, die Bedürfnisse von Kunden genauer zu erkennen. Werbemaßnahmen können personalisiert werden. Das verbessert nicht nur das Kundenerlebnis, sondern erhöht auch die Kundenbindung.

Maschinelles Lernen hilft auch, zu erkennen, dass Kunden möglicherweise in nächster Zeit abwandern. Dafür werden zum Beispiel Supportanfragen von Kunden automatisch ausgewertet. Oder man extrahiert aus bereits abgewanderten Kunden diejenigen Merkmale, die sie gemeinsam haben. Selektiert man auf Basis dieser Merkmale Kunden des aktuellen Kundenbestands, erhält man die aktuell abwanderungsgefährdeten Kunden. Diese können dann gezielt "umsorgt" werden.

Im telefonischen Kundenservice werden schon heute immer mehr Chat-Bots eingesetzt - automatisierte Programme, die mit dem Kunden kommunizieren. Durch die Sammlung von Stimmdaten in verschiedenen Situationen kann der Chat-Bot seine kognitive Fähigkeit zur Interpretation des Umgangstons verbessern. Und noch viel wichtiger: Der Bot kann den Anruf an einen Call-Center-Mitarbeiter weiterleiten, wenn ein komplexeres Problem vorliegt.

Durch den automatischen Abgleich von Lebensläufen kann maschinelles Lernen helfen, schneller die besten Kandidaten für eine Stelle zu finden. Sie können strukturierte und unstrukturierte Kontextinformationen analysieren und automatisch Berichte generieren. Statt in der Versicherungsbranche jede Forderung manuell von einem Mitarbeiter prüfen zu lassen, können Versicherungsunternehmen Maschinen einsetzen, um in simplen Versicherungsfällen eine Vorentscheidung zu treffen und ein Antwortschreiben aufzusetzen.

Maschinelles Lernen ist auch eine Schlüsseltechnologie für die Entwicklung autonomer Systeme: kollaborative Roboter, die mit ihren menschlichen Kollegen Hand in Hand arbeiten, gehören ebenso dazu wie selbstfahrende Autos.Auch jenseits rein kommerzieller Anwendungen sind die Einsatzgebiete fast unendlich: Automatisierte Diagnoseverfahren, Erkennung von Kreditkartenbetrug und Aktienmarktanalysen sind häufige Anwendungen. Selbstlernende Programme können sogar helfen, Leben zu retten. Forscher der University of Liverpool trainierten beispielsweise ein Programm erfolgreich darauf, die Muster von Landminen in den Daten von Radar- und Akustiksensoren zu erfassen.

Welche Anbieter sind die Technologieführer beim Maschinellen Lernen?

Die großen Internet- und Technologiekonzerne IBM, Google, Microsoft, Facebook, Amazon und Apple investieren viele Millionen in Machine Learning und nutzen es sehr intensiv. IBMs Supercomputer Watson ist die populärste Appliance für maschinelles Lernen, die zum Beispiel im Finanz- und Gesundheitswesen eingesetzt wird und die wirksamsten Therapien für Patienten findet. Apple nutzt maschinelles Lernen bei seinem Spracherkennungssystem Siri, Microsoft bei Cortana, Facebook bei der Bilderkennung und Google bei vielen seiner Dienste wie im Suchmaschinen-Ranking oder den Bilddiensten.

Alle diese Hersteller bieten viele unterschiedliche Services, die maschinelle Lernverfahren einsetzen und aquirieren immer wieder kleinere Machine-Learning-Startups. In Deutschland hat sich SAP dazu verpflichtet, zukünftig alle Unternehmensanwendungen intelligent zu gestalten und auf breiter Basis zur Verfügung zu stellen. So soll man künftig auf der SAP HANA Cloud Platform auch maschinelles Lernen nutzen können.

IBM Watson integriert mehrere Artificial Intelligence Methoden: Neben maschinellem Lernen sind das Algorithmen der natürlichen Sprachverarbeitung und des Information Retrieval, der Wissensrepräsentation und der automatischen Inferenz.
IBM Watson integriert mehrere Artificial Intelligence Methoden: Neben maschinellem Lernen sind das Algorithmen der natürlichen Sprachverarbeitung und des Information Retrieval, der Wissensrepräsentation und der automatischen Inferenz.
Foto: IBM

Wie kann man Machine-Learning-Anwendungen entwickeln?

Cloud-Anbieter wie Microsoft, IBM, Google und Amazons Webservice-Sparte haben inzwischen eigene Services für maschinelles Lernen geschaffen. Damit können Entwickler ohne spezielles Machine-Learning Know-how intelligente Anwendungen bauen, die aus einem frei wählbaren Datenbestand lernen. Bei IBM heißt diese Plattform Watson, bei Microsoft ist es das Azure ML Studio, bei Amazon ist es Amazon Machine Learning und bei Google Tensorflow und andere Plattformen.

Zudem gibt es inzwischen ein großes Spektrum an freier, qualitativ hochwertiger Open-Source-Software, die maschinelles Lernen für ein breites Publikum von Datenspezialisten und Entwicklern zugänglich macht. Auf Programmiersprachenebene wird besonders Pyhton favorisiert, Weka ist eine auf Java basierende Open-Source-Software mit zahlreichen Lernalgorithmen. Deeplearning4j ist eine in Java programmierte Open-Source-Software, die ein künstliches neuronales Netz implementiert. Apache Spark schließlich bietet ebenfalls ein bekanntes Machine-Learning-Framework auf Open-Source Basis. Sein umfangreiches Angebot an Algorithmen wird ständig überarbeitet und erweitert.