Machine Learning

Vom Hype zur Realität

Kommentar  14.08.2017
Von 


Paul Salazar ist Vice President Central EMEA bei Elastic. Er verfügt über 30 Jahre Erfahrung in führenden Positionen  in den Bereichen  Engineering, Produktmanagement, Marketing und Sales, sowohl bei international tätigen Unternehmen als auch Startups im Silicon Valley. Seit 20 Jahren liegt sein Fokus auf Open Source Software-Management und Open Source-Businessmodellen.

Machine Learning unter der Motorhaube

In jüngerer Zeit sind viele Lösungen hervorgekommen, die Machine Learning quasi "unter der Motorhaube" haben und so den Endkunden nur wenig oder überhaupt nicht mit der Komplexität des Themas belasten. Diese Ansätze vereinfachen eine oder mehrere der vorab identifizierten Herausforderungen oder verbergen sie gänzlich. Dies ermöglicht es den Endkunden, schnell und zuverlässig umsetzbare Ergebnisse zu erzielen. Hierbei ist die Implementierung der Machine-Learning-Methoden zwangsläufig weniger flexibel und der Datenwissenschaftler in seinem Handlungsbereich zugegebenermaßen sehr eingeschränkt.

Machine Learning einfach zu implementieren und nutzbar machen: So geht's

Die Überwindung der drei oben beschriebenen Herausforderungen ist der Schlüssel, um Machine Learning einfach zu implementieren und nutzbar zu machen. Zunächst einmal ist es unerlässlich, Daten in einem Standardformat bereitzustellen - mit wenig oder gar keiner Notwendigkeit, sie zu normalisieren oder anderweitig zu gestalten. Dies ermöglicht die verzögerungsfreie Durchführung von Experimenten und bietet zudem die Fähigkeit, einen Datensatz nach dem anderen auszuprobieren und zu sehen, was passiert. In der Anlaufphase einer komplexen Lösung, die Machine Learning einbezieht, ist dies ein kritischer Faktor.

Zweitens ist es wichtig, ein klar definiertes Ergebnis zu haben. Je enger Format und Form der Ergebnisse ausgerichtet werden können, desto effizienter lassen sich hinterher auf Basis der Ergebnisse Maßnahmen ergreifen. Zu viele Auswahlmöglichkeiten führen zur sogenannten "Paralyse durch Analyse" und verlangsamen den Prozess.

Und zu guter Letzt sorgen leicht verständliche Darstellungen der Ergebnisse dafür, dass die Resultate für ein größeres Spektrum an Endkunden verwertbar werden. Komplexe Ergebnisse, die eine Interpretation durch den Datenwissenschaftler nötig machen, werden einer breiten Annahme entgegenwirken. Dazu wird es die Fähigkeit von Organisationen, umsetzbare Ergebnisse aus ihrer Machine-Learning-Analyse zu gewinnen, erheblich verlangsamen.

Schlussfolgerungen

Für eine weiter verbreitete Nutzung und Annahme von Machine Learning muss es in eine komplette, kostengünstige und einfach zu nutzende Lösung verpackt werden. Die Benutzer benötigen eine Benutzeroberfläche, die wie ein persönlicher Assistent die Auswahl aus vordefinierten Optionen ermöglicht und in bestehenden Standards formatierten Daten bietet. Während der Verarbeitung nur über eine begrenzte Anzahl an Optionen zu verfügen - also eine stark fokussierte Nutzung von Machine Learning -, stellt sicher, dass für die Auswahl der Methoden oder andere Einrichtungsschritte nur wenig Zeit aufgewendet wird.

Mit einer Paketlösung stellen vorgefertigte Visualisierungsvorlagen und standardisierte Datenformate für den Export sicher, dass das Ergebnis schnell analysiert und für die weitere Verwendung im Geschäftsablauf weitergeleitet werden kann. Das Wichtigste ist, dass eine gut gestaltete Verpackung des Ganzen zu einer breiteren Annahme und Nutzung von Machine Learning führt und dem Unternehmen somit das Potential für einen exponentiellen Wertzuwachs bietet.

Ein in Vollzeit beschäftigter Datenwissenschaftler kann eine solche Paketlösung fast immer übertreffen. Allerdings ist dies in der Regel mit erheblichen Kosten und einem entsprechenden Zeitaufwand verbunden. Außerdem ist ein solcher Ansatz weder skalier- noch wiederholbar. Selbst dort, wo fokussiertere ML-Methoden eingesetzt werden, bieten Paketlösungen Unternehmen einen hervorragenden Ausgangspunkt, um ein weitaus breiteres Datenspektrum zu erkunden und die Leistung eines dedizierten Datenteams produktiver und effektiver einzusetzen.