KI-Herausforderungen lösen

Mit Datenmanagement zur KI

29.06.2020
Anzeige  Daten sind heute ein wichtiger Erfolgsfaktor in Data-Science- und KI-Projekten. Um eine hohe Ergebnisqualität zu gewährleisten, muss vorab geklärt werden, welche Daten auf welche Weise gesammelt, organisiert und analysiert werden sollen. Die KI-Leiter kann dabei helfen.
Um KI erfolgreich anzuwenden müssen wie auf einer Leiter mehrere Stufen überwunden werden.
Um KI erfolgreich anzuwenden müssen wie auf einer Leiter mehrere Stufen überwunden werden.
Foto: Ollyy - shutterstock.com

Unternehmen, die auf künstliche Intelligenz (KI) und Data Science setzen, sind für die Zukunft bestens gerüstet. Mithilfe von Daten und lernenden Maschinen können Betriebe jeder Größe und Branche immense Wettbewerbsvorteile erzielen. So sind datenaffine Unternehmen in der Lage, schneller auf Marktveränderungen zu reagieren und sie ziemlich präzise vorherzusehen. Sie verstehen ihre Kunden und Mitarbeiter besser und wissen, was diese brauchen. Und sie können ihre Maschinen optimal warten und pflegen und beispielsweise Ausfälle frühzeitig verhindern.

Ein Selbstläufer sind intelligente Systeme allerdings nicht. Vielmehr gibt es im Vorfeld eine ganze Reihe von Herausforderungen zu bewältigen und Fragen zu beantworten: Welche Voraussetzungen müssen etwa für KI-Anwendungen erfüllt sein? Welche Geschäftsprobleme lassen sich überhaupt mit KI-Methoden lösen? Welches Know-how und welche Skills sind erforderlich? Und mit welchen Methoden und Verfahren soll gearbeitet werden?

Mit die größte Herausforderung aber sind bei KI-Anwendungen die Daten. Qualitativ hochwertige, vollständige, passende und vertrauenswürdige Daten bilden die Basis dafür, KI-Modelle optimal zu trainieren und zu generieren. Erst wenn genügend solcher Daten vorliegen, können hochwertige KI-Anwendungen erstellt und sinnvolle Aussagen getroffen werden, auf deren Basis dann Vorhersagen, Bewertungen und Empfehlungen möglich sind.

Wo sind die Daten? - Daten sammeln

Zunächst muss klar sein, welche Daten überhaupt benötigt werden. Oftmals ist schon dieser erste Schritt - das Sammeln der Daten - nicht trivial, da beispielsweise Produktionsanlagen erst einmal dazu befähigt werden müssen, Daten zu übermitteln. Denn gerade viele ältere Anlagen sind dafür nicht entwickelt worden. Aber selbst wenn ein Unternehmen die für KI-Anwendungen notwendigen Daten bereits besitzt, heißt das nicht, dass das Datenproblem gelöst ist.

Damit sich die Daten für KI nutzen lassen, ist erst einmal zu klären, welche Datenquellen zur Verfügung stehen und wie man die Datenquellen anzapfen kann. Oft sind Daten ungeordnet und fragmentiert und liegen verteilt in unterschiedlichen Silos vor. Um die Daten zu nutzen, muss diese Datengrundlage daher zunächst geordnet, kuratiert und aufbereitet werden. In KI-Projekten nimmt 50 Prozent der Zeit allein die Vorverarbeitung der Daten ein, hat das Fraunhofer-Institut IKIS herausgefunden.

Im Vorteil sind hier Unternehmen, die im großen Stil in Big Data-Infrastrukturen und Data Lakes investiert haben, um die unternehmenseigenen Daten zusammenzuführen und zentralisiert nutzbar und auswertbar zu machen. Firmen, die hier nicht so gut aufgestellt sind, müssen sich die Daten erst mühsam zusammensuchen.

Wie gut sind die Daten? - Qualität auf dem Prüfstand

Eine weitere zentrale Frage ist die Qualität der Daten. Sind die Daten schlecht, stimmen die Ergebnisse nicht. Business-Entscheidungen werden dann möglicherweise falsch getroffen - zum Nachteil des Unternehmens. Anwender benötigen also ein belastbares Fundament für ihre datengetriebenen Entscheidungen - und zwar auf der Grundlage einer Qualitätssicherung.

Im KI-Umfeld sind korrekte Daten besonders wichtig. Deren Qualität ist entscheidend für das Training der Algorithmen - und damit für den Output der Systeme. Auch hier gilt: Generell ist ein KI-System nur so gut wie die Daten, auf denen es basiert. Wird mit schlechten Daten trainiert, stimmen die Modelle nicht.

Dass eine schlechte Datenqualität der größte Hemmschuh für KI-Projekte ist zeigen Studien. Laut einer Forrester-Umfrage unter Finanz-, Supply-Chain- und Beschaffungsmanagern ist die schlechte Qualität der Unternehmensdaten das größte Problem bei der Einführung von KI. Nahezu zwei Drittel der Befragten sagten, die schlechte Qualität mache es der KI unmöglich, genaue und informierte Entscheidungen zu treffen. Das untergrabe das Ziel, mit Investitionen in KI Gewinne zu machen.

Eine Leiter für KI

Für die optimale Bereitstellung von Daten für KI-Anwendungen hat IBM die KI-Leiter eingeführt. Sie wird ausführlich im O'Reilly-Report The AI Ladder - Demistifying AI Challenges beschrieben. Bei dieser Leiter steigt man Schritt für Schritt immer höher - von der Sammlung über die Organisation zur Analyse und schließlich zur Nutzung der Daten.

Nur wenn jede der Leitersprossen stabil ist - wenn also jede Aufgabe im Umgang mit den Daten gut und sicher gelöst wird -, können Unternehmen trittsicher bis zur Spitze der Leiter emporsteigen und KI erfolgreich im Unternehmen etablieren. Ist jedoch nur eine der Sprossen morsch, scheitert der Aufstieg vielleicht bereits, bevor er beginnt.

Im Wesentlichen besteht die Leiter aus vier Sprossen:

1. Sprosse: Daten sammeln. Auf der ersten Stufe werden alle Daten gesammelt, die für ein Problem oder Projekt relevant sind. Dazu gehören alle Datenformate wie strukturierte und unstrukturierte Daten und sämtliche Daten aus allen Quellen und Kanälen.

2. Sprosse: Daten organisieren. In der nächsten Stufe werden die Daten business-ready gemacht. Sie werden vervollständigt, bereinigt und datenschutzkonform aufbereitet. In dieser Phase wird für eine möglichst hohe Datenqualität gesorgt.

3. Sprosse: Daten analysieren. Im dritten Schritt werden die Daten analysiert. Das Ziel ist, KI von Grund auf aufzubauen und für bestimmte Prozesse einzusetzen. Dazu muss auch geprüft werden, ob beziehungsweise welche Daten als Trainingsmaterial geeignet sind.

4. Sprosse: KI etablieren. Im letzten Schritt werden die KI-Anwendungen prozess- und bereichsübergreifend im gesamten Unternehmen eingeführt - von der Lohnbuchhaltung über die Kundenbetreuung und das Marketing bis zu Produktion und Logistik.

Die KI-Leiter sollte auf einem soliden Untergrund stehen. Dies ist am besten mit einer offenen, übergreifenden und modernen Informationsarchitektur möglich. Offene Container-Architekturen, die Microservices unterstützen, sind hierfür ideal geeignet. Sie helfen, das Silo-Denken zu beenden, und beschleunigen die Bereitstellung von KI-Anwendungen.

Über die vier Sprossen der KI-Leiter können Unternehmen KI-Anwendungen erfolgreich einführen.
Über die vier Sprossen der KI-Leiter können Unternehmen KI-Anwendungen erfolgreich einführen.
Foto: IBM

Data and AI Forum 2020
Das virtuelle Erlebnis für alle Datenbegeisterten!
Termin: 30. Juli 2020, 10.00 bis ca 17.00
Hier geht's zum Programm und zur Anmeldung
#DAIF