IBM kauft Databand.ai

Mehr Datenqualität für Machine Learning und KI

08.07.2022
Von 
Spezialgebiet Business-Software: Business Intelligence, Big Data, CRM, ECM und ERP; Betreuung von News und Titel-Strecken in der Print-Ausgabe der COMPUTERWOCHE.
Sogenannte Observability-Lösungen sollen helfen, böse Datenüberraschungen zu vermeiden. Dafür hat IBM das Startup Databand.ai gekauft und will dessen Software in seinen KI- und Data-Stack einbauen.
Wer sinnvolle Ergebnisse aus seinen KI-Tools ziehen möchte, muss seine Daten im Blick behalten.
Wer sinnvolle Ergebnisse aus seinen KI-Tools ziehen möchte, muss seine Daten im Blick behalten.
Foto: Alex SG - shutterstock.com

IBM hat das israelische Startup Databand.ai übernommen. Das 2018 gegründete Softwarehaus hat eine sogenannte Observability-Suite entwickelt. Die Software zur Datenbeobachtung soll Unternehmen dabei helfen, Probleme mit ihren Daten möglichst schnell und automatisiert zu erkennen und zu beheben. Damit soll sich beispielsweise verhindern lassen, dass fehlerhafte Daten Machine-Learning- und KI-Workloads verfälschen und das Management mit irreführenden Ergebnissen zu schlechten Entscheidungen verleiten.

Mit der Akquisition ergänzt IBM sein Softwareportfolio in den Bereichen Daten, KI und Automatisierung. Databand.ai ist schon die fünfte Übernahme von IBM im laufenden Jahr. Seit Arvind Krishna im April 2020 als CEO das Ruder beim IT-Pionier übernommen hat, wurden mehr als zwei Dutzend IT-Firmen aufgekauft.

Die Mitarbeiter von Databand.ai mit Hauptsitz in Tel Aviv sollen im IBM-Bereich Data and AI aufgehen und dort das Portfolio einschließlich der Watson-Funktionen und IBM Cloud Pak for Data weiter ausbauen. Finanzielle Details der Transaktion gaben die Unternehmen nicht bekannt. Die Übernahme wurde bereits am 27. Juni 2022 abgeschlossen.

Mehr Daten - mehr Qualitätsprobleme

Angesichts der rasant wachsenden Datenmengen hätten Unternehmen Schwierigkeiten, den Zustand und die Qualität ihrer Daten richtig einzuschätzen, hieß es von Seiten IBMs. Daher sei Software für die Datenbeobachtung zunehmend wichtig für Datenteams und Data Scientists in den Unternehmen. IBM zufolge geht es darum, den Zustand der Daten in den IT-Systemen besser zu verstehen und Probleme wie Anomalien, fehlerhafte Datenveränderungen beziehungsweise falsch konfigurierte Daten-Pipelines automatisch und möglichst in Echtzeit zu identifizieren und zu beheben. Nach Angaben von Gartner kostet schlechte Datenqualität jedes einzelne Unternehmen durchschnittlich 12,9 Millionen Dollar pro Jahr.

Arvind Krishna, CEO von IBM, setzt auf Übernahmen, um sein Softwareportfolio zukunftsfähig auszurichten.
Arvind Krishna, CEO von IBM, setzt auf Übernahmen, um sein Softwareportfolio zukunftsfähig auszurichten.
Foto: drserg - shutterstock.com

Die Databand.ai-Lösung nutzt historische Trends, um Statistiken über Daten-Workloads und Data-Pipelines direkt an der Quelle zu berechnen. So soll sich feststellen lassen, ob die Datenqualität für ML- und KI-Ansprüche ausreicht beziehungsweise an welchen Stellen es zu Problemen kommen könnte. Die Plattform lässt sich als SaaS-Lösung betreiben sowie in der Enterprise-Version auch im eigenen Rechenzentrum installieren. An das Datenradar ließen sich verschiedene Quellen anbinden, vom Data-Lake über Streaming-Plattformen bis hin zu klassischen Datenbank- und Data-Warehouse-Lösungen.

Was ein Data Scientist können muss

Databand plus Instana - den Daten auf der Spur

IBM plant offenbar, Databand.ai mit seiner Lösung IBM Observability by Instana APM zu verknüpfen. So könnten Databand.ai-Funktionen Datenanalysten zum Beispiel warnen, wenn Daten, die sie für ein Analysesystem verwenden, unvollständig sind oder sogar fehlen. Da diese Daten üblicherweise aus Business-Anwendungen stammen, könne Instana den Anwendern dann im nächsten Schritt helfen zu klären, woher die fehlerhaften Daten stammen beziehungsweise warum ein Anwendungsservice schlechte oder gar keine Daten liefert. Gemeinsam würden Databand.ai und IBM Instana eine vollständigere und besser erklärbare Sicht auf die gesamte Anwendungsinfrastruktur und das Datenplattformsystem bieten, versprechen die IBM-Verantwortlichen.

"Datengetriebene Unternehmen sind auf qualitativ hochwertige, vertrauenswürdige Daten angewiesen, um ihre geschäftskritischen Prozesse voranzutreiben", sagte Daniel Hernandez, General Manager für Daten und KI bei IBM. Mit Databand.ai biete IBM die notwendigen Observability-Funktionen, um im großen Maßstab vertrauenswürdige Daten für KI bereitzustellen.

Aus Sicht von Josh Benamram, Mitbegründer und CEO von Databand.ai, ist es ein großes Problem für Unternehmen, wenn sie nicht sehen können, dass ihre Datenplattform ineffektiv oder gar fehlerhaft funktioniert. Es gehe darum, böse Datenüberraschungen zu vermeiden, indem Probleme erkannt und behoben werden, bevor sie kostspielige Auswirkungen auf das Geschäft hätten.