Neue Funktionen

Snowflake baut die Daten-Cloud aus

19.11.2020
Von 
Martin Bayer ist Chefredakteur von COMPUTERWOCHE, CIO und CSO. Spezialgebiet Business-Software: Business Intelligence, Big Data, CRM, ECM und ERP.
Ein Datenmarktplatz, mehr Spielraum für Entwickler, zusätzliche Governance-Richtlinien und die Einbeziehung unstrukturierter Daten – mit neuen Funktionen will Snowflake seine Daten-Cloud ausbauen.
Auf dem Data Marketplace sollen sich Snowflake-Kunden mit Daten und Datendiensten versorgen können.
Auf dem Data Marketplace sollen sich Snowflake-Kunden mit Daten und Datendiensten versorgen können.
Foto: FUN FUN PHOTO - shutterstock.com

Der Cloud-Spezialist Snowflake, der mit Datawarehouse-Anwendungen gestartet war und erst vor zwei Monaten einen fulminanten Börsengang hingelegt hatte, baut seinen Daten-Marktplatz in großen Schritten aus. Nutzer finden dort künftig auch zusätzliche Dienste von professionellen Data-Services-Anbietern.

Solche Datendienstleister sollen etwa Datenpools von Unternehmen anreichern, indem sie zum Beispiel Risikobewertungen aufgrund der vorgefundenen Daten vornehmen oder anhand von Datensätzen Prognosen zum Kundenverhalten oder auch zu Geschäftsrisiken abgeben. Nutzer des Data Marketplace können sich Snowflake zufolge einen sicheren und bidirektionalen Live-Zugriff ausschließlich auf solche Daten einrichten, die sie von einem Data Service Provider verarbeitet oder analysiert haben möchten.

Das Geheimnis hinter Snowflake

"Die Data Coud enthält eine riesige Menge an Daten von Snowflake-Kunden und kommerziellen Datenanbietern", sagte Benoit Dageville, Mitbegründer und President of Products. Der Manager spricht von einem starken globalen Datennetzwerkeffekt, der es Unternehmen ermögliche, Innovationen voranzutreiben und sich neue Einnahmequellen zu erschließen.

Snowpark entlastet Entwickler

Neben dem Datenmarktplatz will der Hersteller mit dem neuen Produkt "Snowpark" die Arbeit von Entwicklern sowie Data Engineers und Data Scientists erleichtern. Diese können mit Snowpark Code in den Sprachen ihrer Wahl schreiben und dann Arbeitslasten wie ETL/ELT, Datenvorbereitung und Feature Engineering auf Snowflake ausführen.

Dieses Vorgehen vereinfache die IT-Architektur, stellt der Anbieter seinen Kunden in Aussicht. Verschiedene Daten-Pipelines ließen sich in Snowflakes Kerndatenplattform integrieren und konsolidieren. Letzten Endes könnten so auch die Kosten gesenkt werden, da weniger Systeme in der gesamten Datenarchitektur benötigt würden. Snowpark ist derzeit nur in Testumgebungen verfügbar, gab der Hersteller bekannt. Wann das Werkzeug produktiv für alle Kunden zur Verfügung stehen wird, ist noch nicht bekannt.

Richtlinien für bessere Zugriffskontrolle

Darüber hinaus plant Snowflake, mit seiner Datenplattform in Zukunft auch unstrukturierte Daten wie Audio-, Video-, PDFs, Bilddaten und andere Formate zu unterstützen. Kunden müssten somit keine parallelen Systeme für diese Datentypen betreiben. Nutzer könnten damit auf der Snowflake-Plattform auch Pipelines für unstrukturierte Daten orchestrieren, so wie mit den strukturierten Daten auch. Mit der Integration erhielten sie umfassendere Einblicke in Datenzusammenhänge und könnte damit neue Umsatzmöglichkeiten für sich erschließen, verspricht der Anbieter. Diese Funktion befindet sich derzeit noch in der Private-Preview-Phase.

Ebenfalls als Private Preview sollen noch in diesem Jahr neue Zeilenzugriffs-Richtlinien verfügbar sein. Kunden sollen damit ihre Data Governance verbessern können. Mittels dieser Richtlinien lässt sich festlegen, wer bestimmte Ergebnisse von Datenabfragen sehen kann. Mit Hilfe übergreifender Richtlinien zur Zugriffsbeschränkung müssten sich Anwender nicht mehr bei jeder Einzelabfrage um die betreffenden Einschränkungen kümmern.

Sicherheitsverantwortliche könnten dafür sorgen, dass die Richtlinien auf alle auf der Plattform ausgeführten Arbeitslasten angewendet werden. Beispielsweise lässt sich eine Richtlinie implementieren, dass Vertriebsmitarbeitern nur die Zeilen mit Kundendaten zurückgegeben werden, die für sie relevant sind, und nicht Kundendaten, die mit anderen Vertriebsmitarbeitern verknüpft sind.

Datensilos auflösen

Snowflake baut sein Datawarehouse sukzessive weiter zu einer umfassenderen Data Cloud aus. Diese läuft auf den Infrastrukturen der großen Hyperscaler AWS, Google und Microsoft Azure. Anwender sollen damit Datensilos in ihrer Organisation beseitigen können. "Viele Unternehmen haben diverse SaaS- und Cloud-Provider, ihre Daten liegen fragmentiert an vielen Plätzen", konstatierte Snowflake-CEO Frank Slootman zur Ankündigung der neuen Produkte. Ohne eine Konsolidierung sei es schwer, die Werte aus den Daten zu schöpfen, die man für das Business brauche.

"Wir sind nicht nur eine Data Cloud, sondern auch eine Workflow Executuion Platform", sagt Frank Slootman, CEO von Snowflake.
"Wir sind nicht nur eine Data Cloud, sondern auch eine Workflow Executuion Platform", sagt Frank Slootman, CEO von Snowflake.
Foto: Snowflake

Slootman denkt bereits weiter. Es gehe nicht mehr nur um die Daten an sich, sondern vor allem darum, was sich aus diesen Daten machen lässt. "Wir sind nicht nur eine Data Cloud, sondern auch eine Workflow Execution Platform", stellte der Manager klar. Anwenderunternehmen müssten überlegen, wie sie ihre Datenbestände zu ihrem Vorteil nutzen könnten. "Viele Firmen sitzen auf extrem wertvollen Daten", sagte Slootman. Sie bräuchten jedoch einen Marktplatz, um ein Geschäft daraus zu machen. "Snowflake ist die Plattform, mit der Kunden Datenmarktplätze aufbauen und Daten monetarisieren können."