Analyseergebnisse anschaulich im Netz publizieren

Silk - Virtuelles Makeup für strukturierte Daten

20.01.2015
Dirk Stähler befasst sich seit vielen Jahren mit der innovativen Gestaltung von Organisationen, Prozessen und IT-Systemen. Er unterstützt privatwirtschaftliche Unternehmen und öffentliche Verwaltungen in Europa, dem Mittleren Osten und Nordamerika dabei, Mehrwert durch die kreative Nutzung ihrer Informationstechnologie zu gewinnen. Ein besonderes Augenmerk seiner Arbeit liegt auf den Chancen und Risiken, die sich aus der Verwertung öffentlich verfügbarer Inhalte des Internets ergeben. Die "Wissensmaschine" Internet und den Wert ihrer Inhalte für jeden zugänglich zu machen, ist sein erklärtes Ziel.
Das Start-Up Silk aus Amsterdam bietet ein Werkzeug zur interaktiven Visualisierung, Speicherung und Publizierung strukturierter Daten. Kombiniert mit Diensten zum Auslesen von Webseiten eröffnet es neue Perspektiven auf Informationen im Netz.
Die Aufbereitung umfangreicher Analysen für eine Präsentation im Internet ist nicht immer einfach.
Die Aufbereitung umfangreicher Analysen für eine Präsentation im Internet ist nicht immer einfach.
Foto: Sergey Nivens - Fotolia.com

Im Internet stecken - nahezu - unendliche Mengen an Daten. Vor wenigen Wochen habe ich mit kimono ein Werkzeug vorgestellt, das es ermöglicht Inhalte aus dem Netz in strukturierter Form zu extrahieren. Analog einer Schere für das Internet, können mit kimono Daten aus Webseiten ausgelesen und maschinenlesbar bereitgestellt werden. Die Einsatzszenarien reichen von der privaten Überwachung der Preisentwicklung bei Produkten und Dienstleistungen bis zur Beobachtung von Wettbewerbern durch Unternehmen. Eine zentrale Anforderung, egal ob privat oder kommerziell eingesetzt, ist aber, dass die Bedienung der Werkzeuge durch jeden Anwender ohne tiefes IT-Wissen möglich ist.

Die Sammlung von Daten lösen die modernen Screen-Scraping Werkzeuge bereits zufriedenstellend. Ein Problem aber lösen sie nicht: wenn zur Interpretation der Daten interaktive Visualisierungen erforderlich sind, helfen sie alleine nicht weiter. Bereits die Aufbereitung eines Excel-Sheets mit interaktiver Darstellung gesammelter Inhalte lässt Nutzer ohne Hintergrund in Datenvisualisierung an Grenzen stoßen. Sollen Ergebnisse optisch ansprechend online zur Verfügung gestellt werden bieten herkömmliche Tabellen-Kalkulationsprogramme keine einfache Lösung mehr. Wer Daten online in Informationen verwandeln und publizieren möchte, benötigt zur Umsetzung oft einen Grafiker oder Web-Designer. Genau das möchte das Start-Up Silk ändern. Es zielt darauf ab, die Publizierung strukturierter Daten im Netz zu vereinfachen und jedem Nutzer individuelle Analysen zu ermöglichen.

Wie Silk funktioniert

Silk berechnet aus CSV- oder Excel-Dateien das zugrundeliegende Datenmodell, bereitet die Inhalte zur effizienten Auswertung in einer Datenbank auf und stellt eine leicht zu bedienende Web-Oberfläche zur Visualisierung bereit. Vergleichbar mit modernen Content Management Systemen zur Erstellung von Webseiten liefert Silk einen Baukasten zur Visualisierung strukturierter Daten im World Wide Web. Die interaktiv nutzbaren Ergebnisse können sowohl auf der Webseite von Silk betrachtet oder in eigene Webseiten eingebunden werden.
Alle erforderlichen Arbeitsschritte zur Erstellung der Visualisierung und Publizierung erfolgen direkt im Browser. Selbst für komplexe Analysen der Daten wird kein umfassendes IT-Wissen benötigt. Der Kern der Anwendung ist in Haskell programmiert, eine Sprache die es den Entwicklern von Silk ermöglicht, individuell bereitgestellte Daten und deren Strukturen mit einfachen mathematischen Lösungen zu bearbeiten. Silk kann dadurch mit hoher Geschwindigkeit entwickelt werden. Betrieben wird die Lösung auf Servern in der Amazon Elastic Cloud. Alle Daten verbleiben auf den Servern von Silk, so dass Nutzer mit Bedenken hinsichtlich des Datenschutzes vielleicht von der Nutzung absehen.

Das Google für strukturierte Daten

"Wir wollen dem Endanwender eine Plattform zur einfachen Visualisierung seiner Daten direkt im Browser bereitstellen", beschreibt Salar al Khafaji das Ziel von Silk. Al Khafaji gründete das Unternehmen im Jahr 2010 zusammen mit Lon Boonen. Heute verfügt es über ein weiteres Büro in San Francisco, jedoch spricht sich al Khafaji deutlich für die Vorteile des Standortes Amsterdam aus. "In Europa finden wir hervorragend ausgebildetes Personal für unsere Entwicklung. Es ist nicht erforderlich Aktivitäten im Silicon Valley zu konzentrieren", erläutert al Khafaji den europäischen Ansatz von Silk.
Was mich im Gespräch mit dem CEO von Silk überraschte, war die angestrebte Positionierung des Unternehmens als Content- und nicht als Werkzeuganbieter. Al Khafaji sieht die Chance, Silk mittel- bis langfristig als Drehscheibe für strukturierte Daten im Netz zu positionieren. Egal zu welchen Themen Internetnutzer in Zukunft grafisch aufbereitete Daten suchen, WikiLeaks Spy Files, Ebola Ausbrüche, Kickstarter Projekte, weltweite Öl-Verschmutzungen und vieles mehr, Silk soll als "Google zur Anzeige graphisch aufbereiteter Daten" die zugehörigen Informationen bereithalten. "Zunächst fokussieren wir unser Angebot auf öffentlich zugängliche Daten, im wesentlichen auf Open Data", konkretisiert al Khafaji den Ansatz.

Die Zielgruppe Endanwender, die Positionierung als Content Anbieter und der Fokus auf Open Data ist in Kombination eine besondere Herausforderung für das junge Unternehmen. Resultieren daraus doch Risiken und Zielkonflikte, die ein schnelles Erreichen signifikanter Umsätze und Erlöse behindern.

Potentielle Endanwender sind zwar zahlreich vorhanden, liefern Start-Up Unternehmen aber nur selten nachhaltige Umsätze. Die Positionierung als Content Anbieter birgt hohe Risiken urheberrechtlicher Auseinandersetzungen. Besonders weil Silk nicht in der Lage sein wird, große Mengen extern eingestellten Contents auf urheberrechtliche Konflikte zu überprüfen. YouTube kämpft noch heute mit diesem Problem. Der Fokus auf Open Data ist in Verbindung mit der Zielgruppe Endanwender verständlich. Ein Schwerpunkt auf nicht öffentliche Daten - zwingende Voraussetzung um Industrie-Kunden zu gewinnen - verspräche aber mehr Umsatz und ein stabileres Wachstum.

Wie ich Silk nutze - Visualisierung gescrapter Daten

Unabhängig von kaufmännischen Fragen bietet Silk in Kombination mit Werkzeugen zur Sammlung strukturierter Daten interessante Anwendungsfelder.

Durch Kombination eines Scrapers zur Sammlung von Daten im Netz, eines Google-Spread-Sheets zur Speicherung und Silk zur graphischen Darstellung kann jeder Anwender mit wenigen Handgriffen den gesamten Prozess der Visualisierung im Browser aufbauen.
Durch Kombination eines Scrapers zur Sammlung von Daten im Netz, eines Google-Spread-Sheets zur Speicherung und Silk zur graphischen Darstellung kann jeder Anwender mit wenigen Handgriffen den gesamten Prozess der Visualisierung im Browser aufbauen.
Foto: Dirk Stähler

Wer zum Beispiel die Entwicklung der Stellenangebote eines Unternehmens über einen längeren Zeitraum überwachen möchte, erstellt einen Scraper für verschiedene Job-Portale im Internet zum Beispiel mit kimonolabs.com oder import.io. Die gesammelten Daten werden mit Hilfe von IFTTT in einheitlicher Struktur in ein Google-Sheet geschrieben und anschließend mit Silk graphisch aufbereitet. Sämtliche Werkzeuge stehen kostenfrei zur Verfügung und die Ergebnisse sind beeindruckend.

Suchergebnis einer Silk-Anfrage.
Suchergebnis einer Silk-Anfrage.
Foto: Dirk Stähler
Grafische Darstellung eines Abfrageergebnisses aus Silk.
Grafische Darstellung eines Abfrageergebnisses aus Silk.
Foto: Dirk Stähler

Fazit

Silk ist ein technisch beeindruckender Dienst, mit dem jeder in wenigen Minuten Analysen und Visualisierungen erstellen kann, die mit anderen Werkzeugen oftmals aufwändig sind. Das Unternehmen steht aber vor der Herausforderung, die Ausrichtung auf Endanwender, die Positionierung als Content Anbieter und den Fokus auf Open Data so zu verbinden, um nachhaltig Gewinn zu erzielen. In eigenem Interesse hoffe ich das al Khafaji und sein Team es schaffen, denn Silk hat bereits einen Platz in meiner Bookmark-Leiste. (bw)