Windows Azure Marketplace DataMarket

Information als Service

18.01.2011 von Klaus Manhart
Mit dem Windows Azure Marktplatz DataMarket erleichtert Microsoft Unternehmen, Organisationen und Privatpersonen die Aufbereitung und Analyse von Daten. Der auf Microsoft Cloud-Technologie basierende-Service stellt eine große Bandbreite von Inhalten aus kommerziellen und öffentlichen Quellen auf einem Marktplatz bereit.
Schmerzpunkte: Beim Zugang, der Aufbereitung und der Analyse von Daten haben alle Beteiligten mit großen Herausforderungen zu kämpfen.
Foto: Microsoft

Unternehmen arbeiten heutzutage mit einer Unmenge an Daten. Dazu gehören beispielsweise Daten zu Kaufgewohnheiten von Kunden oder Informationen zu Produkten und Lieferanten. Auch Bevölkerungsstatistiken und geografische Informationen werden heute zunehmend relevant. Viele dieser Daten gibt es bereits im Internet - doch die Datenquelle Internet anzuzapfen hat ihre Tücken.

So ist schon das Finden der richtigen Datenquellen eine Herausforderung. Abgesehen von Suchmaschinen gibt es kaum öffentlich zugängliche Datenbanken mit unternehmensrelevanten Datenquellen. Um eine seriöse Datenquelle im Netz zu finden, braucht man zudem fast immer Daten von mehreren Quellen, die dann verglichen, ausgewählt und in die eigenen Geschäftsdaten integriert werden müssen. Und schließlich gibt es eine Unzahl an Formaten und Medien, mit denen die Informationen ausgeliefert werden. Der Umgang und die Integration dieser unterschiedlichen Formate und Medien ist zeit- und arbeitsaufwändig.

Sind die Daten dann schließlich in die eigenen Geschäftsapplikationen und Workflows eingefügt, gehen die Probleme weiter. Schlechte Datenqualität führt beispielsweise oft dazu, dass die Daten von Hand bereinigt werden müssen. All diese Probleme potenzieren sich, wenn ein Unternehmen Informationen vieler unterschiedlicher Lieferanten bezieht.

Was ist DataMarket?

Der DataMarket basiert auf Windows Azure und SQL Azure.
Foto: Microsoft

Der Windows Azure Marktplatz DataMarket soll diese Unzulänglichkeiten beseitigen und bietet gleichzeitig neue Möglichkeiten der Analyse und Integration von Fremddaten in die Business-Umgebung. Die cloudbasierte Plattform stellt empirische Daten, Bilder, Echtzeit-Webservices und Analysemöglichkeiten bereit. Die Daten stammen von kommerziellen Anbietern sowie öffentliche Datenquellen und werden in einem einheitlichen Format an zentraler Stelle global zur Verfügung gestellt. Im Prinzip funktioniert der DataMarket für Anwender wie ein Appstore, bei dem statt Anwendungen Daten und mit diesen verknüpfte Informationen kostenfrei oder gegen Gebühr heruntergeladen werden können.

Entwickelt wurde der DataMarket auf der Grundlage von Windows Azure und SQL Azure. Die auf der Plattform bereitgestellten Daten werden in SQL Azure gespeichert - einem cloudbasierten relationalen Datenbankservice, der auf SQL Server Technologien aufbaut. Um ihre Daten global zur Verfügung zu stellen sind für Inhalteanbieter somit keine Investitionen in Hardware oder Software notwendig. Sie können sich auf das fokussieren was wirklich zählt: ihre Daten und deren Mehrwert für die Kunden.

Mit der größte Vorteil von DataMarket ist die übergreifende Konsistenz - angefangen von der Datenbeschreibung bis hin zum Bezug der Daten. Der Service bietet die Daten in einer einheitlichen Oberfläche im Standardformat OData an. Mit der Bereitstellung der Daten in diesem Format soll sichergestellt werden, dass Anwender auf die Informationen von jeder Plattform aus zugreifen können.

Wie Kunden und Content Provider profitieren

Auf dem DataMarket stellen Content Provider eine Fülle von Daten bereit - wie etwa Zahlen zu Konsumentenausgaben.
Foto: Microsoft

Kunden können den DataMarket nutzen, um die Quellen zu abonnieren, Daten abzufragen und zu analysieren. Das Finden und Erkunden der Daten soll mit dem Dienst ebenso vereinfacht werden wie das Bereitstellen und Verwalten der Daten für Anwendungen sowie deren Analysen. Mit dem webbasierten Service Explorer lassen sich beispielsweise intuitiv Abfragen erstellen und es ist sofort ersichtlich, welche Daten enthalten sind und wie diese strukturiert sind.

Für Unternehmen ergeben sich damit ganz neue Möglichkeiten des Datenbezugs und der Datenverknüpfung. So lassen sich etwa Vertriebsdaten wie Umsatzdaten mit Informationen aus dem DataMarket - etwa Wetterdaten oder demografischen Daten - verknüpfen. Damit können dann beispielsweise Absatztrends in Abhängigkeit vom Wetter oder anhand von Geburtsraten identifiziert werden. Eigene Datenanalysen werden damit effektiver, datenintensive Applikationen können leichter erstellt werden.

DataMarket integriert sich zudem nahtlos in die Tools und Technologien, die Unternehmen für die Analyse von Daten nutzen. So lassen sich Analysen in Microsoft Excel über ein Add-In durchführen. Das DataMarket Add-In für Excel erlaubt es, Datensätze aus dem DataMarket zu kaufen und in Excel zum Beispiel über PowerPivot auszuwerten. Auch über SQL Server Reporting Services und SQL Azure Reporting Services sind Datenanalysen möglich. Berichte können in Access oder SQL Server Daten aus der lokalen Datenbank mit Informationen aus dem DataMarket verknüpft werden. Konsistente und flexible APIs erlauben zudem eine einfache Einbindung von Datenmaterial in eigene Geschäftsanwendungen, beispielsweise über Visual Studio.

Auch Content Provider profitieren vom DataMarket. Sie können ihre Daten an zentraler Stelle auf der Plattform einstellen und monetarisieren. Auf diese Weise erreichen sie weltweit Millionen von Entwicklern und Excel-Nutzern. Der Vorteil für Provider: E-Commerce-Prozesse für Abrechnung und Bereitstellung der Inhalte müssen nicht mehr extra entwickelt werden, weil diese Funktionalitäten bereits in DataMarket integriert sind. Der Inhalteanbieter behält dabei die volle Kontrolle über das zugrundeliegende Preismodell, die Bedingungen für die Nutzung seiner Daten und den verwendeten Storage.

Konkret genutzt wird der DataMarket bereits von Verlagen, die ihre Informationen ohne großen Aufwand einem breiten Publikum bereitstellen. Auch Finanzdienstleister verwenden bereits den Dienst und bieten Investoren Quellen für fundierte Entscheidungen und Invest-Opportunities an.

Inhalte von DataMarket

Einige Beispiel-Szenarien, wie Unternehmen DataMarket-Daten gewinnbringend nutzen können.
Foto: Microsoft

Aktuell enthält der Marktplatz Daten von über 40 Content Providern zu Bereichen wie Demografie, Ökologie, Finanzwesen, Einzelhandel, Reisen, Sport und Geologie. Diese Daten können Unternehmensanwender nutzen, um ihre Businessdaten wie Produktkataloge, Marktforschung und Sales Leads oder Web Services anzureichern - und neue Erkenntnisse zu gewinnen.

Die meisten Informationen werden auf kommerzieller Basis veröffentlicht, andere wie Public Domain Daten sind kostenlos. Allerdings ist DataMarket nicht ausschließlich eine Plattform für geschäftliche Daten, sondern enthält auch Datensätze jenseits der üblichen Interessen von Unternehmen und Wirtschaftsverbänden. So beinhaltet der Marktplatz etwa auch die folgenden Daten:

• Nationale und internationale Nachrichten
• Kriminalitätsstatistiken
• Immobilien
• Demographie und Verbraucherausgaben aus Alteryx
• UNESCO Ernährungs- und Landwirtschaftsreports
• Geographische Informationssysteme vieler Arten
• Kohlendioxidemissionen
• Wettervorhersagen und viele mehr