Business Intelligence per Drag and Drop

21.08.2007
Mit der Einführung von "SQL Server 2005" hat auch Microsoft das BI-Thema seitens der Infrastrukturprodukte aufgegriffen. Die für diesen Bereich relevanten Funktionen gibt es als komfortabel zu bedienende Services.

Business Intelligence (BI) hat viele Facetten. Die einen betrachten es etwa im Bereich Customer-Relationship-Management oder Controlling als taktische Aufgabe, andere arbeiten im Compliance-Umfeld eher mit strategisch ausgerichteten Lösungen, und wieder andere bevorzugen für Echtzeitaufgaben und Monitoring operative BI-Tools. Um diese Anwendungsszenarien technisch zu unterstützen, unterscheidet Microsoft die drei Bereiche "BI-Plattform und -Services", "BI-Frontends" und "BI-Applikationen". Der SQL Server 2005 fällt unter die Kategorie BI-Plattform und bietet drei Services: die "Integration Services" für Datenintegration und ETL (Extraction, Transformation, Loading), die "Analysis Services" für Olap und Data Mining sowie die "Reporting Services" für Reporting und Verteilung.

Die von Microsoft bereitgestellten technischen Komponenten für Business-Intelligence-Lösungen lassen sich in die drei Hauptgruppen Applikationen, Frontends sowie Plattform (SQL Server 2005) und Services gliedern.

Mit Hilfe der Integration Services stellt SQL Server 2005 eine ETL-Plattform und mit dem SQL Server Business Intelligence Development Studio eine vollgrafische Oberfläche mit visuellem Debugging zur Verfügung. Daten sollen sich auch in einer inhomogenen IT-Landschaft aus unterschiedlichen Quellen extrahieren, transformieren und bei Bedarf an andere Ziele weiterleiten lassen. Über das visuelle Debugging wird das Überwachen und Monitoring auch für Transformations- und Ladeprozesse angeboten. Die Integration Services verfügen über ein API, auf dem man eigene Objekte in .NET programmieren kann, um einerseits flexible Transformations- und Ladeszenarien zu entwerfen und um andererseits benutzerdefinierte komplexe Szenarien abbilden zu können. Dies kann zum Beispiel auf Transformationen zwischen SQL Server und der SAP-Welt zutreffen. Shinja Strasser, Software Architect bei der New Solutions GmbH in Burghausen, rät in diesem Zusammenhang, dass sich BI-Entwickler beziehungsweise BI-Administratoren genau überlegen müssen, für welche Szenarien die Integration Services eingesetzt werden sollen, da die von Microsoft angebotenen SQL-Server-Editionen Workgroup, Standard und Enterprise unterschiedliche Anforderungen abdecken.

Integration Services

Im Standard bieten die Integration Services laut Strasser leistungsfähige Transformationen und Komponenten wie zum Beispiel Konvertierungen (Daten und Zeichen), Look-ups, Sortierungen und Aggregationen an. Es stehen auch eine Reihe von Assistenten für den weniger erfahrenen BI-Entwickler und BI-Administrator zur Verfügung, die das Erstellen und Debuggen von Paketen, das Ausführen von Workflow-Funktionen (SQL-Anweisungen, FTP-Tasks, Senden von E-Mails etc.), das Festlegen von Datenquellen und –zielen sowie das Transformieren und Aggregieren Schritt für Schritt begleiten.

Analysis Services

Die SQL Server 2005 Analysis Services (SSAS) umfassen die Olap- und Data-Mining-Funktionen für BI-Anwendungen, die später auch die Grundlage für die Berichte darstellen. Das Erstellen beziehungsweise Modellieren der mehrdimensionalen Datenstrukturen wird visuell ebenfalls über das Business Intelligence Development Studio erledigt und von speziellen Assistenten unterstützt. Hier können beispielsweise Key-Performance-Indikatoren (KPI) definiert oder Zeitabhängigkeiten behandelt werden. Es besteht auch die Möglichkeit, den Datenzugriff sehr feinstufig zu berechtigen, lokale Cubes zu verschlüsseln und die Kommunikation zwischen Client und Server zu signieren. Der Bereich Data Mining enthält bereits Algorithmen wie zum Beispiel Naive Bayes (Klassifikationsalgorithmus für die Vorhersage-Modellierung), Association-Regeln, Clustering, Time Series, Neuralnetze, Regression, Entscheidungsbäume und lineare Regression. Mining-Modelle lassen sich mit Hilfe des Data-Mining-Designers erstellen und über einen Viewer betrachten. Zudem gibt es Möglichkeiten, Mining-Modelle zu trainieren und zu vergleichen. Eine Programmierschnittstelle erlaubt es ferner, Data-Mining-Funktionen in neue oder bestehende Anwendungen zu integrieren. Umgekehrt können Drittanbieter darüber eigene Algorithmen für das Data-Mining-Framework anpassen. Werden beispielsweise über die Integration Services Daten transformiert, so lassen sich über Data-Mining-Methoden wie Assoziations- und Cluster-Algorithmen oder Fuzzy Logic Datenanomalien, Duplikate oder fehlende Daten erkennen.

Reporting Services

Die dritte BI-Disziplin kommt mit den Reporting Services, die eine Web-basierende Lösung für Berichte aller Art bereitstellen. Als Vorteil in diesem Punkt hebt Strasser hervor, dass Microsoft stark auf die Integration mit seinen Office-Systemen geachtet hat. So können Unternehmen Berichte zum Beispiel über den Office Sharepoint Server oder über ein Extranet veröffentlichen beziehungsweise abonnieren lassen. Natürlich ist es auch möglich, einfache Office-Dokumente für die Weiterverarbeitung zu generieren. Der im Lieferumfang enthaltene Report-Builder unterstützt über Assistenten und Designer zum Beispiel bei Ad-hoc-Berichten. Die Daten für die Berichte lassen sich aus unterschiedlichen Quellen wie relationalen Tabellen und mehrdimensionalen Cubes abgreifen. Da der SQL Server 2005 den Zugriff via Soap/http unterstützt, können Reports und Daten auch über Web-Services-Techniken für andere Systeme in der IT-Umgebung bereitgestellt werden. Die Kommunikation basiert in diesem Fall auf XML.

Die Reporting Services enthalten zusätzlich ein Web-basierendes Tool zur Verwaltung der Berichte. Damit lassen sich zum Beispiel an Rollen ausgerichtete Sicherheitskonzepte auf dem Berichts-Server hinterlegen. Ebenso ist es möglich, die Ausführung und Übermittlung von Berichten zu planen und den Berichtsverlauf aufzuzeichnen. Ab dem Service Pack 1 des SQL Server 2005 lässt sich über XML/A eine Berichtslösung für das SAP Business Information Warehouse erstellen.

Entwicklungsumgebung

Für Microsofts gesamte BI-Lösung steht eine Entwicklungsumgebung in der Art von Visual Studio 2005 zur Verfügung. Auch hier unterstützen Assistenten und Drag-and-Drop-Features den Aufbau eines Data Warehouse oder das Anlegen von Berichten. Durch die grafischen Oberflächen und Tools ist es laut Strasser auch einem Nicht-Experten möglich, in die Thematik einzusteigen, um zum Beispiel über den "One-Click-Cube" Vorschläge für eine Data-Warehouse-Struktur zu erhalten. One-Click-Cube untersucht hier die Beziehungen einer Datenquellenansicht und schlägt anschließend Fakten-, Dimensionstabellen und Measures vor, die die Grundlage für MDX (Multidimensional Expressions) darstellen, die Abfragesprache für multidimensionale Daten in den SQL Server 2005 Analysis Services. Diese Daten können anschließend über den Report-Designer mit den Reporting Services als Bericht oder Liste Web-basierend oder mit einer Office-Anwendung angezeigt und in entsprechende andere Formate (PDF, Grafik etc.) transformiert werden.

Hochperformante Abfragen, Echzeit-Updates und Datenisolierungen für Endkunden oder Anwendungen können durch Cachen erreicht werden. Dazu setzt man im SQL Server 2005 das proaktive Caching ein, so dass ein Olap-Store unter Umständen überflüssig beziehungsweise das Backend-System von den Lasten, die aufgrund der analytischen Abfragen entstehen, befreit ist, da hier die zugrunde liegende Datenbank automatisch aktualisiert wird. Eine deutliche Verbesserung der Abfrageleistung wird durch partitionierte Tabellen und Indizes ermöglicht, was aber nur für große Datenbanken gilt. Der SQL Server 2005 wurde für die x64-Umgebung optimiert und nutzt dabei die erweiterte Speicheradressierung - ein besonders im BI-Umfeld großer Vorteil für Pufferpools und Caches.

Wer braucht welche Edition?

Während für mittelständische Unternehmen, die Daten-Management und Analyse betreiben möchten, die Standard-Edition von SQL Server 2005 ausreicht, sollte für unternehmenskritische Lösungen aufgrund der Skalierung und des Failover-Managements die Enterprise-Edition eingesetzt werden. Die Standard-Edition unterstützt im Failover nur zwei Knoten, und Fast Recovery ist ohnehin nur in der Enterprise-Edition enthalten. Auch das bereits erwähnte proaktive Caching ist mit der Enterprise-Edition erhältlich. Diese bietet auch die Möglichkeit, Daten aus einer Oracle-Replikation für BI-Anwendungen im SQL Server zu nutzen. (ue)