Business Intelligence per Drag and Drop

16.08.2007
Mit der Einführung von "SQL Server 2005" hat Microsoft das BI-Thema seitens der Infrastrukturprodukte aufgegriffen. Die für diesen Bereich relevanten Funktionen gibt es als komfortabel zu bedienende Services.
Die von Microsoft bereitgestellten technischen Komponenten für Business-Intelligence-Lösungen lassen sich in die drei Hauptgruppen Applikationen, Frontends sowie Plattform und Services gliedern.
Die von Microsoft bereitgestellten technischen Komponenten für Business-Intelligence-Lösungen lassen sich in die drei Hauptgruppen Applikationen, Frontends sowie Plattform und Services gliedern.

Business Intelligence (BI) hat viele Facetten. Die einen betrachten es etwa im Bereich Customer-Relationship-Management oder Controlling als taktische Aufgabe, andere arbeiten im Compliance-Umfeld eher mit strategisch ausgerichteten Lösungen, und wieder andere bevorzugen für Echtzeitaufgaben und Monitoring operative BI-Tools. Um diese Anwendungsszenarien technisch zu unterstützen, unterscheidet Microsoft die drei Bereiche "BI-Plattform und -Services", "BI-Frontends" und "BI-Applikationen". Der SQL Server 2005 fällt unter die Kategorie BI-Plattform und bietet drei Services: die "Integration Services" für Datenintegration und ETL (Extraction, Transformation, Loading), die "Analysis Services" für Olap und Data Mining sowie die "Reporting Services" für Reporting und Verteilung.

Fazit

Die von Microsoft bislang bekannten Ankündigungen lassen erkennen, dass im kommenden Release SQL Server 2008 viele Weichen in Richtung Business Intelligence gestellt sind. Grundlage hierfür bietet bereits die aktuelle Version 2005. Sie beherrscht alle wichtigen BI-Funktionen von der Datenintegration über die Analyse bis hin zum Reporting. Eine Besonderheit der Microsoft-Plattform ist die grafische und anhand von Softwareassistenten vereinfachte Bedienung des Systems. Ein Microsoft-spezifischer Vorteil ist sicher auch die Integration von SQL Server mit den anderen Server-Produkten des Hauses, was die Verwendung der Data-Warehouse-Informationen in anderen Applikationen vereinfacht.

Das bringt SQL Server 2008

Berichte schreiben über Word und Excel (Office Writer),

Location Intelligence (räumliche Daten),

Daten- und Backup-Komprimierung,

Optimierungen für Star Join Query,

Resource Governor,

Grouping Sets,

Change Data Capture,

Merge SQL Statement,

Integration Services/Persistent Look-ups,

Block Computations,

Verschlüsselung der ganzen Datenbank und externe Schlüsselverwaltung.

Mit Hilfe der Integration Services stellt SQL Server 2005 eine ETL-Plattform und mit dem SQL Server Business Intelligence Development Studio eine vollgrafische Oberfläche mit visuellem Debugging zur Verfügung. Daten sollen sich auch in einer inhomogenen IT-Landschaft aus unterschiedlichen Quellen extrahieren, transformieren und bei Bedarf an andere Ziele weiterleiten lassen. Über das visuelle Debugging wird das Überwachen und Monitoring auch für Transformations- und Ladeprozesse angeboten. Die Integration Services verfügen über ein API, auf dem man eigene Objekte in .NET programmieren kann, um einerseits flexible Transformations- und Ladeszenarien zu entwerfen und um andererseits benutzerdefinierte komplexe Szenarien abbilden zu können. Dies kann zum Beispiel auf Transformationen zwischen SQL Server und der SAP-Welt zutreffen. Shinja Strasser, Software Architect bei der New Solutions GmbH in Burghausen, rät in diesem Zusammenhang, dass sich BI-Entwickler beziehungsweise BI-Administratoren genau überlegen müssen, für welche Szenarien die Integration Services eingesetzt werden sollen, da die von Microsoft angebotenen SQL-Server-Editionen Workgroup, Standard und Enterprise unterschiedliche Anforderungen abdecken.

Integration Services

Im Standard bieten die Integration Services laut Strasser leistungsfähige Transformationen und Komponenten wie zum Beispiel Konvertierungen (Daten und Zeichen), Look-ups, Sortierungen und Aggregationen an. Es stehen auch eine Reihe von Assistenten für den weniger erfahrenen BI-Entwickler und BI-Administrator zur Verfügung, die das Erstellen und Debuggen von Paketen, das Ausführen von Workflow-Funktionen (SQL-Anweisungen, FTP-Tasks, Senden von E-Mails etc.), das Festlegen von Datenquellen und zielen sowie das Transformieren und Aggregieren Schritt für Schritt begleiten.

Die SQL Server 2005 Analysis Services (SSAS) umfassen die Olap- und Data-Mining-Funktionen für BI-Anwendungen, die später auch die Grundlage für Berichte darstellen. Das Erstellen beziehungsweise Modellieren der mehrdimensionalen Datenstrukturen wird visuell ebenfalls über das Business Intelligence Development Studio erledigt und von speziellen Assistenten unterstützt. Hier können beispielsweise Key-Performance-Indikatoren (KPI) definiert oder Zeitabhängigkeiten behandelt werden.

Data Mining

Es besteht auch die Möglichkeit, den Datenzugriff sehr feinstufig zu berechtigen, lokale Cubes zu verschlüsseln und die Kommunikation zwischen Client und Server zu signieren. Der Bereich Data Mining enthält bereits Algorithmen wie zum Beispiel Naive Bayes (Klassifikationsalgorithmus für die Vorhersage-Modellierung), Association-Regeln, Clustering, Time Series, Neuralnetze, Regression, Entscheidungsbäume und lineare Regression. Mining-Modelle lassen sich mit Hilfe des Data-Mining-Designers erstellen und über einen Viewer betrachten. Zudem gibt es Möglichkeiten, Mining-Modelle zu trainieren und zu vergleichen. Eine Programmierschnittstelle erlaubt es ferner, Data-Mining-Funktionen in neue oder bestehende Anwendungen zu integrieren. Umgekehrt können Drittanbieter darüber eigene Algorithmen für das Data-Mining-Framework anpassen. Werden beispielsweise über die Integration Services Daten transformiert, so lassen sich über Data-Mining-Methoden wie Assoziations- und Cluster-Algorithmen oder Fuzzy Logic Datenanomalien, Duplikate oder fehlende Daten erkennen.

Die dritte BI-Disziplin kommt mit den Reporting Services, die eine Web-basierende Lösung für Berichte aller Art bereitstellen. Als Vorteil in diesem Punkt hebt Strasser hervor, dass Microsoft stark auf die Integration mit seinen Office-Systemen geachtet hat. So können Unternehmen Berichte zum Beispiel über den Office Sharepoint Server oder über ein Extranet veröffentlichen beziehungsweise abonnieren lassen. Natürlich ist es auch möglich, einfache Office-Dokumente für die Weiterverarbeitung zu generieren. Der im Lieferumfang enthaltene Report-Builder unterstützt über Assistenten und Designer zum Beispiel bei Ad-hoc-Berichten.

Die Daten für die Berichte lassen sich aus unterschiedlichen Quellen wie relationalen Tabellen und mehrdimensionalen Cubes abgreifen. Da der SQL Server 2005 den Zugriff via Soap/http unterstützt, können Reports und Daten auch über Web-Services-Techniken für andere Systeme in der IT-Umgebung bereitgestellt werden. Die Kommunikation basiert in diesem Fall auf XML.

Die Reporting Services enthalten zusätzlich ein Web-basierendes Tool zur Verwaltung der Berichte. Damit lassen sich zum Beispiel an Rollen ausgerichtete Sicherheitskonzepte auf dem Berichts-Server hinterlegen. Ebenso ist es möglich, die Ausführung und Übermittlung von Berichten zu planen und den Berichtsverlauf aufzuzeichnen. Ab dem Service Pack 1 des SQL Server 2005 lässt sich über XML/A eine Berichtslösung für das SAP Business Information Warehouse erstellen.

Für Microsofts gesamte BI-Lösung steht eine Entwicklungsumgebung in der Art von Visual Studio 2005 zur Verfügung. Auch hier unterstützen Assistenten und Drag-and-Drop-Features den Aufbau eines Data Warehouse oder das Anlegen von Berichten. Durch die grafischen Oberflächen und Tools ist es laut Strasser auch einem Nicht-Experten möglich, in die Thematik einzusteigen, um zum Beispiel über den "One-Click-Cube" Vorschläge für eine Data-Warehouse-Struktur zu erhalten. One-Click-Cube untersucht hier die Beziehungen einer Datenquellenansicht und schlägt anschließend Fakten-, Dimensionstabellen und Measures vor, die die Grundlage für MDX (Multidimensional Expressions) darstellen, die Abfragesprache für multidimensionale Daten in den SQL Server 2005 Analysis Services. Diese Daten können anschließend über den Report-Designer mit den Reporting Services als Bericht oder Liste Web-basierend oder mit einer Office-Anwendung angezeigt und in entsprechende andere Formate (PDF, Grafik etc.) transformiert werden.

Proaktives Caching

Hochperformante Abfragen, Echzeit-Updates und Datenisolierungen für Endkunden oder Anwendungen können durch Cachen erreicht werden. Dazu setzt man im SQL Server 2005 das proaktive Caching ein, so dass ein Olap-Store unter Umständen überflüssig beziehungsweise das Backend-System von den Lasten, die aufgrund der analytischen Abfragen entstehen, befreit ist, da hier die zugrunde liegende Datenbank automatisch aktualisiert wird. Eine deutliche Verbesserung der Abfrageleistung wird durch partitionierte Tabellen und Indizes ermöglicht, was aber nur für große Datenbanken gilt. Der SQL Server 2005 wurde für die x64-Umgebung optimiert und nutzt dabei die erweiterte Speicheradressierung ein besonders im BI-Umfeld großer Vorteil für Pufferpools und Caches. (ue)