Datenintegration und Business Analytics

CERN erschließt operative Daten künftig über Pentaho-Plattform

Thomas Cloer war viele Jahre lang verantwortlich für die Nachrichten auf computerwoche.de.
Er sorgt außerdem ziemlich rund um die Uhr bei Twitter dafür, dass niemand Weltbewegendes verpasst, treibt sich auch sonst im Social Web herum (auch wieder bei Facebook) und bloggt auf teezeh.de. Apple-affin, bei Smartphones polymorph-pervers.
Das europäische Kernforschungszentrum CERN will verschiedene Altsysteme und Eigenentwicklungen durch Pentahos Datenintegrations- und Business-Analytics-Plattform ersetzen.

Die Abteilung Advanced Information Services (AIS) des CERN bettet Pentaho - das mittlerweile zu Hitachi Data Systems (HDS) gehört - in zahlreiche interne Anwendungen ein, um die Arbeit der operativen Abteilungen zu optimieren. Statt einer eigenständigen Analyseanwendung nutzt CERN dafür Pentahos Web-Service-API. Nutzer und Management sollen darüber in Bereichen wie Finanzen, Personal, Logistik und Prozessautomatisierung kontextuelle Einblicke bekommen.

Foto: HDS

Gegenwärtig läuft Pentaho bei CERN in einer Produktionsumgebung und wird als einheitliche Plattform für von AIS bereitgestellte Daten Ende 2015 voll funktionstüchtig sein und die meisten Altsysteme ersetzen. Eine Reihe von Pentaho basierten Testberichten wurde bereits für Endnutzer eingeführt. Nach Abschluss des Projekts Ende 2015 würden die mehr als 15.000 Nutzer von einer einheitlichen 360-Grad-Ansicht der operativen Daten sowie von Self-Service-Analysen und -Reports profitieren, heißt es in einer Mitteilung.

"Nach der Evaluation von fünf verschiedenen proprietären und Open Source-Plattformen haben wir uns für Pentaho als Lösung entschieden, die am besten an die aktuellen Bedürfnisse des CERN angepasst werden kann", erläutert Jan Janke, Group und Deputy Group Leader GS-AIS bei CERN. "Ich glaube, es ist eine zukunftssichere Lösung, die Data Governance, 'one version of truth' und ein gutes Benutzererlebnis sicherstellt."

Teilchenbeschleuniger Large Hadron Collider (LHC) beim CERN
Teilchenbeschleuniger Large Hadron Collider (LHC) beim CERN
Foto: CERN

Dank der Pentaho Data Integration (PDI) kann CERN von einer aufwendigen manuellen auf eine automatisierte ETL-Umgebung mit systemunabhängigen Daten migrieren. Im Vergleich zur alten Umgebung erlaube es PDI, die verschiedenen ETL/Batchprozesse besser im Überblick zu behalten und sei insbesondere in Hinblick auf implizite Dokumentation und umfangreiches automatisiertes Sammeln von Monitoring-Daten zur Prozessausführung immens wichtig.

CERN hat nicht nur selbst 2500 Beschäftigte, sondern beherbergt auch ähnlich einer Universität jährlich Hunderte von Studenten und Tausende von Gastwissenschaftlern. Außerdem ist die Organisation für die soziale Absicherung seiner Angestellten und deren Familien verantwortlich. Daher unterliegen die Mitarbeiterdaten strengen Datenschutz- und Compliance-Regulierungen.

Die LHC-Röhre von innen
Die LHC-Röhre von innen
Foto: CERN

CERNs fünfköpfiges Entwicklerteam hat laut Case Study gemeinsam mit dem Pentaho-Partner Ancud IT einen Ansatz entwickelt, der einheitliche Zugriffsrechte über Anwendungsgrenzen hinweg garantiert. Die Rechte werden mit einer Rules-Engine kalkuliert und berücksichtigen Geschäftsbedürfnisse und gesetzliche Anforderungen. Innerhalb der Pentaho Lösung werden sie über die Erweiterung von Pentahos Analyse-Engine ("Mondrian") durchgesetzt. Die Sicherheitsimplementierungen mit Pentaho sind abgeschlossen und werden gegenwärtig intern getestet.