Solids Flow Engine bietet integrierten Informationsfluss

Verteilte Daten dynamisch verwalten

20.12.2002
MÜNCHEN (kk) - Die "Flow Engine" von Solid Information Technology ist eine Plattform für die verteilte Datenverwaltung. Sie arbeitet sowohl mit System- als auch mit Anwendungsdaten.

Die Company, die vor zehn Jahren in Helsinki gegründet wurde, im kalifornischen Mountain View ihr Headquarter und im bayerischen Mühldorf ihr Deutschland-Büro hat, bietet einen neuen Lösungsansatz für das Management verteilter Daten. Einsatzgebiete sind bislang hochverfügbare Telekomunikationsanwendungen oder integrierte Applikationen im Flotten-Management.

Für Cybersmart Computing

Die Analysten von IDC prognostizierten im vergangenen Jahr dem Markt für verteilte und replizierte Datenbankinhalte erhebliche Wachstumsraten: 1999 wurde mit solchen Produkten ein weltweiter Umsatz von 441 Millionen Dollar erzielt, 2004 sollen es laut IDC über 1,35 Milliarden Dollar sein. IDC sieht mit diesen Zahlen auch den Trend zu einer IT bestätigt, die den Zugang zu Informationen von überall aus ermöglicht, egal welche Hardware- und Softwarearchitektur oder Netztopologie zugrunde liegt. Die Marktforscher haben dafür den Begriff "Cybersmart Computing" geprägt, das Client-Server- und Host-Computing ablösen werde.

Ein Fundament von Cybersmart Computing ist die Forderung, die Daten eines zentralisierten Systems in einer transparenten Weise je nach Bedarf verfügbar zu machen. Generell besteht die Möglichkeit, den Zugriff von außen (remote) zu ermöglichen oder die Informationen lokal vor Ort zu replizieren. Dabei gilt die Faustregel, dass strukturierte Daten, die semantische Abhängigkeiten aufweisen, gemeinsam, typischerweise in einer Datenbank, gespeichert werden sollen. Die semantisch weniger verflochtenen Daten sind laut IDC "gute Kandidaten für eine Verteilung mittels Replikation", insbesondere, wenn der lokale Anwender einen sofortigen und ununterbrochenen Zugang zu ihnen benötigt.

Was passiert aber mit den Datensätzen, die in keine der beiden Kategorien einzuordnen sind? Hier greift das Konzept des integrierten Datenflusses von Solid. Die Flow Engine kombiniert in einem Produkt Datenbank und Replikation auf einer Plattform. Dabei wird der Gedanke des zentralisierten Daten-Repository aufgegeben zugunsten eines dynamisch definierbaren Netzes von verteilten Speichern, die über einen bi-direktional programmierbaren Datenfluss verbunden sind. Er stellt sicher, dass die aktuellste Version auf allen anderen Knoten verfügbar ist und dass Änderungen auf die Knoten, die ebenfalls mit diesen Files arbeiten, verteilt werden.

Spezielle Transaktionstechnik

Der Datenfluss ist also verantwortlich für den Austausch aller benötigten Informationen zwischen den beteiligten Systemen. Die Art der Information ist dabei nahezu beliebig: Binärcode, Gerätekonfigurationsdaten, Dateninhalte (content data) oder jede andere Art von Information, die die Geräte benötigen, um sinnvoll arbeiten zu können. Ändert ein Device die Inhalte, die es mit anderen teilt, dann werden die geänderten Daten über den Master-Knoten an die anderen Teilnehmer verteilt. Mögliche Konflikte oder sonstige Inkonsistenzen räumt der Master-Knoten aus, der dazu eine "intelligente Transaktionstechnik" verwendet. Solid hat sich diese Technik patentieren lassen.

Die Flow Engine organisiert also Datenbanken in eine Flusstopologie, die aus einer möglicherweise großen Anzahl von Master- und Replizier-Knoten besteht, die untereinander Daten austauschen. Die Topologie ist hierarchisch aufgebaut. "Ein Master kann viele Reproduktionsknoten bedienen", versichert Ari Valtanen, Senior Vice President und Chief Technology Officer von Solid. Dementsprechend sei diese Technik geeignet für Systeme, in denen viele Netzknoten in einer flexiblen, skalierbaren und von der Anwendung kontrollierbaren Art über Datenaustausch zusammenarbeiten. Das Programm umfasst weniger als 2 MB und taugt daher für den Einsatz in kleinen Geräten wie kabellosen Terminals oder optischen Routern.

Die ersten Einsätze erlebte die Software, von der bereits mehr als zwei Millionen Lizenzen vergeben wurden, in der Telekommunikationsindustrie. Mittlerweile bekunden auch Ausrüster für den Business-Bereich ihr Interesse. So zertifizierte HP die Embedded-Version der Flow Engine für die "MC-Serviceguard"-Plattform, die dort für geringere Ausfallzeiten sorgen soll. EMC will das Programm in den "Data Manager" einbauen.

Abb: Architektur der Flow Engine

Aufbau der Flow Engine für eine verteilte Datenverwaltung: Ein relationales Datenbank-Managementsystem (SQL-92) kombiniert mit bi-direktionaler Synchronisation. Quelle: Solid