Talend Open Studio: Datenintegrationstechnik als Open Source

23.10.2007
Die kostenlosen Werkzeuge dienen der Synchronisation, Verteilung, für ETL und zur Migration von Daten.

Talend Open Studio ist aktuell in Version 2.2 als kostenloser Download auf der Website des Anbieters Talend erhältlich. Es bietet eine Werkzeugumgebung auf Basis des Eclipse-Frameworks, mit der sich Aufgaben bei der Verwaltung datenzentrierter Unternehmensanwendungen oder eines Data Warehouse automatisieren lassen. So können Anwender mit dem Tool "Talend Open Studio Business Modeler" Datenbewirtschaftungsprozesse entwerfen und diese mit Hilfe des grafischen Entwicklungswerkzeugs "Talend Open Studio Job Designer" implementieren. Hierfür steht eine Komponentenbibliothek bereit. Diese bietet Basisfunktionen für Mappings, Transformationen und Lookups sowie solche für die Filterung von Daten, Multiplexing und zur Extraktion, Transformation und Landen (ETL) von Daten.

Die Datenbewirtschaftungsprozesse lassen sich mit Hilfe des Tools Talend Open Studio Job Designer implementieren.
Die Datenbewirtschaftungsprozesse lassen sich mit Hilfe des Tools Talend Open Studio Job Designer implementieren.

Ebenso werden laut Talend Schnittstellen zu marktgängigen relationalen Datenbanken, diversen Dateiformate und LDAP-Verzeichnissen unterstützt. Fehlende Komponenten lassen sich in Java, Perl oder SQL entwickeln. Mit der aktuellen Version 2.2 soll sich die Zahl der verfügbaren nativen Datenkonnektoren auf 150 belaufen. Neueste Zugänge sind Konnektoren für Slowly Changing Dimensions für MySQL, Oracle, Ingres, MS SQL, DB2 und Sybase (inklusive Support für Typ 1, 2 und 3), die Unterstützung von gespeicherten Verfahren in Oracle, Microsoft SQL, Ingres, MySQL, DB2 und der native Support Datenbanken wie Teradata oder Plattformen wie "IBM System i ".

Weitere Features von Talend Open Studio sind ein zentraler Metadaten-Speicher für alle Projektinformationen sowie solche zur laufende Fehlerbeseitigung (Debugging) der Datenflüsse. Zudem lässt sich die Datenbewirtschaftung auf Rechnerknoten verteilen und setzt keine zentrale Server-Instanz voraus. Neu in Talend Open Studio 2.2 ist die "Activity Monitoring Console", Personal Edition, mit der Administratoren Datenintegrations-Jobs überwachen sowie Statistiken und Trends zu diesen auswerten können. Zudem erscheinen in der Konsole Warnmeldungen bei Störungen oder Ausfällen.

Talend wurde 2003 von französischen Entwicklern gegründet. Im letzten Jahr kam die erste Version von Talend Open Studio auf den Markt. Seit Oktober 2007 ist Talend auch in Deutschland aktiv. Nach eigenen Angaben wurde die Tool-Sammlung bereits 150 000 Mal aus dem Netz geladen. Zusätzlich bietet das Unternehmen die kommerzielle Werkzeugsammlung "Talend Integration Suite". Sie erweitert die Open-Source-Produkte um technischen Support sowie zusätzlichen Features beispielsweise für den Einsatz und das Monitoring komplexerer Lösungen. Ferner können Unternehmen das Mietangebot "Talend on Demand" anfragen, für das der Anbieter das Hosting übernimmt. Es soll das verteilte Arbeiten mit der Datenintegrationssoftware unterstützen, indem es sämtliche Projektdaten an zentraler Stelle verwaltet. Zur Auslagerung von Unternehmensdaten ist das Angebot nicht gedacht. (as)