Web

IBMs Data-Mining-Framework Minelink soll komplexe Daten durchleuchten

10.08.2004

IBM hat unter der Bezeichnung "Minelink" ein Data-Mining-Framework entwickelt: Die Technik soll es ermöglichen, Informationen aus unterschiedlichen Quellen nicht nur zu integrieren, sondern auch in einen inhaltlichen Zusammenhang zu bringen. Minelink nutzt Funktionen der hauseigenen Datenbanktechnik "DB2 Discovery Link". Während Discovery Link jedoch nur Rohdaten einbindet, vermag es Minelink, Informationen zu analysieren sowie zu visualisieren. Big Blue nennt den Ansatz "Federated Data Mining Framework", da sowohl verschiedene Informationsquellen als auch bestehende Data-Mining-Werkzeuge eingebunden werden können.

Entwickelt wurde Minelink an IBMs Almaden-Forschungszentrum. Ursprünglich diente das System dazu, Informationen aus weltweit verteilten Genom-Datenbanken zu extrahieren, zu analysieren sowie zu integrieren, um beispielsweise Diagnosen zu stellen sowie Heilungsmethoden für Krankheiten zu finden. Prinzipiell eignen sich die Verfahren aber auch für andere Daten. Firmen wären beispielsweise in der Lage, ihre auf unterschiedliche IT-Systeme verteilten Stammdaten zu konsolidieren oder Beziehungen zwischen Einträgen in umfangreichen Data-Warehouses ausfindig zu machen.

Wann Minelink das Forschungslabor verlässt und gemeinsam mit dem Datenbanksystem DB2 angeboten wird, steht noch nicht fest. Laut dem Nachrichtendienst "News.com" könnte dies in ein bis zwei Jahren geschehen.

Der Hersteller unternimmt große Anstrengungen, um Produkte zum Integrieren unterschiedlicher Datenquellen auf den Markt zu bringen. Unlängst hatte das Unternehmen mit "Websphere Product Center" eine Lösung für das Produkt-Informations-Management auf den Markt gebracht, das auf der Technik der übernommenen Firma Trigo aufsetzt. Auch "DB2 Information Integrator" dient dazu, unterschiedliche Datentöpfe im Unternehmen anzuzapfen. (fn)