Web

Fujitsu entwickelt schnellste Bio-Datenbank der Welt

14.07.2004

Der japansche Computerbauer Fujitsu entwickelt gemeinsam mit dem staatlichen Genforschungs-Institut (Idenken) eine Life-Sciences-Datenbank, die noch in diesem Jahr als schnellste ihrer Art in Betrieb gehen soll. Ein Prototyp auf Basis der Fujitsu-Engine "Shunsaku XML" befindet sich bereits im Probebetrieb.

Das Idenken betreibt eine der drei Hauptdatenbanken für genetische Informationen weltweit. Es sammelt die Daten aller staatlichen Genom-Forschungsprojekte und außerdem alle Public-Domain-Daten des japanischen Patentamts. Derzeit enthält das System 35 Millionen Einträge, unter anderem die DANN-Muster von 39,8 Milliarden Basen, und verdoppelt seine Größe jedes Jahr.

Aufgrund von rund 10.000 Datenbanksuchen täglich hat Geschwindigkeit für das Idenken-System höchste Priorität. Das gegenwärtige Produktivsystem auf Basis einer relationalen Datenbank benötigt für eine Suche nach zwei oder drei Schlüsselbegriffen rund zehn Minuten; schon der neue Prototyp verkürzt diese Zeit auf etwa fünf Sekunden.

Shunsaku erreicht seine hohe Geschwindigkeit aufgrund eines speziellen Suchalgorithmus, der ohne Datenbankindex auskommt. Alle Suchen laufen in Echtzeit, und Dokumente erscheinen in der Ergebnisliste, sobald sie zur Datenbank hinzugefügt wurden. Das System wurde ursprünglich für hoch performante Textsuchen entwickelt. Der Prototyp wurde zunächst entwickelt, um die Funktionen des vorhandenen Systems zu kopieren. Fujitsu-Sprecher Nick Hayashi geht davon aus, dass die neue Datenbank durch weitere Optimierungen bis zu 200 Mal schneller als das Altsystem werden kann.

In Japan ist Shunsaku bereits als "Interstage Shunsaku Data Manager Enterprise Edition" auf dem Markt. In den USA soll die Datenbank-Engine noch in diesem Jahr erhältlich sein. (tc)