Cluster verdrängen Supercomputer-Boliden

11.11.2004
Aus Tausenden Servern gebildete Hochleistungsrechner bieten Preisvorteile.

Seit der Supercomputing-Show "SC2004" in Pittsburgh ist die Rangordnung wieder so, wie es sich aus amerikanischer Sicht gehört. Nicht mehr der 2002 installierte japanische "Earth Simulator" führt die Rangliste der stärksten Rechner der Welt an, sondern ein - nicht einmal fertig gestellter - "Blue Gene/L", den IBM für das Lawrence Livermore National Laboratory in Kalifornien baut. Auf Platz zwei folgt das SGI-System "Columbia" am kalifornischen Ames Research Center der Nasa. 70,72 beziehungsweise 51,87 Teraflops (Billionen Gleitkommaberechnungen pro Sekunde) sind deutlich besser als die 35,86 Teraflops des Earth Simulator.

Der ungebremste Bedarf an Rechenpower schlägt sich in der 24. Top-500-Liste des Supercomputing deutlich nieder. 399 Rechner haben eine Leistung von mehr als 1 Teraflops; vor sechs Monaten waren es nur 242. Und um in die Liste aufgenommen zu werden, muss ein System heute schon 850 statt 624 Gflops bringen.

Billiger durch Standard-CPUs

Weiter angehalten hat der Trend zu Clustern statt massiver Systeme. Der Blue Gene ist ein Verbund von Power-5-Nodes. Mit geclusterten Blades arbeitet Europas stärkster Rechner, der "Mare Nostrum" in Barcelona (Platz vier der Liste). Auf Platz sieben steht ein "Super-Mac" aus "Xserve"-Servern von Apple. 296 Systeme lassen sich als Cluster einordnen. Die meisten Superrechner, nämlich 320, basieren auf Standardprozessoren von Intel; vor einem Jahr waren es nur 189. Mit Abstand folgen Systeme mit IBMs Power 5 (54), HPs PA-Risc (48) und AMD-CPUs (31).

Clustering reduziert deutlich die Kosten hoher Rechenleistung. So soll der Blue Gene rund 100 Millionen Dollar kosten, für den Earth Simulator waren noch 250 Millionen Dollar fällig. Der Super-Mac schlug mit gerade fünf Millionen Dollar zu Buche. IBM vermarktet den Blue Gene inzwischen gar als kommerzielles Produkt: Ein Rack mit einer Leistung von 5,7 Tflop/s (auf weniger als einem Quadratmeter!) kostet 1,5 Millionen Dollar. 64 Racks lassen sich maximal zusammenschalten.

Nach dem erfolgreichen Mare-Nostrum-Projekt halten kompakte Blade-Server Einzug im Supercomputing bei Unternehmen. Big Blue kündigte in Pittsburgh das System "p5-575" an, dessen Blades mit acht Power-5-CPUs bestückt sind. Die Sonderform dieses Prozessors arbeitet mit nur einem Rechenkern, ordnet diesem aber 36 MB Cache-Speicher zu. Bis zu 64 der Acht-Prozessor-Nodes bilden ein Cluster.

Der nächste Schritt im Highend sind virtuelle Supercomputer beziehungsweise Grids. So sind im Projekt "Distributed European Infrastructure for Su-percomputing Applications" (Deisa) vier IBM-Großrechner zusammengeschaltet. Zwei aus Deutschland und je einer aus Frankreich und Italien verei-nen mehr als 4000 Prozessoren und schaffen eine Leistung von 22 Tflop/s. In Kürze sollen noch zwei Systeme aus Groß-britannien und jeweils eines aus Finnland und den Niederlan-den zugeschaltet werden. Die beteiligten Großforschungsinstitute hätten ohne diesen Computerverbund die benötigte Rechenleistung nicht bezahlen können.

Besonders in puncto Einstiegstechnik für Supercomputer-Cluster tut sich viel. Dell präsentierte mit dem "Poweredge SC1425" eine abgespeckte Version des "1850"-Rechners, der mit Intels 32- und 64-Bit-Chip "Xeon EM64T" ("Nocona") arbeitet. Der neue Rechner kommt ohne zweite Stromversorgung und ausgefeilte Festplattenfunktionalität aus, da diese für Cluster-Verbünde nicht benötigt werden. Als Basissoftware verwendet Dell das Programm "Rocks" von Platform Computing. Zu den Aufgaben der Software gehört es, Nachrichten unter den Server-Knoten zu verteilen und zu verwalten sowie Anwenderprogramme auszuliefern. Dells Lösung skaliert bis zu 256 Rechner im Verbund. Ein Cluster mit acht Knoten, Linux-Betriebssystem, Installation und Servicevertrag kostet in den USA 33 500 Dollar.

HP setzt auf Itanium 2

HP baut das Angebot an neuen Cluster-Servern auf den "Itanium"-Prozessoren auf, die in Kooperation mit Intel entwickelt wurden. Unter dem Begriff "Unified Cluster Portfolio" bündelt HP die Hardware mit der hauseigenen "XC-System"-Software für die Verwaltung der Rechnerverbünde und der Speicherlösung "Scalable File Share". Ergänzt wird das Angebot durch Dienstleistungen für Installation und Konfiguration. Der Startpreis für ein Paket mit 16 Servern liegt bei 6000 Dollar. Der Hersteller arbeitet derzeit an einem Grafiksystem auf Cluster-Basis, das Bilder mit einer Auflösung von 100 Millionen Pixel liefern soll. HPs "Scalable Visualization System" soll Mitte nächsten Jahres fertig sein.

Noch in diesem Jahr will das Startup-Unternehmen Ciara Technologies sein Linux-Cluster "VXR-3DT" auf den Markt bringen. Die Lösung skaliert von 16 bis 19 440 Xeon-Prozessoren. Die Cluster-Knoten sind untereinander gekoppelt und über schnelle Infiniband-Kanäle mit einem Speichersystem verbunden. Auf AMDs 32/64-Bit-Prozessoren der Opteron-Klasse mit ihrer Hypertransport-Verbindung und auf Infiniband setzt die Firma Pathscale aus dem kalifornischen Sunnyvale. Deren Lösung "Infinipath" soll das Cluster-Interconnect mit der niedrigsten Latenzzeit der Welt sein. (ls)