Europäische Initiative für Größtrechner (Teil 2 und Schluß)

Tflop-Rechner soll Bausteine unseres Universums erforschen

24.05.1991

In Europa hat sich eine von Physikern getragene Initiative namens ETI (European Teraflop Initiative) gegründet. Ihr Ziel ist der Bau eines Rechner mit einer Leistung von 1 Teraflop. Ziel ist, die Forderung Rubbias zu erfüllen und einen eigenen, europäischen Tflop-Computer zu bauen.

Die Initiative setzt sich auf deutscher Seite aus bedeutenden Forschern von DESY, CERN und verschiedenen Hochschulen zusammen. Diese Arbeitsgruppe wandte sich an die Aachener Parallelrechnerfirma Parsytec mit der Bitte uni Aussagen zu den konkreten Möglichkeiten einer Tflop-Technologie. Im zweiten Teil des Artikels beschreibt Manfred J. Heinze* den momentanen Stand der europäischen Teraflop-Initiative.

In der Informatik wurde dieses Konzept unter dem Kürzel MIMD für "Multiple Instruction Multiple Data" mit verteiltem Speicher (Distributed Memory) bekannt und steht im Gegensatz zum SIMD-Konzept, für " Single Instruction Multiple Data".

Mikroprozessor setzte neue Maßstäbe

Mit Entwicklung des Transputers durch das englische Unternehmen Inmos brach 1985 für die MIMD-Parallelverarbeitung ein neues Zeitalter an. Das Kunstwort Transputer (Transistor-Computer) drückt bereits die Idee aus, ganze Computer wie Transistoren miteinander zu verschalten, wobei die Kommunikationskanäle der Transputer, die Links, den Informationsaustausch übernehmen.

Mit dem Transputer wurde ein Mikroprozessor vorgestellt, der neue Maßstäbe setzte, da er nicht nur der schnellste 32-Bit-Mikroprozessor seiner Zeit war, sondern auch der erste Prozessor, der nicht nur Rechen-, sondern auch Kommunikationsleistung auf einem Chip integrierte.

Der Transputer ist bis heute der einzige Prozessor, der von seiner Architektur her für MIMD-Parallelverarbeitung konzipiert und in Massenstückzahlen verfügbar ist.

Mitte April 1991 schließlich stellte Inmos den T9000-Transputer vor. Er wird mit 50 Hertz getaktet, hat eine schnelle Fließkomma-Arithmetik mit 20 Mflops und 16 KB internen Speicher, der als Instruktionen- und Daten-Cache frei konfiguriert werden kann. Integriert sind außerdem ein erweiterter Prozeß-Scheduler, der das Taskswitching auf Hardware-Ebene übernimmt, und Kommunikations-Links mit einer Gesamtbandbreite von 80 MB/s.

Verglichen mit dem T800, realisiert der T9000 eine um den Faktor zehn höhere Leistung. Außerdem ist er mit einem "Instructiongrouper" ausgerüstet, der den eingelesenen Code darauf untersucht, ob einzelne Code-Elemente parallel auf den Komponenten des Chips ausgeführt werden können.

Von besonderem Interesse für Programmierer von massiv-parallelen MIMD-Rechnern dürfte die Integration von unendlich vielen virtuellen Kanälen über einen "Virtual Channel Processor" sein. In Kombination mit einem speziellen Routing-Chip ist die effiziente Kommunikation in einem massiv-parallelen System mit mehreren tausend Prozessoren sichergestellt.

Der Routing-Chip "C104" wurde im Rahmen des europäischen Forschungsprojektes Puma spezifiziert, in das die nunmehr über fünfjährigen europäischen Erfahrungen im Bau und Betrieb von Parallelrechnern einflossen.

Um 65 536 Prozessoren in ein System integrieren zu können, wird der Rechner aus elementaren Baublöcken zusammengesetzt. Insgesamt 16 "sichtbare" T9000-Transputer, ausgestattet jeweils mit 16 MB lokalem Speicher, und vier C104-Chips bilden diesen elementaren Baublock, der sich 4096fach im Tflop-Rechner wiederfindet.

Bei dieser Größenordnung von Prozessoren und Speicherelementen stellt sich natürlich die Frage nach der Betriebssicherheit. Die Konstruktion muß deshalb redundante Komponenten enthalten: Nur so läßt sich die Idee eines unbegrenzt skalierbaren massiv-parallelen MIMD-Rechners auch in funktionsfähige Systeme umsetzen.

Neben den 16 "sichtbaren" T9000-Transputern pro elementarem Baublock existiert deshalb ein weiterer "unsichtbarer" Prozessor, der im Bedarfsfall einen fehlerhaften Prozessor ersetzen kann.

Vier der elementaren Baublöcke mit 64 Prozessoren von 1 Gflop Gesamtleistung werden zu einer Grundeinheit vereint. Diese Grundeinheit bildet physikalisch eine autarke Zelle mit einer eigenen Spannungsversorgung und einem eigenen Kühlsystem. 1024 dieser Grundelemente werden durch eine externe Verschaltung in einem dreidimensionalen Gitter angeordnet, dessen Kantenlängen sich frei wählen lassen, zum Beispiel 8 x 8 x 16.

Bei dem Entwurf des Tflop-Rechners wurde größter Wert darauf gelegt, daß der Rechner für ein breites Spektrum an Anwendungen einsetzbar ist. Beispielsweise liegt dem Rechner ein dreidimensionales Gitter als Kommunikationsstruktur zugrunde, so daß sich eine Vielzahl von Informationsverarbeitungsproblemen, die in einer räumlich gegliederten Weit entstehen, optimal auf den Rechner abbilden lassen. Bisherige Erfahrungen etwa aus dem Bereich der Strömungssimulation auf massiv-parallelen MIMD-Rechnern bestätigen dies.

So wurde 1991 im Rahmen eines Schwerpunktvorhabens der DFG für Strömungssimulation die erste Ausbaustufe eines massiv-parallelen MIMD-Rechners (ein Parsytec Supercluster mit 256 Prozessoren und 600 Mflops) am Rechenzentrum der RWTH-Aachen installiert und am 2. Mai 1991 eingeweiht.

In der Endstufe wird dieser Schwerpunktrechner mit 512 Prozessoren der größte transputerbasierte Parallelrechner der Welt sein. Hier bereitet man sich schon jetzt auf den Einsatz der nächsten Generation von Höchstleistungsrechnern vor.

Die Tflop-Initiative befaßt sich inzwischen nicht nur mit den speziellen Interessen der Quantenchromodynamiker, sondern sie gibt auch Impulse für die Entwicklungszentren der Parallelverarbeitung. In den letzten Jahren sind eine Reihe von Algorithmen und Programmiermodellen für MIMD-Parallelrechner entwickelt worden, die nun in die zweite Generation gehen. Es zeigt sich schon heute, daß die über die Tflop-Systeme geführten Diskussionen wesentliche Einflüsse auf die Produktgestaltung von MIMD-Parallelrechnern mit einer Leistung von mehreren Dutzend Gflops haben. Die Verbreitung und das Einsatzspektrum dieser Rechner werden dadurch noch weiter gesteigert.