Eine Marktanalyse Wissenschaftler stellen Liste der Top-500-Supercomputer vor Von Hans-Werner Meuer und Erich Strohmaier*

12.11.1993

Die neueste Statistik ueber den Markt fuer Supercomputer beruht erstmals auf der Liste der 500 leistungsstaerksten installierten Computersysteme weltweit. Diese Top-500-Liste und ihre Auswertung werden in diesem Artikel diskutiert.

Ein stark innovativer Markt wie der fuer Hoechstleistungsrechner ist oftmals durch sehr rasche, sich zum Teil gegenseitig ueberholende Entwicklungen gekennzeichnet. Die Vektorrechner haben in den 80er Jahren ungefaehr ein Jahrzehnt von der Markteinfuehrung bis zur breiten Akzeptanz auch im industriellen Sektor benoetigt.

Verglichen mit dieser Entwicklungszeit vollzieht sich seit einigen Jahren mit rasantem Tempo eine Interessenverlagerung hin zu Parallelrechnern mit neuen Architekturen (MPPs: Massively Parallel Processing Systems). Zugleich wird die Vorstellung von Supercomputern als monolithischen, zentral betriebenen Geraeten durch die monatlichen Ankuendigungen neuer Superworkstations und die Entwicklungen hin zum Netzcomputing mit Workstation-Clustern stark in Frage gestellt.

MPP bieten besseres Preis-Leistungs-Verhaeltnis

Die Vorreiterrolle bei ersten Gehversuchen in diese Richtungen nehmen die Universitaeten und Grossforschungseinrichtungen ein, da sie ueber einen groesseren Spielraum fuer den Einsatz von neuen und damit risikoreichen Technologien verfuegen.

Beschleunigt werden diese Entwicklungen derzeit nicht nur durch entsprechende High-Performance-Initiativen - HPCC in den USA, HPCN in Europa -, sondern gerade auch durch den Einsparungsdruck auf die Haushalte der oeffentlichen Hand. Hier versprechen die Hersteller von massiv-parallelen Systemen deutlich bessere Preis- Leistungs-Verhaeltnisse als von den Konkurrenten aus dem High-end- Mainframe-Bereich.

Die Protagonisten von Workstation-Clustern locken gar mit dem Argument, dass notfalls einfach die bereits vorhandenen Workstations ueber Nacht als Cluster Supercomputerleistung fuer einzelne Anwendungen bereitstellen koennten. In Zeiten einer allgemeinen Rezession, in der auch die Betriebe in allen Bereichen rationeller produzieren muessen, wundert es daher nicht, wenn auch im industriellen Sektor verstaerkt der Einsatz von MPPs und Workstation-Netzen geprueft wird, auch wenn dort die Anforderungen an Qualitaet und Zuverlaessigkeit in der Regel weit hoeher sind als an Universitaeten. Den ueber mehrere Groessenordnungen skalierbaren MPPs und den von unten nachdraengenden Super-Workstations haben die traditionellen Hersteller von Vektorrechnern (wie Cray Research oder Convex) mittlerweile nicht nur eigene MPP-Projekte (T3D von Cray Research), sondern auch kleinere und kostenguenstigere Einstiegsmodelle entgegengesetzt. Eine einfache, klare und eindeutige Definition eines Supercomputers anhand seines Typenschilds, wie noch vor fuenf Jahren ohne weiteres moeglich, ist wegen dieser Entwicklungen mittlerweile illusorisch geworden. Zu gross sind die Leistungsbandbreiten selbst innerhalb einzelner Rechnerfamilien geworden.

Zur Analyse des Markts fuer Supercomputer bietet es sich daher an, nur Systeme ab einer gewissen, tatsaechlich installierten Leistung zu betrachten.

Um nicht jedes Jahr erneut willkuerlich eine Leistungsgrenze zeigen zu muessen, hat sich das Mannheimer Supercomputer-Seminar entschlossen, seine Statistiken in Zukunft auf die Liste der 500 leistungsstaerksten Installationen zu stuetzen.

Diese Zahl von 500 haben wir nach einer Vorstudie gewaehlt, in der wir, ausgehend von unseren letztjaehrigen Statistiken und mittleren Systemgroessen, abgeschaetzt haben, dass zwischen 500 und 1000 Systeme mit einer Leistung oberhalb von zirka 300 Mflops existieren. Diese Leistung liegt noch deutlich genug oberhalb der heute typischen Workstation-Leistungen, so dass die so ausgewaehlten Systeme sicher als Supercomputer gelten koennen. Eine deutlich kleinere Zahl haette hingegen nur unnoetigerweise unsere statistische Basis verkleinert.

Probleme der adaequaten Leistungsbewertung

Ein Problem stellt natuerlich die noetige Wahl eines Masses fuer die Leistungsbewertung eines Computers dar. Gerade im Bereich der Parallel- und Vektorrechner sind Leistungsvergleiche notorisch schwierig, da die Leistungen stark von den verwendeten Messprogrammen abhaengen. Je realistischer solche Messverfahren gestaltet werden, desto aufwendiger sind sie, so dass Resultate nicht fuer alle Rechner vorliegen.

Der Linpack-Benchmark von Jack Dongarra1, bei dem grosse lineare Gleichungssysteme geloest werden, behandelt ein einzelnes realistisches Problem aus der linearen Algebra und ist hinreichend einfach und damit sehr weit verbreitet. Da Resultate fuer nahezu alle fuer uns in Frage kommenden Rechner existieren, haben wir uns entschlossen, diese Leistungszahlen bei den Top 500 zugrunde zu legen.

Die verwendete Leistungszahl "Rmax" wird hierbei mit optimalen Problemgroessen fuer den jeweiligen Rechner gemessen. Die erreichten Leistungen sind daher durchweg sehr gut und stellen eine korrigierte Peak Performance "Rpeak" dar.

Fuer die Installationsdaten haben wir neben den Herstellern Supercomputer-Experten aus den jeweiligen Laendern und die an das Internet angeschlossenen Anwender befragt. Durch die ergaenzende und korrigierende Wirkung dieser unabhaengigen Informationsquellen und durch einen entsprechenden Review-Prozess haben wir die Qualitaet unserer Daten sichergestellt.

Damit waren wir in der Lage, im Juli 1993 weltweit erstmals die Top-500-Liste zu publizieren2. Lediglich verlaessliche Daten ueber IBM-Installationen fehlen in dieser ersten Version der Liste, die wir nun halbjaehrlich aktualisieren wollen. Vor allem aber haben wir damit ein neues Fundament fuer unsere Supercomputer- Statistiken, deren Genauigkeit uns Rueckmeldungen von verschiedener Seite bestaetigt haben.

Obwohl in den letzten Jahren von einigen Herstellern der Teraflops-Rechner (allzuschnell) versprochen wurde, war es fuer uns fraglich, ob ueberhaupt alle 500 Rechner der Top 500 zusammen 1 Tflops (1012 Gleitpunktoperationen pro Sekunde) erreichen wuerden.

Tatsaechlich wurde diese Marke mit 1,17 Tflops nur knapp ueberschritten. An der Spitze der Liste stehen dabei zwei grosse CM5-Systeme von Thinking Machines mit je 1024 Prozessoren und einer Linpack-Leistung Rmax von je knapp 60 Gflops. Das Schlusslicht hingegen ist der VP200 bei Debis in Muenchen mit 422 Mflops. In der Liste befinden sich somit Computersysteme, deren Leistungen um zwei Groessenordnungen differieren.

Andererseits sind die aufgefuehrten Systeme noch deutlich leistungsstaerker als alle heute lieferbaren Workstations. Die Entry-Level-Modelle von Cray Research, Convex oder kleinere Geraete der MPP-Hersteller wie Ncube, Parsytec, Kendall Square Research und anderen sind auch nicht vertreten, so dass wir unser Ziel, nur echte Supercomputer in unsere Liste aufzunehmen, erreicht haben.

Bei der Zahl der installierten Systeme pro Kontinent faellt auf, dass Japan mit 22 Prozent sogar noch hinter Europa (28 Prozent) deutlich weniger Supercomputer hat als die USA (46 Prozent). Bei unseren Statistiken der letzten Jahre sah dies noch wesentlich anders aus, allerdings wurden damals eben auch alle kleinen Modelle der Vektorrechner von Fujitsu, NEC und Hitachi mitgezaehlt, die es nun nicht mehr in die Top 500 geschafft haben.

Bei der installierten Leistung wird die Dominanz der USA mit 65 Prozent gegenueber Japan (17 Prozent) und Europa (16 Prozent) noch deutlicher. Sie wird verursacht durch die groessere Zahl von MPP- Systemen in den USA. Dort sind immerhin bereits 42 Prozent der Supercomputer aus dieser Rechnergattung und uebertreffen mit ihrer akkumulierten Leistung die Vektorrechner in den USA um zirka 50 Prozent. In Europa sind zwar 35 Prozent der Systeme MPPs, ihre akkumulierte Leistung ist aber noch deutlich kleiner als die der dort installierten Vektorrechner.

In Japan sind hingegen noch ueberwiegend die traditionellen Vektorrechner installiert, die MPP-Systeme sind mit 14 Prozent stark unterrepraesentiert. Dies koennte sich schnell aendern, wenn die japanischen Hersteller mit eigenen MPP-Modellen in den Markt gehen.

Aufgeschluesselt nach Herstellern liegt Cray Research sowohl nach Zahl der Systeme (41 Prozent) als auch nach installierter Leistung (35 Prozent) vorne. Waehrend dieses bei der Anzahl der installierten Systeme ein sehr deutlicher Vorsprung vor Fujitsu einschliesslich der Siemens-Nixdorf Informationssysteme AG (SNI) mit 14 Prozent, der Thinking Machines Corp. (TMC) mit elf Prozent, Intel (neun Prozent), Convex (sieben Prozent), NEC (sechs Prozent), Kendall Square Research (KSR) mit vier Prozent und Maspar (vier Prozent) ist, sieht es nach der installierten Leistung Rmax voellig anders aus.

In Europa liegt Deutschland an der Spitze

Hier rangiert TMC mit 30 Prozent nur knapp hinter Cray Research, die wiederum aufgrund der zum Teil ueberproportional leistungsfaehigen Systeme in den USA in Fuehrung liegt, vor dem japanischen Vektorrechnerhersteller NEC mit elf Prozent sowie Fujitsu/SNI und Intel mit jeweils acht Prozent. Ncube und DEC konnten genauso wie die Europaeer Meiko und Parsytec weniger als zehn Systeme in den Top 500 plazieren.

Immerhin 28 Prozent der Systeme wurden an die Industrie verkauft und damit etwa gleich viele wie an Universitaeten (32 Prozent) und an Grossforschungseinrichtungen (31 Prozent). Waehrend die Zahl der Systeme an geheimen Einsatzorten vier Prozent betraegt, ist ihr Anteil an der installierten Leistung mit zwoelf Prozent ueberproportional hoch. Die Leistung der Supercomputer in der Industrie hingegen summiert sich auf nur 13 Prozent, hier werden oftmals kleine und mittlere Vektorrechnermodelle eingesetzt, die groessten Modelle der Industrie tauchen erst ab Platz 29 in der Liste auf. Maximalausbauten von MPP-Herstellern fehlen hier noch voellig, was den geringen Prozentsatz an installierter Leistung begruendet.

Beschraenkt man sich nun einmal auf die 140 Supercomputer in Europa, so liegt Deutschland sowohl bei der Zahl (42 Prozent) als auch bei der Leistung (37 Prozent) deutlich vor Frankreich mit 19 Prozent der Systeme und 21 Prozent der Leistung und Grossbritannien mit 16 Prozent der Systeme und 23 Prozent der Leistung. Dieser Troika folgen Skandinavien, Benelux, die Schweiz und Italien.

Bei der Aufschluesselung nach Herstellern faellt zunaechst auf, dass die europaeischen Firmen Meiko (Grossbritannien) mit fuenf Prozent und Parsytec (Deutschland) mit zwei Prozent der Systeme selbst in Europa nur eine nachgeordnete Rolle spielen. Marktfuehrer ist wieder mit deutlichem Abstand Cray Research mit 38 Prozent der Systeme und 37 Prozent der installierten Leistung, gefolgt von SNI mit 13 Prozent der installierten Systeme sowie 14 Prozent der installierten Leistung.

SNI profitiert von seiner starken Position im deutschen Markt. Im Vergleich zur weltweiten Praesenz ist der ehemalige Minisupercomputer-Hersteller Convex mit zehn Prozent der installierten Systeme relativ stark vertreten, gemessen an der installierten Leistung macht das wegen der weniger maechtigen Systeme in Europa nur vier Prozent aus.

Der neue Highflyer heisst Kendall Square Research

Einen sehr guten Start in Europa hatte auch die Firma Kendall Square Research mit sieben Prozent der installierten Systeme und immerhin vier Prozent der installierten Leistung. Als Newcomer ist KSR erst seit Mitte 1992 auf dem Markt. Marktfuehrer in Europa bei MPP-Systemen ist der Weltmarktfuehrer in diesem Segment, die Firma TMC, in Europa - wie Convex - mit zehn Prozent der installierten Systeme, aber mit 17 Prozent der installierten Leistung vertreten.

Bei der Verteilung nach Anwendungen faellt das staerkere Uebergewicht der Bereiche Universitaet und Grossforschung auf. Der industrielle Sektor hinkt mit nur 20 Prozent der Systeme beim Einsatz von Supercomputern den USA hinterher.

Aus Deutschland schafften es immerhin 59 Systeme in die Top 500, die wir hier mit ihren Plazierungen in der weltweiten Top 500 wiedergeben wollen. Von diesen wurden 18 (30,5 Prozent) von Cray Research und 15 (25,5 Prozent) von Siemens-Nixdorf geliefert. Was die installierte Leistung betrifft, rangiert SNI mit 33 Prozent sogar vor Cray mit 27 Prozent.

Die Bedeutung von SNI wird durch die Kooperation mit KSR (fuenf Systeme ergeben einen Marktanteil von 8,5 Prozent) weiter verstaerkt. Zusammen mit KSR ist SNI in Deutschland damit auch bei den installierten Systemen an erster Stelle vor Cray Research zu nennen.

Nach Bundeslaendern sortiert liegt Nordrhein-Westfalen mit 24 Prozent (14 Systeme) vor Bayern mit 20 Prozent (zwoelf Systeme). Bei unserer ersten Top 50 in Deutschland3 im Juni 1993 war dies genau umgekehrt. Dahinter folgt Baden-Wuerttemberg mit 17 Prozent (zehn Systeme) vor Hessen mit zehn Prozent (sechs Systeme), Hamburg mit acht Prozent (fuenf Systeme) und Niedersachsen mit sieben Prozent (vier Systeme).

Aus den neuen Bundeslaendern ist nach wie vor als einziges System der VP200EX der Universitaet Dresden in den Top 500 vertreten. Leistungsmaessig betraegt dessen Anteil an der gesamtdeutschen Supercomputerleistung 0,7 Prozent, was den deutlichen ostdeutschen Nachholbedarf auf diesem Gebiet signalisiert.

Wie wir es erwarteten, dominieren unter den 500 leistungsfaehigsten Computern (noch) klar die Vektorrechner mit 344 installierten Systemen, das entspricht 69 Prozent. Interessant ist die MPP- Durchdringung auf den Kontinenten: Waehrend in den USA das Verhaeltnis Vektor zu MPP bereits wie 58 zu 42 ist, in Europa mit 65 zu 35 und in Deutschland mit 68 zu 32 in etwa der weltweiten Verteilung entspricht, ist die MPP-Durchdringung in Japan aeusserst schwach, das Verhaeltnis ist hier 86 zu 14 zugunsten der Vektorrechner.

Offensichtlich haelt Japan sehr stark an dem Einsatz der Vektorrechner fest, eine eigene MPP-Industrie ist dort nicht vorhanden. Der Vergleich zu RISC-Mikroprozessoren draengt sich auf, bei denen Japan praktisch ebenfalls nicht vertreten ist und diesen Markt voellig den USA ueberlassen hatte beziehungsweise ueberlassen musste.

Betrachtet man die installierte Leistung - wiederum muessen wir uns das Mass Rmax des Linpack-Benchmarks vergegenwaertigen -, dann sind die MPP-Systeme weltweit bereits mit 42 Prozent vertreten. In den USA haben die MPP-Rechner demnach - wuerden nur grosse Gleichungssysteme geloest - mit 54 Prozent schon knapp die Vektorrechner uebertroffen, in Europa (34 Prozent) und Deutschland (32 Prozent) liegt man knapp unter dem weltweiten Durchschnitt, waehrend in Japan lediglich zehn Prozent der installierten Leistung auf MPP-Systeme entfallen.

Wir werden, ermutigt durch unseren Erfolg bei der ersten Ausgabe der Top 500, diese regelmaessig halbjaehrig auf den neuesten Stand bringen. Fuer Interessenten mit Zugriff auf das Internet steht jederzeit die aktuellste Liste auf unserem FTP-Server "ftp.unimannheim.de" bereit, wo sie mit "anonymous ftp" unter dem Verzeichnis Top 500 gefunden werden kann.

Darueber hinaus ist geplant, im November 1993 einen etwa 200 Seiten starken Bericht unter dem Titel "Report on Top 500 Supercomputers in the World" herauszugeben.

Der Bericht basiert auf den Daten der Top-500-Liste vom Oktober 1993 und enthaelt unter anderem Analysen anerkannter Experten ueber die USA, Kanada, Japan, Europa, Deutschland, Frankreich, Vereinigtes Koenigreich sowie die Benelux-Laender.