Erstmals auf dem Supercomputer-Seminar in Mannheim

Hitliste: Top-50-Anwender von Supercomputern in Deutschland

04.06.1993

*Professor Dr. Hans-Werner Meuer ist Direktor des Rechenzentrums der Universitaet Mannheim; Dr. Erich Strohmaier ist wissenschaftlicher Mitarbeiter am Rechenzentrum der Universitaet Mannheim in einem von der Siemens-Nixdorf Informationssysteme AG finanzierten Projekt zur Leistungs-messung von Supercomputern

*Daten, Hinweise und Kommentare zu den Top-50- beziehungsweise Top-500-Listen, fuer die wir sehr dankbar waeren, koennen an die Autoren etwa per E-mail an top500rz.uni-mannheim.de uebermittelt werden. Beide Listen werden auch per anonymous ftp auf dem server ftp.uni-mannheim.de erhaeltlich sein.

In Deutschland gibt es derzeit schaetzungsweise mehr als zehn Millionen Computer: vom wenige hundert Mark preiswerten PC bis hin zur Cray 2 der Universitaet Stuttgart, die bei der Anschaffung seinerzeit 40 Millionen Mark kostete. Aber wo befinden sich die derzeit leistungsfaehigsten Rechner in Deutschland? Im folgenden Beitrag wird erstmals die Top-50-Liste der in Deutschland eingesetzten Supercomputer praesentiert.

Auf dem Mannheimer Supercomputer-Seminar, das in diesem Jahr zum achtenmal vom 24.-26. Juni stattfindet, praesentieren Jack Dongarra und Hans Meuer erstmalig die TOP-500-Liste der weltweit leistungsstaerksten installierten Computer. Der Markt fuer Supercomputer und Parallelrechner steht als High-Tech- Schluesselindustrie des kommenden Jahrhunderts sehr viel staerker in der Aufmerksamkeit der Oeffentlichkeit, als dies die Anzahl der Geraete dieser Rechnerklasse erwarten laesst.

Das Interesse der Hersteller, bei Statistiken ueber dieses hart umkaempfte Marktsegment mit guten Zahlen zu glaenzen, ist daher besonders gross. Bis vor wenigen Jahren bestand die Liste der in Frage kommenden Rechner nur aus Vektorrechnern mit einem oder wenigen (bis zu vierProzessoren amerikanischer (Cray Research Inc., Control Data Corp. ; CDC) und japanischer Hersteller (Fujitsu, NEC, Hitachi).

Da die Leistungsbandbreiten dieser Modellserien verhaeltnismaessig klein waren, konnten aussagekraeftige Basisdaten fuer Statistiken durch einfaches Zaehlen der installierten Systeme gewonnen werden. Auf solchen Daten basierten die seit 1986 auf dem Mannheimer Supercomputer-Seminar veroeffentlichten Formel-1- und Parallelrechner-Statistiken.

Durch die Entwicklung hin zu MP-Systemen (Multiprozessormit bis zu 16 Vektorprozessoren, der Diversifizierung der Produktpaletten durch EL-Modelle (Entry-Level) und dem starken Aufkommen der MPP- Rechner (Massively Parallel Processing) wurde diese Art der Datengewinnung aber immer fragwuerdiger. Zwischen der Leistung des Minimal- und des Maximalausbaus eines Parallelrechners kann heute gut und gerne ein Faktor 100 liegen. Die Leistungsbandbreiten der verschiedenen Rechner ueberlappen sich nahtlos, so dass es nicht mehr sinnvoll ist, alle Installationen eines Modells zu beruecksichtigen und die eines anderen zu vernachlaessigen.

Hinzu kommt das Problem der veralteten Ex-Supercomputer, zum Beispiel der Cray-XMP- oder Siemens-VP100-Systeme etc. Die Groesse der einzelnen Installationen muss beruecksichtigt werden, um aussagekraeftige Statistiken erstellen zu koennen.

Angeregt durch die bekannten Top-500-Listen des Wirtschaftsmagazins Forbes (Zusammenstellung der umsatz- und gewinntraechtigsten Unternehmen, der 500 reichsten Menschen etc.) haben wir uns daher entschlossen, die traditionell auf dem Mannheimer Supercomputer-Seminar Ende Juni publizierten Statistiken ab diesem Jahr auf unseren Listen der 50 leistungsstaerksten Rechner Deutschlands (Top50) und der 500 staerksten der Welt (Top500) aufzubauen.

In diesem Artikel analysieren wir die aktuelle Situation in Deutschland anhand der ersten Top-50-Liste. Diese und ihre Auswertung wird als Fortfuehrung der bekannten Formel-1-Statistiken in der Eroeffnungssitzung des diesjaehrigen Supercomputer-Seminars am 24. Juni 1993 in Mannheim praesentiert werden.

Das groesste Problem stellt die Wahl eines geeigneten Leistungsmasses dar. Waehrend fuer Forbes noch klar ist, wie man Dollar in Mark umrechnen kann, gibt es bei Computern kein allgemeines, brauchbares Mass in Form einer Zahl fuer die Leistung. Realistische Benchmarks produzieren oftmals Zahlenkolonnen und sind nur fuer einige Rechner erhaeltlich.

Jack Dongarra hat seit Jahren mit seinem Linpack-Benchmark einen Mittelweg gesucht zwischen reinen Spitzenleistungsangaben und umfangreichen Anwendungs-Benchmarks. Zur Leistungsmessung benutzt er einen wichtigen Algorithmus zur Loesung linearer Gleichungssysteme und gewinnt damit eine Zahlenangabe, die wiederum eine bessere Beschreibung der Rechner fuer diese Anwendungsklasse wiedergibt.

Da der Aufwand zur Durchfuehrung dieser Messungen relativ gering ist, sind Ergebnisse fuer nahezu alle Rechner publiziert. Als Variante fuer besonders leistungsfaehige Systeme bietet sich der sogenannte Linpack-Benchmark "NxN Best Effort" an, bei dem sowohl die Groesse des Gleichungssystems guenstig gewaehlt als auch das Loesungsprogramm optimiert werden darf.

Die breite Verfuegbarkeit dieser Zahlen hat uns bewogen, in Zusammenarbeit mit Jack Dongarra diese Leistungsangaben "Rmax" des Benchmarks "Highly Parallel Computing" als Grundlage fuer unsere Top-Listen zu verwenden (per E-mail von netlibornl.gov erhaeltlich).

Fuer die deutsche Top-50-Liste ergibt sich damit folgendes Bild. 39 traditionelle Vektor-Mainframes (Cray YMP, Siemens-VP/S-Serie, NEC, Convex) stehen elf MPP-Systemen (KSR-1 von Kendall Square Research, CM-Modelle von Thinking Machines, iPSC/860 von Intel) gegenueber und dominieren damit nach wie vor die Spitzengruppe.

Betrachtet man aber nur die Installationen in den Kalenderjahren 1992/1993, so finden sich neun Vektorrechner und sechs MPP- Systeme. Zu diesen kommen eventuell noch weitere vier MPP-Systeme hinzu, die bisher nur als Kandidaten fuer die Top 50 registriert sind, da sie zwar ueber hohe theoretische Spitzenleistungen verfuegen, aber fuer sie noch keine Rmax-Werte publiziert wurden. Der Trend geht auch bei Supercomputern eindeutig weg von den Mainframes und hin zu MPP-Systemen, die auf Standard- Mikroprozessoren basieren.

Fuehrend in Deutschland ist nach wie vor Cray Research mit einem Marktanteil von 42 Prozent, gefolgt von der SNI AG, die mit den Fujitsu-Vektorrechnern ueber 26 Prozent Marktanteil verfuegt. Der Newcomer KSR erreicht in Deutschland mit zehn Prozent bereits Platz drei. Beruecksichtigt man die Kooperation von KSR mit SNI, so wird die besondere Bedeutung von SNI in Deutschland noch deutlicher. Convex haelt acht Prozent und Thinking Machines sowie Intel jeweils sechs Prozent des Marktes.

Die gesamte addierte Rechenleistung der Top-50-Supercomputer in Deutschland betraegt 47,8 Gflops. Vergleicht man diese Zahl mit den vollmundigen Ankuendigungen einiger Hersteller Ende 1991, demnaechst Tflops-Rechner bauen und liefern zu koennen, so wirkt sie ernuechternd. Von Tflops sind wir noch einige Jahre und etliche Millionen Mark entfernt.

Um in die Top 50 zu gelangen, genuegen derzeit zirka 300 MFlops Leistung, was in etwa einer Cray-YMP-CPU entspricht. Waehrend es KSR, Intel und auch Convex mit ihren Spitzenmodellen zum erstenmal in die Formel1 geschafft haben, blieb dies den beiden heissen Aspiranten Parsytec und Ncube noch verwehrt.

Von Parsytec fehlen nach den grossen Gcel-Installationen noch Leistungsdaten, bei Ncube steht eine groessere Installation in Deutschland kurz bevor, ist aber noch nicht erfolgt.

Interessantes ergibt sich auch, wenn man die Rechner nach Bundeslaendern sortiert. Bayern liegt mit 20 Prozent wegen der grossen Zahl von Industrie-Kunden an der Spitze, gefolgt von Nordrhein-Westfalen mit 16 Prozent. Es folgen mit jeweils zwoelf Prozent Baden-Wuerttemberg, Hessen und Hamburg, waehrend in allen neuen Bundeslaendern lediglich zwei Systeme stehen, die leistungsmaessig nur 1,6 Prozent der Top 50 ausmachen.

Hier zeichnet sich also einmal mehr sehr deutlich der Zustand und Nachholbedarf im High-Tech-Bereich ab. Splittet man die gesamte verfuegbare Rechenleistung aller in Deutschland installierter Supercomputer nach Bundeslaendern auf, liegt Nordrhein-Westfalen wegen einiger sehr grosser Installationen mit 27,2 Prozent eindeutig vor Bayern mit 18,9 Prozent und Baden-Wuerttemberg mit 18,7 Prozent an der Spitze. Diese drei Bundeslaender verfuegen ueber zwei Drittel der Supercomputer-Kapazitaet in Deutschland.

Die branchenspezifische Analyse nach Branchen zeigt, dass an Universitaeten etwa die Haelfte, an Grossforschungseinrichtungen und bei der Industrie jeweils rund ein Viertel der Systeme installiert ist. SNI ist dabei mit seiner KSR-Referenz-installation der einzige industrielle Kunde eines MPP-Systems. In diesem Bereich konnten die Formel-1-MPPs noch keinen Einzug halten, obwohl alle Hersteller grosse Anstrengungen in dieser Richtung unternehmen.

Nachdem bereits die gruendliche Analyse der Top 50 in Deutschland fuer uns einige interessante und neue Aspekte gezeigt hat, sind wir selbst neugierig, was unsere erste weltweite Top-500-Liste, an der wir gerade arbeiten, Ende Juni an Ueberraschungen bereithaelt.