Mehr als tausend Prozessor-Knoten realisierbar:

Drei-Mann-Team entwickelt Parallelrechner

07.08.1987

MÜNCHEN (CW) - Ihren ersten Parallelrechner hat die P1 GmbH jetzt vorgestellt. Parwell, so der Name, ist ein hierarchisch aufgebautes Multiprozessorsystem, das speziell für rechenintensive Anwendungen, wie etwa Berechnungen von Strömungen oder Finiten Elementen und Bildverarbeitung, geeignet ist. Zielmärkte sind daher wissenschaftliche Institute sowie Entwicklungs- und Forschungsabteilungen in großen Unternehmen.

Bei der Konzeption von Parwell haben sich die drei Entwickler für die Baumstruktur entschieden, weil, so die Begründung des Münchener Unternehmens, es hierbei keine architekturbedingten Grenzen der Ausbaufähigkeit gebe. So sind Konfigurationen mit über tausend Knoten denkbar. Ein Masterknoten an der Spitze übernimmt die Kommunikation mit dem Host. Ihm sind Knotenrechner untergeordnet, denen jeweils wieder Knotenrechner untergeordnet sein können, und so weiter.

Einzelne oder mehrere Knoten können von jedem hierarchisch wichtigen Knoten über einen speichergekoppelten transparenten Baumdurchgriff (32-Bit-Bus) und über beliebig viele Ebenen angesprochen werden. Der schreibende Zugriff auf alle untergeordneten Knoten ist mit einer einzigen Adressierung (Broadcasting) möglich.

Ein Knotenrechner besteht aus einem 32-Bit-Eingangsbus, einem 68020-Mikroprozessor, einer 68881-Fließkomma-Einheit, 1 bis 4 MB RAM, der Dual-Port-Logik (DPL) für Speicherzugriffe von übergeordnetem Bus und lokalem Prozessor sowie einem 32-Bit-Ausgangsbus. Die Leistung eines solchen Knotens gibt der Hersteller mit 2,4 Mips und 1 MFlops an. Jeder Knotenrechner kann als Masterknoten für die in der Baumstruktur niedriger tangierenden Knoten fungieren. Um eine höhere Integrationsdichte zu erreichen, sind pro Platine zwei Knotenrechner (A und B) implementiert, von denen aber nur Knoten A einen Ausgangsbus besitzt.

Die Knoten des Parallelrechners sind mit einem prozessorunabhängigen Bus gekoppelt und können daher mit unterschiedlichen Mikroprozessoren betrieben werden. Ein ausfallender Knoten beeinflußt nur den anschließenden Parwell-Teilbaum. Je weiter oben in der Hierarchie also der Ausfall auftritt, desto weniger Knoten sind noch arbeitsfähig.

Die Parwell-Entwicklungsumgebung gleicht laut Entwickler der einer normalen Workstation. Der Benutzer schreibt und entwickelt seine Programme unter Unix in Modula-2. Hierfür werden eine Reihe von Tools angeboten, die vom Editor über den Compiler bis zum High Level Debugger reichen. Auch existieren eine Fortran- und C-Schnittstelle.

Dem Anwender steht eine Schnittstelle zur Verfügung, die auf einer automatischen rekursiven Selbstkonfiguration des Rechners aufbaut. Beim Programmstart wird dem Programm mitgeteilt, wie viele Knoten sich wo auf welcher Ebene im Parwell-Baum befinden. Auf diese Weise, so die Entwickler, laufen die Programme ohne Rekompilierung auf Systemen unterschiedlicher Knotenanzahl.

In Entwicklung befinden sich sowohl ein objektorientiertes Modula-2 (Herbst '87) als auch "Linda", eine Parallelrechner-Hochsprache, die an der Yale University entworfen wurde. In Verbindung mit Modula-2 erlaubt Linda die Ansprache und Kontrolle von Parallelrechnern unterschiedlicher Architekturen.

Die Host-Kopplung von Parwell ist so gestaltet, daß unterschiedliche Herstellertypen angebunden werden können. Realisiert wurde bereits der Anschluß an die Systeme DN 3000 (Apollo) sowie WS30 (Siemens). Eine Verbindung zum Apple Macintosh II wird voraussichtlich ab Herbst dieses Jahres verfügbar sein. Die Ankopplung an IBM-Rechner und die VAX von DEC ist in Vorbereitung (Frühjahr 1988). Seit Dezember 1986 besteht eine Kooperation mit der Siemens AG, die eine Parwell-Konfiguration zu Testzwecken einsetzt.

Eine fertige Parwell-Arbeitskonfiguration (inklusive Software, aber ohne die jeweilige Workstation) beläuft sich auf etwa 60 000 Mark Fixanteil und zirka 10 000 Mark je weiterer Knoten, teilen die Münchner mit. Die Lieferzeit für kleinen bis mittleren Konfigurationen mit Leistungen von 40 Mips und 16 MFlops bis 320 Mips und 128 MFlops beträgt rund acht Wochen.