AT&T Global Information Solutions: Massiv-parallele DB bedient kommerzielle Anwendungen Von Dieter Buelow*

02.09.1994

Mit kommerziellen Anwendungen hat die Massiv-parallel-Verarbeitung ein Problem: Die Software dafuer muesste eigentlich voellig neu geschrieben werden. AT&T Global Information Solutions (GIS), ehemals NCR, die ihrerseits 1992 mit dem MPP-Pionier Teradata fusionierte, hat sich auf die Loesung dieses Problems konzentriert.

Die Loesung besteht aus mehreren Schritten. Der erste: Der riesige Arbeitsaufwand, kommerzielle Software fuer MPP-Rechner zu schreiben, wurde auf die Entwicklung eines MPP-Datenbankservers fokusssiert. Das Konzept entspricht dem Modell "Client-Database- Server".

Client kann dabei sowohl das Programm auf dem Mainframe oder dem PC im Netz, als auch ein Programm aus einem TP-Monitor (CICS, IMS/DC) sein. Idee und Fakten dahinter: Zeitfresser in kommerziellen Anwendungen sind die Datenbankabfragen. Das gilt schon fuer Online Transaction Processing und noch mehr fuer Aufgaben des Decision Support. Abfragesprache fuer Teradata ist natuerlich SQL. So wird jede Anwendungsfunktion fuer Entwickler und Benutzer transparent.

Das massiv-parallele Teradata-RDBMS durchsucht vollstaendig, bearbeitet und aktualisiert mit kurzen Antwortzeiten Informationen, die frueher unvorstellbar waren - in der Praxis derzeit bis zu 3 TB. Diese Informationsmengen stellt AT&T in der gleichen Betriebssystemumgebung, naemlich Unix, zur Verfuegung, die auch das OLTP (Online Transaction Processing) fuer das Tagesgeschaeft abwickelt.

Der zweite Schritt: Der MPP-Datenbankrechner wird durch ebenfalls massiv-parallele Technik mit Universalrechnern der offenen Systemwelt (Unix, NT) verknuepft. Unter Unix setzt

AT&T eng gekoppelte Multiprozessorsysteme mit der Standard- Systemsoftware Symmetric Multiprocessing (SMP) ein, die ihrerseits Teil der lose gekoppelten MPP-Architektur werden. Die entscheidene Leistung des von USL, ehemals auch eine AT&T-Tochter, entwickelten SMP: Herkoemmliche kommerzielle Anwendungssoftware fuer Unix wird automatisch parallelisiert. SMP-Rechner wiederum dienen heute routinemaessig als Server fuer DOS-, Windows, OS/2- und andere Clients.

Migrationssoftware fuer Mainframes

Der dritte Schritt war die Erstellung von Migrationssoftware fuer Mainframe-Systeme. AT&T Global Information Solutions uebernimmt nach eigenen Angaben jede Anwendung von Mainframes (MVS, BS 2000, GCOS etc.) in die Unix- und MPP-Welt.

Das Prinzip der Produktfamilie 3000 ist, dass sie vom Notepad ueber Workstations, Uniprozessor-, Multiprozessor, Parallelcluster- bis zu MPP-Servern aufwaerts kompatibel ist. Die Prozessoren stammen von Intel. Bei der Modellreihe 3600, den aktuellen, massiv- parallelen Systemen, gibt es zwei Haupttypen von Prozessoren.

Die "Application Processors" (AP) und die "Access Module Processors" (AMP). Die einzelnen APs sind nach dem Prinzip des Symmetrischen Multiprocessing (SMP) aufgebaut - zusammen bilden sie eine lose gekoppelte Parallelrechnerarchitektur (LCMP). Auf ihnen koennen parallele, offene Datenbanksysteme wie zum Beispiel Oracle, Informix und Sybase eingesetzt werden. Sie sind die Traegersysteme fuer kommerzielle Anwendungen.

Eine grosse Anzahl Clients im Netzwerk (Ethernet, SNA, Token Ring etc.) koennen nach dem Prinzip Client/"Transaction"-Server auf die Anwendungen, die auf den lose gekoppelten APs laufen, zugreifen.

Das offene Transaktionverarbeitungssystem "Top End" ermoeglicht paralleles Online Transaction Processing (OLTP) ueber bis zu 48 APs, transparentes Transaction Routing, Lastverteilung und Software-Fehlertoleranz der Anwendungen.

Fuer die Parallelisierung und die Kommunikation zwischen APs und AMPs spielt das sogenannte "Ynet", eine intelligente, Entscheidungen treffende Netzwerkstruktur, die fuehrende Rolle. Ynet ist ein Software- und ein Hardwarebegriff.

Als logisches System parallelisiert es die Datenbankanfragen automatisch, weist sie den massivparallel geschalteten Datenbankprozessoren zu und fuehrt sie nach Erledigung wieder zusammen, um sie als fertige Antwort den anfragenden Systemen zur Verfuegung zu stellen. Ynet fuehrt auch datenbanktypische Dienste wie zum Beispiel Sortieren aus.

Die im Jahre 1983 fuer Teradata patentierte Idee dahinter: Das intelligente, logische Netz zerlegt die zu parallelisierenden Aufgabenstellungen immer jeweils in zwei Komponenten, diese wiederum in zwei und so weiter, wobei es diesen Weg ebenso wieder zurueckverfolgt.

Es entsteht so eine Baumstruktur, deren Grundelement der Topologie des Buchstabens Y entspricht. Dieser logischen Baumstruktur gleicht eine ebenso aufgebaute physische Netzstruktur: Jeder Prozessor steht mit jeweils drei anderen in Direktverbindung, und auf dem Umweg ueber andere ist jeder mit jedem verbunden. Sogenannte "Parsing Engines" (PE) unterstuetzen das Ynet durch Routing der SQL-Statements zwischen APs und AMPs.

Das Ynet hat einen Punkt-zu-Punkt-Durchsatz von zwei mal sechs gleich 12 MB/Sekunde. Da von den lokalen Netzen die Rechenweise in Bit/s vertraut ist, sei darauf hingewiesen: Byte/s, nicht Bit/s, also umgerechnet brutto 96 Megabit/s. Das Ynet hat doppelte Kanaele, die ihre Kapazitaet im Normalbetrieb addieren, waehrend bei Stoerungen in einem Strang der andere seine Aufgabe ohne Unterbrechung mit uebernimmt.

Bynet: Jeder Knoten mit ist mit jedem verbunden

Mit Hilfe eines Hash-Algorithmus verteilt das Ynet jede Tabelle gleichmaessig auf alle Datenbankprozessoren. Jeder von ihnen verwaltet seinen Teil der Tabelle autonom nach dem "Shared- Nothing"-Prinzip, das heisst, er muss weder Arbeitsspeicher noch Platte noch CPU-Ressourcen teilen. Zwei Parallelitaetseffekte kommen laut AT&T dadurch zum Tragen und gewaehrleisten lineare Skalierbarkeit:

1. Direktzugriffe mit Index-Unterstuetzung beanspruchen nur einen oder zwei Datenbankprozessoren fuer Index- und Datenzugriff zusammen. Im statistischen Mittel werden alle Prozessoren gleichmaessig parallel ausgelastet. Die Anzahl der moeglichen Direktzugriffe ist dadurch proportional zur Anzahl der Prozessoren.

2. Beim "Full Table Scan" (Totaldurchsuche) gehen alle Datenbankprozessoren parallel, gleichzeitig und autonom ihren Teil der Tabelle durch. Die Ergebnistabelle erstellt das intelligente Ynet.

Dadurch, dass als Prozessoren, Arbeitsspeicher und Festplatten Standardkomponenten verwendet werden, profitiert das System von den kuenftigen Hardware-Fortschritten. Auf Anfrage erklaerte Alois Scheutwinkel, in Augsburg fuer die Grossrechner des Hauses als Marketier zustaendig, dass auch die heutigen 3600-Modelle auf die 3700-Varianten mit Pentium-Prozessoren aufruestbar sein werden. Die maximale Anzahl der Prozessoren richtet sich danach, wie viele das Softwaresystem adressieren kann. Dies sind derzeit 1024 AMPs und 48 APs, letztere mit derzeit jeweils bis zu 16 Prozessoren, spaeter 32. Die groesste bisher realisierte Konfiguration umfasst 365 AMPs und 32 APs. Mit der Adressierung haengt zusammen, wie AT&T den Begriff "Prozessor" definiert: "Knoten" ist genau so richtig, denn es handelt sich stets um einen kompletten Rechner, also zum Beispiel einen SMP-Rechner mit 32 internen Prozessoren. Anders ausgedrueckt: Als Prozessor ist bei

AT&T die Einheit definiert, fuer die das "Shared Nothing"-Prinzip zutrifft.

Mit der 3700 kuendigt AT&T Global Information Solutions ein auf der Hardwareseite voellig neues MPP-System an, in dem Universal- und Datenbankrechner gleichermassen SMP-Rechner mit bis zu 16, spaeter sogar 32 Prozessoren sind. 4096 dieser Knoten werden adressierbar sein. 3700 wird also ein massiv-paralleles System, das einheitlich aus lose gekoppelten Multiprozessorknoten besteht, die ihrerseits eng gekoppelte Parallelrechner sind.

Das Ynet wird zum Bynet: Auch hier wird die Hardware neu gestaltet, um noch hoehere Geschwindigkeiten zu erzielen, waehrend in der Logik das fuer die Parallelisierung ideale Prinzip des Binaerbaumes, der eine Aufgabe "von Ast zu Ast" immer weiter aufteilen und nachher wieder vereinigen kann, beibehalten wird. Die physische Topologie aendert sich vom Ynet zum "Bynet" dahingehend, dass jeder Knoten mit jedem verbunden ist.

Die Geschwindigkeit zwischen zwei Knoten erhoeht sich auf 2 x 20 = 40 MB/Sekunde, entsprechend 320 Megabit/Sekunde, und mit jeden weiteren steigt die Uebertragungsleistung des Systems. Neben der Kommunikation zwischen Universal- und Datenbankprozessoren, wird die interne Busgeschwindigkeit der SMP-Rechner wesentlich erhoeht: Bei der 3700 werden es 400 MB/Sekunde sein. Zum Vergleich: 80 MB/Sekunde sind im Wettbewerb ueblich. Der gemeinsame Arbeitsspeicher umfasst bis zu 512 MB. Ueber ihn kommunizieren die Prozessoren in einem SMP-Rechner. Weil der interne Bus und die Groesse des Global Memory der potentielle Flaschenhals sind, galten bisher acht oder wenig mehr Prozessoren als Obergrenze fuer einen SMP-Rechner.

Was Fault Tolerance beziehungsweise Ausfallsicherheit betrifft, so arbeitet AT&T nach dem Prinzip "doppelt oder mehrfach ausgelegt, aber nicht redundant". Das heisst, im Normalbetrieb laufen die betreffenden Komponenten keineswegs nur als Reserve nebenher, sondern produzieren uneingeschraenkt. Dies fuehrt zu reduzierten Kosten: Scheutwinkel gibt an, Systeme mit vergleichbarer Gesamtleistung und Ausfallsicherheit wuerden am Markt 28 Milllionen DM gegenueber rund 4 Millionen aus der Schmiede seines Hauses kosten.

Die Systeme erreichen nach Angaben des Herstellers eine "Downtime"-Erwartung von unter einer Stunden im Jahr bei Betrieb rund um die Uhr. Das Software-Herzstueck der Ausfallsicherheit heisst bei AT&T "Lifekeeper", aber auch Top End und viele andere Hardware- und Software-Komponenten dienen der sofortigen Umverteilung von Aufgaben im Stoerfall. Darueber hinaus sind aber auch die klassische Spiegeltechnik und RAID 5 verfuegbar.

Zusammenspiel mit Mainframes

Wenn auch, laut Scheutwinkel, Ersatz der wesentlich teureren Mainframes das Ziel ist, so ist doch in vielen Faellen zunaechst einmal die Zusammenarbeit gefordert. Die Kommunikation nach dem Client-Server-Prinzip, also Programmkooperation statt blossen Datei-Austauschs, ist nach seiner Aussage gewaehrleistet: So lassen sich Mainframes unter MVS als echte Clients der 3600 in Programm- zu-Programm-Kommunikation statt simplem Filetransfer unter dem entsprechenden APPC-Gegenstueck von AT&T bedienen. Als Uebertragungsstrecke dienen die ueblichen Ein/Ausgabekanaele von IBM. Der Transaktionsmonitor Top End sorgt fuer die bidirektionale Anbindung an CICS-, IMS/DC-Applikationen.

Neben der direkten Hostanbindung stehen alle Vernetzungstechniken zur Verfuegung: Uebertragungsprotokoll ist TCP/IP, die Verbindungen gehen ueber Ethernet, Token Ring, FDDI/CDDI und so weiter Bedienung von Windows-, DOS- oder OS/2-Clients vom Unix-System aus ist Routine.