Mikroprozessoren: Technologie und Architektur

22.07.1994

High-noon auf dem Prozessormarkt: IBM, Motorola und Apple wollen Intels

dominierende Position als Anbieter von PC-Prozessoren untergraben. Der Marktfuehrer kontert und macht seit kurzem gemeinsame Sache mit Hewlett-Packard. Digital Equipment, Sun und Mips ringen als lonesome Cowboys zwar allein, allerdings greifen ihnen gleich mehrere Halbleiter-Lizenznehmer beim Wettbewerb um Marktanteile unter die Arme. Arndt Bodo* sondiert

ein heissumkaempftes Terrain.

Von Arndt Bode*

Die Entwicklung neuer Mikroprozessorarchitekturen, speziell im Bereich RISC, geht mit ungebrochener Geschwindigkeit weiter. Kaum ein halbes Jahr ist vergangen, seitdem die ersten

Power-PC-Bausteine auf den Markt gekommen sind. Inzwischen gibt es bereits drei Varianten des Prozessors, eine vierte Version mit groesserer Wortlaenge und deutlich hoeherer Leistung steht vor der Markteinfuehrung. Aehnliches gilt fuer alle anderen Hersteller wie DEC mit dem Alpha-Chip, Sun und deren Sparc-CPUs etc.

Beobachtet man ferner in den elektronischen Medien die Diskussion angekuendigter Bausteine, so findet man dort Aussagen ueber Mikroprozessoren mit mehr als 500 Megahertz, und einer Leistung von jeweils ueber 1000 Specint92 und Specfp92

(fuer Suns Ultrasparc-II). Ferner diskutieren alle Hersteller ueber weitere Architekturtechniken zur weiteren Leistungssteigerung, so munkelt man ueber einen neuen VLIW-Prozessor (Very Long Instruction Word) mit statischer Parallelisierung im Compiler von HP und Intel. Nach der Power-PC-Allianz zwischen IBM, Apple und Motorola koennte sich hier ein weiteres starkes Buendnis zwischen Intel und HP ankuendigen. Betrachtet man die Architektur und die technologischen Merkmale der derzeit aktuellen Mikroprozessoren (vgl. Abbildung 1 und 2, alle Angaben nach Herstellerangaben ohne Gewaehr), stellt sich die Frage, ob der weitere Ausscheidungsprozess unter den Herstellern der verschiedenen Mikroprozessoren auch wesentlich durch technologische Randbedingungen mitbestimmt wird.

Technologische

Eigenschaften

Wesentliche Voraussetzung fuer ein gutes Preis-Leistungs-Verhaeltnis bei Systemen auf der Basis von Mikroprozessoren ist die Anzahl der Transistorfunktionen, die auf dem einzelnen integrierten Schaltkreis fuer den Prozessor unterzubringen sind. So kann durch parallel verarbeitende Werke die Rechenleistung vergroessert werden, durch Integration von Speicher und Peripheriekomponenten die notwendige Anzahl externer und langsam zugaenglicher Bausteine fuer das Gesamtsystem verringert werden.

Die derzeitig auf dem Markt befindlichen Mikroprozessoren umfassen eine bis fuenf Millionen Transistorfunktionen auf dem Baustein. Prozessorfamilien, die aus mehreren Chips bestehen, gehen hier bis zirka 20 Millionen (IBM Power 2), so dass hier weiterhin steigender Bedarf - bereits beim Einzelprozessorsystem - vorhanden ist.

Erste Voraussetzung fuer die Integration einer grossen Anzahl von Transistoren auf dem integrierten Schaltkreis ist die Strukturbreite. Aktuelle Mikroprozessoren liegen hier im Bereich zwischen 0,5 und 0,8 Mikrometer

(+). Es ist aber bekannt, dass eine weitere Verringerung bis 0,1 +ohne groessere technologische Probleme moeglich erscheint, viele Hersteller bauen heute Werke fuer 0,25 + auf. Der begrenzende Faktor scheint derzeit vielmehr in den Kosten fuer den Aufbau einer solchen Produktionslinie zu liegen, die auf weit jenseits von einer Milliarde US-Dollar geschaetzt werden.

Eine weitere Massnahme zur Erhoehung der Anzahl von Transistorfunktionen auf dem einzelnen Schaltkreis ist die Vergroesserung der Chipflaeche. Aktuelle Mikroprozessoren liegen im Bereich von 10 x 10 bis knapp 15 x 15 Quadratmillimetern. Die Vergroesserung in diesem Bereich erscheint problematischer. Die Ausschussrate durch Fehler im Siliziummaterial steigt quadratisch mit der Chipflaeche, der Ausschuss am Rand der Siliziumwafer wird bei groesseren Chipflaechen ebenfalls immer groesser, und die derzeitig verwendeten Stepper fuer das Belichten sind fuer Groessen ueber 15 x 15 Quadratmillimeter nicht geeignet. Dennoch erscheint auch hier eine Erweiterung auf 25 x 25 Quadratmillimeter bis zum Jahr 2000 moeglich.

Eine sinnvolle Schaltung benoetigt zu ihrem Aufbau nicht nur viele Transistorfunktionen, diese muessen auch miteinander verbunden werden, was in der Ebene der Metallisierungslagen geschieht. Mikroprozessoren vom Schlag des Motorola 68040 und Intel 486 verwenden hier noch zwei Ebenen, bereits der Power-PC verfuegt ueber vier Ebenen, von denen allerdings nur drei fuer tatsaechliche Verbindungen benutzt werden, die vierte stellt die Verbindung zu den Anschluessen an die Umwelt her. Es gilt heute als allgemein anerkannt, dass bei Nutzung aller vier Ebenen, was technologisch machbar ist, die Verbindung auch mit beliebig komplizierter Hardware realisiert werden kann.

Ein groesseres Problem stellt die Verbindung des Bausteins mit seiner Umwelt dar. Bis ueber 500 Anschluesse haben die einzelnen Mikroprozessorbausteine schon heute. Die Loesung liegt vermutlich in der Vielfachbelegung der einzelnen Anschluesse, wie sie auch bereits vorkommt.

Neben der Anzahl der Transistorfunktionen ist sicher die Taktfrequenz ein wesentliches Merkmal fuer die Leistungsfaehigkeit der Systeme. Hier unterscheiden sich die einzelnen Prozessoren stark (25 Megahertz beim Motorola 68040 bis 200 Megahertz beim DEC-Alpha).

Mit der Steigerung der Taktfrequenz wird allerdings der Entwurf der Systeme um die Mikroprozessoren herum immer schwieriger (Hochfrequenztechnik) und insbesondere der Anschluss von Speichern immer teurer.

Neben den Kosten steigt jedoch auch die Leistungsaufnahme und damit die Waermeentwicklung im einzelnen Baustein. Waerme in Halbleiterbausteinen ist aber ausserordentlich unerwuenscht, da die Lebensdauer der integrierten Schaltkreise umgekehrt proportional zur Temperatur, bei der sie betrieben werden, ist.

Heutige Mikroprozessoren haben eine Leistungsaufnahme zwischen 5 und 30 Watt (W). Eine Fluessigkeitskuehlung, wie man sie von Superrechnern her kennt, kommt bei der Preisklasse der Workstations und PCs nicht in Frage. Allerdings laesst sich mit der Versorgungsspannung auch die Strukturbreite reduzieren.

Qualitaet der

Architekturen

Waehrend die Mikroprozessoren vor drei Jahren im allgemeinen noch mit fuenf Volt (V) betrieben wurden, sind bei Strukturbreiten von 0,5 + drei V Stand der Technik, im Labor werden Versuche mit einem V und weniger durchgefuehrt. Mit der Spannung geht auch die aufgenommene Leistung zurueck. Allerdings ergeben sich groessere Probleme mit der korrekten Arbeitsweise der so betriebenen Schaltung.

Abgesehen davon, dass wegen der enormen Investitionskosten nur noch wenige Hersteller in der Lage sind, neue Produktionslinien aufzubauen, sind die technologischen Voraussetzungen fuer die einzelnen Hersteller weitgehend die gleichen. So kann man davon ausgehen, dass vom Siliziummaterial bis zur Belichtungstechnik alle Hersteller annaehernd identische Technik - oft sogar vom selben Hersteller - beziehen. Besondere Vorteile ergeben sich allenfalls aus besonderen technologischen Tricks wie etwa der von einigen Herstellern ermoeglichten Reduktion der Leistungsaufnahme durch automatisches Abschalten inaktiver Teile der Schaltung. Angesichts der technologischen Ausgeglichenheit erhaelt die Guete der Architektur wieder staerkere Bedeutung. Diesbezueglich unterscheiden sich die Mikroprozessoren betraechtlich. Man findet solche mit umfangreichen (CISC) und solche mit reduzierten Befehlssaetzen (RISC). Waehrend auf der einen Seite Superpipelining bevorzugt wird (Mips Technology Inc.), findet man auf der anderen Seite superskalare Techniken (alle anderen Hersteller), die sich bezueglich der Anzahl potentiell parallel arbeitender Rechenwerke, der Zahl absetzbarer gleichzeitig gestarteter Befehle und der Reihenfolge-Steuerung der Befehlsausfuehrung betraechtlich unterscheiden.

Neben diesen dynamisch parallelisierenden Varianten wird inzwischen auch ein statisch parallelisierender Ansatz (VLIW- Technik) von HP und Intel angekuendigt. Weiterhin differieren die verschiedenen Mikroprozessoren hinsichtlich der Tiefe der Maschinenbefehls- und arithmetischen (Vektor-)Pipelines, bei der Groesse und Organisation der internen Cache-Speicher, und in Anzahl, Breite und Arbeitsweise der internen und externen Busse. Dazu kommen Unterschiede in der Organisation der Register und hinsichtlich einer Reihe weiterer Merkmale, die die Leistung der Gesamtarchitektur beeinflussen.

Ein gutes Mass fuer die Bewertung einer Architektur ist das Verhaeltnis von Rechenleistung (gemessen in Specmarks) zur Anzahl der Transistorfunktionen multipliziert mit der Megahertz-Rate. Die Architektur, die auf geringster Flaeche und mit geringster Waermeentwicklung, das heisst bei moeglichst billiger Systemumgebung, die hoechste Leistung erzielt, ist die beste. Bildet man den Quotienten aus der Summe der beiden Spec-Zahlen und der Anzahl der Transistorfunktionen in Millionen multipliziert mit der Megahertz- Rate, so entstehen Zahlen leicht >1 fuer gute Architekturen sowie Zahlen <1 fuer schlechte Architekturen.

Die so gewonnenen Zahlen sind jedoch mit Vorsicht zu geniessen, weil die gemessenen Spec-Werte (vgl. Abbildung 2) auf unterschiedlichen Speichergeschwindigkeiten beruhen. Ferner beruecksichtigen die Spec-Zahlen natuerlich nicht andere Zwaenge der Architekturen wie Kompatibilitaet zu frueheren Modellen, spezielle Ausrichtung auf bestimmte Anwendungen und die Qualitaet der Compiler.

Vor allem der letzte Punkt ist sicher kritisch: Nur diejenigen Hersteller, denen es gelingen wird, neue Architekturtechniken mit internem Parallelismus durch vollautomatisch optimierende Compiler zu ergaenzen, werden insgesamt ein gutes Preis-Leistungs-Verhaeltnis bieten koennen. Die Message ist troestlich. Abgesehen von Zwaengen etwa der Kompatibilitaet entscheidet die Ingenieurkunst bei der Konzeption und Produktion von Hardware und Systemsoftware ueber die Marktchancen zukuenftiger Mikroprozessorprodukte.

Spec-Hitliste: RISC contra Intel-Pentium (Stand: Dezember 1993)

ProzessorIBM MIPSMIPSHP Digital Super hyper Intel MIPSPowerPC PowerPC HP SPARC

Power2 TFP R4400 PA-7150 21064A SPARC+ SPARC Pentium R4600 603 601 PA-7100LCMS-2

Taktfrequenz 71,5 MHz 75 MHz 150 MHz 125 MHz 275 MHz 60 MHz 66 MHz 66 MHz 100 MHz 80 MHz 80 MHz 80 MHz 85 MHz

Anzahl Pipelines 5 5 8 5s 7 4 6 5 5 5 5 5 5

Max Fliesskomma Math/Zyklus 6 4 1 2 2 3 2 2 1 3 3 2 1

Max. Integer Math/Zyklus2 int 2 int 1 int 1 int 1 int 1 int 1 int 2 int 1 int 1 int 1 int 2 int 1 int

Max. Anzahl Instrukt./Zyklus 2 FP2 FP1 FP1 FP1 FP1 FP1 FP1 FP 1 FP1 FP1 FP1 FP1 FP

Instruktionen-Cache auf der CPU 32KB16KB16KBkeiner 16KB20 KB 8KB 8KB 16KB8KB 32KB1KB 16KB

Daten-Cache auf der CPU keiner 16KB16KBkeiner 16KB16KBke iner8KB 16KB8KB einer insgesamt 8KB

CPU-Technologie CMOSCMOSCMOSCMOSCMOSBiCMOS CMOSBiCMOS CMOSCMOSCMOSCMOSCMOS

Strukturgoesse 0,60 +m 0,70 +m 0,60 +m 0,80 +m 0,50 +m 0, 72 +m 0,65 +m 0,80 +m 0,64 +m 0,50 +m 0,60 +m 0,80 +m 0,50 +m

Anzahl Lagen 5 3 3 3 4 l 3 2 3 3 4 5 3 3

Anzahl Transistoren5 571 000(1) 3 430 000(2) 2 300 000850 000 2 800 0003 100 0001 700 000(2) 3 100 0001 850 0001 600 0002 800 000 800 000 2 300 000

Chipgroesse ohne Gehaeuse 483 mm2 (1) 596 mm2 (2) 184 mm2 19 6 mm2 164 mm2 256 mm2 327 mm2 (2) 294 mm2 77 mm2 85 mm2 121 mm2 196 mm2 233 mm2

Geschaetzte Kosten $470 (1) $1,1010 (2) $140$150$160$275$1 60 (2) $430$43 $55 $100$140$195

Package 736 pin 2 x 591 pin 447 pin 504 pin 431 pin 29 3 pin 208 pin 279 pin 208 pin 240 pin 304 pin 432 pin 321 pin

MCM PGA PGA PGA PGA PGA TAB PGA MQUAD CQFPCQFPPG A PGA

Specint92126 int >90 int 96 int >135 int 170 int 77 int 65 int 67 int >68 int 75 int 85 int 84 int 61 int

Specfp92 260fp >200 fp 105 fp >200 fp 290 fp 98 fp 86 fp 62 fp >60 fp 85 fp 105 fp 130 fp 53 fp

Halbleiterhersteller IBM (3) Toshiba Toshiba HP (3) Di gital TI, Sun Fujitsu Intel IDT,Motorola,IBM,HP (3) Fujitsu,

Toshiba IBM Motorol a Sun

(1) Besteht aus drei CPUs ohne Cache-Speicherchips; (2) Besteht aus zwei CPUs; (3) IBM und HP verkaufen Prozessoren an Partner Qu elle: Microprocessor Report/SPEC-Konsortium

Intel 486Intel Motorola Motorola MC MC DEC MIPSHP Super-

Pentium 68040 68060 Power-PC Power-PC Alpha R4400SC PA 7100 sparc

601 604 21064

Typ CISCCISCCISCCISCRISCRISCRISCRISCRISCRISC

Wortlaenge (Daten) 32 32 32 32 32 32 64 64 32 32

Cache (MB) 8 8/8 4/4 8/8 32 32 8/8-16/16 keiner 20/16

Daten/Befehle bzw. - 16/16

gemeinsame Register8/8 8/8 16/816/832/32 32/32 32/32 32/32 32/32 136/32

Allzweck/Gleitkomma

Anzahl Rechenwerke 2 3 2 3 3 3 4 - 3 5

Anzahl gestarteter Befehle

pro Takt 1 1 1 2 3 3 2 1 2 3

Anzahl Stufen

arithmetische Pipeline

Festkomma/Gleitkomma 5/5 5/8 3/6 4/4 4/6 4/6 7/107/105/ 6 4/5

Abb.1: Technologische Eigenschaften von RISC- und CISC- Mikroprozessoren

Intel 486Intel Motorola Motorola MC MC DEC MIPSHP Super-

Pentium 68040 68060 Power-PC Power-PC Alpha R4400SC PA 7100 sparc

601 604 21064

Chipflaeche (mm x mm) - 17 x 17 11 x 11 14 x 14 11 x 11 - 15 x 13 12 x 15 14 x 14 16 x 16

Anzahl Transistorfunktionen

(Millionen) 1,2 3,1 1,2 2,5 2,8 3,6 2,8 2,8 0,853,1

Taktfrequenz (Megahertz)50 66 25 50 100 100 200-320 15 0 100 60-100

Leistungsaufnahme (W) 5 16 6 4 9 10 30-46 15 23 14

Versorgungsspannung (V) 5 5 5 3,3 3,6 3,6 3,3 3,3 5

Anzahl der Anschluesse 168 273 179 223 304 - 431 447 50 4 293

Abb.2: RISC- und CISC-Mikroprozessoren: Architekturmerkmale. Im Vergleich zur Spec-Hitliste gibt Abbildung 2 die moeglichen Taktfrequenzen an. So gibt es etwa den Alpha-Chip mit 320 Megahertz erst als Laborvariante. Quelle: Bode