Quad-Core-Angriff: AMD K10-Opteron im Test

11.09.2007
Von 
Christian Vilsbeck war viele Jahre lang als Senior Editor bei TecChannel tätig. Der Dipl.-Ing. (FH) der Elektrotechnik, Fachrichtung Mikroelektronik, blickt auf langjährige Erfahrungen im Umgang mit Mikroprozessoren zurück.

Linpack 64 Bit

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Opteron-Prozessoren mit SSE3 arbeiten unter Linux mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000, 15.000, 18.000, 22.000 und 27.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 5,4 GByte Arbeitsspeicher (27.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Effizient: Obwohl das Barcelona-Doppelpack nur mit 2,0 GHz Taktfrequenz arbeitet, werden die 2,33-GHz-Quad-Core-Xeons locker überholt. Die K10-Architektur profitiert im hohen Maße von der SSE-Überarbeitung, wie der Vergleich mit den Opteron 2220 offenbart. Außerdem zeigt AMDs HyperTransport-Konzept mit den integrierten Speicher-Controllern bei diesem sehr speicherlastigen Benchmark die Überlegenheit gegenüber Intels „klassischer“ FSB-Technologie.
Effizient: Obwohl das Barcelona-Doppelpack nur mit 2,0 GHz Taktfrequenz arbeitet, werden die 2,33-GHz-Quad-Core-Xeons locker überholt. Die K10-Architektur profitiert im hohen Maße von der SSE-Überarbeitung, wie der Vergleich mit den Opteron 2220 offenbart. Außerdem zeigt AMDs HyperTransport-Konzept mit den integrierten Speicher-Controllern bei diesem sehr speicherlastigen Benchmark die Überlegenheit gegenüber Intels „klassischer“ FSB-Technologie.

Die zwei Quad-Core-Opterons arbeiten bei Linpack 170 Prozent schneller als das Dual-Core-Opteron-2220-Doppelpack – obwohl die Barcelonas eine 29 Prozent geringere Taktfrequenz besitzen. Neben der Kernverdopplung ist für den Performance-Sprung der „Dual 128-Bit SSE Dataflow“ der K10-Architektur verantwortlich. Damit kann ein K10-Core zwei 128-Bit-SSE-Befehle pro Taktzyklus einlesen. Bei der aktuellen AMD64-Architektur ist der SSE-Pfad dagegen nur 64 Bit breit.

Laut AMD soll die auch als SSE128 bezeichnete Fließkommabeschleunigung Matrix-Multiplikationen um 85 Prozent gegenüber der K8-Architektur beschleunigen. Diese Berechnungen finden bei Linpack überwiegend statt – damit lässt sich der Performance-Sprung erklären.