Fujitsu SPARC64 X und Oracle SPARC T5 beeindrucken

Die schnellsten Prozessoren im Benchmark-Vergleich

06.05.2013
Von 
Christian Vilsbeck war viele Jahre lang als Senior Editor bei TecChannel tätig. Der Dipl.-Ing. (FH) der Elektrotechnik, Fachrichtung Mikroelektronik, blickt auf langjährige Erfahrungen im Umgang mit Mikroprozessoren zurück.
Hier ist die ultimative Performance-Rangliste der CPU-Architekturen. IBMs POWER7+ hat mit den neuen 16-Core-Prozessoren Fujitsu SPARC64 X und Oracle SPARC T5 starke Konkurrenz bekommen. Im x86-Lager liefern sich die Multi-Core-CPUs Xeon E5 / E7 und Opteron 6300 in Mehrwegesystemen einen engen Kampf.

Hat nun AMD oder Intel die schnellere CPU im Angebot? Bei den Desktop-Prozessoren stellt sich die Frage schon seit geraumer Zeit nicht mehr: Aktuell liegen Intels Top-Modelle wie der Core i7-3960X, Core i7-3970X, Core i7-2700 mit Sandy-Bridge-Architektur oder der Core i5-3570 mit 22-nm-Ivy-Bridge-Technologie deutlich in Führung. AMDs Bulldozer-Prozessor FX-8150 sowie der Nachfolger FX-8350 bleiben meist chancenlos. In Servern mit zwei Sockeln legen die Top-Modelle von Intels Xeon-E5-2600-Serie mit Octa-Core eine beindruckende Performance hin. Hier kann AMDs 16-Core-CPU Opteron 6300, der für Zwei- und Vier-Sockel-Systeme geeignet ist, nicht ganz mithalten. Arbeiten vier Prozessoren im System, so ist das Rennen gegen Intels 8-Core-Modell Xeon E5-4650 schon ausgeglichener.

Doch die Welt der Prozessoren beschränkt sich nicht auf Xeons, Opterons, Phenoms, Core-i7-CPUs oder sonstige x86-Klone. Stark in Szene setzt sich der neue Fujitsu SPARC64 X. Mit 16 Kernen, 2 Thread pro Core und 3,0 GHz Taktfrequenz bringt der Server-Prozessor in Systemen mit 16 oder mehr CPUs dir Rangordnung durcheinander. Und Oracle sprach bei der Vorstellung des neuen SPARC T5 Ende März 2013 vom schnellsten Mikroprozessor der Welt. Die Server-CPU arbeitet ebenfalls mit 16 Kernen. Jeder Core kann dabei acht Threads parallel verarbeiten. Dann gibt es noch den POWER7+ von IBM. Die CPU ist mit vier, sechs und acht Kernen und Taktfrequenzen bis über 4 GHz zu haben. Die Performance-Daten lassen ebenfalls aufhorchen. All diesen CPUs, die für Systeme mit hoher Skalierfähigkeit und hoher Ausfallsicherheit konzipiert sind, stellt Intel jetzt jedoch mit den 10-Core-Prozessoren der Xeon-E7-Serie ebenfalls eine x86-Architektur entgegen.

Die "pure" Performance eines Prozessors lässt sich bestens über seine Geschwindigkeit bei Ganzzahlen- und Fließkommaberechnungen ausdrücken. Als ultimatives und offizielles Performance-Tool für einen plattformübergreifenden Vergleich fungiert die renommierte Benchmark-Suite CPU2006 von SPEC. Der CPU2006-Test besteht aus vielen realen Anwendungen wie Simulationen, Packer oder Raytracer. Die Programme sind nicht fertig kompiliert, sondern liegen als Sourcecode vor.

Um das Optimale aus den CPUs herauszuholen, dürfen bei der CPU2006-Benchmark-Suite beliebige Compiler, Bibliotheken und Betriebssysteme verwendet werden - nur dokumentiert muss es sein. Der Sourcecode darf aber nicht verändert werden. CPU2006 überprüft sowohl die Singlethread-Performance als auch die Leistungsfähigkeit von Multi-Core-CPUs sowie Mehrwegesystemen.

Die CPU-Hersteller veröffentlichen die CPU2006-Ergebnisse auf SPEC.org. Aber auch Systemhersteller wie Dell, Hewlett-Packard, IBM oder Oracle erkennen CPU2006 als offizielles Kräftemessen an und machen die Performance-Werte ihrer Maschinen publik. Dabei achten die Hersteller darauf, die bestmöglichen Resultate für ihre Produkte zu erreichen. Die Ergebnisse lassen sich somit als ultimative Leistungsfähigkeit der jeweiligen CPUs werten - mehr Performance ist nicht drin!

In diesem Artikel präsentieren wir Ihnen die Singlethread- und Multitask-Performance der Prozessoren, die auf unterschiedlichen Architekturen basieren. Außerdem stellen wir die Leistungsfähigkeit der CPUs gegenüber, wenn zwei, vier, acht oder mehr Prozessoren zusammenarbeiten.

CPU2006-Benchmark - strenge Regeln

CPU2006 ermittelt die Performance der Prozessoren - im Zusammenspiel mit dem Speicher. Die Leistungsfähigkeit der Grafikkarte, der Netzwerkanbindung oder des Storage-Subsystems spielt bei der Benchmark-Suite keine Rolle.

SPECs CPU2006 verwendet Ganzzahlen- und Fließkommaprogramme und wird mit den Sourcecodes geliefert. Es handelt sich hierbei nicht um Lowlevel-Benchmarks, sondern um Software, die realitätsnahe Aufgabenstellungen bearbeitet. CPU2000 unterscheidet zwischen zwölf Integer-Programmen, die in C und C++ geschrieben sind, und 17 Floating-Point-Anwendungen, erstellt mit C, C++ sowie Fortran.

Vor jedem Testlauf ist bei CPU2006 Programm für Programm zu kompilieren. Für jede CPU-Architektur lässt sich dadurch die optimale Entwicklungsumgebung - bestehend aus Compilern, Mathematikbibliotheken sowie dem Betriebssystem - verwenden.

SPEC unterscheidet bei CPU2006 zwischen dem Base- und dem Peak-Rating. Beim Base-Rating müssen alle CPU2000-Programme mit den gleichen Compiler-Flags erstellt werden. Das Peak-Rating von CPU2006 erlaubt unterschiedliche Compiler-Einstellungen und Optimierungen bei jedem einzelnen Programm. Mit dem Peak-Rating wird die maximale Leistungsfähigkeit einer CPU ermittelt.

Bei den CPU2006-Benchmarks gibt es sehr strenge Regeln: Die verwendeten Compiler, Bibliotheken, Switches und das Betriebssystem müssen mit dem Ergebnis veröffentlicht werden. Damit lassen sich die Ergebnisse auch von unabhängigen Stellen einfach nachprüfen, Betrug würde schnell auffallen.

Die CPU2006-Benchmark-Suite ermöglicht vier Performance-Messungen:

  • SPECint_2006: Ermittelt die Integer-Performance des Prozessors. Der Test arbeitet singlethreaded.

  • SPECfp_2006: Ermittelt die Floating-Point-Performance des Prozessors. Der Test arbeitet singlethreaded.

  • SPECint_rate_2006: Ermittelt die Integer-Performance bei parallel arbeitenden Programmen. Die Anzahl der parallelen Kopien lässt sich einstellen. Damit lässt sich der Ganzzahlendurchsatz bei Multi-Core-/Multi-CPU-Systemen bestimmen.

  • SPECfp_rate_2006: Ermittelt die Floating-Point-Performance bei parallel arbeitenden Programmen. Die Anzahl der parallelen Kopien kann eingestellt werden. Damit lässt sich der Fließkommadurchsatz bei Multi-Core-/Multi-CPU-Systemen bestimmen.

Bei allen Benchmark-Diagrammen verwenden wir die Peak-Wertung, um die maximale Leistungsfähigkeit der CPUs zu zeigen.