Effizienz vs. Performance

Test - Opteron 6166 HE und 6180 SE im 4S-Server

17.08.2011 von Christian Vilsbeck
AMDs Opteron-6100-Serie hat in 4-Sockel-Servern mit Intels Xeon-E7-4800-CPUs starke Konkurrenten. Die 12-Core-Opterons sind jedoch für ihre hohe Performance pro Watt bekannt. Wir testen den speziell auf Effizienz getrimmten Opteron 6166 HE sowie den für hohe Rechenleistung optimierten Opteron 6180 SE im 4-Sockel-Server IBM System x3755 M3.

Bei den x86-Servern mit vier Prozessoren ist die Auswahl übersichtlich. Von AMD gibt es die Opteron-6100-Serie, Intel bietet die Xeon-E7-4800-Linie an. Zwar sind auch noch die Vorgänger im Angebot, bei Neuanschaffungen spielen diese aber keine Rolle mehr. Der primäre Einsatzzweck von 4-Sockel-Servern ist die Konsolidierung durch Virtualisierung vieler Server auf eine Maschine. Ein möglichst hoher Arbeitsspeicher, viel Rechenleistung und RAS-Features sind hier gefragt. Aber auch HPC-Anwendungen mit Integer- und Floating-Point-Berechnungen verlangen nach möglichst hoher Performance und massiv verfügbarem RAM.

Sowohl der Opteron 6100 als auch der Xeon E7 bieten hierfür durch viele Kerne in Verbindungen mit eigenem Speicher-Controller pro CPU eine ideale Basis. Während die Xeon-E7-4800-Plattform durch zwischengeschaltete SMBs einen noch massiveren RAM-Ausbau ermöglicht, fokussiert die Opteron-6100-Plattform auf ein "schlankes Design" und hohe Energieeffizienz.

Opteron 6180 SE: Der Server-Prozessor mit 12 Kernen arbeitet mit 2,5 GHz Taktfrequenz. AMD verwendet zwei Siliziumplättchen mit je sechs Kernen, die intern über HyperTransport verbunden sind.

AMD besitzt hierfür mit dem Opteron 6166 HE einen besonders auf Effizienz getrimmten 12-Kern-Prozessor. Bei 1,8 GHz Taktfrequenz spezifiziert AMD die CPU mit nur 65 Watt ACP. Auf der anderen Seite gibt es mit dem Opteron 6180 SE die Performance-Variante der zwölfkernigen CPUs. Für die 2,5 GHz Taktfrequenz ist eine ACP-Einstufung von 105 Watt erforderlich.

Im 4-Sockel-Server IBM System x3755 M3 überprüfen wir die Leistungsfähigkeit der unterschiedlich ausgelegten 12-Core-Opterons. Außerdem vergleichen wir den Opteron 6166 HE und Opteron 6180 SE mit Intels 10-Kern-Prozessor Xeon E7-4870. Neben Integer- und Floating-Point-Anwendungen treten die CPUs bei Verschlüsselung, Rendering und Simulation gegeneinander an. Die Geschwindigkeit bei Java-Applikationen wird ebenso untersucht wie die Energieeffizienz der Systeme.

Opteron-6100-Modelle im Überblick

AMD bietet bei der Opteron-6100-Serie insgesamt acht 12-Core-Modelle an. Den Einstieg bei den Zwölfkernern markiert der Opteron 6164 HE mit 1,7 GHz Taktfrequenz. Mit "HE" kennzeichnet AMD Opterons mit 65 Watt ACP. Die Modelle Opteron 6168, 6172, 6174 und 6176 arbeiten mit 1,9 bis 2,3 GHz Taktfrequenz und sind mit jeweils 80 Watt ACP eingestuft. Als Topmodell fungiert der Opteron 6180 SE mit einem Arbeitstakt von 2,5 GHz. Das "SE" steht bei den Opterons für Performance-Varianten mit 105 Watt ACP.

Zusätzlich offeriert AMD seine Opteron-6100-Serie in Varianten mit acht Kernen. Bei diesen Modellen werden zwei Quad-Core-Dies in Prozessorgehäuse gepackt. Wie bei den 12-Core-Modellen besitzen die CPUs einen L3-Cache von 12 MByte.

In der Tabelle finden Sie alle Opteron-6100-Prozessoren mit acht und zwölf Kernen im Überblick. Die aktuelle Preisliste von AMDs Opteron-Prozessoren finden Sie hier.

Alle Opteron-6100-Modelle im Überblick

Prozessor

Taktfrequenz [GHz]

Kerne

L3-Cache

DIMM-Support

ACP [Watt]

Opteron 6180 SE

2,5

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

105

Opteron 6176 SE

2,3

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

105

Opteron 6176

2,3

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6174

2,2

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6172

2,1

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6168

1,9

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6168

19

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6166 HE

1,8

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

65

Opteron 6164 HE

1,7

12

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

65

Opteron 6136

2,6

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6136

2,4

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6134

2,3

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6132 HE

2,2

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

65

Opteron 6128

2,0

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

80

Opteron 6128 HE

2,0

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

65

Opteron 6124 HE

1,8

8

12 MByte

Quad Channel DDR3-1333 / LV-DDR3-1066

65

Analyse: Rechenleistung

AMDs Opteron Opteron 6180 SE arbeitet mit einer 39 Prozent höheren Taktfrequenz als der Opteron 6166 HE. Bei Workloads, die überwiegend im Cache der Prozessoren gehalten wird, setzt der Opteron 6180 SE seinen Taktvorteil auch in eine entsprechend höhere Performance um. Dies ist beispielsweise bei der Verschlüsselung mit openSSL zu beobachten. Bei openSSL unter Linux überzeugt der Opteron 6180 SE auch mit einer 19 Prozent höheren RSA2048-Verschlüsselung gegenüber dem Xeon E7-4870; das Entschlüsseln erledigen die vier Zwölkerner sogar 31 Prozent schneller als die 10-Core-Xeons. Allerdings verwenden die Xeon E7 bei openSSL ihren AES-Befehlssatz nicht.

Die ebenfalls primär im Cache der CPUs sich haltenden Workloads beim Rendering von CINEBENCH 11.5 und der Finanzanalyse mit SunGard entscheidet der Xeon E7-4870 allerdings mit neun bis 13 Prozent für sich. Dabei arbeiteten die Xeons aufgrund der Thread-Problematik von Windows Server 2008 R2 ohne Hyper-Threading, das zirka nochmals 20 Prozent mehr Performance ermöglicht.

Wird von Applikationen verstärkt viel Arbeitsspeicher benötigt, so sinkt der Skaliereffekt der Taktfrequenz bei den Opterons. Der Wert lässt sich mit dem speicherintensiven Java-Workload von SPECpower ermitteln. Der Opteron 6180 SE setzt sich jetzt im 4-Sockel-Betrieb im Testsystem IBM x3755 M3 nur noch 24 Prozent vom Opteron-6166-HE-Quartett ab. Mit deutlichem Vorsprung entscheiden jedoch die vier Xeon E7-4870 diesen Test für sich: Mit 2.043.354 ssj_ops arbeiten die Intel-CPUs 30 Prozent schneller als die Opteron 6180 SE (1.567.609 ssj_ops).

Ein ähnliches Leistungsbild zwischen den Prozessoren zeigt sich auch bei den speicherintensiven Integer- und Floating-Point-Tests der Benchmark-Suite SPEC CPU2006. Der Opteron 6180 SE distanziert sich mit 23 höherer Integer-Leistung vom Opteron 6166 HE, bei den noch speicherfordernden Fließkommaberechnungen ermöglicht der 2,5-GHz-Zwölfkerner noch 21 Prozent mehr Durchsatz als die 1,8-GHz-Variante. Einen deutlichen Vorsprung verbucht jedoch Intels Xeon E7-4870 im 4-Sockel-Betrieb: Die 10-Core-CPUs mit 2,4 GHz Taktfrequenz bieten eine 44 Prozent höhere Integer-Performance als die Opteron 6180 SE. Bei unserem Standard-Setup mit Intel 10.1 Compiler und QxO-Switch (SSE3) unter Windows Server 2008 R2 arbeiteten die Xeons durch die Windows-Thread-Beschränkung ohne Hyper-Threading. Bei den auf SPEC.org gemeldeten Herstellerangaben ziehen die Xeons den Opterons sogar mit 43 Prozent mehr Integer-Durchsatz davon. Fließkommaberechnungen erledigen die Xeon E7-4870 noch 19 Prozent schneller als die Opteron 6180 SE.

Analyse: Energieeffizienz

Die Energieeffizienz der Server-Plattformen überprüfen wir mit der Benchmark-Suite SPECpower_ssj2008 unter Windows Server 2008 R2 mit SP1. Der Test verwendet parallel laufende Java-Workloads mit aufwendigem XML-Processing.

Die Energieeffizienz des IBM-x3755-M3-Servers ist mit den vier Opteron 6166 HE um 15 Prozent höher als mit Opteron-6180-SE-CPUs. Zwar liefern die Opteron 6180 SE bei SPECpower_ssj2008 eine 24 Prozent höhere Java-Performance, die CPUs benötigen unter Last aber auch deutlich mehr Energie. Im Leerlauf ist der Unterschied beim verwendeten 4-Sockel-Server IBM x3755 M3 noch relativ gering: Mit den Opteron 6166 HE (65 Watt ACP) werden 209 Watt konsumiert, sind die Opteron 6180 SE (105 Watt ACP) eingebaut, so genehmigt sich das System 219 Watt.

Unter Volllast zeigt sich ein sehr hoher Unterschied. Während der x3755 M3 mit den 6166er Opterons 555 Watt bei 100 Prozent CPU-Auslastung benötigt, fordern die Opteron 6180 SE satte 929 Watt. Der große Unterschied ist durch zwei Faktoren bedingt. Zum einen besitzen die Opteron 6180 SE pro CPU eine 40 Watt höhere ACP - summiert sind das 160 Watt. Dann sind aber immer noch gute 200 Watt Differenz. Verantwortlich hierfür sind deutlich höhere Drehzahlen der verbauten redundanten Lüfter, um die 105-Watt-CPUs unter Last zu kühlen. Außerdem ändert sich je nach Last der Wirkungsgrad der drei verbauten Netzteile.

Mit den vier Opteron 6166 HE ist der IBM x3755 M3 auch 20 Prozent effizienter als der 4-Sockel-Server Quanta QSSC-S4R mit vier Xeon E7-4870. Sind dagegen die auf Performance getrimmten Opteron 6180 SE im IBM-Server verbaut, so liegt die Energieeffizienz auf einem Niveau mit dem Quanta-Server.

Fazit

Die Wahl des richtigen Modells aus der Opteron-6100-Serie bei einem 4-Sockel-Server lässt sich schnell treffen. Die beste Energieeffizienz gibt es mit dem Opteron 6166 HE. Im Vergleich zum Topmodell Opteron 6180 SE arbeitet der Server - in unserem Beispiel der IBM System x3755 M3 - zirka 15 Prozent effizienter. Noch gravierender ist der Unterschied bei der maximalen Energieaufnahme des 4-Sockel-Servers: 929 Watt mit vier Opteron 6180 SE statt nur 555 Watt mit den 6166er Modellen. Stehen die Energiekosten im Vordergrund, so fällt die Wahl entsprechend noch leichter. Außerdem ist ein Opteron 6166 HE mit 873 US-Dollar deutlich günstiger als der mit 1514 US-Dollar in der Preisliste stehende Opteron 6180 SE.

Geht es primär aber um die Performance, so ist natürlich der Opteron 6180 SE wiederum deutlich im Vorteil. Je nach Workload arbeiten die vier 2,5-GHz-CPUs zirka 20 bis 40 Prozent schneller als das Opteron-6166-HE-Quartett. Allerdings sollten dann auch Systeme mit dem Xeon E7-4870 in die Kaufüberlegung mit eingeschlossen werden. Bei ähnlicher Energieeffizienz zum Opteron 6180 SE (im IBM x3755 M3) liefern vier Xeon E7-4870 (10 Kerne / 2,4 GHz) Workload-abhängig nochmals ungefähr 20 bis über 40 Prozent mehr Performance.

Allerdings wird das Plus an Geschwindigkeit mit deutlich höheren Systemkosten erkauft. Die Xeon-E7-Plattform sticht im Segment der x86-Server aber auch durch die RAS-Features hervor. Insbesondere die MCA-Technologie zum Abfangen von Hardwarefehlern besitzt RISC-Niveau. Durch Sicherheitsmerkmale wie DDDC grast Intel mit dem Xeon E7 auch mehr im Gebiet der überschaubaren Itanium-9300-Weide, als bei den kostengünstigen Opteron-6100-Lösungen. (cvi)

Testsysteme im Detail

AMDs Opteron 6166 HE und 6180 SE in der 4S-Konfiguration testen wir in dem 2U-Rackserver IBM System x3755 M3. Das System setzt auf AMDs SR5670-Chipsatz. Jedem Prozessor stehen acht Registered DDR3-1333-DIMMs (zwei pro Channel) zur Verfügung. Die insgesamt 32 DIMM-Steckplätze ermöglichen mit 4-GByte-Riegeln 128 GByte Arbeitsspeicher.

Den Opteron 6174 in der 2-Sockel-Konfiguration testen wir in einem 2-Sockel-Referenzsystem von AMD. Das Tower-System verwendet das AMD-Referenz-Mainboard Dinar2 mit AMD SR5690-Chipsatz. Jeder Socket-G34-CPU stehen acht DIMM-Steckplätze zur Verfügung (zwei Speicherriegel pro Channel). Beide Opteron 6174 können im Testsystem auf jeweils vier 4-GByte-Registered-DIMMs zurückgreifen. Dem System stehen somit insgesamt 32 GByte RAM zur Verfügung.

Socket-G34-Plattform: IBMs System x3755 M3 für vier Opteron 6100 stellt jeder CPU bis zu acht DDR3-DIMMs zur Verfügung.

Für den Test des Xeon X7560 und Xeon E7-4870 dient uns der 4-Sockel-Server QSSC-S4R, den Intel hat zusammen mit Quanta Computer entwickelt hat. Das 4U-System für vier Prozessoren verfügt über 64 DIMM-Slots. Die Registered DDR3-1066-Speicherriegel nehmen in acht Hot-Swap-fähigen Riser-Karten Platz. Die in unserem System verwendeten Samsung M393B5170FH0 mit 4 GByte ergeben bei Vollbestückung 256 GByte RAM.

Xeon-E7/7500-Plattform: Der 4U-Server QSSC-S4R bietet Platz für vier Xeon X7560 oder Xeon E7-4879 und 64 DIMMs. Eine Vielzahl redundanter Lüfter sowie vier Netzteile sorgen für hohe Ausfallsicherheit.

Intels Xeon X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher - 12 GByte pro CPU mit drei Channels.

Um insbesondere für die Energiemessungen möglichst gleiche Vorraussetzungen für die AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten. Bei den Energiemessungen achten wir darauf, die minimale Anzahl von DIMMs zu verwenden, bei der noch alle Speicher-Channels belegt sind. Unterschiede gibt es bei den Netzteilen. Der Xeon-X5680-Server bezieht seine Energie aus zwei 770-Watt-Netzteilen. Im 2S-Opteron-6174-System befindet sich ein 1200-Watt-Netzteil. Der 4-Sockel-Server QSSC-S4R für den Xeon E7 und Xeon 7500 arbeitet mit vier 850-Watt-Netzteilen. Der IBM x3755 M3 für die vier Opteron-6100-Prozessoren ist mit drei 1100-Watt-Netzteilen ausgestattet.

Als Betriebssystem setzen wir Windows Server 2008/R2 SP1 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 5.4 in der 64-Bit-Version.

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.