Server-CPU senkt Stromverbrauch

Intel Xeon L5520 Quad Core im Test

24.06.2009 von Christian Vilsbeck
Intels CPU-Familie Xeon 5500 (Nehalem) liefert Bestwerte in Sachen Performance. Doch wie schneidet das Stromspar-Modell Xeon L5520 gegen die Opteron-Konkurrenten von AMD ab?

Intel bietet Prozessoren der Serie Xeon-5500 mit Nehalem-Architektur in verschiedenen Leistungsklassen und entsprechendem Stromverbrauch an. Der Xeon X5570 mit 2,93 GHz Taktfrequenz beispielsweise besitzt einen TDP-Wert von 95 Watt (TDP = Thermal Design Power). Ganz anders das sparsame 60-Watt-Modell Xeon L5520. Der ebenfalls mit vier Kernen, 8 MByte L3-Cache, Hyper-Threading und Turbo-Mode ausgestattete Xeon arbeitet mit 2,26 GHz Taktfrequenz.

Bildergalerie: Alle Benchmarks des Xeon L5520 im Überblick.
SPECint_rate_base2006
Die zwei Xeon L5520 bieten gegenüber den Xeon-X5570-CPUs bei 23 Prozent geringerer Taktfrequenz zirka 17 Prozent weniger Integer-Performance. Bei identischer Compiler-Einstellung -QxO arbeiten zwei Xeon L5520 (2,26 GHz, Quad-Core) bereits 19 Prozent schneller als die Opteron 2435 mit 2,6 GHz und Hexa-Core. Mit der Compiler-Einstellung –fast bieten die Low-Voltage-Xeons sogar 30 Prozent mehr Integer-Durchsatz.
SPECfp_rate_base2006
Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen ermöglichen zwei Xeon L5520 bei identischer Compiler-Einstellung –QxO zirka 22 Prozent mehr Performance als die Hexa-Core-Opterons.
Java Runtime
Die Stromspar-Xeons L5520 ermöglichen trotz geringer Taktfrequenz und weniger Kerne etwas mehr Java-Performance als die mit Hexa-Core-Technologie arbeitenden zwei Opteron 2435. Uneinholbar an der Spitze liegen die zwei Xeon X5570.
Java-Performance
Der Workload ist speicherintensiver als bei SPECjvm2008. Das Xeon-X5570-Päärchen arbeitet hier 26 statt nur 18 Prozent flinker als die Xeon-L5520-CPUs. Die Low-Voltage-Xeons arbeiten nur mit DDR3-1066 statt DDR3-1333 sowie mit einem 5,86-GT/s-QuickPath-Interface statt mit 6,4 GT/s wie beim Xeon X5570. Die zwei Opteron 2435 können bei SPECjvm2008 die Xeon L5520 überholen.
Mit Powermanagement
Obwohl die zwei Xeon L5520 eine 21 Prozent geringere Performance als die Xeon X5570 bieten, liegt die Energieeffizienz des Intel-Servers durch den geringeren Energiebedarf auf ähnlichem Niveau. Sehr stark präsentiert sich die zwei Opteron 2435 - sie hieven die Energieeffizienz des AMD-Servers auf das Niveau des Intel-Systems mit Xeon-5500-Prozessoren.
Ohne Powermanagement
Mit inaktivem SpeedStep reduzieren die zwei Xeon X5570 die Systemeffizienz um knapp zwei Prozent. Bei den Xeon-L5520-CPUs verschlechtert sich die Effizienz um weniger als ein Prozent. Beim Opteron-2384-System geht die Effizienz ohne PowerNow! um knapp drei Prozent zurück.
Verbrauchsarm
Unter Volllast benötigt der Nehalem-Server mit den 60-Watt-Xeon-L5520-CPUs zirka 130 Watt weniger als mit den 95-Watt-Xeon-X5570-Modellen. Neben den sparsameren CPUs braucht auch der Speicher durch den Betrieb mit 1066 statt 1333 MHz weniger Energie. Außerdem arbeitet das Netzteil des Servers bei den unter Last stehenden Xeon L5520 in einem effizienteren Bereich.
Mit Powermanagement
Im Leerlauf mit SpeedStep arbeiten die zwei Xeon L5520 und Xeon X5570 mit der identischen Taktfrequenz von 1,6 GHz. Die Xeon-L5520-CPUs sparen zusätzlich Energie, weil sie den Speicher nur mit 1066 statt 1333 MHz ansteuern. Außerdem arbeitet das QuickPath-Interface mit einer geringeren Geschwindigkeit. Die zwei Opteron 2435 arbeiten im Tyan-Server ebenfalls ähnlich sparsam wie Xeon-5500-CPUs im Asus-Server. Während der Asus-Xeon-Server zwei 770-Watt-Netzteile betreibt, arbeitet im Tyan-Opteron-Server ein 1000-Watt-Netzteil, aber ein 4-Sockel-Mainboard (im Test mit zwei Opteron 2435 bestückt).
Ohne Powermanagement
Im Leerlauf steigt bei den Xeon X5570 der Energiebedarf ohne SpeedStep lediglich um 2 Watt. Bei den Xeon L5520 ist innerhalb der Messtoleranz kein Unterschied zu erkennen. Die Opteron-2435-Modelle erhöhen ihren Energiebedarf im Leerlauf ohne Powermanagement um 10 Watt.
Schnelle
VorhersagenTrotz Hexa-Core-Technologie und höherer Taktfrequenz müssen sich zwei Opteron 2435 den zwei Xeon L5520 geschlagen geben.
Überraschung
Die Matrixberechnungen bei Linpack zählen schon immer zu einer Paradedisziplin für Opteron-Prozessoren. Entsprechend setzt sich AMDs Hexa-Core-Päärchen deutlich an die Spitze. Intels Xeon X5570 muss sich bereits dem Quad-Core-Opterons geschlagen geben.
RSA-2048
EncryptionDer Test läuft überwiegend im Cache ab. Die 6-Core-Opterons 2435 verschlüsseln 20 Prozent schneller als zwei Xeon X5570. Intels Xeon-L5520-Prozessoren müssen sich mit einem Platz im Mittelfeld begnügen.
RSA-2048 Decryption
Auch das Entschlüsseln erledigen die Hexa-Core-Opterons mit dem höchsten Durchsatz.
Szene „Space Flyby“
Der Render-Workload passt überwiegend in die Caches der Prozessoren. Von integrierten Speicher-Controllern profitieren sowohl die Xeon-5500-CPUs als auch die Opterons hier weniger. Intels neue Stromspar-Xeons L5520 bieten angesichts der geringen Taktfrequenz eine vergleichsweise gute Performance.
1 Thread
Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. Durch die Turbo-Technologie arbeitet der Xeon L5520 hier mit 2,53 GHz, die Xeon X5570 mit 3,33 GHz Taktfrequenz. Entsprechend der prozentual höheren Taktfrequenz rendert der Xeon X5570 zirka 31 Prozent schneller als der Xeon L5520.
Alle
ThreadsJetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. AMDs Opteron-2435-Päärchen mit Hexa-Core-Technologie muss sich nur vom Xeon-X5570-Duett geschlagen geben. Die Nehalem-Quad-Core-Xeons profitieren hier stark von Hyper-Threading.

Die Kommunikation zwischen den CPUs sowie zur Peripherie funktioniert wie bei allen Xeon-Prozessoren der Serie 5500 über QuickPath-Schnittstellen. Statt 6,4 GT/s wie beim Xeon X5570 muss sich der Xeon L5520 mit 5,86 GT/s begnügen. Der in der CPU integrierte Speicher-Controller mit drei DDR3-Channels erlaubt statt 1333 MHz auch nur 1066 MHz Taktfrequenz. Mit einem Listenpreis von 530 US-Dollar kostet der Stromspar-Xeon dafür auch weniger als die Hälfte eines Xeon X5570.

Die CW-Schwesterpublikation TecChannel prüfte in einem Test, welche Leistungseinbußen beim stromsparenden Xeon L5520 im Vergleich zum Spitzenmodell Xeon X5570 zu erwarten sind. Zudem klärten die Tester, ob die Low-Voltage-CPU mit 2,26-GHz-Quad-Core-Architektur schneller ist als AMDs Opteron 2435 mit 2,6 GHz und sechs Kernen. Darüber hinaus erfahren Sie, wie es um die Performance pro Watt der Prozessoren auf mehreren Testsystemen steht.

Details zum Xeon 5500 „Nehalem-EP“

Intels Xeon-Modelle W5580, X5570, X5560, X5550, E5540, E5530, E5520 und L5520 mit Nehalem-Architektur arbeiten mit vier Kernen und zusätzlichem Hyper-Threading. In der 2-Sockel-Konfiguration stehen dem Betriebssystem somit 16 virtuelle Kerne zur Verfügung. Hyper-Threading lässt sich im BIOS der Server deaktivieren.

Bei den Quad-Core-Modellen Xeon E5504, E5506 und L5506 gibt es kein Hyper-Threading. Außerdem müssen diese CPUs mit nur 4 MByte Shared L3-Cache auskommen. Die Modelle W5580 bis L5520 können dagegen auf einen 8 MByte großen L3-Cache zurückgreifen. Bei allen Nehalem-Xeons besitzt jeder Core neben dem 32 KByte fassenden L1-Cache für Daten und Befehle einen dedizierten L2-Cache mit 256 KByte Puffergröße.

Der im Prozessor integrierte Speicher-Controller des Xeon 5500 unterstützt drei DDR3-Speicher-Channels. Pro Channel sind drei gepufferte oder ungepufferte DIMMs mit ECC möglich, die Speicherriegel arbeiten dann mit 800 MHz Speichertakt. Bei zwei DIMMs pro Channel sind 1066 MHz möglich. Ist pro Channel nur ein DIMM eingesetzt, so erlaubt der Speicher-Controller den Betrieb mit 1333 MHz Taktfrequenz.

Den Speichertakt von 1333 MHz unterstützen jedoch nur die Xeon-Modell W5580 und X55xx. Beim Xeon E5540 bis L5520 ist der Speichertakt auf maximal 1066 MHz beschränkt. Die Modelle Xeon E5504, E5506 und L5506 unterstützen nur eine Speichergeschwindigkeit von 800 MHz.

Bis auf den Xeon E5506 und L5506 verfügen die Quad-Core-Modelle der Xeon-5500-Serie über die Turbo-Technologie. Beispielsweise arbeitet der Xeon L5520 mit einer Grundtaktfrequenz von 2,26 GHz. Die im BIOS ein- und ausschaltbare Technologie erlaubt ein automatisches Übertakten der Kerne, je nach den gerade laufenden Anwendungen. Lastet ein Programm beispielsweise nur einen oder zwei Prozessorkerne aus, so erhöht der Turbo Mode die Taktfrequenz um zwei „Speed Bins“ (bei den X55xx-Modellen um drei Speed Bins). Durch die von Intel definierten 133 MHz für einen Speed Bin bearbeitet der Xeon L5520 Single- und Dual-Threads mit 2,53 GHz. Sind drei oder vier Kerne aktiv am Arbeiten, so dürfen diese um bis zu zwei Speed Bins höher takten. Durch die Turbo Technologie reizt Intel den spezifizierten TDP-Wert des Xeon L5520 von 60 Watt aus – überschritten wird die Spezifikation nicht.

Platz nimmt der Xeon 5500 im Socket LGA1366. Die Kommunikation mit der zweiten CPU und mit dem Chipsatz 5500 übernimmt bei den Nehalem-Xeons das serielle QuickPath-Interface. Jeder Xeon besitzt zwei QuickPath-Interconnects: Ein Interface kommuniziert mit dem Chipsatz Intel 5520, das andere ist direkt mit der zweiten CPU verbunden. Jedes QuickPath-Interface erlaubt bis zu 6,4 GT/s beziehungsweise 12,8 GByte/s pro Richtung (siehe Tabelle).

In der Tabelle finden Sie alle Xeon-5500-Prozessoren mit 45-nm-Nehalem-Architektur im Überblick:

Intels 45-nm-Nehalem-Xeons im Überblick

Prozessor

Taktfrequenz [GHz]

QPI [GT/s]

L2-Cache

Kerne

Turbo / HT

TDP [Watt]

Xeon W5580

3,20

6,4

8 MByte

4

ja / ja

130

Xeon X5570

2,93

6,4

8 MByte

4

ja / ja

95

Xeon X5560

2,80

6,4

8 MByte

4

ja / ja

95

Xeon X5550

2,66

6,4

8 MByte

4

ja / ja

95

Xeon E5540

2,53

5,86

8 MByte

4

ja / ja

80

Xeon E5530

2,40

5,86

8 MByte

4

ja / ja

80

Xeon E5520

2,26

5,86

8 MByte

4

ja / ja

80

Xeon L5520

2,26

5,86

8 MByte

4

ja / ja

60

Xeon E5506

2,13

4,8

4 MByte

4

nein / nein

80

Xeon L5506

2,13

4,8

4 MByte

4

nein / nein

60

Xeon E5504

2,00

4,8

4 MByte

4

nein / nein

80

Xeon E5502

1,86

4,8

4 MByte

2

nein / nein

80

Multitask Integer: SPECint_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz.

Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für „Non-Intel-Processors“ (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon L5520 und X5570 für eine optimale Vergleichbarkeit mit dem Opteron 2435 ebenfalls mit -QxO.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beispielsweise arbeiten beim Zwei-Sockel-Server mit Hexa-Core-Opterons zwölf Kopien parallel. Beim Nehalem-EP-System mit Xeon L5520 und X5570 (Quad-Core) sind durch das zusätzliche Hyper-Threading 16 virtuelle Kerne vorhanden. Entsprechend laufen bei den Xeon-L5520/X5570-CPUs 16 parallele Kopien.

SPECint_rate_base2006

SPECint_rate_base2006: Die zwei Xeon L5520 bieten gegenüber den Xeon-X5570-CPUs bei 23 Prozent geringerer Taktfrequenz zirka 17 Prozent weniger Integer-Performance. Bei identischer Compiler-Einstellung -QxO arbeiten zwei Xeon L5520 (2,26 GHz, Quad-Core) bereits 19 Prozent schneller als die Opteron 2435 mit 2,6 GHz und Hexa-Core. Mit der Compiler-Einstellung –fast bieten die Low-Voltage-Xeons sogar 30 Prozent mehr Integer-Durchsatz.

Multitask Floating Point: SPECfp_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz.

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für „Non-Intel-Processors“ (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5570 für eine optimale Vergleichbarkeit mit dem Opteron 2435 ebenfalls mit -QxO.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECint_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beispielsweise arbeiten beim Zwei-Sockel-Server mit Hexa-Core-Opterons zwölf Kopien parallel. Beim Nehalem-EP-System mit Xeon L5520 und X5570 (Quad-Core) sind durch das zusätzliche Hyper-Threading 16 virtuelle Kerne vorhanden. Entsprechend laufen bei den Xeon-L5520/X5570-CPUs 16 parallele Kopien.

SPECfp_rate_base2006

SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen ermöglichen zwei Xeon L5520 bei identischer Compiler-Einstellung –QxO zirka 22 Prozent mehr Performance als die Hexa-Core-Opterons.

Java Virtual Machine Performance

Mit SPECjvm2008 stellt die Standard Performance Evaluation Corporation (SPEC) einen Benchmark für die Performance von Systemen unter Java Runtime Environment (JRE) zur Verfügung. Die Evaluierungssoftware zur Ermittlung der Java-Performance wurde von SPEC in Zusammenarbeit mit AMD, Bea, Hewlett-Packard, IBM, Intel und Sun entwickelt.

Für die Performance des Systems in einer Java Virtual Machine zeigen sich neben der Wahl der Java-Engine die Prozessoren sowie die Speicherarchitektur verantwortlich. SPECjvm2008 startet eine JVM und führt einen Multithread-Workload durch. Alle Prozessorkerne eines Systems werden von SPECjvm2008 ausgenutzt.

SPECjvm2008 arbeitet mit einem Base-Run, bei dem keine speziellen Tuning-Maßnahmen durch Flags und Optimierungen erlaubt sind. Damit wird die Java-Performance der Systeme mit der installierten JVM ermittelt. Zehn verschiedene Tests wie Compilieren, Rendering, Verschlüsselung oder Komprimierung werden durchgeführt. Beim Peak-Run lassen sich für jeden Test Optimierungen für die JVM einstellen.

Wir führen SPECjvm2008 im Base-Run unter Windows Server 2008 Enterprise x64 mit der JRE Bea JRockit 6 R27 in der 64-Bit-Version durch:

Java Runtime

Java Runtime: Die Stromspar-Xeons L5520 ermöglichen trotz geringer Taktfrequenz und weniger Kerne etwas mehr Java-Performance als die mit Hexa-Core-Technologie arbeitenden zwei Opteron 2435. Uneinholbar an der Spitze liegen die zwei Xeon X5570.

Maximale Java-Performance

SPECpower_ssj2008 ermittelt neben der Energieeffizienz bei 100 Prozent Prozessorauslastung auch die maximale Java-Performance des Systems. Als Java-Engine unter Windows Server 2008 Enterprise x64 dient Bea JRockit in der 64-Bit-Version 6 R27.

SPECpower_ssj2008 nutzt einen anderen Workload als SPECjvm2008. Außerdem arbeiten bei SPECpower_ssj2008 nicht nur eine JVM, sondern mehrere virtuelle Java-Instanzen. Bei den getesteten Vier-Sockel-Systemen sind zwei JVMs aktiv. Jede JVM agiert multithreaded mit der Anzahl der CPU-Kerne pro Sockel. Bei diesem konfigurierbaren Setup erzielt SPECpower_ssj2008 bei Zwei-Sockel-Systemen die besten Ergebnisse.

Bei diesem Test sind die Energiesparoptionen der Prozessoren aktiv, die erreichbare Performance wird durch die Vollauslastung der CPUs allerdings nicht beeinflusst.

Dass beim Java-Workload von SPECpower hohe Speicher- und Busbandbreiten von Vorteil sind, zeigen auch die Xeon E5472. Trotz nur 3,0 GHz Taktfrequenz überholen die Xeon E5472 hier die 3,33-GHz-Xeon-X5470-CPUs, weil sie mit DDR2-800-Speicher und FSB1600 arbeiten (statt DDR2-667 und FSB1333).

Java-Performance

Java-Performance: Der Workload ist speicherintensiver als bei SPECjvm2008. Das Xeon-X5570-Päärchen arbeitet hier 26 statt nur 18 Prozent flinker als die Xeon-L5520-CPUs. Die Low-Voltage-Xeons arbeiten nur mit DDR3-1066 statt DDR3-1333 sowie mit einem 5,86-GT/s-QuickPath-Interface statt mit 6,4 GT/s wie beim Xeon X5570. Die zwei Opteron 2435 können bei SPECjvm2008 die Xeon L5520 überholen.

Energieeffizienz: Performance/Watt

Der Gesamtwert von SPECpower_ssj2008 steht für die Energieeffizienz des Systems. Der Benchmark gibt die gemittelte Performance pro Watt an, die über alle Lastzustände von zehn bis 100 Prozent gemessenen werden.

Um die Energiesparoptionen der Prozessoren zu nutzen, arbeitet Windows Server 2008 Enterprise x64 mit dem Energieschema „Ausbalanciert“. SpeedStep (Intel) und PowerNow! (AMD) zum dynamischen Regeln von Taktfrequenz und Core-Spannung je nach CPU-Auslastung sind bei dem SPECpower-Benchmark aktiv:

Mit Powermanagement

Mit Powermanagement: Obwohl die zwei Xeon L5520 eine 21 Prozent geringere Performance als die Xeon X5570 bieten, liegt die Energieeffizienz des Intel-Servers durch den geringeren Energiebedarf auf ähnlichem Niveau. Sehr stark präsentiert sich die zwei Opteron 2435 - sie hieven die Energieeffizienz des AMD-Servers auf das Niveau des Intel-Systems mit Xeon-5500-Prozessoren.

Jetzt wird bei den Energieoptionen von Windows Server 2008 das Schemata „Höchstleistung“ ausgewählt. Die Prozessoren arbeiten immer mit voller Taktfrequenz und Core-Spannung. Die dynamischen Powermanagement-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schemata „Höchstleistung“ nicht aktiv.

Im folgenden Diagramm sehen Sie die Auswirkungen des deaktivierten CPU-Powermanagements auf die Energieeffizienz der Systeme:

Ohne Powermanagement

Ohne Powermanagement: Mit inaktivem SpeedStep reduzieren die zwei Xeon X5570 die Systemeffizienz um knapp zwei Prozent. Bei den Xeon-L5520-CPUs verschlechtert sich die Effizienz um weniger als ein Prozent. Beim Opteron-2384-System geht die Effizienz ohne PowerNow! um knapp drei Prozent zurück.

Maximaler Energieverbrauch

SPECpower_ssj2008 ringt dem Testsystem im Lastzustand 100 Prozent den maximalen Energieverbrauch ab. Alle Kerne der Prozessoren sind voll ausgelastet. Die aktiven JVMs fordern zusätzlich den Arbeitsspeicher der Systeme.

Verbrauchsarm

Verbrauchsarm: Unter Volllast benötigt der Nehalem-Server mit den 60-Watt-Xeon-L5520-CPUs zirka 130 Watt weniger als mit den 95-Watt-Xeon-X5570-Modellen. Neben den sparsameren CPUs braucht auch der Speicher durch den Betrieb mit 1066 statt 1333 MHz weniger Energie. Außerdem arbeitet das Netzteil des Servers bei den unter Last stehenden Xeon L5520 in einem effizienteren Bereich.

Minimaler Energieverbrauch

SPECpower_ssj2008 führt neben den Lasttests zusätzlich Kalibrierungsmessungen über den Energieverbrauch bei Leerlauf durch. Dabei wird der minimale Energiebedarf des Systems ermittelt.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows Server 2008 Enterprise x64 mit dem Energie-Schemata „Ausbalanciert“. Die Prozessoren nutzen ihre Powermanagement-Features SpeedStep (Intel) und PowerNow! (AMD) aus:

Mit Powermanagement

Mit Powermanagement: Im Leerlauf mit SpeedStep arbeiten die zwei Xeon L5520 und Xeon X5570 mit der identischen Taktfrequenz von 1,6 GHz. Die Xeon-L5520-CPUs sparen zusätzlich Energie, weil sie den Speicher nur mit 1066 statt 1333 MHz ansteuern. Außerdem arbeitet das QuickPath-Interface mit einer geringeren Geschwindigkeit. Die zwei Opteron 2435 arbeiten im Tyan-Server ebenfalls ähnlich sparsam wie Xeon-5500-CPUs im Asus-Server. Während der Asus-Xeon-Server zwei 770-Watt-Netzteile betreibt, arbeitet im Tyan-Opteron-Server ein 1000-Watt-Netzteil, aber ein 4-Sockel-Mainboard (im Test mit zwei Opteron 2435 bestückt).

Jetzt wird bei den Energieoptionen von Windows Server 2008 das Schemata „Höchstleistung“ ausgewählt. Die dynamischen Powermanagement-Funktionen SpeedStep (Intel) und PowerNow! (AMD) sind beim Schemata „Höchstleistung“ nicht aktiv:

Ohne Powermanagement

Ohne Powermanagement: Im Leerlauf steigt bei den Xeon X5570 der Energiebedarf ohne SpeedStep lediglich um 2 Watt. Bei den Xeon L5520 ist innerhalb der Messtoleranz kein Unterschied zu erkennen. Die Opteron-2435-Modelle erhöhen ihren Energiebedarf im Leerlauf ohne Powermanagement um 10 Watt.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 4.0 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard rechnet überwiegend mit Integer-Operationen. Speicherzugriffe halten sich bei Adaptiv Credit Risk in Grenzen.

Schnelle Vorhersagen

Schnelle Vorhersagen: Trotz Hexa-Core-Technologie und höherer Taktfrequenz müssen sich zwei Opteron 2435 den zwei Xeon L5520 geschlagen geben.

Linpack 64 Bit

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Opteron-Prozessoren mit SSE3 arbeiten unter Linux ebenfalls problemlos mit der von Intel-Compilern erstellten Linpack-Version zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000, 15.000, 18.000, 22.000 und 27.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 5,4 GByte Arbeitsspeicher (27.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Überraschung

Überraschung: Die Matrixberechnungen bei Linpack zählen schon immer zu einer Paradedisziplin für Opteron-Prozessoren. Entsprechend setzt sich AMDs Hexa-Core-Pärchen deutlich an die Spitze. Intels Xeon X5570 muss sich bereits dem Quad-Core-Opterons geschlagen geben.

Encryption/Decryption: openSSL 64 Bit

Die Leistungsfähigkeit der Prozessoren beim Verschlüsseln und Entschlüsseln von Daten unter Linux 64 Bit ermittelt das Open-Source-Programm openSSL in der 64-Bit-Version 0.9.8b. Der Code von openSSL ist single threaded programmiert. Durch den Start von multiplen Kopien summiert openSSL die Performance beim Verschlüsseln und Entschlüsseln von Daten.

Wir testen die Prozessoren bei openSSL mit dem RSA-Schlüssel und einer Schlüssellänge von 2048 Bit. Der synthetische Benchmark gibt einen guten Anhaltspunkt für die Geschwindigkeit der Prozessoren beim Verschlüsseln und Entschlüsseln von Daten. Spezielle, für die CPU-Architekturen optimierte Mathematik-Bibliotheken kommen beim mit gcc kompilierten openSSL-Benchmark nicht zum Einsatz.

RSA-2048 Encryption

RSA-2048 Encryption: Der Test läuft überwiegend im Cache ab. Die 6-Core-Opterons 2435 verschlüsseln 20 Prozent schneller als zwei Xeon X5570. Intels Xeon-L5520-Prozessoren müssen sich mit einem Platz im Mittelfeld begnügen.

RSA-2048 Decryption

RSA-2048 Decryption: Auch das Entschlüsseln erledigen die Hexa-Core-Opterons mit dem höchsten Durchsatz.

Rendering: SPECapc 3ds Max 2009 x64

Discreet/Autodesk bietet mit 3ds Max 2009 x64 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 9 2009 x64 Multiprocessing voll aus. Die Multi-Core-Technologie sowie ein zweiter Prozessor wirken somit beschleunigend.

Die gewählten Render-Szenen „Space Flyby“ und „Underwater“ basieren auf der Benchmark-Suite SPECapc for 3ds Max von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle, die OpenGL/DirectX-basierten Tests der SPECapc-Suite verwenden wir nicht.

Szene „Space Flyby

Szene „Space Flyby“: Der Render-Workload passt überwiegend in die Caches der Prozessoren. Von integrierten Speicher-Controllern profitieren sowohl die Xeon-5500-CPUs als auch die Opterons hier weniger. Intels neue Stromspar-Xeons L5520 bieten angesichts der geringen Taktfrequenz eine vergleichsweise gute Performance.

Rendering: CINEBENCH 10 64 Bit

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt wieder Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Teset wird eine fotorealistische 3D-Szene mithilfe des Cinema-4D-Raytracers berechnet. Die Szene enthält unter anderem Lichtquellen, Schatteneffekte sowie Multi-Level-Reflektionen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 10 wenig – der Test läuft überwiegend in den Cache-Stufen ab.

1 Thread

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core nutzt hier nichts. Durch die Turbo-Technologie arbeitet der Xeon L5520 hier mit 2,53 GHz, die Xeon X5570 mit 3,33 GHz Taktfrequenz. Entsprechend der prozentual höheren Taktfrequenz rendert der Xeon X5570 zirka 31 Prozent schneller als der Xeon L5520.

Alle Threads

Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. AMDs Opteron-2435-Päärchen mit Hexa-Core-Technologie muss sich nur vom Xeon-X5570-Duett geschlagen geben. Die Nehalem-Quad-Core-Xeons profitieren hier stark von Hyper-Threading.

AMD & Intel: Listenpreise 2-Sockel-CPUs

In der Tabelle finden Sie die Preise der aktuellen Xeon-5500-Prozessoren im Vergleich zu AMDs Opteron-2400-Serie. Bei AMDs Preisliste gab es am 01. Juni 2009 die letzten Änderungen. Intels Preisliste wurde am 02. Juni 2009 aktualisiert.

OEM-Preise im Vergleich

Modell

Taktfrequenz [GHz]

Listenpreis [US-Dollar]

AMD Opteron-2400-Serie

Opteron 2435

2,6

989

Opteron 2431

2,4

698

Opteron 2427

2,2

455

Intel Xeon-5500-Serie

Xeon W5580

3,20

1600

Xeon X5570

2,93

1386

Xeon X5560

2,80

1172

Xeon X5550

2,66

958

Xeon E5540

2,53

744

Xeon E5530

2,40

530

Xeon E5520

2,26

373

Xeon L5520

2,26

530

Xeon E5506

2,13

266

Xeon L5506

2,13

423

Xeon E5504

2,00

224

Xeon E5502

1,86

188

Fazit

Geht es um die pure Performance, so bleibt der Xeon X5570 das Maß der Dinge. Doch selbst der deutlich günstigere Xeon L5520 bietet eine beeindruckende Leistung, die durchschnittlich auf dem Niveau von AMDs Topmodell Opteron 2435 mit Hexa-Core-Technologie liegt.

Wird bei einem Server somit mehr Wert auf geringere Anschaffungs- und Energiekosten gelegt, so wird der Stromspar-Xeon L5520 zum Favoriten. Unser getesteter Intel-basierender 2-Sockel-Server bietet mit den zwei Xeon L5520 annähernd die identische Performance pro Watt als mit dem Xeon-X5570-Pärchen. Die Energieeffizienz des Opteron-2435-Servers liegt auf einem ähnlich hohen Niveau. Allerdings ist der Anschaffungspreis durch die höheren CPU-Preise des Opteron 2435 höher. (cvi)

Testsysteme im Detail

Intels Xeon L5520 und X5570 „Nehalem-EP“ testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Beim Xeon L5520 arbeitet der Speicher mit 1066 MHz. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher – 12 GByte pro CPU mit drei Channels.

Tylerburg-EP-Plattform: Der Zwei-Sockel-Server Asus RS700-E6/RS4 dient als Testplattform für die Xeon- Prozessoren L5520 und X5570.

Um die Performance und die Energieeffizienz der Xeon-Nehalem-CPUs bestmöglich mit den Xeon-5400- und Opteron-Prozessoren vergleichen zu können, verwenden wir möglichst bauähnliche Server. Die Xeon-5400-CPUs nehmen in einem SuperServer 6025W-NTR+B von Supermicro Platz. Als Mainboard verwendet der Server ein Supermicro X7DWN+ mit Seaburg-Chipsatz. Vier FB-DIMM-Channels steuern insgesamt acht 2-GByte-Module vom Typ Nanya NT2GT72U4NB1BD-2C an. Die FB-DIMMs arbeiten bei der FSB1600-CPU Xeon E5472 mit DDR2-800-SDRAMs mit einem 5-5-5-Timing. Bei den FSB1333-Xeons steuert der Chipsatz den Speicher automatisch mit einer Geschwindigkeit von 667 MHz bei CL5 an.

AMDs Opteron 2384 „Shanghai“ und 2356 „Barcelona“ testen wir in einem 2-Sockel-Server Supermicro A+ 2021M-UR+B. Der Rack-Server verwendet als Mainboard das Supermicro H8DMU+ mit NVIDIA MCP55Pro-Chipsatz. Jedem Prozessor stehen vier gepufferte 2-GByte-DIMMs in einer Dual-Channel-Konfiguration zur Verfügung. Insgesamt verfügt der Opteron-Server somit über 16 GByte Arbeitsspeicher.

AMDs Opteron 2435 testen wir in einem 4-Sockel-Server Tyan Transport GT26. Der 1U-Rack-Server verwendet als Mainboard ein Tyan S4987 mit NVIDIA MCP55-Chipsatz. Das System eignet sich für den Betrieb mit zwei oder vier Prozessoren. Jedem Prozessor stehen zwei gepufferte 4-GByte-DIMMs in einer Dual-Channel-Konfiguration zur Verfügung. Insgesamt verfügt der Tyan-Server in der 2-Sockel-Konfiguration über 16 GByte Arbeitsspeicher.

Um insbesondere für die Energiemessungen gleiche Vorraussetzungen für den AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten von Samsung. Somit lassen sich bestmögliche Vergleiche zwischen den Prozessoren ziehen. Jeder Server bezieht seine Energie aus zwei 700-Watt-Netzteilen (AMD-Server und Intel-Xeon-5400-System) beziehungsweise 770-Watt-Netzteilen (Intel Nehalem-EP-System). Das Testsystem für den Opteron 2435 ist mit einem 1000-Watt-Netzteil ausgestattet.

Als Betriebssystem setzen wir Windows Server 2008 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 5 in der 64-Bit-Version.

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.