System-Administratoren handeln überwiegend nach dem Motto "Never change a running system". Nur in zwingenden Fällen aktualisieren sie das Betriebssystem des Servers. Wenn die Servermaschine über Jahre einwandfrei unter Windows Server 2003 funktioniert, warum zum gegenwärtigen Windows Server 2008 R2 wechseln? Die Verantwortlichen übergehen dann in der Regel das aktuelle OS. Beliebt ist auch, auf moderne Hardware ein vollständiges und erprobtes Image zu migrieren. Aber Microsoft ist logischerweise daran gelegen, die Verkaufszahlen seines aktuellen Betriebssystems zu steigern. Ein Verkaufsargument ist, dass Microsoft seine Anwendungen Exchange Server 2010 und SQL Server 2008 R2 an das aktuelle Betriebssystem angepasst hat.
Aktuelle Betriebssysteme besitzen selbstverständlich modifizierte und neue Netzwerk-, Remote- und Verwaltungs-Features, doch IT-Verantwortliche verzichten gerne auf diese Merkmale. Die Sache sieht anders aus, wenn die aktuelle Version weniger Kosten im Rechenzentrum verspricht.
Das Thema Green IT beschäftigt Administratoren immer mehr, vor allem die Energiekosten stehen im Mittelpunkt. Im klassischen Alltagsbetrieb gibt es Einsparpotenzial, da Server kaum unter Volllast arbeiten. Dies ist sogar der Fall, wenn die Systeme virtualisiert sind. Gewöhnlich sind die CPUs zwischen fünf bis 15 Prozent ausgelastet. Dies hat Microsoft erkannt und garantiert, dass die Energiekosten bei Windows Server 2008 R2 geringer ausfallen als bei der 2003er Version.
Ein modernes Prozessor-Powermanagement mit Core Parking verteilt laufende Prozesse auf so wenige CPU-Kerne wie möglich und schaltet untätige Prozessoren ab. Das verringert den Stromverbrauch. Benötigt das System mehr Leistung, mobilisiert es die passiven CPUs und kompensiert Lastspitzen.
Zusätzlich fördert die Funktion Timer Tick Distribution die Deeper C-State C3 der Prozessoren. Konkret heißt das: Timer-Interrupts werden nur aktiven CPU-Kernen zugewiesen, um passive Prozessoren länger im C3-Mode zu halten. Die untätigen Prozessoren verharren so länger im Strom sparenden Modus. Außerdem will Microsoft nach eigenen Informationen die Anzahl der gerade ausgeführten Hintergrundprozesse verringert haben.
Die Kollegen von TecChannel haben in ihrem Testlabor auf einem 2-Sockel-Rackserver mit Xeon-X5680-Prozessor die Energieeffizienz und Performance von Windows Server 2008 R2 mit den Vorläufern Windows Server 2008 SP2 und Windows Server 2003 R2 gegenübergestellt.
Energieeffizienz: Performance/Watt
Der Gesamtwert von SPECpower_ssj2008 steht für die Energieeffizienz des Systems. Der Benchmark gibt die gemittelte Performance pro Watt an, die über alle Lastzustände von zehn bis 100 Prozent gemessenen werden.
Um die Energiesparoptionen der Prozessoren zu nutzen, arbeitet Windows Server Enterprise x64 mit dem Energieschema "Ausbalanciert". SpeedStep zum dynamischen Regeln von Taktfrequenz und Core-Spannung je nach CPU-Auslastung sind bei dem SPECpower-Benchmark aktiv.
Jetzt wird bei den Energieoptionen von Windows Server das Schemata "Höchstleistung" ausgewählt. Die Xeon-Prozessoren arbeiten immer mit voller Taktfrequenz und Core-Spannung. Die dynamische Powermanagement-Funktion SpeedStep ist beim Schemata "Höchstleistung" nicht aktiv.
Im zweiten Diagramm sehen Sie die Auswirkungen des deaktivierten CPU-Powermanagements auf die Energieeffizienz der Systeme.
Maximaler Energieverbrauch
SPECpower_ssj2008 ringt dem Testsystem im Lastzustand 100 Prozent den maximalen Energieverbrauch ab. Alle Kerne der zwei Xeon-X5680-Prozessoren sind voll ausgelastet. Die aktiven JVMs fordern zusätzlich den Arbeitsspeicher der Systeme.
Minimaler Energieverbrauch
SPECpower_ssj2008 führt neben den Lasttests zusätzlich Kalibrierungsmessungen über den Energieverbrauch bei Leerlauf durch. Dabei wird der minimale Energiebedarf des Systems ermittelt.
Im ersten Diagramm vergleichen wir den Systemverbrauch unter Windows Server Enterprise x64 mit dem Energie-Schemata "Ausbalanciert". Die Xeon X5680 nutzen ihre Powermanagement-Features wie SpeedStep voll aus.
Dann wird bei den Energieoptionen von Windows Server 2008 das Schemata "Höchstleistung" ausgewählt. Die dynamische Powermanagement-Funktion SpeedStep von Intel ist beim Schemata "Höchstleistung" nicht aktiv. Die Auswirkungen sehen Sie im zweiten Diagramm.
Maximale Java-Performance
SPECpower_ssj2008 ermittelt neben der Energieeffizienz bei 100 Prozent Prozessorauslastung auch die maximale Java-Performance des Systems. Als Java-Engine unter Windows Server Enterprise x64 dient Bea JRockit in der 64-Bit-Version 6 R27.
SPECpower_ssj2008 nutzt einen anderen Workload als SPECjvm2008. Außerdem arbeiten bei SPECpower_ssj2008 nicht nur eine JVM, sondern mehrere virtuelle Java-Instanzen. Bei den getesteten Vier-Sockel-Systemen sind zwei JVMs aktiv. Jede JVM agiert multithreaded mit der Anzahl der CPU-Kerne pro Sockel. Bei diesem konfigurierbaren Setup erzielt SPECpower_ssj2008 bei Zwei-Sockel-Systemen die besten Ergebnisse.
Bei diesem Test sind die Energiesparoptionen der Prozessoren aktiv, die erreichbare Performance wird durch die Vollauslastung der CPUs allerdings nicht beeinflusst.
Dass beim Java-Workload von SPECpower hohe Speicher- und Busbandbreiten von Vorteil sind, zeigen auch die Xeon E5472. Trotz nur 3,0 GHz Taktfrequenz überholen die Xeon E5472 hier die 3,33-GHz-Xeon-X5470-CPUs, weil sie mit DDR2-800-Speicher und FSB1600 arbeiten (statt DDR2-667 und FSB1333).
Java Virtual Machine Performance
Mit SPECjvm2008 stellt die Standard Performance Evaluation Corporation (SPEC) einen Benchmark für die Performance von Systemen unter Java Runtime Environment (JRE) zur Verfügung. Die Evaluierungssoftware zur Ermittlung der Java-Performance wurde von SPEC in Zusammenarbeit mit AMD, Bea, Hewlett-Packard, IBM, Intel und Sun entwickelt.
Für die Performance des Systems in einer Java Virtual Machine zeigen sich neben der Wahl der Java-Engine die Prozessoren sowie die Speicherarchitektur verantwortlich. SPECjvm2008 startet eine JVM und führt einen Multithread-Workload durch. Alle Prozessorkerne der zwei verwendeten Xeon X5680 werden von SPECjvm2008 ausgenutzt.
SPECjvm2008 arbeitet mit einem Base-Run, bei dem keine speziellen Tuning-Maßnahmen durch Flags und Optimierungen erlaubt sind. Damit wird die Java-Performance der Systeme mit der installierten JVM ermittelt. Zehn verschiedene Tests wie Compilieren, Rendering, Verschlüsselung oder Komprimierung werden durchgeführt. Beim Peak-Run lassen sich für jeden Test Optimierungen für die JVM einstellen.
Wir führen SPECjvm2008 im Base-Run unter Windows Server Enterprise x64 mit der JRE Bea JRockit 6 R27 in der 64-Bit-Version durch:
Multitask Integer: SPECint_rate_base2006
Wir setzen die SPEC-Benchmarks unter Windows Server Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Integer-Berechnungen von SPECint_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Integer-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.
Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beim verwendeten Zwei-Sockel-Server mit Xeon X5680 (Hexa-Core) sind durch das zusätzliche Hyper-Threading 24 virtuelle Kerne vorhanden. Entsprechend laufen hier 24 parallele Kopien mit einem Speicherbedarf von 2 GByte RAM pro Kopie.
Multitask Floating Point: SPECfp_rate_base2006
Wir setzen die SPEC-Benchmarks unter Windows Server Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.
Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beim verwendeten Zwei-Sockel-Server mit Xeon X5680 (Hexa-Core) sind durch das zusätzliche Hyper-Threading 24 virtuelle Kerne vorhanden. Entsprechend laufen hier 24 parallele Kopien mit einem Speicherbedarf von 2 GByte RAM pro Kopie.
STREAM: Speicherbandbreite
Der quelloffene STREAM-Benchmark ist ein weit verbreiteter Industriestandardtest zum Messen der möglichen Speicherbandbreite in einem System. Wir verwenden die 64-Bit-Windows-Binary von der University of Virginia. Die OMP-fähige STREAM-Version nutzt möglichst alle Kerne der Prozessoren aus, um den höchsten Speicherdurchsatz zu generieren.
Rendering: CINEBENCH 11.5 64 Bit
Mit dem CINEBENCH 11.5 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 11.5 basiert auf Cinema 4D Release 11.5 und führt Rendering-Tests durch. Maxon bietet CINEBENCH 11.5 als 32- und 64-Bit-Version zum Download an. Die Rendering-Engine von Cinemal 4D Release 11.5 unterstützt bis zu 64 Threads.
Beim Render-Test wird eine fotorealistische 3D-Szene mithilfe des Cinema-4D-Raytracers berechnet. Die Testszene enthält über 2000 Objekte mit mehr als 300.000 Polygonen, nutzt scharfe und weiche Spiegelungen, Flächenlichter und -schatten, prozedurale Shader, Kantenglättung und vieles mehr. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicherbandbreiten nutzen beim Rendering von CINEBENCH 11.5 wenig - der Test läuft überwiegend in den Cache-Stufen ab.
Fazit
Aus unserer Betrachtung der Performance und Effizienz heraus können wir bei modernen Servern den Einsatz von Windows Server 2008 R2 ohne Einschränkung empfehlen. Während die "pure" Performance von Microsofts aktuellem Server-Betriebssystem auf einem Leistungsniveau mit den Vorgängern Windows Server 2003 R2 und 2008 SP2 liegt, überzeugt die 2008er R2-Version in der Effizienz vollends.
Vor allem im typischen Server-Lastbereich von weit unter 50 Prozent und bei Leerlaufphasen wie meist nachts lässt sich massiv Energie sparen. Gegenüber dem sich noch sehr häufig im Einsatz befindenden Windows Server 2003 R2 spart die 2008er R2-Version auf unserem Xeon-Testsystem satte 57 Watt im Leerlauf. Unter Volllast sind es immer noch zirka 20 Watt. Bei gleichzeitig relativ unverändert gebotener Performance erhöht sich die Energieeffizienz um zirka zehn Prozent. Doch selbst gegenüber Windows Server 2008 SP2 nimmt die Energieeffizienz des Systems mit der 2008er R2-Version zu, wenn alle Powermanagement-Features ausgenutzt werden. Eine weitere Verbesserung der Performance und Effizienz durch das Service Pack 1 für Windows Server 2008 R2 konnten wir bei unserem Xeon-X5680-Server nicht feststellen.
Wenn Sie sich über die Performance und Energieeffizienz verschiedener Prozessoren informieren möchten, dann empfehlen wir Ihnen auch unsere Artikel Intel Xeon E7-4870 im Test - Neue Generation mit Leistungssprung sowie Test - Xeon L5630 vs. Opteron 4162 EE.
Dieser Artikel basiert auf einem Beitrag unserer Schwesterpublikation TecChannel. (sjf)
Testsystem im Detail
Intels Xeon X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel zwei 4 GByte Registered DIMMs vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Insgesamt besitzt das System damit 48 GByte Arbeitsspeicher - 24 GByte pro CPU mit drei Channels.
An der SATA-Backplane des Servers sind zwei SATA-RAID-Edition-Festplatten von Samsung angeschlossen. Der Xeon-Server bezieht seine Energie aus zwei redundant ausgelegten 770-Watt-Netzteilen.