Quadcore-Prozessor im Sinne der Green-IT

Nehalem rechnet sich nach acht Monaten

14.04.2009
Von Thomas Steudten
Mit seiner neuen Prozessorfamilie Xeon 55x0 hat Intel vor allem zweierlei vor - die Rechenzentren energieeffizienter machen und über Virtualisierung mehr Leistung aus der Technik kitzeln. Dafür nutzt Intel für seine Nehalem-Prozessoren eine alt bekannte Technologie - das Hyperthreading.

Moderne Rechenzentren beinhalten heute keinen monströsen Großrechner mehr. Stattdessen kommen wartungsfreundliche Kompaktsysteme - sogenannte Blades - zum Einsatz, die auf kleinem Raum ihre Performance zur Verfügung stellen. Für eine optimierte Auslastung der Hardware-Systeme werden gleich zahlreiche Betriebssysteme in virtuellen Umgebungen betrieben und konsolidiert.

Einige kritische Kenngrössen im Rechenzentrum sind auch weiterhin der Energiebedarf und die Kühlleistung (British Thermal Unit, BTU) um die IT-Systeme im erlaubten Betriebstemperaturbereich (Thermal Design Power, TDP) zu betreiben. Da der Platz meist begrenzt ist, sind effektive Kühlmethoden wie Wasserkühlung im geschlossenen Rack, Kühltunnel und definierte Temperaturzonen heute aktuell. Kosteneinsparungen sollten zu einem möglichst raschen ROI führen.

Mag die Energieversorgung im Normalzustand noch möglich sein, so stoßen im Störungsfall die Infrastruktursysteme, wie Notstromversorgungen der Zentren nach nur kurzer Zeit an ihre Leistungsgrenzen, wenn auch die Kühlung daran gebunden ist.

Kennzeichen von Rechenzentren

• geringes Platzangebot

• hohe Wärmeabgabe der Komponenten

• Hohe Systemdichte

• hoher Energiebedarf für Betrieb (System, Kühlung)

Green-IT als wirtschaftliche Notwendigkeit

Im Rahmen der Green-IT kommt dem Wirkungsgrad der IT- und Umsysteme daher eine wichtige Bedeutung zu. Der Investitionschutz und der Total-Cost-of-Ownership (TCO) sind für Unternehmen klare wirtschaftliche Kenngrößen. Ein IT-System dass elektrische Leistung bezieht und dabei Abwärme produziert, obwohl die Applikation gerade nicht genutzt wird, ist unrentabel.

Xeon 55x0 nahezu stromlos unterwegs

Die Firma Intel hat dieses Quartal 17 neue Xeon Prozessoren auf Basis der Core-Architektur "Nehalem" vorgestellt. Einer davon ist der 4-Kern Xeon 55x0 mit 2.66, 2.8 oder 2.93GHz und den neuen Features:

• Energieeinsparung dank: Kernabschaltung

• Leistungssteigerung dank: "Turbo Boost" über 3 Bins

• Skalierung dank: Hyper-Threading (HT)

• Ablösung FSB: QuickPath Interconnect (QPI)

Kernabschaltung über Power-Gates. Quelle: Intel
Kernabschaltung über Power-Gates. Quelle: Intel
Technische Besonderheiten des Nehalem

Die Auferstehung des Hyperthreading

Die vier Kerne im Xeon 55x0 können voneinander unabhängig über integrierte Power-Gates nahezu stromlos geschaltet werden und ergänzen damit die bisherigen Energie-Sparmaßnahmen der CPU. Die restlichen Systemkomponenten des Prozessors bleiben davon unberührt. Die Anzahl der Power-States wurden von 3 (Xeon 5300) und 4 (Xeon 5400) auf nun 15 P-States erweitert. Damit kommt der Xeon 55x0 auf eine Leistungsaufnahme von 10W im Idle-Modus.

Das Prinzip des simultanen Multi-Threading. Quelle: Intel
Das Prinzip des simultanen Multi-Threading. Quelle: Intel

Weiterhin sind relevante Recheneinheiten doppelt pro Prozessorkern vorhanden, so dass gleich zwei Threads, ähnlich wie Prozesse, quasi parallel ausgeführt werden können. Während der eine Thread auf eine Ressource warten muss, kommt der andere zur Ausführung. Damit bringt Intel das Hyper-Threading vom Pentium 4 zurück und steigert die Ausführungsleistung, da das Betriebssystem nun doppelt so viele Prozessoren sieht.

Zwei Prozesse parallel verarbeiten

Aus Übertakterkreisen ist bekannt, dass Prozessoren auch außerhalb ihrer vom Hersteller definierten Kenngrößen stabil betrieben werden können, wenn Randbedingungen wie Kühlung und Thermal Design Power (TDP) eingehalten werden.

Der "Turbo Boost" steuert die Taktrate des Prozessorkerns autonom. Quelle: Intel
Der "Turbo Boost" steuert die Taktrate des Prozessorkerns autonom. Quelle: Intel

Hier greift Intel nun ein und bietet beim Xeon 55x0 das Feature "Turbo Boost". Dieses steuert über einen integrierten Mikrokontroller - der Power Control Unit, PCU - autonom, also ohne Eingriffsmöglichkeit von außen, die Taktrate des Kerns und überhöht diese im Rahmen der TDP. Die PCU überwacht im Mikrosekundenbereich die Temperatur des Kerns, die angelegte Spannung und die Taktfrequenz. Über drei Bins - ein Bin entspricht einer Frequenzerhöhung um 133MHz - kann die Takterhöhung erfolgen. Ein auf 2,93GHz ausgelegter Prozessorkern kann damit auch mit 3,3GHz takten. Mit dieser Leistungsreserve sollen laut Intel Leistungsspitzen in der Applikation besser bewältigt werden können. Aktuelle Benchmark-Werte zeigen in etwa eine Verdopplung der CPU-Leistung.

Quick Path Interconnect statt Hypertransport. Quelle: Intel
Quick Path Interconnect statt Hypertransport. Quelle: Intel

Abbildung 4

Nicht zuletzt ist der Front-Side-Bus (FSB), also die Verbindung zwischen Prozessor und Northbridge und Speicher ein Engpass. Statt nun auf den offenen Industriestandard "Hypertransport" zu setzen, hat Intel einen eigenen seriellen Link Namens "Quick Path Interconnect (QPI) entwickelt und zusätzlich den Speicherkontroller nicht mehr in der Northbridge, sondern wie AMD auch, in den Prozessor integriert.

Quick Path Connect statt Hypertransport

Damit stehen drei Speicherkanäle für bis zu 18 DDR3[1333]-Module (=max. 144GB) mit einer Bandbreite von 3x64Bit mit je 1.33GT/s und einem gemeinsamen 8 MByte großen L3-Cache dem Prozessor zur Verfügung. Der Zugriff auf den Speicher eines anderen Prozessors erfolgt ebenfalls über den Link. Gemäß Intel deckt Hypertransport die Anforderungen an einen schnellen Link zwischen den Prozessoren und den Prozessoren und dem I/O-Subsystem nicht ab. QPI bietet ohne die bekannte 8/10 Kodierung 25.6 GByte/s (FSB: 12.8) und somit gleich viel, wie Hypertransport V3.1 pro Richtung. Betrachtet man also wie Intel das Gesamtsystem, so sind damit die größten Engpässe im System beseitigt.

QPI bietet bis zu 20 (HT: 32) parallele Lanes, d.h. serielle unidirektionale Verbindungen mit jeweils 6.4 GBit/s bzw. GT/s. Wobei der Xeon 55x0 über zwei Links (=Port: Intel Notation), d.h. vier unidirektionalen Verbindungen zu je 20 Lanes verfügt.

80 Prozent weniger Energie nötig

Eine Reduzierung der Idle-Energieaufnahme um 80 Prozent gegenüber dem Xeon 5300 und eine doppelte Leistung sind ein guter Investitionsschutz in den Xeon 55x0, möchte man den begrenzten Serverraum effektiv nutzen, die Energieaufnahme reduzieren und den Kühlkreislauf nicht weiter belasten.

Virtualisierung: Aus einem Kern werden zwei virtuelle

Der Prozessor kann jedoch nur von seiner gesteigerten Verarbeitungsgeschwindigkeit profitieren, wenn er die Daten auch möglichst schnell über das I/O-System, d.h. gerade auch Netzwerk zugeführt bekommt. Das Netzwerk ist der Puls im RZ und der neue 10GE-Ethernet-Kontroller 82599 steigert im Zusammenspiel mit dem Xeon die Leistung um 150 Prozent.

Neben der für große Rechenzentren wichtigen Prozessor-Virtualisierung Virt-x, wird auch die Chipsatz- Virt-d und Netzwerk-Virtualisierung Virt-c von Intel unterstützt und führt zu einer Verdoppelung der VM-Benchmark-Performance. Virt-x beinhaltet FlexMigration, FlexPriority und Extended Page Tables und führen zu einer gesteigerten Performance im virtuellen Umfeld. Bei Hyper-Threading werden aus einem physikalischen Kern zwei Virtuelle und die Leistung wird ca. um 30 Prozent gesteigert, da es passieren kann, dass beide Kerne auf eine physikalische Ressource warten müssen.

vPro bietet für den Remote-Zugriff auf die Systeme die Basis und betrachtet man die von Intel angekündigte Trusted-Platform TXT so bietet Xen bereits eine für den Benutzer transparente administrative Konsole, die in einer virtuellen Maschine nach dem Booten ausgeführt wird.

Nehalem rechnet sich im Rechenzentrum nach acht Monaten

Sparsame Prozessoren wie der neue Xeon 55x0 leisten einen wichtigen Beitrag zu einem reduzierten TCO und gesteigerter Produkivität dank Energieeinsparung und effektiven Nutzung der vorhandenen Resourcen. Intel spricht von einer Amortisation innerhalb von 8 Monaten. Mit der Miniaturisierung auf 45 Nanometer (nm) und der kommenden Generation auf 32nm wird auch die Leistungsaufnahme bei gesteigerter CPU-Performance weiter reduziert. Für Rechenzentren und HPC ist die Nehalem Architektur des neuen Xeon daher prädestiniert.