Intel setzt auf Quick Path Interconnect

Abschied vom Hypertransport

13.05.2009 von Thomas Steudten
Intel löst den parallelen FSB ab und entschied sich gegen den seriellen offenen Standard Hypertransport: ein Vergleich der beiden Technologien.

Der parallele Frontside-Bus stößt mit modernen Prozessoren wie dem Xeon 55x0 derzeit an seine Grenzen und bremst so das Gesamtsystem. Intel hat daher nach einem Nachfolger geforscht und mit QuickPath-Interconnect eine Punkt-zu-Punkt Verbindung etabliert, die sich besonders durch geringe Latenz auszeichnet - also höherer Übertragungsgeschwindigkeit.

Bridge: Vom Süden in den Norden

Im klassischen PC-Segment der x86-Prozessoren ist der Prozessor über die so genannte Northbridge mit integriertem Speicherkontroller an den gemeinsamen Hauptspeicher angebunden. Diese Front-Side-Bus (FSB) genannte Verbindung zwischen CPU und Chipsatz ist die Referenz aller Systemtakte auf dem Board, von dem alle anderen Takte gebildet werden. Langsamere System-Komponenten sind über die Southbridge mit der Northbridge verbunden.

Performantes Warten

Der schnellste Prozessor verweilt im Wartezustand, wenn dieser seine Daten nicht schnell genug geliefert bekommt bzw. wieder ablegen kann.

Intel-Konkurrent AMD hatte nun mit der Übernahme der Alpha-Architektur die Technologie in der Hand und hat den Speicherkontroller direkt in den Prozessor (Athlon 64, Opteron) integriert. Kleinere Anpassungen führten dann zur neuen als Industriestand etablierten Linkverbindung "Hypertransport - HT". Obwohl HT eine CPU-unabhängige Spezifikation beinhaltet, gibt es speziell für x86 Prozessoren Anpassungen. Mittlerweile hat sich HT in der 3. Generation etabliert.

Intel geht nun mit der "QuickPath" Architektur ebenfalls diesen Weg für die neuen Prozessoren der Nehalem Architektur "Core i7" und Xeon. Als Ablösung für den Front Side Bus und in Computern mit mehreren Hauptprozessoren setzt Intel aber auf eine proprietäre Lösung namens QuickPath Interconnect - kurz "QPI". Ein wichtiger Vorteil: Der Layoutaufwand reduziert sich bei QPI im Vergleich zum Front-Side-Bus. Da QPI quasi das Netzwerk aller Systemkomponenten bildet, wird dies bei Intel auch als "Common System Interface - CSI" bezeichnet.

Vorteile von QPI

QPI ist wie FSB eine Punkt-zu-Punkt Verbindung für den lokalen Nahbereich auf dem Board (Backplane) und bietet dem gegenüber die folgenden drei Vorteile: grössere Bandbreite, geringere Latenzzeit und die Tatsache, dass weniger Leitungen nötig sind.

Hypertransport und Quick Path Interconnect: Ein Leistungsvergleich

Was

Front Side Bus

Quick Path Interconnect

Hypertransport (V3.1)

Takt [MHz]

400

3200

3200

Transfers pro Takt

QDR

DDR

DDR

GT/s

1.6

6.4

6.4

Datenbreite [Byte]

8

2

4

Bandbreite [GB/s]

12.8

25.6

51.2

Im Vergleich zu QPI bildet der Hypertransport keine Punkt-zu-Punkt-Verbindung, sondern eine Ketten- oder Baumstruktur.QPI definiert dafür fünf Layer, genannt "Protokoll", "Transport", "Routing", "Link" und "Physical".

Der physikalische Layer definiert die elektrischen Eigenschaften für die Übertragung der Bits über die Leitungen. Pro Datenrichtung wird ein Leitungspaar mit einem sehr geringen Spannungspegel und differentieller Übertragung verwendet. Zwei dieser unidirektionalen Verbindungen bilden den Link von einem Device zum anderen, eine 1-Bit Lane oder auch Port genannt. QPI kann nun 20 dieser Lanes nutzen. Reduzierte Lanes mit halber oder viertel Breite sind möglich. Damit sind physikalische Übertragungen von 5,10 oder 20 Bit pro Zeiteinheit möglich. HT bedarf im Minimum 2-Bit Lanes, kommt aber auch auf ein Maximum von 32-Bit.

HT und QPI senden die Daten in Form von Datenpaketen, wobei HT noch "priorisierte Kontrollpakete" nutzt. Mittels Signalisierung können Kontrollpakete auch über einen voll ausgelasteten Datenkanal gesendet werden. Eine Fehlerkorrektur sichert QPI die Datenübertragung über den Link-Layer, dessen Pakete immer 80 Bit gross sind. Dabei werden die Korrekturinformationen in den Datenstrom gemischt. Dies ist einer der Gründe, warum trotz 20 Bit Lane, nur 16 Bit an Nutzdaten übermittelt werden können.

Hypertransport bietet in Version 3.1 seit August 2008 mit "DDR", 32Bit breitem Pfad und einer Taktfrequenz von 3200 MHz eine Datenrate von 25.6Gbyte/s pro Richtung, also 51.2Gbyte/s brutto und damit doppelt so viel, wie QPI zur Zeit.

Beim Vergleich der Performance der genannten Verbindungstypen wird oft die Rate in Giga-Transfers pro Sekunde (GT/s) genannt. In Verbindung mit der Busbreite ergibt dies die Bandbreite pro Port: Aktuell nutzt AMD noch HT 1.1, kommende Prozessoren werden HT 3.0 als Link verwenden. Damit ist Intel mit QPI bereits führend beim seriellen Link.

Aussicht

Mit QPI erfüllt Intel aktuelle und zukünftige Anforderungen im Bereich Zuverlässigkeit, Verfügbarkeit und Verwaltung für die neuesten Prozessorarchitekturen, wie den Core i7 und Xeon 55x0. Zwar ist QPI aufgrund separater Taktleitungen kein reiner serieller Link, doch eine passende Ablösung für den FSB.

Nur schade, dass sich Intel hier nicht für eine etablierte Lösung mit Hypertransport in der 3. Generation entschieden hat oder gar dem HT-Konsortium beigetreten ist. Ein Grund wird wohl die Komplexität von HT sein, eine simple Implementierung in Prozessor und Chipsatz zu aufwändig für eine triviale Punkt-zu-Punkt Verbindung.

Hypertransport und Quick Path Interconnect in Zahlen

Was

Hypertransport

QuickPath Interconnect

Physical Link Layer

Ein Leitungspaar mit niedriger, differentieller Spannung pro Richtung: 1,2Volt ± 5%

Ein Leitungspaar mit niedriger, differentieller Spannung pro Richtung.
Spannung? 20 Phits

Max. Anzahl Leitungen pro Link

2x2x32=128

2x2x21=84

Linkbreite [Bit]

Variabel: 2,4,8,16,32 Sender/ Empfänger unterschiedlich

5,10 oder 20

Taktlinks pro Linkbreite

8

20

Kapazitive Kopplung?

Ja, ab V3.0

Nein, DC Kopplung

Terminierung

100 Ohm on-die

Frage Intel

Link Splitting?

Ja, ab V3.0

Nein

Hot-Plugging?

Ja, ab V3.0

Nein

Takt [MHz]

800, 1400, 2600, 3200

3200

Dyn. Takt/ Linkbreite?

Ja, ab V3.0

Nein

Daten-Paketgrösse [Byte]

Vielfaches von 4

Max. Daten-Paketgrösse [Byte]

Kontrollpaket:8

64 n/a

PCIe Mapping

Ja

?

Daten pro Takt

DDR, 2-fach

DDR, 2-fach

Transportart

Paketbasiert

Paketbasiert

Min. Anforderungen

200MHz, 2 Links pro Richtung

1 Port

Out-of-Band Paket

Ja, priorisiertes Kontrollpaket

Nein

Datenrate vollduplex [Gbyte/s]

] 12,8; 22,4; 41,6; 51,2

25,6

Datenintegrität

Error Retry

CRC, Retry

Virtuelle Kanäle

6