Quad-Core-Test: Intel Core 2 Extreme QX6800 im Geschwindigkeitsrausch

09.04.2007 von Bernhard Haluschak und Christian Vilsbeck 
Intel präsentiert mit dem Core 2 Extreme QX6800 eine beschleunigte Quad-Core-CPU. Im Vergleich zum Core 2 Extreme QX6700 erhöhte der Hersteller die Taktfrequenz auf 2,93 GHz. Mit diesem leistungsstarken Quad-Antrieb sollte der neue Prozessor alle Verfolger hinter sich lassen.

Früher als erwartet stellte Intel bereits im November 2006 mit dem Core 2 Extreme QX6700 den ersten Quad-Core-Prozessor vor. Der Mitbewerber AMD beabsichtigt, erst Mitte 2007 ein entsprechendes Pendant auf den Markt zu bringen. Anders als Intels Multichip-Lösung sollen alle Prozessor-Cores des AMD-Debütanten auf einem Die untergebracht sein. Doch bis es so weit ist, fahren Intels Vierfach-Beschleuniger in puncto Performance der Konkurrenz ganz klar davon.

Intel verpasste dem Vorgänger Core 2 Extreme QX6700 ein Tuning-Upgrade und schickt unter dem Namen Core 2 Extreme QX6800 ein neues Familienmitglied ins Rennen um die Poleposition.

Alle Kerne des Core 2 Extreme QX6800 teilen sich weiterhin einen 1066 MHz schnellen Prozessorbus und jeweils zwei Kerne pro Die nutzen 4 MByte Cache gemeinsam. Allerdings arbeitet die CPU statt mit einer Taktfrequenz von 2,66 jetzt mit 2,93 GHz. Die Fertigung von Intels Quad-Core-Modell erfolgt weiterhin im 65-nm-Prozess. Der TDP-Wert des Core 2 Extreme QX6800 liegt laut Hersteller bei 130 Watt. Dagegen beträgt der TDP-Wert der „Mainstream-Version“ Core 2 Quad Q6600 maximal 105 Watt bei einer Taktfrequenz von 2,40 GHz. Platz nimmt der Quad-Extreme weiterhin im Steckplatz LGA775.

Core 2 Extreme QX6800: Der Quad-Core-Prozessor mit 2,93 GHz Taktfrequenz setzt sich aus zwei Dual-Core-Dies zusammen. Die FSB1066-CPU für den Sockel LGA775 verfügt über insgesamt 8 MByte L2-Cache.

Im tecCHANNEL-Testlabor muss der Core 2 Extreme QX6800 gegen die hauseigenen Quad-Core-Modelle von Intel und gegen die Dual-Core-CPUs von AMD antreten. Dabei beeindruckt der Testkandidat durch einen klaren Start-Ziel-Sieg und erreicht besonders bei Multithreading-Programmen und bei Multitask-Anwendungen gute Beschleunigungswerte.

Einen Test des aktuellen Athlon 64 X2 6000+ mit Dual-Core-Technologie finden Sie bei tecCHANNEL im Artikel Dual-Core-Test: Neuer Athlon 64 X2 6000+ mit 3,0 GHz. Welche neuen CPUs die Prozessorhersteller auf den Markt bringen wollen, können Sie in dem Beitrag Vergleich: Die Desktop-CPU-Roadmaps von AMD & Intel nachlesen.

SYSmark2004 SE

Mit dem Benchmark-Paket SYSmark2004 SE bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Die Second Edition verwendet wieder 17 Anwendungen und arbeitet wahlweise mit den Windows XP in der 32- und 64-Bit-Edition zusammen. SYSmark2004 SE öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben einem Gesamtwert für die Systemleistung bietet SYSmark2004 SE detaillierte Ergebnisse in den Kategorien Office Productivity und Internet Content Creation an.

Gesamtwertung: Intels Core 2 Extreme QX6800 setzt sich knapp vom Dual-Core- X6800 mit ebenfalls 2,93 GHz Taktfrequenz ab. Der Anteil von mehr als zwei parallel arbeitenden Anwendungen sowie multithreaded agierender Programme ist bei SYSmark2004 SE zu gering, um vier Kerne auszulasten.

SYSmark2004 SE: Internet Content Creation

Im Workload Internet Content Creation von SYSmark2004 SE sind Prozessoren mit schnellen FPUs im Vorteil. Die Anwendungen im diesem Testblock unterstützen zudem in hohem Maße SSE2 und Multiprocessing. Zu den Applikationen des Workloads Internet Content Creation zählen Macromedia Dreamweaver und Flash MX, Discreet 3ds max 5.1, Adobe AfterEffects 5.5, Photoshop 7.0.1 und Premiere 6.5, Microsofts Windows Media Encoder 9, WinZip 8.1 sowie McAfee VirusScan 7.0.1.

Internet Content Creation: In diesem Szenario dominieren SMP-fähige Anwendungen wie 3ds max und Photoshop. Der Core 2 Extreme QX6800 setzt jetzt seine vier Kerne besser in Szene und geht in Führung. Alle Core-2-Prozessoren profitieren hier auch von ihrer hohen SSE-Performance – AMDs Athlon-64-Modelle müssen sich deutlich geschlagen geben.

SYSmark2004 SE: Office Productivity

Der Workload Office Productivity in SYSmark2004 SE verwendet insgesamt zehn verschiedene Applikationen. Hierzu zählen Microsofts Word, Excel, PowerPoint, Access und Outlook in der Version 2002, McAfee VirusScan 7.0, ScanSoft Dragon Naturally Speaking 6, WinZip 8.1, Adobe Acrobat 5.0.5 sowie der Internet Explorer 6.0.

Office Productivity: Büroarbeiten erledigen die 2,93-GHz-Prozessoren Core 2 XE X6800 und Core 2 Extreme QX6800 etwa gleich schnell. Der Quad-Core-Prozessor zieht aus seinen zwei zusätzlichen Kernen keinen deutlichen Nutzen. Die Office-Applikationen arbeiten in diesem Szenario single-threaded, parallel laufend fordern nur zwei Programme gleichzeitig Rechenleistung.

SPECint_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intels C++ 9.1 und Fortran 9.1 sowie MS Visual Studio 2005 .NET für alle Integer-Tests. Auch AMD und Intel verwenden diese Compiler für das Base-Rating, wie man an den von beiden Firmen offiziell gemeldeten Integer-Resultaten sehen kann.

Der SPECint_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Integer-Performance der Prozessoren.

SPECint_base2000: Wenig überraschend arbeiten der Core 2 Extreme QX6800 und der Core 2 XE X6800 im single-threaded Integer-Test gleich schnell. Unabhängig von der Kernanzahl deklassieren Intels Core-2-Modelle die restliche x86-Welt. Die Integer-Performance ist in allen zwölf Einzeltests der Suite konkurrenzlos. Dabei ist es egal, ob der Test im Cache abläuft oder speicherintensiv ist.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Integer-Benchmarks im Vergleich:

SPECint_base2000: Official Run

Prozessor

Core 2 XE QX6800

Core 2 XE QX6700

Core 2 Duo E6700

Core 2 XE X6800

Taktfrequenz

2,93 GHz

2,66 GHz

2,66 GHz

2,93 GHz

Sockel

LGA775

LGA775

LGA775

LGA775

Core

Kentsfield

Kentsfield

Conroe

Conroe

Speichertyp

DDR2-800

DDR2-800

DDR2-800

DDR2-800

Chipsatz

975X

975X

975X

975X

Compiler

Intel

Intel

Intel

Intel

Test

164.gzip

1812

1652

1653

1817

175.vpr

2340

2153

2152

2349

176.gcc

3357

3077

3076

3367

181.mcf

5239

4896

4902

5253

186.crafty

2714

2468

2467

2722

197.parser

2290

2090

2089

2297

252.eon

3829

3488

3487

3811

253.perlbmk

3332

3092

3111

3384

254.gap

3084

2848

2854

3093

255.vortex

4889

4499

4504

4909

256.bzip2

2353

2111

2149

2362

300.twolf

3369 

3062

3056

3365

Gesamt

3072

2814

2820

3082

SPECint_rate_base2000

Bei den Integer-Berechnungen von SPECint_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECint_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Core 2 Duo/Extreme, Core Duo, Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) und Core 2 Quad Q6600 und Extreme QX6700/QX6800 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und mehreren Kernen ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECint_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

SPECint_rate_base2000: Der Core 2 Extreme QX6800 zieht den Dual-Core-Modellen davon. Bei gleicher Taktfrequenz wie der Core 2 XE X6800 liefert der Quad-Core-Prozessor einen um 82 Prozent höheren Integer-Durchsatz. Dem 2,67-GHz-QX6700 enteilt der Vierkerner noch um etwa 7 Prozent. Arg erwischt es AMD Topmodell Athlon 64 X2-6000+ – der QX6800 ist 174 Prozent schneller.

SPECfp_base2000

Wir setzen die SPEC-Benchmarks praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 9.1 und MS Visual Studio 2005 .NET sowie Intel Fortran 9.1 für alle Fließkommatests. Bei den AMD-Prozessoren testen wir die Floating-Point-Performance zusätzlich mit den PGI-6.0-Compilern. Auch AMD und Intel benutzen diese Compiler für das Base-Rating bei den Fließkomma-Benchmarks, wie man an den von beiden Firmen offiziell gemeldeten FP-Resultaten sehen kann.

Der SPECfp_base2000-Benchmark arbeitet single-threaded und nutzt die Vorteile von Hyper-Threading, Dual- und Quad-Core nicht. Die ermittelten Werte gelten als Indiz für die Floating-Point-Performance der Prozessoren.

SPECfp_base2000: Die Quad-Core-CPU kann durch den single-threaded agierenden Test nur den 4 MByte L2-Cache eines Siliziumplättchen nutzen. Der L2-Cache auf dem zweiten Dual-Core-Die des QX6800 bleibt ungenutzt. Die 2,93-GHz-CPUs Core 2 Xe X6800 und Core 2 Extreme QX6800 liefern deshalb die gleiche Performance. Alle Core-2-Prozessoren liegen mit Abstand an der Spitze. Neben den großen L2-Caches zeichnet die hohe SSE2-Performance der Core-Architektur hierfür verantwortlich.

In der Tabelle finden Sie die Einzelergebnisse des SPEC-CPU2000-Floating-Point-Benchmarks im Vergleich:

SPECfp_base2000: Official Run

Prozessor

Core 2 XE QX6800

Core 2 XE QX6700

Core 2 Duo E6700

Core 2 XE X6800

Taktfrequenz

2,93 GHz

2,66 GHz

2,66 GHz

2,93 GHz

Sockel

LGA775

LGA775

LGA775

LGA775

Core

Kentsfield

Kentsfield

Conroe

Conroe

Speichertyp

DDR2-800

DDR2-800

DDR2-800

DDR2-800

Chipsatz

975X

975X

975X

975X

Compiler

Intel

Intel

Intel

Intel

Test

168.wupwise

4652

4458

4477

4680

171.swim

2972

2961

3002

3022

172.mgrid

1877

1740

1747

1885

173.applu

2259

2193

2227

2301

177.mesa

2876

2620

2627

2885

178.galgel

7046

6420

6418

7046

179.art

10171

9224

9229

10221

183.equake

3138

3055

3055

3149

187.facerec

3046

2818

2836

3079

188.ammp

2180

1993

1995

2181

189.lucas

2837

2726

2786

2897

191.fma3d

2153

2032

2041

2167

200.sixtrack

1177

1070

1069

1175

301.apsi

1982

1837

1830

1975

Gesamt

2939

2756

2770

2958

SPECfp_rate_base2000

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2000 ermittelt die Benchmark-Suite den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Typischerweise entspricht die Anzahl der Tasks/Kopien der Anzahl der - virtuellen - Prozessoren des Systems.

So läuft SPECfp_rate_base2000 beim Athlon 64 mit einer Kopie, beim Athlon 64 X2 sowie FX-60/62 (Dual-Core), Core 2 Duo/Extreme, Core Duo, Pentium 4 (Hyper-Threading), Pentium D (Dual-Core) mit zwei Kopien sowie beim Pentium Extreme Edition 965 (Dual-Core + Hyper-Threading) und Core 2 Quad Q6600 und Extreme QX6700/QX6800 (Quad-Core) mit vier Kopien. Bei diesem Test wird der Vorteil von Hyper-Threading und mehreren Kernen ausgenutzt. Bei Singlethread-Prozessoren wie dem Athlon 64 führen SPECfp_rate_base2000-Tests mit einer und zwei Kopien zum gleichen Ergebnis - der maximale Durchsatz bleibt unverändert.

SPECfp_rate_base2000: Bei den speicherintensiven Fließkommatests arbeitet der Quad-Core-Prozessor Core2 XE QX6800 am schnellsten. Dass sich alle vier Kerne einen FSB zum Speicher teilen, wie beim Core 2 Duo E6700, wird beim Fließkomma-Multitask-Szenario zum Nachteil.

Linux 64 Bit: Linpack

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben. Linpack löst komplexe lineare Gleichungssysteme.

Unter SUSE Linux 10.1 64-Bit-Edition setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Athlon-64-Prozessoren mit SSE3 arbeiten mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen und nutzen die Befehlserweiterung.

Bei unseren Tests löst Linpack bis zu 10.000 Gleichungssysteme. Damit benötigt der Benchmark maximal 763 GByte Arbeitsspeicher. Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Bandbreitenvorteil: Intels Core-2-Prozessoren belegen aufgrund ihrer besseren SSE-Performance die Spitzenpositionen. Der Core 2 Extreme QX6800 mit 2,93 GHz setzt seine hohe Taktfrequenz in 8 Prozent mehr Rechenleistung um – im Vergleich zum QX6700er mit 2,67 GHz Taktfrequenz.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 2.5 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Dual-Core-Prozessoren optimal. SunGard arbeitet überwiegend mit Integer-Operationen.

Schnelle Kalkulation: Die Vierkern-CPU Core 2 Extreme QX6800 erledigt die Monte-Carlo-Simulation um zirka 15 Prozent schneller als derQX6700. Unter den Dualisten herrscht ein munteres Wechselspiel zwischen AMD und Intel.

Audio-Enkodieren: iTunes 6

Apples iTunes 6 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Nur beim MP3-Enkodieren nutzt iTunes 6 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitiert der Core 2 Extreme QX6800 nicht von seinen vier Kernen. Durch den zusätzlichen Overhead, den Windows durch das wechselweise Verteilen der zwei Threads zwischen den vier Cores verursacht, arbeitet der QX6800 sogar etwas langsamer als der X6800.

Der Pentium Extreme Edition 965 zieht aus seinen vier „virtuellen“ Kernen (Dual-Core + Hyper-Threading) ebenso wie der Core 2 Extreme QX6700 und QX6800 keinen deutlichen Nutzen. Deshalb arbeitet ein Pentium D 960 (Dual-Core, kein Hyper-Threading) trotz geringerer Taktfrequenz hier schneller.

Video-Enkodieren: iTunes 6

Mit Apples iTunes 6 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 128 Kbit/s und einer „mobilen“ Auflösung von 320 x 176 Bildpunkten. Dieses Videoformat ist für Apples iPod-Player optimiert. iTunes 6 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Auch beim Wandeln von Videos ziehen die Core-2-Prozessoren allen anderen CPUs auf und davon. Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads – der Core 2 Extreme QX6800 ist deshalb nicht schneller als der X6800er mit nur zwei Cores.

Rendering: 3ds Max 8

Discreet/Autodesk bietet mit 3ds Max 8 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 8 Multiprocessing voll aus. Die Dual- und Quad-Core- sowie Hyper-Threading-Technologien wirken somit beschleunigend.

Die verwendeten Render-Szenen basieren auf der Benchmark-Suite SPECapc for 3ds Max 7 von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle.

Szene Radiosity: Rendering zählt zur Paradedisziplin für Multi-Core-Prozessoren. Intels Core 2 Extreme QX6800 arbeitet hier um 73 Prozent flinker als die Dual-Core-Variante X6800. Die Core-Prozessoren nutzen ihre hohe SSE-Performance beim Rendern auch bestens aus.
Szene Underwater: Die Quad-Core-Prozessoren besetzen die Spitzenpositionen – angeführt vom Core 2 Extreme QX6800. Es wird deutlich, dass die Render-Performance der Prozessoren vom Workload und somit der Cache-Größe abhängig ist.

Rendering: CINEBENCH 9.5

Mit dem CINEBENCH 9.5 stellt Maxon eine neue Version des bekannten Benchmark-Tools bereit. CINEBENCH 9.5 basiert auf Cinema 4D Release 9.5 und führt wieder Shading- und Raytracing-Tests durch.

Der Raytracing-Test von CINEBENCH 9.5 überprüft die Render-Leistung des Prozessors. Eine Szene "Daylight" wird mit Hilfe des Cinema-4D-Raytracers berechnet. Sie enthält 35 Lichtquellen, wovon 16 mit Shadowmaps behaftet sind und so genannte weiche Schatten werfen.

Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte eine untergeordnete Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 9.5 wenig - der Test läuft überwiegend in den ersten beiden Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet – Multi-Core und Hyper-Threading nutzen hier nichts. Das 2,93-GHz-Quad-Core-Modell QX6800 ist etwas langsamer als die Dual-Core-Variante X6800. Die Verteilung des einen Thread von Windows auf die vier Kerne (wechselweise) bedingt zusätzlichen Overhead.
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren – physikalischen und virtuellen – Prozessorkerne. Intels Core 2 Extreme QX6800 deklassiert das restliche Feld. Gegenüber dem mit gleicher Taktfrequenz arbeitenden Core 2 Extreme X6800 rendert der Quad-Core um 59 Prozent schneller.

Rendering & Enkodieren

In einem Multitask-Szenario führen wir das Rendering von CINEBENCH 9.5 bei einer konstanten Hintergrundlast durch. Diese realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File. Das Enkodieren erfolgt in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Beim Render-Vorgang nutzt CINEBENCH 9.5 alle zur Verfügung stehende Prozessorkerne. In der Tabelle sehen Sie, wie stark die Render-Performance einbricht, wenn eine konstante Hintergrundlast arbeitet.

Rendering & Enkodieren

Prozessor

CINEBENCH 1 Thread

CINEBENCH alle Threads

CINEBENCH alle Threads + LAME

Performance-Einbruch

Alle CINEBENCH-Ergebnisse in Punkten. Höhere Werte sind besser.

Athlon 64 FX-60 S939

380

707

383

-45,8 %

Athlon 64 FX-62

412

759

406

-46,5 %

Athlon 64 X2 4000+

295

552

296

-46,4 %

Athlon 64 X2 4600+ EE

353

651

346

-46,9 %

Athlon 64 X2 4800+

354

656

353

-46,2 %

Athlon 64 X2 4800+ S939

354

655

350

-46,6 %

Athlon 64 X2 5000+

381

707

386

-45,4 %

Athlon 64 X2 5200+

384

706

386

-45,3 %

Athlon 64 X2 6000+

449

837

433

-48,3 %

Core 2 Duo E6400

356

663

341

-48,6 %

Core 2 Duo E6700

445

831

427

-48,6 %

Core 2 Q6600

394

1276

995

-22,0 %

Core 2 XE QX6800

481

1549

1209

-21,9 %

Core 2 XE QX6700

436

1417

1090

-23,1 %

Core 2 XE X6800

491

908

472

-48,0 %

Core Duo T2600

325

604

315

-47,8 %

Pentium 4 670

322

378

204

-46,0 %

Pentium D 920

239

439

233

-46,9 %

Pentium D 960

305

557

304

-45,4 %

Pentium XE 965

318

652

526

-19,3 %

Bei allen Dual-Core-CPUs bricht die Rendering-Performance um zirka 45 bis 49 Prozent ein, wenn LAME im Hintergrund enkodiert. Die Quad-Core-Prozessoren Core 2 Quad Q6600 und Extreme QX6700 / QX6800 rendern dagegen nur um 22 bis 23 Prozent langsamer. Intels Pentium Extreme 965 reduziert seine Render-Performance mit 19 Prozent noch geringer. Die Dual-Core-CPU präsentiert sich dem Betriebssystem durch sein Hyper-Threading ebenfalls als Vierkerner. Während beim QX6700 und QX6800 das Enkodieren aber mit voller Performance erfolgt, arbeitet LAME beim Pentium XE 965 deutlich langsamer – die Priorität der Rechenleistung liegt bei CINEBENCH.

OpenGL: CINEBENCH 9.5

Der Leistungstest OpenGL-HW von CINEBENCH 9.5 führt zwei Animationen mit Hilfe der OpenGL-Beschleunigung der Grafikkarte aus. Die Animation "Pump Action" besteht aus 37.000 Polygonen in 1046 Objekten, in der zweiten Szene "Citygen" sind zwei Objekte mit insgesamt 70.000 Polygonen enthalten.

Eine Liga: Cinema 4D – und somit der Prozessor – übermittelt der Grafikkarte lediglich die Position der Lichtquellen sowie die Geometrie. Die Cache-Größe der Prozessoren sowie die Speicher-Performance sind wichtiger. Multi-Core und Hyper-Threading erwirken keinen Vorteil. Intels Core-2-Modell X6800 und das Vier-Core-Pendant QX6800 arbeiten nahezu gleich schnell.

Beim Leistungstest OpenGL-SW übernimmt die Cinema-4D-Engine zusätzlich die Berechnung der Beleuchtung.

Lichtschalter: Jetzt muss der Prozessor zusätzliche Rechenarbeit übernehmen. Der grafikintensive Test zieht aus der Multi-Core-Technologie keinen Nutzen. Die Core-2-CPUs mit dem Core 2 XE X6800 besetzen auch die Führungspositionen.

OpenGL: SPECviewperf 9

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 9 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Highend-Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Lightscape, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualzation Mockup und UGS NX.

Besonders die Anwendung Lightscape Viewset (light-08) nutzt die OpenGL-Beschleunigung der Grafikkarte voll aus. Das Lightscape Visualization System von Discreet Logic kombiniert proprietäre Radiosity-Algorithmen mit einem physikalisch basierenden Beleuchtungssystem.

light-08: Multi-Core und Hyper-Threading nutzen hier nichts. Die Core-2-Prozessoren arbeiten der Grafikkarte am besten zu und behaupten sich vor den Athlon-64-FX-Modellen. Erwartungsgemäß bieten die 2,93-GHz-CPUs Core 2 XE X6800 und Core 2 Extreme QX6800 die gleiche Performance.

Die Einzelergebnisse der Tabelle zeigen, dass die OpenGL-Performance stark abhängig von der Applikation ist. Darüber hinaus bestätigen die Ergebnisse, dass Multi-Core und Hyper-Threading bei diesen Applikationen keine Vorteile bringen.

Alle Einzelergebnisse des SPECviewperf 9 finden Sie in der Tabelle:

SPECviewperf 9

Prozessor

3dsmax-04

catia-02

ensight-03

light-08

maya-02

proe-04

sw-01

ugnx-01

tcvis-01

Alle Ergebnisse in fps. Höhere Werte sind besser.

Athlon 64 4000+ S939

9,78

10,81

9,84

9,85

10,97

6,34

12,33

8,64

2,94

Athlon 64 X2 4000+ AM2

8,75

9,79

9,39

8,62

9,75

5,94

11,75

8,34

2,87

Athlon 64 X2 4800+ S939

10,05

11,14

10,10

10,12

10,99

6,39

12,32

8,78

2,89

Athlon 64 X2 4800+ AM2

10,25

11,45

10,25

10,31

11,37

6,54

12,65

8,96

2,98

Athlon 64 FX-60 S939

10,62

11,78

10,42

10,90

11,75

6,65

12,64

9,02

2,92

Athlon 64 FX-62 AM2

11,52

12,80

11,03

11,96

12,88

7,08

13,43

9,45

3,06

Athlon 64 X2 6000+ AM2

11,90

14,01

12,43

12,75

13,64

9,31

18,42

10,31

5,01

Core 2 Duo E6700 DDR2-800

12,48

14,52

12,49

13,18

17,87

9,21

18,73

10,15

4,51

Core 2 Quad Q6600 DDR2-800

11,95

13,76

12,09

12,10

16,76

8,84

18,19

9,88

4,46

Core 2 XE QX6800 DDR2-800

12,64

14,95

12,73

14,23

18,83

9,43

18,86

10,27

4,46

Core 2 XE QX6700 DDR2-800

12,45

14,51

12,43

13,16

17,81

9,19

18,71

10,09

4,51

Core 2 XE X6800 DDR2-800

12,66

14,98

12,82

14,32

18,92

9,51

19,05

10,34

4,51

Core Duo T2600

9,56

10,74

10,56

9,29

12,59

7,05

14,62

7,46

3,76

Pentium 4 670

10,48

11,75

11,48

10,80

14,35

7,59

15,81

8,77

4,13

Pentium D 920

8,05

9,01

10,14

8,24

11,42

6,19

13,34

7,56

3,80

Pentium D 960

9,81

11,00

11,16

10,10

13,28

7,29

15,31

8,53

4,10

Pentium XE 965

10,48

11,73

11,56

10,75

14,60

7,91

16,27

8,91

4,26

OpenGL & Enkodieren

In einem zweiten Multitask-Szenario überprüfen wir den Einbruch der Framerate des OpenGL-3D-Spiels Quake 4, wenn im Hintergrund MP3s erstellt werden. Das Enkodieren realisieren wir mit LAME durch das Wandeln einer WAV-Audio-Datei in ein komprimiertes MP3-File - in einer Endlosschleife. LAME arbeitet beim MP3-Erstellen durch unsere gewählte Einstellung im Single-Thread-Modus und lastet einen CPU-Kern voll aus.

Quake 4 unterstützt durch ein aktivierbares SMP bereits Dual-Core-Prozessoren. In der Tabelle sehen Sie den Unterschied in der Framerate ohne und mit SMP-Aktivierung bei Quake 4. Bei aktiver LAME-Hintergrundlast lassen wir Quake 4 mit eingeschaltetem SMP laufen.

Rendering & Enkodieren

Prozessor

Quake 4 SMP off [fps]

Quake 4 SMP on [fps]

Quake 4 SMP on + LAME [fps]

Performance-Einbruch

Quake 4: Medium Quality, Auflösung 1280x1024, AA off

Athlon 64 X2 4600+ EE

70

104

89

-14,4 %

Athlon 64 X2 5000+

71

105

92

-12,4 %

Athlon 64 X2 5200+

74

108

94

-13,0 %

Athlon 64 X2 6000+

82

115

102

-11,3 %

Core 2 Duo E6400

83

116

104

-10,3 %

Core 2 Duo E6700

99

126

113

-10,3 %

Core 2 Quad Q6600

91

124

124

0 %

Core 2 XE QX6800

104

128

127

001 %

Core 2 XE QX6700

97

126

126

0 %

Während die Dual-Core-Prozessoren mit Hintergrundlast um zirka 10 bis 14 Prozent in der Framerate einbrechen, bleibt die Quake-4-Performance des Core 2 Quad Q6600 und Extreme QX6800 / QX6700 konstant. Weil Quake nur von einem zweiten Prozessorkern profitiert, stehen bei den Quad-Core-Modellen zwei weitere Kerne anderen Applikationen voll zur Verfügung. Das Single-Thread-LAME-Enkodieren im Hintergrund wirkt sich beim Core 2 Extreme QX6700 /QX6800 auf die Framerate somit nicht negativ aus.

DirectX: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multi-Core-Technologie fließt in das Ergebnis ein. Intels Core 2 Extreme QX6800 überholt durch seine vier Kerne mit Leichtigkeit den mit gleicher Taktfrequenz arbeitenden Dual-Core-X6800.

3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Der Core 2 Extreme QX6800 mit Quad-Core arbeitet um 75 Prozent schneller als die X6800er-Doppelkernvariante. Dem 2,66-GHz-Extreme QX6700 enteilt der Prozessor mit 10 Prozent höherer Rechenleistung.

32-Bit-Transfer

Die Cache- und Speicher-Performance der Prozessoren überprüfen wir mit unserem Programm tecMem aus der tecCHANNEL Benchmark Suite Pro. tecMem misst die effektiv genutzte Speicherbandbreite zwischen der Load/Store-Unit der CPU und den unterschiedlichen Ebenen der Speicherhierarchie (L1-, L2-Cache und RAM). Die Ergebnisse erlauben eine getrennte Analyse von Load-, Store- und Move-Operationen.

Core 2 Extreme QX6800 (2,93 GHz) DualDDR2-800 CL4: Insgesamt besitzt die CPU zwar 8 MByte L2-Cache, einem Kern stehen jedoch nur 4 MByte Puffer zur Verfügung. Zwei Kerne pro Siliziumplättchen teilen sich den 4 MByte L2-Cache dynamisch.
Core 2 Extreme X6800 (2,93 GHz) DualDDR2-800 CL4: Die Dual-Core-CPU erreicht im Cache eine Bandbreite von 22.113 MByte/s. Aus dem DDR2-800-Speicher holt der Core 2 Extreme bei 32-Bit-Zugriffen 3480 MByte/s (Load) heraus.

64-Bit-Transfer

Hier testen wir mit tecMem die Performance mit den 64-Bit-Load und -Store-Kommandos aus dem MMX-Befehlssatz. Die Transferrate ist hier schon deutlich höher als bei den 32-Bit-Kommandos, da die CPU mit jedem Befehl mehr Daten transferieren kann.

Core 2 Extreme QX6800 (2,93 GHz) DualDDR2-800 CL4: Mit dem 800er-Speicher erreicht der 2,93-GHz-Prozessor einen Durchsatz von 6814 MByte/s.
Core 2 Extreme X6800 (2,93 GHz) DualDDR2-800 CL4: Im Speicher transferiert der Dual-Core-Prozessor mit 6809 MByte/s (Load) mehr als das 2,93-GHz-Quad-Core-Modell. Der X6800 legt durch den Overhead beim Weiterverarbeiten der Daten weniger Wartezyklen ein als der QX6700.

128-Bit-Transfer

Mit den 128-Bit-SSE-Befehlen lässt sich die maximale Cache- und Speicher-Performance ermitteln, die eine CPU erreichen kann.

Core 2 Extreme QX6800 (2,93 GHz) DualDDR2-800 CL4: Bei 128-Bit-Transfers erreicht die Cache-Bandbreite mit 44.747 MByte/s ihr Maximum. Dem Speicher entlockt die CPU jetzt 7143 MByte/s (Load, 8-MByte-Blöcke).
Core 2 Extreme X6800 (2,93 GHz) DualDDR2-800 CL4: Im L1-Cache erreicht die CPU maximal 44.755 MByte/s. Im Speicher liegt die Bandbreite bei 7131 MByte/s (Load, 8-MByte-Blöcke).

Energieverbrauch

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte, Soundkarte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Läuft nur der Windows-Desktop ohne CPU-Belastung, so macht sich der um 55 Watt höhere TDP-Wert des Core 2 QX6800 im Vergleich zum X6800 kaum bemerkbar. Neben der sehr sparsamen Plattform mit dem mobilen Core Duo T2600 fällt AMDs Athlon 64 X2 4600+ in der Energy-Efficient-Version positiv auf.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD PowerNow! (Cool’n’Quiet) zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Aktiviert man bei AMD PowerNow!, so sind die Athlon-64-Plattformen mit DDR2-Speicher genügsamer als Intels Core-2-CPUs. Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilf bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt.

Sind die Prozessoren, der Speicher sowie die Grafikkarte unter hoher Last, so steigt der Energiebedarf der Plattformen auf folgende Werte:

Full Power: Unter Volllast benötigt Intels 975X-Plattform mit dem Quad-Core-Prozessor QX6800 41 Watt mehr als mit der Dual-Core-Variante Core 2 XE X6800. Am sparsamsten bleiben die Plattformen mit dem mobilen Core Duo T2600 sowie AMDs Athlon 64 X2 4600+ EE. Auffällig ist auch, dass der Quad-Core-Prozessor im gleichen Mainboard weniger Energie benötigt als die Einsteiger-NetBurst-CPU Pentium D 920.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 20. Februar 2007 die letzten Änderungen. Intels Preisliste wurde am 24. Dezember 2006 aktualisiert. Eine aktuelle Preisliste von Intel lag bis zur Veröffentlichung des Artikels noch nicht vor.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket 939

Athlon 64 3200+ S939

2000 / 1000

78

55

Athlon 64 3500+ S939

2200 / 1000

88

70

Athlon 64 3800+ S939

2400 / 1000

93

75

Athlon 64 X2 4200+ S939

2200 / 1000

159

175

Athlon 64 X2 4600+ S939

2400 / 1000

195

215

Socket AM2

Athlon 64 FX-62

2800 / 1000

713

700

Athlon 64 X2 6000+

3000 / 1000

459

470

Athlon 64 X2 5600+

2800 / 1000

326

400

Athlon 64 X2 5400+

2800 / 1000

267

270

Athlon 64 X2 5200+

2600 / 1000

232

230

Athlon 64 X2 5000+

2600 / 1000

222

190

Athlon 64 X2 5000+ EE 65 nm

2600 / 1000

222

k.A.

Athlon 64 X2 4800+ EE 65 nm

2500 / 1000

217

220

Athlon 64 X2 4600+

2400 / 1000

195

155

Athlon 64 X2 4600+ EE

2400 / 1000

195

k.A.

Athlon 64 X2 4400+ EE 65 nm

2300 / 1000

170

160

Athlon 64 X2 4200+

2200 / 1000

159

115

Athlon 64 X2 4200+ EE

2200 / 1000

159

k.A.

Athlon 64 X2 4000+ EE 65 nm

2100 / 1000

144

115

Athlon 64 X2 3800+

2000 / 1000

113

90

Athlon 64 X2 3800+ EE

2000 / 1000

113

k.A.

Athlon 64 X2 3800+ EE SFF

2000 / 1000

k.A.

k.A.

Athlon 64 3800+

2400 / 1000

93

75

Athlon 64 3500+

2200 / 1000

88

65

Athlon 64 3500+ EE SFF

2200 / 1000

k.A.

k.A.

Athlon 64 3200+

2000 / 1000

78

65

LGA775

Core 2 Extreme QX6700

2930 / 1066

999

965

Core 2 Extreme QX6700

2670 / 1066

999

965

Core 2 Extreme X6800

2930 / 1066

999

960

Core 2 Quad Q6600

2400 / 1066

851

840

Core 2 Duo E6700

2670 / 1066

530

485

Core 2 Duo E6600

2400 / 1066

316

300

Core 2 Duo E6400

2130 / 1066

224

210

Core 2 Duo E6300

1860 / 1066

183

170

Pentium D 945 (kein VT)

3400 / 800

163

150

Pentium D 925 (kein VT)

3000 / 800

133

120

Pentium D 915 (kein VT)

2800 / 800

113

100

Pentium D 820

2800 / 800

93

90

tecCHANNEL Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Intel setzt mit dem Core 2 Extreme QX6800 in puncto Performance neue Maßstäbe. Die Taktfrequenzerhöhung auf 2,93 GHz gegenüber dem Core 2 Extreme QX6700 beschert dem Neuling einen Performance-Gewinn von bis zu 15 Prozent, je nach entsprechender Applikation. In der Gesamtleistung steht der Debütant unangefochten an der Spitze.

Besonders leistungsstark zeigt sich der QX6800 in Multitasking-Szenarios mit vielen parallel arbeitenden Anwendungen. In den immer seltener vorkommenden Single-Thread-Applikationen verrichtet der Core 2 Extreme QX6800 seine Aufgaben aufgrund der gleichen Taktfrequenz etwa ebenso schnell wie die X6800er Dual-Core-Variante. Doch gegenüber der AMD-Konkurrenz kann sich der Core 2 Extreme QX 6800 in Bezug auf Rechenleistung deutlich absetzen.

Bei der Energiebilanz kann sich der Core 2 Extreme QX6800 durchaus sehen lassen. Trotz hoher Rechenleistung begnügt sich die Intel-CPU im Vergleich zur Konkurrenz mit einer „moderaten“ Leistungsaufnahme, die unter Volllast etwa 319 Watt beträgt. Dagegen verlangt AMDs Topmodell Athlon 64 X2 6000+ 326 Watt. Allerdings ist die Athlon-CPU mit dem PowerNow!-Verfahren gegenüber dem Intel-Modell mit SpeedStep-Technologie im Idle-Modus sparsamer.

Mit der laut Listenpreis 999 Euro teuren Core-2-Extrem-QX6800-CPU kann sich Intel wieder einen kleinen Schritt weiter von der AMD-Konkurrenz absetzen. Ob das reicht, wird sich zeigen. Denn etwa Mitte 2007 will AMD mit einer neuen Quad-Core-basierten Prozessorgeneration kontern, wie Sie in unserem Artikel Vergleich: Die Desktop-CPU-Roadmaps von AMD & Intel nachlesen können. (hal)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows XP Professional SP2 durchgeführt. Für den Linux-Test verwenden wir SUSE Linux 10.1 in der x86_64-Edition.

Intels Core 2 Duo E6700, Core 2 Extreme X6800, Pentium Extreme Edition 965, die Pentium-D-900-Modelle sowie der Pentium 4 670 nehmen in einem Intel-Desktop-Board D975XBX Platz. Den Core 2 Quad Q6600 und Extreme QX6700 / QX6800 testeten wir in der neuen Board-Revision D975XBX2. Die Mainboards verwenden den 975X-Chipsatz. Als Arbeitsspeicher steht jeweils DDR2-667-SDRAM mit CL4 in einer Dual-Channel-Konfiguration zur Verfügung. Die Core-2-Modelle haben wir mit DDR2-800-Speicher (CL4) getestet.

LGA775-Plattform: Das D975XBX von Intel setzt auf den 975X-Express-Chipsatz. Das Mainboard unterstützt den Pentium 4, Pentium D, Pentium Extreme Edition sowie die Core-2-CPUs.

Der Core Duo T2600 arbeitet in einem AOpen i975Xa-YDG mit Intels 975X-Express-Chipsatz und Socket 479M.

Core-Duo-Plattform: Das AOpen i975Xa-YDG mit Socket 479M setzt auf Intels 975X Express Chipsatz. Beim Speicher steuert das Board DualChannel-DDR2-667-SDRAM an.

AMDs Athlon-64-Modelle für den Socket AM2 testen wir in einem Asus M2N32-SLI Deluxe mit nForce-590-SLI-Chipsatz. Der CPU steht Dual-Channel-DDR2-800-SDRAM mit CL4 von Corsair zur Verfügung. AMDs Socket-939-Prozessoren arbeiten in einem MSI K8N Diamond Plus mit NVIDIAs nForce 4 SLI. Der Chipsatz unterstützt HyperTransport-Taktfrequenzen bis 1000 MHz sowie PCI Express. Auf dem MSI-Mainboard können die AMD64-CPUs auf DualDDR400-SDRAM CL2 zurückgreifen.

Socket-AM2-Plattform: Das Asus M2N32-SLI Deluxe verwendet als Chipsatz NVIDIAs nFORCE 590 SLI. Beim Speicher steuert das Board DualChannel-DDR2-800-SDRAM an.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer ATI Radeon X1900XTX in der PCI-Express-x16-Variante bestückt. Der Grafikkarte mit 512 MByte Grafikspeicher standen der Catalyst-Treiber 6.4 sowie DirectX 9.0c zur Seite. Einheit herrschte auch beim Arbeitsspeicher mit jeweils 1 GByte und den Massenspeichern - die Serial-ATA-II-Festplatte Maxtor MaxLine III mit 250 GByte Kapazität.

Der Artikel stammt von der CW-Schwesterpublikation tecchannel.de.