英特尔Xeon X7560 四路服务器超详评测(1)(5)

时间:2010-11-18   来源:   网友评论:0   人气: 5904 作者:

线程:SPEC CPU 2006整数性能

关闭超线程之后,整数运算吞吐量下降了15.6%,缓过来是打开超线程提升了18.5%,有一个项目是关闭超线程运行性能较高的:429.mcf  组合优化

线程:SPEC CPU 2006浮点性能

超线程对浮点的影响较小,这一点和其他Nehalem是一样的,这是因为这些程序能较高效率地利用运算单元。关闭超线程后吞吐量下降了9.1%,换过来是打开超线程提升10%。不少项目是关闭超线程比较好,不过差别也不大,一般选打开就可以了。

 

CineBench R11.5 64bit
处理器 双路Intel Westmere-EP
Xeon X5680
DELL PowerEdge M910
四路Intel Nehalem-EX
Xeon E7540
四路Intel Nehalem-EX
Xeon X7560
超线程关闭
四路Intel Nehalem-EX
Xeon X7560
显卡 - - - -
CPU Benchmark
Rendering (1 CPU) 1.16 pts 0.78 pts 0.92 pts 0.92 pts
Rendering (x CPU) 16.40 pts 19.26 pts 15.70 pts 27.08 pts
Threads 24 48 32 64
Multiprocessor Speedup 14.18x 24.65x 17.14x 29.43x

 

 

CineBench受超线程影响很大,降低了42%的性能。

 

 

MMM - Matrix-Matrix Multiplicaion Benchmark
处理器 双路Intel Westmere-EP
Xeon X5680
DELL PowerEdge M910
四路Intel Nehalem-EX
Xeon E7540
四路Intel Nehalem-EX
Xeon X7560
超线程关闭
四路Intel Nehalem-EX
Xeon X7560
单位 GFLOPS GFLOPS GFLOPS GFLOPS
Threads 1
5000 step 8.877563 5.867645 6.965506 7.036748
10000 step 8.883291 5.865347 6.974666 7.034792
15000 step 8.881528 5.826604 6.935187 6.960592
Threads 2
5000 step 17.5891 11.570261 13.944669 13.979099
10000 step 17.73566 11.689317 13.984364 14.032266
15000 step 17.67208 11.602247 13.920488 13.89951
Threads 4
5000 step 34.85343 21.788607 27.715225 27.555005
10000 step 34.90105 22.21115 27.846714 27.685804
15000 step 34.92557 22.073702 27.702342 27.297404
Threads 8
5000 step 45.99856 41.228878 49.714209 49.518835
10000 step 45.99856 43.472432 50.227199 49.767277
15000 step 47.74417 43.37777 50.514463 49.750117
Threads 16
5000 step 66.10022 73.379889 96.880558 47.855051
10000 step 72.38159 78.596851 99.776303 48.320744
15000 step 73.2495 79.099092 99.385572 48.421492
Threads 24
5000 step 66.10022 94.000418 138.717733 70.233111
10000 step 72.38159 124.028823 148.818098 71.502532
15000 step 73.2495 124.574801 148.054922 71.685326
Threads 32
5000 step     151.664487 96.076302
10000 step     184.741778 97.64478
15000 step     183.894563 98.195937
Threads 48
5000 step   97.335138   136.623189
10000 step   119.780984   142.50301
15000 step   121.637469   145.534244
Threads 64
5000 step       137.141474
10000 step       182.49902
15000 step       185.098571

 

 

打开关闭的峰值计算性能都差不多,表明了这些程序对运算单元的利用率高,超线程起到的作用不太大。

 

 

SunGard Adaptiv Analytics Benchmark v4.0
处理器 双路Intel Westmere-EP
Xeon X5680
DELL PowerEdge M910
四路Intel Nehalem-EX
Xeon E7540
四路Intel Nehalem-EX
Xeon X7560
超线程关闭
四路Intel Nehalem-EX
Xeon X7560
Threads 24 48 32 64
Time
(lower is better)
94.911s 139.512s 66.986s 104.925s

 

 

这个程序本身就推荐关闭超线程运行。

 

 

black_scholes
处理器 双路Intel Westmere-EP
Xeon X5680
DELL PowerEdge M910
四路Intel Nehalem-EX
Xeon E7540
四路Intel Nehalem-EX
Xeon X7560
超线程关闭
四路Intel Nehalem-EX
Xeon X7560
Threads 24 48 32 64
Time
(lower is better)
5.51s 4.40s 3.21s 2.78s

 

 

这个程序可以有效地利用多线程。

 

超线程:SQL2005数据库性能

关闭超线程也能达到分峰值26万的TPS,大约是打开超线程的86.8%,降低了13.2%,总的来说,四路系统下,超线程的影响低于笔者在二路系统中看到的幅度,部分地是由于线程数量已经多到了一定的程度,要使用8路Nehalem-EX系统时,一共达到64个核心128个线程,这时对操作系统、驱动、应用软件都有一定的考验。

测试使用了常用的烤机Prime95软件,也测定了数据库基准测试下的功耗: 

 

 

功耗(W)
项目 关机 IDLE Prime95 64bit
SmallFFTs
Prime95 64bit
In-place large FFTs
SQL2005测试
1500虚拟用户数量
HTToff 30 756 1161 1350 -
HTTon 30 756 1201 1370 1080

 

 


之前的Dunnington测试,测试方法不同,仅供参考

关机时也有一定的功耗,这是因为四个冗余电源仍有一些电路在工作,不过,买来这么贵的服务器天天不开机就是暴殄天物。机器闲置时功耗756W,用Prime95时最大功耗可以达到1370W,在数据库测试时在1080W左右。

 

 

启动计时
按下开关到引导OS 3:30
OS启动 0:50
合计 4:20

 

 

高配置的服务器启动都比较慢,例如,这台机器启动就花了4分20秒。启动过程包含了内存的检测和阵列卡的启动(已经关闭网络启动)。

Nehalem-EX(至强7500和6500系列)是Intel年初推出的面向可扩展系统(2路到128路)的处理器平台,它的特点就是可扩展、高可靠性(众多的RAS特性),接手的是Xeon 7400系列的多路服务器平台产品线。为了符合Nehalem-EX最多8个核心的设计,Intel为其开发了环形的内部互联总线,外围电路也和普通的Nehalem很不相同。

 IT168评测中心观点
Nehalem-EX:至强7500系列和6500系列

在可扩展和高可靠性这两点上,Nehalem-EX都比上一代的Dunnington(就是至强7400系列)有了非常大的进步,并且,Nehalem架构对性能的巨大影响也非常重要,特别是考虑到竞争对手在四路市场的影响力的时候。相信Nehalem-EX不仅仅是对X86的竞争对手,对RISC界的竞争对手也造成了很大的压力。因为Intel的Converged Core(融合核心)策略,现在Intel的几乎所有的产品线都采用了Nehalem架构,应用可以跑在所有的平台上,可以享用通用的软件优化。这增强了Nehalem-EX在四路市场上的竞争力。

  Nehalem架构巅峰:Nehalem-EX
45nm八核心:Nehalem-EX晶圆图

Nehalem架构巅峰:Nehalem-EX
Nehalem-EX架构图(附带内存子系统)

测试上,顶级配置的Nehalem-EX比顶级配置的Westmere-EP和Dunnington提升了80%左右的理论计算能力,以及241%的SPEC CPU 2006得分,后者可以代表着大量的实际应用。实际应用性能的数倍提升,依赖于核心的增加,以及直联架构(IMC和QPI)带来的改变,因为Dunnington受到了FSB总线和内存带宽的巨大限制。

 Nehalem-EX平台评测
Intel Nehalem-EX官方测试样机:外表不凡,内里更是不凡!

虽然实际表现很不错,然而就笔者来看,Nehalem-EX还不足够完美。不过Nehalem架构的引入已经奠定了基础,下一代的Westmere-EX将更接近完美:达到10个核心20个线程、更接近常用平台的运行频率以及更快的内存,总的来说,Nehalem-EX让Intel的多路产品线焕然一新。


 

文章评论