InfoWorld的回顾:英特尔至强Nehalem-EX处理器住大

英特尔全新的Nehalem-EX CPU的SMP服务器带来的八个核心,海量内存的支持,大型​​机像-RAS功能,以及大规模的工作量巨大的性能提升

虽然每个人都已经有了相当不错的时间扑安腾在过去的几年里,安腾确实有一些显著上层梯队功能的x86 / x64系统梦寐以求的理想。其中的许多功能在RAS(可靠性,可用性和可服务性)领域 - 就像失败的DIMM隔离,热插拔内存,插座间内存镜像,损坏数据围堵,和CPU能力的热增加。直到Nehalem-EX处理器的发布,这些功能根本就没有在世界至强存在。他们现在要做的。

Nehalem-EX芯片专为大容量SMP服务器设计,可从2个套接字扩展到256个套接字,每个套接字可寻址内存最多可达256GB。每个芯片有8个物理内核和24MB的L3缓存,可以通过超线程表示16个逻辑内核。这些都是重要的数字。可以将1TB的RAM放入4套接字Nehalem-EX服务器中。

快速的AES加密、更好的可伸缩性和一致的每核性能使新的六核Xeon成为Nehalem-EP的有价值的继承者。看到“InfoWorld的回顾:英特尔的Westmere支柱的东西。”]

理解《Nehalem-EX》和《westmer - ep》之间的区别也很重要。westmer - ep采用32nm制程,Nehalem-EX采用45nm制程。像X7400邓宁顿一样,westmer - ep有六个核,Nehalem-EX有八个核。westmer - ep最多有12MB的L3缓存,Nehalem-EX最多有24MB。westmer - ep的运行频率为3.33GHz / core, Nehalem-EX的运行频率为2.26GHz / core(目前)。在westmer - ep有两个快速通道互连的地方,Nehalem-EX有四个,并且可以寻址westmer - ep两倍的RAM。它们都提供超线程、Intel VT虚拟化钩子和Turbo模式。

Nehalem-EX处理器适合于非常大的规模的工作量。虽然的Westmere-EP在时钟速率的磕碰,它不会被附近的Nehalem-EX处理器提供的水平随时随地规模。这就是说,某些工作负载更适合的Westmere-EP,尤其是单线程任务是受益于更高的时钟频率。

EX-treme性能为了测试Nehalem-EX,我选择了我的现实并发测试套件。由于实验室中缺少一台Intel x7400系列服务器,我用一台运行两个Intel X7560 nehalram - ex cpu的Dell R810与一台运行四个Intel X7350 Tigerton cpu的较老的HP DL580 G3进行了比较。在深入研究结果之前,请注意这些系统之间的差异:HP DL580具有四个四核的CPU X7350以每核2.93GHz带4MB L3高速缓存运行。戴尔R810只有两个8核X7560s,运行速度为2.26GHz /核,拥有12MB的缓存。虽然X7560 Nehalem-EX cpu支持超线程,但DL580中的X7350s却不支持。这并不是一个全面的分析,但是如果您的服务器使用了一年以上并且运行在x7300系列平台上,那么它可以很好地说明预期的性能提升。

我跑了基于常见的操作测试在许多应用中。瘸腿测试转换152MB的WAV文件到MP3以256Kbps的比特率。压缩测试用gzip和bzip2压缩和解压缩一个55MB的MP3文件。MD5的测试计算上152MB的文件MD5校验和,和MP4到FLV转码测试一个24MB的MP4文件FLV。这些测试是单线程的,但具有并发的水平提高到应力的物理和逻辑核心,存储器带宽和存储器互连,以及磁盘I / O同时运行。

在Nehalem-EX处理器,我跑这些测试与超线程启用和禁用。为了进行比较,我会引用超线程禁用,这样的数字代表相同数量的逻辑CPU的结果。所有测试均在CentOS 5.4上运行。该报告的数字从测试被引诱RAMDISK运行从一个瓶颈消除磁盘I / O。

结果开始时有些unimpressively。八个并发进程,在DL580四个X7350 CPU,以防止两个Nehalem-EX处理器的CPU在R810在LAME和gzip测试旗鼓相当,但均显著落后于​​其他测试。在16的并发级别,差距显着扩大在所有测试中,使用旧系统的稍稍领先Nehalem-EX处理器在LAME和gzip测试,但运行中剩余的落后方式。一旦开始显著超额认购每台服务器上的逻辑CPU的数量的测试中,Nehalem-EX处理器拉的方式进入铅和在所有测试在那里呆了。

事实上,我跑了很多测试通过在48,64,和96个并发进程级别来验证结果,因为性能差异如此巨大。例如,在64个并发工艺中,耗时2分12秒为双CPU的Nehalem-EX系统完成MP4到FLV测试。四CPU X7350系统接管了30分钟完成相同的任务。这是一个巨大的性能差异。两个服务器之间的性能增量仅作为并发增加增长更宽。不仅是我能斜坡Nehalem-EX处理器高达768个并发进程,但它仍在运行约50%的测试,比X7360快可以运行64个并发进程。

这种性能的极大提高是由许多原因造成的。旧的X7350系统可能有两个额外的cpu和每个核670MHz的时钟速率,但是它只有4MB的L3缓存,而Nehalem-EX上有24MB的L3缓存。X7350也缺乏QuickPath的优点,内存总线成为了瓶颈。因此,在更重的工作负载测试中,Nehalem-EX击败了X7360,即使每个核的时钟速率降低,而核数相同。在较轻的工作负载中,差异不那么显著。

我还在一台4 cpu的AMD Opteron 8435服务器上运行了相同的测试套件。这款6核2.6GHz的伊斯坦布尔cpu已经推出一年多了,还不能完全与Nehalem-EX相匹配(因为内存更慢,L3缓存少25%,这个版本的超传输速度也比QPI慢)。但就实际部署而言,他们对Nehalem-EX进行了合理的比较。

这些试验表明,Nehalem-EX处理器从快绝对收益,1,066MHz DDR3内存(与伊斯坦布尔的800MHz的DDR2),QPI和增加缓存,因为击败了AMD皓龙8435在大部分测试X7560,虽然几乎没有显着像你想象的。我跑的测试,对一个24核伊斯坦布尔系统并再次与人为约束条件限制了AMD框只有16个物理内核。这不是一个完美的对比,考虑到仍有AMD在框中四个CPU,但它是合理的。

结果:全24核心的AMD伊斯坦布尔系统在对X7560几个并发级别举行了性能优势启用超线程。但是,仅限于16个核心的时候,比较有或没有启用超线程的X7560伊斯坦布尔系统失地。在大多数情况下,利润率约为赞成X7560比AMD皓龙8435的10%,但它在整个并发水平有所波动。这两种服务器自爆门关闭基于X7350服务器,尤其是在更高的并发水平。

这个故事的寓意是,Nehalem-EX处理器扩展出非常好。然而,AMD新推出的12核马尼库尔芯片可以让它变成一个完全不一样了。

的界限逐渐模糊之一的86 / x64服​​务器和最RISC服务器和主机之间的主要区别是高端RISC平台来处理错误检测,纠正,和恢复在系统级的能力。这不是简单地确定一个DIMM坏了,并显示故障位置,但自动阻止关闭该内存段并允许DIMM要热插拔与另一个,然后用替换恢复正常操作,而没有任何问题停机时间。在Nehalem-EX处理器的MCA(机器校验架构)提供了这种能力,以及其它增强的可靠性特性。

提供这些功能并不简单,因为它听起来可能。操作系统需要在其中发挥舞蹈显著部分也因为处理器需要通知RAM失败的操作系统,并允许操作系统要么重新启动已使用内存的过程或者从坏的RAM洗牌数据远之前隔离和更换。

还有在Nehalem-EX处理器的热添加内存和CPU的支持,这意味着RAM和处理器可以在运行到现有的系统,而无需重新启动加入。当然,这也需要与操作系统和固件,使密切沟通,所以不要指望这些特性可用在较旧的操作系统平台,虽然大多数主要操作系统厂商已经表示,他们将在处理器的版本支持这些功能。

还有更多的RAS特性,如QPI包重试和QPI CRC检查,支持可靠性的快速路径互连,I/O集线器热添加,和内存热节流。一言以定之,英特尔已经在Xeon上投入了一大堆非常高的可靠性功能。

虽然Nehalem-EX并没有提供最快的时钟速率,但它提供了比其他任何英特尔处理器更多的CPU核心,它可以处理大量的内存,并增加了一整套可靠性特性——以前只有Itanium才有这些特性。我们很快就会看到AMD刚刚推出的Magny Cours能带来什么,但无论结果如何,很明显,x86/x64运算能力从来没有这么好过。

相关报道:

这个故事, ”InfoWorld的回顾:英特尔至强Nehalem-EX处理器住大,最初发表于InfoWorld.com。按照最新的发展服务器,处理器, 和别的硬件在InfoWorld.com上。

了解更多关于硬件在InfoWorld的硬件通道。

这篇文章,“信息世界评论:英特尔Xeon Nehalem-EX生活大”最初发表于信息世界

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权©2010Raybet2

IT薪资调查:结果在