|
||||
AMD今天提前五个月正式发布了代号“伊斯坦布尔”的六核心服务器,型号为Opteron 2400/8400系列。AnandTech也同时放出了相关评测文章,详细讲述了相关最新技术特性,并对实际性能进行了测试。
“伊斯坦布尔”采用直连架构的原生六核心设计,全面适合双路、四路、八路服务器市场,支持AMD-V虚拟化技术和AMD-P电源管理技术套装,继续采用Socket F 1207平台和低价高能效DDR2内存架构,性能每瓦特相比上代四核心“上海”最多提升34%。
IBM、Cray、Sun、戴尔、惠普等都将从本月起出货采用伊斯坦布尔处理器的服务器系统,主板和基础架构合作伙伴也会提供支持。
一、引言
在经过第一代65nm工艺四核心“巴塞罗那”的铺垫后,升级到45nm的四核心“上海”在发布时堪称是当时最出色的服务器处理器,不过就在今年三月底,Intel将Nehalem架构引入了服务器领域,全新的Xeon 5500系列完全横扫了双路领域,很多时候领先对手60-85%,这也是自AMD进军服务器市场以来Intel取得的最大幅度的领先优势。
这时候六核心伊斯坦布尔就显得尤为重要了。现在距离上海发布才整整半年,AMD就增加了两个核心、升级了集成内存控制器(IMC),而且首批频率就达到了2.6GHz,更令人印象深刻的是功耗只比2.7GHz的上海略微高出几瓦。
六核心伊斯坦布尔的Opteron 8435 2.6GHz
二、六核心的优劣
当Intel发布同样六核心的“Dunnington”的时候,就很少有应用程序能充分发挥这些核心的潜能,伊斯坦布尔也面临同样的问题。有些服务器程序倾向于利用2n个核心,很少一部分能扩展到八核心上,至于能用满十六核心的非常罕见。是的,不止是桌面上,服务器里也有很多程序的多核心扩展性很有限,比如邮件服务器、网络服务器、部分数据库等,渲染程序也会在核心数超过八个的时候性能急剧下滑。
当然六核心也有好处。Nehalem Xeon有四个物理核心、八个逻辑核心,但每两个线程需要共享32KB一级缓存和256KB二级缓存,而伊斯坦布尔的每个核心都能独享64KB一级缓存和512KB二级缓存。显然,伊斯坦布尔的主攻方向是计算敏感HPC、大规模数据库,特别是高负载的虚拟化应用。
顺便提一点,伊斯坦布尔和上海的内存支持能力其实差不多,所以使用新系统的时候可能会首先碰到内存资源紧张,然后才是计算能力不足。
六核心伊斯坦布尔核心照
三、伊斯坦布尔技术改进
与上海相比,伊斯坦布尔除了增加两个内核外变化并不大,主要有一下四个方面:
-探测过滤器“HT Assist”:
之前多次介绍过这种探测过滤器技术,下边对比一下就更明白了。
上边是四核心上海简图。CPU 3可能需要CPU 1才有权访问的缓存行(cacheline),但事实上最近的数据在CPU 2的二级缓存里,这时候流程如下:
1、CPU 3向CPU 1请求数据(蓝色实心箭头)
2、CPU 1发出广播,看其它CPU核心谁有所需数据、谁的距离最近(三个红色实心箭头)
3、CPU 3等待问题解决(四个红色空心箭头)
4、请求数据从CPU 2传输给CPU 3(两个蓝色空心箭头)
这种广播式处理方法有两个严重缺点:一是简单的请求就需要十次处理,浪费大量带宽;二是这十次处理给CPU 3上的指令增加了大量延迟。
解决方案就是基于目录的探测式系统,AMD叫作HT Assist。它在每颗处理器上保留1MB三级缓存作为一个目录,跟踪系统其它地方使用的缓存行。这样,虽然三级缓存只剩下了5MB,但省去了大量的探测传输。
上边就是新的六核心伊斯坦布尔简图。还是之前的问题,流程就变成了:
1、CPU 3向CPU 1请求数据(蓝色实心箭头)
2、CPU 1检查三级缓存目录缓存来定位所需数据(鲜红色粗箭头)
3、直接向相关数据最近的CPU 2发送请求(深红色实心箭头)
4、请求数据从CPU 2发送到CPU 3(两个蓝色空心箭头)
处理次数从十次减少到了五次,可大大降低延迟、节省带宽。对于四路系统来说,内存带宽可以多出60%:没有HT Assist是25.5GB/s,有了就可以达到41.5GB/s。
特别指出,HT Assist只对四路、八路系统有用,特别是后者,对双路系统就完全没用了,因为只有两颗处理器。再加上HT Assist还会占用三级缓存,所以在双路系统里应该禁用它,在BIOS里显示为“Probe Filter”。
- X8 ECC:
内存条上的每一颗内存芯片都提供4-bit或8-bit位宽,分别叫作x4和x8,这样组成64-bit位宽就需要16颗x4芯片或8颗x8芯片,所以内存条上至少要有八颗芯片(单面或双面)。伊斯坦布尔的内存控制器现在支持x4和x8两种类型内存条的错误校验(ECC)了。
-远程电源管理界面“APML”:
提供一个借助P-State电源状态限制来监视、控制平台功耗的界面,无需进入BIOS调教。对于大规模数据中心来说,逐台服务器进入BIOS调整电源管理参数是很恐怖的,APML就是个很方便的解决方法。
服务器系统需要一颗处理器和BMC(管理处理器)来支持APML,软件方面也有一定要求。软硬件都还在研发中,所以伊斯坦布尔发布之初该功能暂不可用。
-更快的HT总线速度:
上海处理器的HT 3.0总线最高速度为2.2GHz DDR,每方向带宽8.8GB/s,伊斯坦布尔则提高到2.4GHz DDR,也就是9.6GB/s,和Nehalem Xeon低端版本的QPI总线带宽相同。
该功能要等到AMD的Fiorano平台才能完全实现,现在搭配NVIDIA MCP55平台还是限制在2.2GHz DDR。
四、首发产品线
第一批伊斯坦布尔有五款型号,均为75W标准型,而105W SE高性能版、55W节能版、40W超低功耗版将在第三季度推出。
面向双路应用的有Opteron 2435/2431/2427三款,主频2.6/2.4/2.2GHz,二级缓存6×512KB,三级缓存6MB,单向互连带宽9.8GB/s或8.8GB/s。
价格上这三款新品分别需要989美元、698美元和455美元。
面向八路应用的则有Opteron 8435/8431两款,主频2.6/2.4GHz,售价2649美元和2149美元。
再看看AMD、Intel最近几代服务器处理器的生产工艺、晶体管数量、核心面积和核心数量。伊斯坦布尔的集成度和上海差不多,但晶体管数量不到Dunnington的一半、核心面积则是将近七成。
五、性能实测
服务器应用和性能指标距离普通桌面用户太远,所以就不详细阐述了,数据和柱状图可以说明一切,相信大家很容易就能看清上海、伊斯坦布尔、Nehalem Xeon等之间的性能差异。
六、功耗
这部分的测试还只完成了一少部分,还需要重新检查,所以这里只简单提一下:满载状态下Opteron 2435系统比Xeon X5570系统省电大约35-45W,在略高于300W的系统上这一差距非常明显;至于待机系统功耗,现在看似乎Nehalem Xeon略微占优。
七、小结
就单路和双路应用而言,伊斯坦布尔相比同频上海在OLTP、ERP、Reporting、OLAP、HPC、虚拟化等方面能带来的性能提升少则5%、多则27-46%,可惜Web方面反而会下滑3%。Xeon X5570 2.93GHz与Opteron 2435 2.6GHz相比,优势相当明显,除了虚拟化应用大部分不相上下外,OLTP、ERP、Reporting、OLAP、Web、HPC能胜出14-50%。
很显然,伊斯坦布尔取代不了Nehalem Xeon 5500系列,后者拥有超线程技术和更高的频率、IPC、内存带宽,在OLTP、ERP、网络服务、渲染、高性能计算(HPC)等领域依然还是首选。
当然伊斯坦布尔也不是毫无用武之地。综合考虑性能、功耗和成本,至少有两个领域非常适合伊斯坦布尔:决策支持数据库,和虚拟化。
AnandTech最后透露,伊斯坦布尔在四路领域是非常可怕的竞争对手,但详细评测还要稍后才会完成。