要对Pentium4 1.5GHz这样刚刚上市不到一周的处理器进行评价,难度非常大,因为凡是对新上市的CPU进行测试都会面临一个同样的问题:测试软件能否充分发挥新处理器的性能?新发表的处理器往往会增加一些更强的指令集,尤其是针对多媒体应用方面,Pentium4就首次引入了SSE2指令集,包含144个用于增强128位SIMD单指令多数据流整数运算和128位双精度浮点运算性能的新指令,使得运行一些特定任务减少了指令数量,从而提高执行效率,像视频、语音识别、图形处理以及工程科学应用等方面。不过要使用SSE2提高效率,必须使用Intel最优化的C/C++编译器进行重新编译。尽管Intel早就作好准备,向各应用软件开发商提供自己的SSE2 SIMD指令支持,但至今我们除了了解到有60多家软件公司宣布支持SSE2外,仍然没有看到一款支持SSE2的正式软件发表。这就使得用目前的测试软件来测试Pentium4会导致Pentium4的一些新功能得不到发挥,而如果仅仅是与其他处理器比频率高低,显然不能很好地反映CPU的真正性能。不过,幸好几天前SiSsoft发表了针对Pentium4优化过的Sandra2001测试软件,CPUID也增加了对Pentium4的识别功能,使得这次测试多少有些把握。
一、测试方案
除了测试这款频率最高的CPU目前能够表现的最高性能,我们还将它与Athlon进行了比较测试,以考察Pentium4在系统设计上是否有优势。
平台一
CPU:Pentium4 1.5GHz、Pentium4 1GHz(我们这颗Pentium4 1.5GHz没有锁频,降频到1GHz)
主板:微星MS-6339 i850主板
内存:256MB PC800 RUMBUS
平台二
CPU:Athlon 1GHz
主板:联想K7T KT133主板
内存:金邦金条256MB(128MB PC133×2)
其他配件完全相同
显卡:ELSA GeForce2 GTS Ultra 64MB DDR
硬盘:IBM Deskstar 75GXP
CD-ROM:志美50X CD-ROM
显示器:LG 795FP Plus
电源:七喜牛魔王服务器电源DPS-3000(符合ATX 2.03规范)
软件系统:Microsoft Windows98SE、DirectX8.0
i850芯片组驱动程序 Version 2.60.001A
VIA KT133芯片组驱动程序 Version4.25A
GeForce2GTS Ultra显卡驱动程序 Version6.31
为了在测试中尽量减少3D性能测试部分显卡瓶颈对测试的影响,我们选用了目前最顶级的配置,ELSA GeForce2GTS Ultra 64MB DDR。与1GHz Althon配合的KT133主板,我们特意选择了在上次KT133横向测试中,性能出众的联想QDI K7T主板。
根据Intel的建议,Pentium4需要使用符合ATX2.03规格的电源,ATX 2.03规格除了我们常见的与主板电源相连接的插头外,还多出一个专为i850主板准备的ATX12V电源插头。保证了主板上Pentium4处理器部分更大的功耗,也进一步确保有充足的电力供应Pentium4专用CPU散热风扇的运行。所以我们选用了符合ATX 2.03规范的七喜牛魔王电源。
在测试之前我们感觉对Pentium4 1.5GHz的测试应该很轻松,因为Intel以Pentium4 1.5GHz再一次夺得时钟频率的桂冠,远远领先于对手AMD目前最高的Athlon1.2GHz,似乎测试难逢对手。
二、测试分析
●SiSoft Sandra2001内存带宽测试
从Pentium4的规格我们知道,尽管奔腾4仍然采用100MHz的总线时钟频率,数据宽度为64bit,但Intel独创的“Quad-pumped”技术,使得数据传输得以提升至4倍,所以Pentium4的带宽理论值达到3.2GB/s,比AMD Athlon采用的EV6总线的2.1GB/s高出近40%。从SiSoft Sandra2001的Int ALU/RAM Bandwidth以及Float FPU/RAM Bandwidth测试成绩来看,Pentium4的“Quad-pumped”400MHz总线驱动i850的Dual RDRAM通道,的确使得内存带宽遥遥领先,突破1000大关,这也是我们见到的最大测试值,是Athlon 的两倍多。
●处理器级的整数性能和浮点性能
Winbench99的CPU Mark99和FPU WinMark99,以及Sandra2001的CPU Dhrystone和FPU Whetstone是专门针对CPU整数性能和浮点性能进行处理器级的测试。从测试情况来看,Pentium4的表现比较令人失望。1.5GHz Pentium4的整数性能和1GHz的Athlon差不多,而相同频率的Pentium4则远远落后Athlon,浮点性能从FPU WinMark99看来1.5GHz Pentium4比1GHz Athlon略低,算是性能相当,不过在SiSsoft2001中1.5GHz Pentium4的FPU Whetstone成绩还是要比1GHz Athlon好一些,这也许应该归功于SiSsoft2001对Pentium4的优化。
从SiSsoft Sandra2001的多媒体性能测试我们可以更清楚地看到针对SSE2优化的重要性。SiSsoft Sandra2001已经可以识别Pentium4的SSE2指令,并专门针对SSE2进行测试,测试后显示Integer SSE2和Floating-Point SSE2,而测试完Athlon后显示的是Interger MMX Enh和Floating-Point 3Dnow! Enh,。从测试结果来看,1.5GHz的Pentium4与1GHz的Athlon相比,SSE2的整数性能和浮点性能都略强于Athlon(MMX整数性能、3Dnow!浮点性能),但相同频率下,Pentium4还是表现得落后不少,差距在30%,如果Sandra2001能够完全发挥SSE2和3D Now!的性能,这样的差距似乎显示出,Intel从Athlon推出后就开始落后的CPU整数浮点性能有进一步扩大的趋势。总的来说,相同频率的Pentium4与Athlon相比,无论是整数性能还是浮点性能,Pentium4的性能表现都要差一些。
●Business Winstone99、Content Creation 2000系统整体性能测试
ZD的Business Winstone99、Content Creation 2000都是主要针对系统整体性能的测试套件,是对系统硬盘系统、内存带宽和CPU性能,尤其是整数性能的综合考验,Business Winstone99通过应用Windows下常用的8个办公套件和浏览器运行一系列脚本,模拟主流商业应用环境;Content Creation 2000是在多任务环境中使用Adobe PhotoShop 5.0、Adobe Premiere 5.1、Macromedia Director 7.0、Macromedia Dreamweaver 2.0、Netscape Navigator 4.6和Sonic Foundry Sound Forge scripts等应用软件,模拟现实的Internet内容创建操作。从上面分析我们已经知道Pentium4在整数性能方面并不令人满意,甚至不及PentiumⅢ,尽管有内存带宽的优势,但毕竟影响Business Winstone99、Content Creation 2000成绩最主要的因素是处理器的整数性能,所以1.5GHz的Pentium4降频到1GHz后性能远远不及相同频率的Athlon,即使1.5GHz Pentium4在Content Creation 2000测试中也只比1GHz的Athlon多一点点,而在Business Winstone99测试中甚至比1GHz Athlon还低。
●Quake3
在OpenGL经典游戏Quake3的测试中,Pentium4终于一展雄威,性能表现非常出色。在Fastest模式下,640×480分辨率下跑出了246帧/秒的惊人成绩,这可是我们见到过的Quake3最高记录。
我们知道,Quake3的测试中,分辨率越低,性能的发挥对CPU的依赖越大,不同频率的CPU下往往性能表现差异巨大,而到了高分辨率,大量的材质渲染使得显卡不堪重负,往往表现出瓶颈现象,所以你会看到在高分辨率下,不管使用什么频率的CPU测试结果会相同。表格中加灰色底纹的成绩就是处于显卡瓶颈限制状态,所以我们主要考察低分辨率下不受显卡瓶颈限制的成绩。将Pentium4 1.5GHz降频到1GHz与同频率的Athlon相比,Pentium4仍然超出不少,低分辨率下性能差距可以达到15%,而1.5GHz的Pentium4更是高出30%。
其实在我们以前的测试中已经发现,Quake3是一款对内存尤其是FSB总线速度十分敏感的游戏,Pentium4采用的100MHz的“Quad-pumped”技术使得CPU以相当于400MHz的的频率传输数据,同时与RAMBUS的高内存带宽作配合,这显然要比Athlon的200MHz总线速度配合PC133 SDRAM内存性能强很多。
●MDK2
MDK2同样是我们常用的OprnGL测试游戏,不过在Quake3中不可一世的Pentium4在MDK2中又变得很温和,MDK2并没有针对Pentium4的SSE2作优化,所以增强指令集对Pentium4没有任何帮助, 在测试中我们将硬件T&L关闭,使所有T&L的工作交给CPU来完成,进一步加重CPU的负荷。
1.5GHz Pentium4性能表现只比1GHz Athlon好一点,性能差距保持在7%,如果我们采用1.2GHz的Athlon,其MDK2的性能表现一定可以超过1.5GHz Pentium4。将1.5GHz的Pentium4降频到1GHz后,MDK2的性能表现只相当于1GHz Athlon的80%多一点。看来Pentium要在这样的游戏中超越Athlon,必须进一步提高频率,以高频率取胜。
●3D Mark2000
尽管3D Mark2000是我们最常用的D3D测试软件,考察CPU的浮点性能,但3D Mark2000并没有针对SSE2优化,只是使用了SSE,针对Athlon倒是优化过。从测试的情况来看,无论是CPU Speed还是3D Mark的成绩,1.5GHz还是领先很多,高出1GHz Athlon15%,但反过来,相同频率的Pentium4和Athlon比较,Athlon又表现好一些,性能高出Pentum4近10个百分点。3D Mark2000的测试并不能够完全反映Pentium4的实际效能,但从测试成绩来看,如果用到SSE2指令,Pentium4的浮点性能表现应该会更好些。
●OpenGL专业测试SPEC viewperf、Indy3D
在专业OpenGL测试SPEC viewperf中,Pentium4 1.5GHz基本上保持了领先,比1GHz Athlon高出10%以上,但相同频率的Pentium4和Athlon相比,并不占优势,甚至部分测试项成绩还略低一些。在Indy3D 16MB的测试中,Pentium4有相似的表现。
结 论
从整个测试来看,Intel Pentium4的体系结构的确非常优秀,400MHz 3.2GB/s系统总线以及双通道3.2GB/s的RAMBUS,的确使Pentium4更好地解决了内存带宽瓶颈。但新增加的SSE2指令没有表现出令人满意的性能。至少在目前支持SSE2指令集的应用程序尚未普及的情况下,SSE2指令集对Pentium4性能的发挥没有任何帮助。不过Pentium4还是取得频率上的桂冠,但AMD 凭借目前上市的Athlon 1GHz尤其是1.2GHz处理器就可以在绝大多数应用中与Pentium4 1.5GHz战成平手。Pentium4的市场前景除了应用软件厂商的支持,使Pentium4的潜能真正发挥出来外,价格会是更主要的因素。从目前近万元的零售价来看,还是显得离我们太遥远。(钟建勇)
|