今年11月20日,INTEL发布了他们新一代处理器PENTIUM 4,这次推出的PENTIUM 4包括1.4GHz 和1.5GHz两个版本,PENTIUM 4的发布表明了INTEL希望重新夺回处理器市场领先位置的决心。在过去的几个月里,AMD的ATHLON对INTEL构成了极大威胁,不仅高端处理器市场的份额持续减少,而且在INTEL处理器占统治地位的低端市场也有被AMD重新收复的危险,因此INTEL急需一种高性能的处理器来稳住自己的阵脚,PENTIUM 4正是在这种背景下诞生的。
PENTIUM 4仍然属于X86架构的处理器,原来的代号是IA-32,P4采用的是20级超标量、超管线结构,而P3采用的却是10级超标量设计,而它们的竞争对手―AMD的ATHLON采用的是带有15级FPU管线的10级超标量设计,因此P4的性能在理论上比P3和ATHLON都有较大程度的提高。我们知道不久前INTEL由于P3 1.13 GHz设计上的问题而被迫收回了这批处理器,而P4的最低频率为1.4 GHz,比1.13 GHz快了许多,由于P4与P3一样采用的是0.18微米铝工艺,那么INTEL是如何提高P4频率的呢?答案就在设计上,通过提高管线的长度使INTEL可以向更高的频率迈进,但是长管线的缺点也非常明显,就是会使处理器的执行效率下降。
INTEL指出,CPU 性能主要是由芯片的时钟频率与每时钟周期执行的指令数决定的,长管线会使每个时钟周期内执行的指令数减少。INTEL认为在相同频率情况下,P4的效率将会比P3下降10-20%,因此我们可以这样认为,在仅考虑频率因素的情况下,1.4GHz的P4在性能上仅和1.2GHz的P3相当,显然这种状况对P4非常不利,因此INTEL在P4中又采用了其它一些新技术来弥补长管线的缺点,这些技术包括增加一个全新的乱序推理执行引擎,因为现代处理器的运算速度,远远超过了主系统的需求,如果是486以前的机型(当然486很少会出现这种情况,386、286就更不用提了),CPU则会处于等待状态。而现代的CPU,为了最大限度提高CPU的利用率,CPU会在主系统请求前,对后面的数据进行预测计算,当然这样做的效率是很低的,但总比没有强。因此CPU在这方面的潜力非常大,如果某种预测算法可以使命令执行的正确率提高10%,那么对CPU性能的提升将会是非常惊人的。正是为了这个目的,INTEL在P4中加入了一个经过改良的引擎和执行转移缓存(EXECUTION TRANSFER CACHE),用来迅速终止错误的预测,使处理器执行的指令更加优化。
作为超标量执行设计的一部分,INTEL还加入了144条SSE2(STREAMING SINGLE INSTRUCTION MULTIPLE DATA EXECUTION)指令和一个高级动态执行引擎(ADVANCED DYNAMIC EXECUTION ENGINE),主要用来与算术逻辑单元(ALU)配合工作,ALU主要处理整数运算,以2倍CPU时钟频率运行,因此CPU在处理整数型多任务时显得非常容易。
P4的前端总线频率为100 MHz,由于采用了QDR传输模式,可以达到相当于400MHz前端总线的传输量,其实QDR的原理与ATHLON的DDR前端总线类似。不管是DDR还是QDR,由于它们最大限度地挖掘了每一时钟周期的潜力,结果是它们对时钟信号变得更加敏感、对传输的数据精度要求更高,这给超频带来了很大的难度。
P4的管脚与封装
PENTIUM 4采用了新的SOCKET 423 FLIPCHIP封装方式,芯片体积要比P3大一些,正是这个原因,原来基于SOCKET 370的散热方式无法与P4兼容。INTEL在管脚上作了一点小改进,使得处理器在安装时不会插错,由于P3和ATHLON每边的管脚数都完全相同,对电脑初学者会造成一定的麻烦,而P4每边的管脚数都不一样,从而可以避免这个问题,使用户很容易找到正确的CPU插入方向。
INTEL 850芯片组
目前INTEL 850是支持P4的唯一芯片组,它和支持P3高端的INTEL 840芯片组非常相似,观察850芯片组的外形,你会发现它和我们以前见过的北桥芯片没有一点相似之处,实际上它与P3的内核很相似,这是因为850芯片组同样采用FLIP-CHIP PGA封装方式,和P3、P4 的封装方式完全相同。
由于设计上的BUGS,850芯片组曾经推迟一个月上市,同样也推迟了P4的上市日期。其实这个BUGS非常小,仅当系统使用PCI接口的图形卡时,系统可能无法稳定工作(很难想象一套P4系统还在使用PCI接口的图形卡)。在BUGS清除之前,INTEL没有向外销售一块850芯片组,向主板厂商发售的都是订正过的芯片。
在性能上,850芯片组与老的840芯片组有些类似,如他们都支持RDRAM内存,AGP 4X接口,拥有3.2 GB/S的处理器带宽和266 MB/S I/O带宽,但是850芯片组在内存控制器上没有一块小容量的预读缓存,也没有关于64位PCI插槽的选项,而这些功能都是840芯片组所拥有的。P4还会配置INTEL开发的ICH2(第2代输入/输出控制器),这同样会在最近发售的840主板上见到,ICH2支持6个PCI插槽,4 USB端口,集成有10/100网卡和双ATA/100通道,而ICH1支持到ATA/66。
P4的内存
P4目前只支持RAMBUS内存,尽管有很多人憎恨RAMBUS内存,但不可否认它是一种高效的内存技术,这也是为什么INTEL死守RAMBUS不放的重要原因,现在P4与INTEL 850的配合将使RDRAM性能上的优势完全发挥出来。上面曾提到,850芯片组拥有2个RDRAM通道,可以提供最大3.2 GB/S的带宽,尽管840芯片组也拥有双通道,因此拥有同样的带宽,可是由于P3 133-MHz前端总线的限制,使应有的性能无法发挥出来,而在P4中,这一切问题都不存在了,处理器与内存之间拥有很宽的数据传输通道。
由于每块850主板上都有2个RDRAM通道。这意味着你必须成对购买RAMBUS内存条,因为RAMBUS设计需要每个通道至少有一根内存条,这给以后的升级带来了麻烦,或许INTEL就是要消灭升级这个字眼。在内存的选择上,最好使用PC-800的RDRAM内存条,只有它才能保证实现上面提到的那些性能指标,如果你贪图便宜而购买了PC-600 RDRAM内存条,那么系统的内存带宽将会下降1/3,只有2.4 GB/S。
如果你不喜欢 RAMBUS内存的话,那么还是可以选择DDR内存的,只是需要等上一段时间,INTEL表示正在开发支持DDR内存的P4芯片组,而且INTEL还会将P4总线技术授权给第三方公司如 VIA 和ALI等,让这些公司生产自己的P4。现在的问题是:即使是目前最快的DDR内存―PC2100(PC-133 DDR),也只提供了2.1 GB/S 的内存带宽,这比RDRAM内存中最慢的PC-600还慢,更为重要的是DDR内存与处理器无法同步运行。现在还有一个对DDR内存不好的消息,就是目前国际市场上RAMBUS内存价格甚至比DDR内存还要便宜,如果是这样的话,DDR内存与RDRAM内存相比已经没有任何优势可言了。
P4的散热
尽管P4采用的是0.18微米铝工艺生产,但芯片产生的热量比我们原先预计的要少,因此P4在工作时只需用散热片散热即可,而不需要其他主动散热方式。P4 1.5 GHz在峰值时平均耗能为50瓦左右,比P3的30瓦多了不少。为了冷却P4,INTEL建议采用一个大的、铜制的散热片(约450克重),INTEL自己零售的散热器还包括有一个温控风扇和一瓶散热硅胶。
在测试中,我们发现P4并没有散发多少热量,通过测量,发现处理器核心温度大约只有29.5度,很显然这算不了什么,另外一些著名的生产散热装置的公司如ALPHA、THERMALTAKE和GLOBALWIN肯定会找到更有效地冷却P4的方式。
P4与最初发售的P3一样,不支持多处理器工作方式,这对一直强调多处理器重要性的INTEL来说无疑是最大的讽刺。INTEL计划将在明年下半年为P4加入SMP功能,但是到那时,双处理器的ATHLON系统肯定已经上市,INTEL将会面临更大的挑战。从P4的性能测试来看,P4的表现远没有预计的那样出色,在许多测试项目中的表现甚至不如P3和ATHLON,这其中当然有一定的客观原因,如果INTEL不能有效改变这种局面的话,将会给P4的推广造成很大的影响。
|