最近几个月,处理器的核心速度从500 ~ 800 MHz暴涨到1GHZ以上,缓存也从半速的512KB外部Cache,变为256KB的全速片内缓存,而且我们也目睹了Intel从极力推荐RAMBUS内存新标准到反对的戏剧性转变。
众所周知,多少年来莫尔定律一直控制着计算机硬件的飞速发展,但处理器的1GHZ似乎是一道不可逾越的障碍。让CPU在室温下跑得这么快,不仅仅需要缩小芯片大小、集成更多的元件、修订处理器微代码,还有其它众多的工作要做!
尽管在去年就出现过1GHZ的处理器,例如有家公司曾用水冷系统把CPU超到1GHZ,但这些1GHZ的处理器,总的来说还都是在超频:都是用水冷系统来改善CPU的运行环境,确切地说是降低CPU的温度,把低于1GHZ的CPU超到1GHZ的。尽管用水冷系统超频CPU,确实是一种在今天提前享受明天高性能的好办法,但这种方法不适合大批量生产,而且价格昂贵,一般人买不起,另外该系统的安装也过于精致复杂,一般商家安装不好,所以这种冷却系统不适合作为桌面PC或者通过零售店组装出售。
提高核心速度
然而,作为一种技术进步,我们总是试图从当前设计出发去寻找提高CPU核心速度的新办法,例如仔细检查和优化那些阻碍CPU提速的部件,其中最常见的技术就是缩小CPU芯片,通过缩小芯片为CPU提速。当芯片缩小以后,CPU核心速度就能提得更高,究其原因是因为芯片内每个晶体管的大小缩小了,晶体管间互连路径的长度和宽度也大大缩小了,这样就使得晶体管间数据传播和交换的时间大幅度减少,通过缩小芯片的尺寸,可以造出比前代要快得多的CPU。
芯片缩小技术的另一个重要优点就是CPU所需的电压也被降低。由于所有的晶体管和晶体管间互连路径都被缩小,使得驱动它们所需要的功率也大幅度减小,电压因此被降低。电压的降低也意味着功耗的降低,功耗的降低总是件好事情,因为功耗太高会限制CPU速度的提高,功耗太高,会产生过多的热量,使CPU不能在安全环境下运行,如果发热过多还会造成CPU烧毁的惨剧。
Cache的考虑
芯片缩小技术是保留老CPU设计方案、让CPU跑得更快的好办法,但是这种方法对逻辑设计、制造FPU和存储控制寄存器就失灵了。现代的CPU都包含Cache,用来存放缓冲数据和经常使用的代码,Cache一般位于片外或者内核中,如果要提高CPU核心速度,Cache的优化也是需要重视的地方。
处理器的Cache存储器通常有L1Cache和L2Cache所组成。由于L1Cache位于处理器的内核中,当CPU进行各种各样的应用,例如数据读取、数据移位和数据循环时,L1Cache的延时就很短、与CPU通讯的速度也很快,L1Cache一般只存储少量的数据。L2Cache不仅可以做到芯片外,还可以做到芯片内,它可以存放更多的数据,通常是L1Cache的几倍,常见的是L1Cache的4~16倍之间。
把L2Cache做到芯片内、以全速工作的最大好处是能让L1Cache和L2Cache并行运行,同时存取其中的数据,减少了CPU的等待时间。这是改进缓存性能的一个好方法,但是也有一些不利因素,其一就是用缩小内核来提高核心速度,也会引起内核中L1 Cache核心速度的降低。
如果我们观察AMD750和800 MHz型号的Athlon,就会发现,其外部L2Cache运行在至少1/2的核心速度上。INTEL的Pentium III有256KB的全速L2Cache,由于L2Cache被做在芯片内,制造这种CPU的过程同以前一样,只不过新采用了0.18微米工艺,在以前0.25和0.35制造工艺时期,Pentium的L2Cache是放在芯片外的。全速片内L2Cache的新奔腾III比老奔III会有更高的核心速度。
系统性能
如果1GHZ的CPU工作时需要经常等待数据,1GHZ的CPU速度也没有多大用处。因此,对于1GHZ的系统,CPU应该能快速读写内存中数据,让CPU能处理更多的数据,发挥1GHZ的高速度,所以对1GHZ,系统最大的瓶颈是负责数据存储和检索的内存子系统,如果处理器有2GB/S内存带宽的处理能力,但内存带宽仅400MB/S,它就会常常等待从内存中传来数据,不能有效地发挥CPU的高性能。
INTEL确实很早就看到了这个问题,所以极力推荐Rambus。Rambus拥有800 Mb/s的内存带宽,大约是SDRAM的两倍,不幸的是,Rambus似乎被许多阻碍它成为标准的问题所困扰,例如生产线问题,一旦转产Rambus,原来制造SDRAM的生产线就要全部作废,这对内存制造商的打击太大,所以内存制造商不愿意转产Rambus。AMD以采用Digital的EV-6总线开始,走了一条完全不同的道路。Athlon处理器不是在100或133MHZ上运行,而是在200MHZ上运行,因此它比同档次的Intel Pentium III要有更宽的内存带宽,而且更重要的是,EV-6总线具有很大的伸缩性,能够很轻松地使用SDRAM、VSDRAM-甚至是Rambus内存。从性能发展的前途来讲,内存带宽是最大的性能指标之一,因为CPU从主存储器中读取大部分的代码,然后执行,大约80%的处理器周期,是用来处理这些数据的。分析当前的处理器和内存结构,其带宽不足,也严重阻碍了CPU向1GHZ以上冲刺。
结语
从以上可以看出,制造1GHZ以上的CPU,我们需要做如下的挑战性工作:
缩小芯片尺寸:以便把速度提到1GHZ以上。我们必须转向使用0.18或者0.13微米制造工艺,INTEL和AMD在过去的几个月中都已经做过了。
片内集成L2cache:加快处理器cache速度和延时的唯一方法是把cache集成到处理器芯片内,把处理器内核和cache集成在一起。
内存带宽:由于1GHZ的处理器采用2GB/S的存储带宽,内存子系统的速度必须与这种高速CPU相匹配,至少也要有800 Mb/s的内存带宽。
尽管现在1GHZ以上的处理器已经开始出售,但这种CPU的生产量太少,价格太贵,这些都阻碍了它们向零售市场的流通,因此价格和技术一样也是一种挑战。虽然今天可以买到1GHZ以上的CPU,但是比那些不用冷却系统就不能超频到1GHZ的装置要昂贵的多。(lcal)
|