核心的优化
AMD在优化雷鸟Thunderbird处理器时学到了很多东西,如今又都运用到在优化新Athlon 4核心上。
我们知道任何一个处理器含有大量不同类型的晶体管,如雷鸟就拥有三千七百万个不同种类的晶体管。但由于雷鸟是AMD第一个采用片内集成二级缓存的处理器,如此复杂的工程不可避免的存在很多问题,其中最重要的就是发热量和能耗的问题。在研制Athlon 4的时候,优化这些晶体管就成了首要的任务,不过AMD取得的成绩也是惊人的,Athlon 4核心比雷鸟处理器增加了五十万个晶体管,可是在相同的时钟频率下,电能的消耗却比雷鸟处理器减少了20%。Athlon 4的核心面积也没有增加很多,仅仅从雷鸟的120平方毫米增加到128平方毫米。
针对Athlon 4的优化工作还包括对处理器核心布局的修改,这就是造成Athlon 4核心和雷鸟核心外观上不同的原因。这样的改变并不仅仅是表面的,它能明显的减少能耗,而且还能提高性能。不过Athlon 4并没有像以前传言的那样改进它的分支预测单元。
缓存的改进
Athlon 4一个非常重要的改进就是增加了翻译后备缓冲区(Translation Lookaside Buffer,TLB)入口的个数。我们都知道处理器通常拥有两种缓存,分别是一级缓存(L1)和二级缓存(L2)。这些缓存是用来存储常用数据的,但是还有另一种类型的缓存:翻译后备缓冲区,简称为TLB,它的作用是将真实内存地址翻译成缓存中的虚拟地址,CPU在缓存中和内存中交换数据的时候就需要依赖TLB来转换两者之间的地址。因此,TLB必须十分精确,准确性通常需要达到99%,这也就是TLB的命中率。如果TLB命中率不高,CPU就无法在TLB中找到需要的地址,这对于性能的影响是非常巨大的。因为CPU一旦找不到一个地址,它就会花3个时钟循环来解决这个问题,而如果可以直接在TLB中找到这个地址,处理器就只需要花1个时钟循环,节约了两倍的时间。所以你可以想象一旦TLB的精确性下降,处理器必须要浪费大量时钟频率来挽救,最终必然导致电脑性能急剧下降。
Athlon 4增加了一级缓存TLB入口的数目,因此也必然增加了Athlon 4的TLB命中率。雷鸟核心一级缓存的TLB入口数目为:指令缓存24个,数据缓存32个,而相应的Pentium III为:指令缓存TLB入口为32个,数据缓存为72个。但不幸的是,我们并不知道Athlon 4核心TLB入口增加后的确切数字,不过相信会超过Pentium III的水平。但即使TLB入口数目大幅增加,Athlon 4实际的性能提升并不会非常明显,因此我们也不必太在意TLB入口的数目。
数据预读(Data Prefetch)
Athlon 4核心的一级缓存和二级缓存的容量和类型都没有改变,同样Athlon 4拥有一个两路互连式64KB一级指令缓存和64KB一级数据缓存。而二级缓存则是16路互连式独占缓存,因此一级缓存中的数据不会复制到二级缓存中,这也就是为什么AMD称Athlon系列拥有384KB片内缓存的原因。虽然缓存的容量和类型没有改变,但是Athlon 4在缓存的基础上增加了一个自动数据预读机制。
这就类似于Pentium 4采用的硬件预读构架,Athlon 4数据预读功能也可以预测那些数据需要从主内存复制到缓存中,这个过程会明显增加FSB和内存带宽的利用率,同时在FSB和内存带宽增大的时候,这样的作用会更加明显。因此,Athlon 4平台采用DDR SDRAM内存的效果肯定要比雷鸟+DDR SDRAM效果好。
SSE
提起SSE,恐怕没有多少人不知道吧,这可是Intel Pentium III的看家法宝,如今Pentium 4已经升级为SSE 2。而当初旧Athlon发布的时候,它增加了19条全新的指令,AMD称之为3Dnow!。这些指令都是采用单指令多数据(SIMD)结构,而它们仅仅只能算是SSE指令集的一部分。现在AMD在Athlon 4中增加了52条新的指令,成为3Dnow! Professional。而这些新增加的指令实际上和两年前Intel推出的SSE如出一辙。
这些指令集又有什么作用呢?在实际应用中,单指令多数据(SIMD)指令集能在一条指令中运用多个数据,使它能方便的应用于各种3D游戏中。例如3D处理中常用到的将数字空间坐标系转化为向量空间的坐标系,在这样的转化中需要大量的反复的数学运算,包括加、减、乘、除。但是如果使用SIMD指令集进行这样的转化,就会节省大量的时间。
虽然,增加SSE指令不能使Athlon 4是性能得到飞跃,但是在那些针对SSE指令优化的程序中,Athlon 4将会和Intel的处理器处于同一起点,以后的评测中人们就不会看到某种软件“专门为SSE优化”的情况了。虽然目前Athlon 4还仅仅只兼容老版本的SSE指令集,但根据最新的计划表明,AMD的64位处理器x86-64将会采用完整的SSE 2指令集,
低电压、PoweNow!技术和温度探测
由于Athlon 4一开始就瞄准了笔记本电脑市场,因此AMD必须针对笔记本电脑处理器的特点对它进行改进。首先,最重要的就是Athlon 4工作电压的下降,目前1GHz Athlon 4仅需要1.4v电压,而雷鸟1GHz则需要1.75v。Athlon 4之所以能在如此低的电压下工作,主要原因是我们前面提到过的晶体管和布局的改进。
Athlon 4同样也具有AMD的PowerNow!技术。和Intel的SpeedStep技术一样,AMD PowerNow!技术允许处理器根据工作情况动态的改变自身的时钟频率和电压。比如,仅仅在运行Word的时候,1GHz的Athlon 4处理器可能会自动降频到500MHz,同时电压也降低到1.2v,但是一旦你启动了播放DVD的软件,处理器就会自动升高主频。
Athlon 4采用的PowerNow!技术和K6-II+、K6-III+时代的一样,并没有什么改进。但是唯一的不同是,那时的处理器速度还不快,很多时候处理器都必须工作在较高的频率上,因此PowerNow!技术的优势并不明显。而现在的Athlon 4 1GHz却在较低频率上也能保证电脑性能,就更能体现PowerNow!技术的优势。PowerNow!技术将500MHz到最高频率之间分为32个等级,不同的情况可以采用不同的等级。
显然,PowerNow!在桌面电脑上的用途并不大,但是在笔记本电脑上却非常有用,不过运用PowerNow!技术必须要同时得到芯片组和BIOS的支持。
AMD Athlon 4最后一个特征就是芯片内部集成了温度探测器,这为防止处理器因为温度过高而损坏的时候很有效。Pentium 4曾经因为拥有芯片内部的温度探测器而受到不少批评,但是这项功能却在多种情况下防止处理器被烧毁,如安装了错误的散热器、CPU风扇停转的等等。芯片内部集成的温度探测器同样也需要主板的支持,目前常用的VIA 686系列南桥芯片支持Athlon 4的这项功能。
|