在主板厂商的吹捧声中,DDR SDRAM时代仿佛已经来临。当初厂商们为DDR SDRAM平台许诺的种种优势,在现有的KT266、AMD760、SiS735芯片组下丝毫未能体现,纵使DDR SDRAM的价格日趋走低,但对比起现有非常成熟的SDRAM平台,那稍微增加的性能优势又不足以让人们忘却DDR SDRAM平台仍然持有的许多缺陷。倒底是芯片组的错?还是DDR SDRAM系统性能的确如此?现有的平台条件根本证明不了什么,然而在本次台湾Computex 2001展示会上,nVIDIA给我们上了生动的一课,也带来了一位主板芯片组市场上的新伙伴,那就是nVIDIA nFORCE芯片组。
nVIDIA nFORCE主板芯片组 nVIDIA,一个熟悉的名字,人们熟悉它,多是因为它在显卡市场叱咤风云、力拔山河的表现,从当初收购3dfx,到现在和Microsoft合作生产XBOX游戏机,无一不显示出它在显卡研发方面雄厚的技术实力。但这次它的举动却让人摸不着头脑,一个显卡厂商怎么会推出主板芯片组来了? 其实这是事出有因的,须知在XBOX中,除了显卡部分,其主板芯片组和音频芯片也都是由nVIDIA一手包办的,XBOX本身就是一台专业(用于游戏)的个人电脑,也就是说,在设计XBOX之余,nVIDIA已经掌握了PC平台关键的技术——主板芯片组的设计。如果这个能力光用在XBOX的设计上,那就真的有些浪费了。nVIDIA把目光描向了庞大的OEM市场,如果它能提供一款整合有高速图形芯片和多功能音频芯片的高性能主板芯片组,那么无疑就能在这市场上占有一席之地,于是,nFORCE就这样产生了。
nFORCE的两个组成部分,IGP和MCP
有别于传统的南北桥设计,虽然nFORCE也是把芯片组分成两个部分,然而它们却和以往的南北桥有着很大程度上的不同,现在它们都被称之为了“处理器”。 IGP(Integrated Graphics Processor,整合的图形处理器) 位置与传统芯片组中北桥芯片相似的是被称之为IGP的芯片,所谓的IGP,其实就是内建了图形电路的芯片,那它和其它同样整合了图形电路的北桥芯片又有什么不同呢?它为什么被称之为“处理器”?现在就让我们来看看IGP的构造。
从左面nFORCE的构造图中我们可以看到,所谓的IGP芯片,其实在功能上被分为4个部分,它们分别是主管内存存/取的TwinBank Memory Architecture、负责与CPU通信的DASP、内建的图形单元GeForce 2 GPU和负责与MCP通信的HyperTransport部分。现在就让我们来看看,这四个部分组成的芯片为什么就被叫做“处理器”。
TwinBank Memory Architesture
我们看到图中,与内存子系统相连的,就是被命名为TwinBank Memory Architecture的内存控制器,它是nFORCE IGP芯片的心脏,为了获得最大的系统内存带宽,TMA在IGP中担任着极为重要的角色。
左图就是TMA内存控制器的原理图,所谓的TMA,其实就是一个类似于GeForce 3中Crossbar(交错式)的内存存取架构,通过把系统内存分为两个部分,各自都为64位,TMA能一次存/取128位的数据,并且,由于负责内存存/取操作的是两个独立的控制器,MC0和MC1,因此TMA相对于传统单通道DDR SDRAM内存控制系统一个更为优越的地方在于,除了系统内存带宽提升了一倍,即2.1GB/sec×2=4.2GB/sec以后,还使系统内存存/取延迟大幅度降低,本来DDR SDRAM就比RDRAM的延迟要低,现在再加上与i850双通道RDRAM技术相匹敌的双通道DDR SDRAM系统,并且再度降低内存操作延迟时间,现在我们可以自豪的说,DDR SDRAM阵营有一个真正能超越RDRAM系统的内存体系了。
此外,TMA系统还拥有如下特性:
支持64及128位内存工作模式。 在64位模式的时候, DIMM可以由MC0或者MC1来存取。 在128位模式下,MC0(对应DIMM0)以及MC1对应(DIMM1/DIMM2)都将被使用。 两个内存控制器的功能是一样的,所有控制、时序参数的控制是可以独立调整的。 支持3.3V标准SDRAM以及2.5V DDR SDRAM。 支持133/100MHz DDR(266/200MHz)SDRAM或者133/100MHz SDRAM。 支持1至3条unbuffered式、非-ECC的内存条。 支持64、128、256、512Mb×8、×16的内存搭配方式。 支持64MB到1.5GB的系统内存容量 支持在不对等内存容量(例如:128MB + 256MB = 384MB)依然能够获得128位 TMA架构的优势。
其实nVIDIA之所以要构建这个拥有4.2GB/sec带宽的超级内存控制器其实是为了它整合在芯片组内部的GeForce2 GPU保持一定的性能而设计的,当然,我们可以想象,虽然系统带宽提升了,但由于整合在内部的GeForce2 GPU与系统使用相同的内存资源,因此,当你使用自带的图形功能时候,系统所能提供的内存带宽誓必有大部分被其占用,因此如果你想得到极致的DDR SDRAM系统带宽,你可能得选择以外接显卡的方式来获得。
DASP
除了让人拍案叫绝的TMA内存控制系统,在IGP内部还为性能优化整合了一个名为DASP的部分。 从左图我们可见,CPU与系统内存控制器有两个数据通道,一个是直接与MC连接,而另外一个则是经过DASP与其相连,在nVIDIA技术文挡中,DASP被称为"动态思路调整前置处理器",当然,我们抛开这个花俏的名字,看到,其实这个所谓的处理器只是一个带有动态执行预测功能的L3 Cache。根据目前的资料所显示,nVIDIA或许在IGP中固化了64K的L3 Cache,通过一个执行判定电路,把CPU即将需要的数据预先从系统主内存中读取到DASP的缓存中,这时候CPU如果要获得下一步操作的数据,直接从DASP中取就可以了,无论IGP使用了什么样的内存读取架构,外接的内存子系统无论如何也不可能有读取整合在IGP内部Cache中数据那么高效,根据nVIDIA的资料,DASP在某些情况下可以使CPU减少40%到60%的内存等待周期。 (上图是DASP功能打开/关闭的性能对比,我们可以看到,当DASP功能打开以后,系统在真实应用下的性能的确获得了大幅度的提高) IGP由于拥有了TMA和DASP功能,它现在完全有能力说自己是有始有终最厉害的DDR SDRAM芯片组,其实这话nVIDIA已经明地里暗地里都说了。 至于整合在IGP内部的Geofrce2 GPU部分,很遗憾,nVIDIA有鉴于系统内存带宽的关系,没有整合GeForce2 GTS级的GPU,而是采用了对显存带宽需求更低的GeForce2 MX级的GPU,估计也是为了不把系统性能拖得太低的缘故吧。但即便是如此,整合了GeForce2 MX电路的nFORCE主板也比i815好上许多许多。
根据目前的资料显示,nFORCE主板的图形3D性能大概和目前普通版的GeForce2 MX400级别的显卡差不多,对大概想要这样性能就足够的用户来说,你们可以剩下一笔不少的购置费了。
HyperTransport Link
最后来看看整合在IGP内部,而且在MCP内部也有的HyperTransport部分,它其实就是一个总线控制器,用来负责IGP和MCP间数据的传输。众所周知,随着现在外置PCI设备对系统总线带宽需求越来越大,那些ATA 100控制器,高速的网卡等都是非常占有带宽资源的,旧有的体系往往成为了性能上的瓶颈,也因此Intel推出了加速中心架构的概念,VIA也有了V-Link的体系,那么nVIDIA呢?没关系,只要和AMD拉好关系就有了。这个所谓的HyperTransport总线技术,其实就是前段时间由AMD推出的LDT(闪电式数据总线技术)。通过一个同步的,8位的高速数据总线,现在nFORCE在不增加更多引脚的同时,获得了IGP与MCP间800MB/sec的奇大数据带宽! (从上图可见现在的外置设备为了不降低它们的性能,系统起码要提供513MB/sec的总线带宽) 而现在HyperTransport提供了足足800MB/sec,相信能够满足两三年内任何的外设需要了。
好,现在让我们来看看nFORCE中另外一个重要的组成部分,MCP(多媒体和通讯处理器)
nFORCE的另一半 - MCP
大家再费点时间看看前面nFORCE架构的构成原理图,我们能够发现,所谓的MCP其实也是由几个功能单元所组成的,它们分别是负责与IGP通信的HyperTransport部分,负责通信设备的Complete Comm Suit和负责系统同步信号优化的Stream Thru部分,最后的就是负责系统音效果部分的APU逻辑单元。
HyperTransport我们这里就不多说了。现在让我们来看看负责通信和信号同步优化的单元。
Stream Thru
为了认识Stream Thru技术和传统的技术有什么不同,让我们先来看看旧有的体系 好,上图就是旧有的信号通路展示图,从图中我们可以看到,所有的外置设备,包括内置的网卡控制器,都必须经过整合在南桥芯片上的仲裁器,再通过一条非同步的数据总线,然后再通过北桥上的仲裁器,才能与系统内存,显示卡或CPU进行沟通。这样繁杂和非同步的通信架构势必在一定程度上影响了这些外置设备的性能发挥。 现在让我们来看看nFORCE的Stream Thru技术是怎么解决这个问题的。 OK,从图中我们可以看到,在位置相对于传统南桥的MCP中,取消了独立的仲裁器,而是把所有的外置设备包括自带的网卡控制器都同过一条高速的同步总线(HyperTransport Link)直接与IGP中的智能型仲裁器相连,并且,这个仲裁器还能根据数据流是否需要同步而分别合适的内存存取时间,根据nVIDIA的原话来说,就是 “IGP中HyperTransport控制器可以把同步以及非同步的数据申请递交到一个单步式智能仲裁器,这个单步式智能仲裁器可以确保为数据读取以及写入路径分配到内存等待时间和带宽,从而提升流式多媒体、数据包传输以及数据下载的效率。” 我们也不要理那么多技术上的东西,实际上,我也看不明白nVIDIA这句话是什么意思,然而可以知道的是,通过加快总线的带宽和只使用单步的仲裁器系统就能有效提升外部设备与CPU、内存、显卡的通信效率,根据nVIDIA的数据,一个最典型的优化例子,内部的10/100M网卡控制器就能在这种体系下获得15%左右的性能提升。
(左图是在Windows2000下,使用netiQ Chariot测试软件获得的官方测试数据,可见使用了Stream Thru技术后,系统的网络吞吐量的确获得了不小程度上的提升) 就我来说,我不把Stream Thru看成是一种提升系统性能的技术,而把它看做是一种更为有效的内部通信体系,事实上也的确如此,在Computex上,nVIDIA也学Intel那样,把Stream Thru技术改名为"Net Boost体系"。
现在让我们来看看nVIDIA在nFORCE中另一个最引以为豪,也是MCP中最重要的组成部分-APU(Audio Processor Unit)。
nVIDIA自己的音频处理器 - APU
过往的一些所谓的整合型芯片组,到了最后,其音频处理部分其实还是通过整合在主板上的音频芯片提供的,这些芯片大多是由创新未来公司所提供的。而nFORCE的出现重新定义了什么称得上是一款整合型芯片组,因为它在nFORCE的MCP芯片上,整合了一款完全由自己研发的音频处理芯片(电路),并把它命名为nVIDIA APU。
从上图我们可以看到,这个所谓的nVIDIA 音频处理器,按功能上由4个部分组成。 Setup Engine - 负责提供并设置其它三个处理单元所需要的数据和参数,所有的内存管理,定址和DMA控制也都是由它来负责的 Voice Processor - 这个单元提供许多定义好的DSP数位处理功能来把音效混合缓存中的音频数据进行特效处理 Global Processor - 这个单元是一个可编程的DSP处理器,它负责为数据加入各式各样的音响效果,并最终产生实际的音频信号输出到系统OS Dolby Interactive Content Encoder - 这个单元都是由一些可编程的DSP所组成,用来完成Dolby Digital(AC-3)的数据编码并通过SPDIF端口输出到带有Dolby Digital解码的功放中去。 此外,nVIDIA APU还是首枚完全支持DirectX8.0 音效API的音频处理器 DirectX 8.0提供了一系列新的音频函数来让音频硬件执行原来需要CPU介入才能完成的音效操作。 可下载的音频版本2(DLS2): 当用立体音频作为音源信号时,APU能够进行硬件级的信号压取和过滤 更有效率的使用DirectSound缓冲区 : 同过新定制的DirectSound缓冲区功能,从而以音频硬件的方式营造出更多 复杂的音响效果,例如是拥有实时交互效果的高质量音乐或音响效果。
第二代交互式3D音频定位效果 : 支持回响、阻塞和闭塞等声响特效 逐音频流混合——通过混合两个或多个音频流来得到丰富和复杂的音响效果 同时,nforce APU还是一个高速音频处理器,通过对DirectX8 API的支持,APU能够 把如下效果都通过音频处理器来执行,从而大大加快音频流的处理速度: HRTF音频定位算法 模拟原野的音响效果 宏效果 7波段的图形均衡器 上图是nFORCE APU和目前市售99-149美金的声卡所做的比较,可以发现nVIDIA APU在众多的方面都领先于这些比它昂贵数倍的声卡。
结 语
得益于GeForce2 GPU和nVIDIA APU,现在nFORCE真的算是一款整合型芯片组,也因为如此,你甚至只要在这些主板上插上个CPU,就能开始使用了。这样做也带来了一个明显的好处,在OEM市场上,拥有众多功能,并且性能上也耗不逊色的PC系统将能已更低的价格出现在市面上,这对于用户来说当然是一件好事,对于nVIDIA来说,此举必定能使nVIDIA一瞬间切入庞大的主板芯片组OEM领域,为nVIDIA开拓另一片广阔的商机。 另外,我们要注意的是,目前的nFORCE只是对应Athlon CPU的,由于其它厂商在主板芯片组领域都有插足,例如是Intel和VIA。因此在短时间内推出基于他们总线技术的芯片组或遇到许多的障碍,最明显的一个就是得不到总线协议的使用授权。而AMD则不在这个范围之列,虽然它自己也生产主板芯片组,但它生产这些芯片组的唯一目的是为了配合他们的CPU产业,现在能够在主板芯片组设计上的到nVIDIA的大力支持,可是一件求之不得的好事,也就不难怪AMD自己也没使用的好东西——LDT总线技术已经出现的nVIDIA的芯片组当中了。AMD+nVIDIA的超级联盟,Intel、VIA、SiS、ALi将会如何面对呢?相信这会是一个非常非常撬手的问题,能不能在短期内拿出与nFORCE一比高低的芯片组成为了这场大战入选的唯一门票。 根据目前的资料显示,我们唯一感到不很放心的就是nVIDIA MCP对外部设备的兼容程度,但随着许多一线主板大厂华硕、技嘉、升技、微星等公司的介入,相信这个问题将能迅速的得到解决,届时我们唯一所希望的,就是能尽快看到这款芯片组的主板面世,凭借着它,我们能够用Athlon组装一台真正能超越Intel平台的PC系统了。(邱峰)
|