——前言 今年是充满反击气氛的一年,CPU方面有Intel人气正不断上升的P4[反击AMD的K7处理器]、主板芯片组方面就有威盛的KT266A[反击矽统的SIS735 DDR芯片组]...。而在图形芯片方面,由于3dfx已经不复存在,Matrox又没能拿出具杀伤力的产品,因此今年最让人关注的无疑是NVIDIA与ATi两大图形芯片巨头之间的对抗了。
在今年2月份的英特尔开发者论坛召开期间,NVIDIA宣布推出采用NV20架构的GeForce3芯片,这枚采用了许多先进的技术图形芯片一问世,就已经成为当时最快的游戏卡,在不少测试中比上一代的产品领先一大段距离。不过比较遗憾的就是,在一段时期里,GeForce3的价格维持在2500元以上的水平,加上支持DirectX 8.0的软件还并不多[DirectX 8.0基本上就是为GeForce3度身订制的],让不少用户还不能尝试GeForce3的真正魅力。
在GeForce 3问世后,大家的目光也开始关注ATi代号为R200的下一代图形芯片。ATi的行销做的的确不错,连续数个月里都在发布一些R200的相关技术资料,希望在正式发布前,让大家对其充满期望,各媒体也是赞誉有加。加上ATi在过往一直都扮演弱者的角色,经过连场的宣传下,R200身上扛着的翻身重担和期望更是与日俱增。
8月14日,ATi的RADEON8500[200]首次登场,两家目前最著名的硬件网站——Toms和Anand也发表了相关的测试报告。不过很显然的是,当时的ATi准备并不充分,出现了Tom's Hardware和Anandtech的测试有较大出入的情况,矛盾的地方比比皆是。最有趣的是,NVIDIA在Radeon8500发布前,向上述两家网站提供了版本号为20.80的雷管4[即现在雷管XP的前身]驱动程序,原本由于规格原因,性能应该和RADEON8500存在较大差距的GeForce3居然在Q3和3D Mark2001中唰的一下提升了10%~20%的性能,给NVIDIA的用户带来了一个相当大的惊喜。
在我们进行的雷管XP实际测试中,发现这个新版本的驱动的确带来了可观的性能提升,在很多情况下,其提升效果对于一片使用12.41版驱动的GeForce3来说就必须超频才能获得,不过在那篇测试报告中,我们没有就雷管XP的细节进行阐述,当然,这点小小的失误将在本文得到补偿啦:)。
但是其实NVIDIA心里也清楚,光靠GeForce 3 + 雷管XP驱动对抗ATi是不行,更何况那是在ATi准备不充分的情况下才偷袭得手的。ATi的驱动研发能力也在提升中,如果NVIDIA要在性能上和ATi 抗衡的话,就必须推出新的产品。性能上的抗衡还是不够的,因为ATi已经开放RADEON8500的授权,授权生产厂商也可以生产RADEON8500显卡,毫无疑问,这些OEM Radeon8500的价格必然比ATi出品的要便宜[某些厂商已经报出了190美金的价格]。因此,如果NVIDIA要保持优势的话,新产品的性能/价格比就必须比竞争对手更具吸引力,这已经不再仅仅是形象上的对抗措施了,而是切实关系到NVIDIA未来半年能否保持目前发展势头的重要举措之一。
在今天,NVIDIA公司终于正式发布了其对抗Radeon8500/Radeon7500的三款新产品:GeForce3 Ti500、GeForce3 Ti200以及GeForce2 Ti。这三款产品和他们的前辈相比,有什么不同和改进的地方呢?性能的表现将会如何?和ATi的产品相比,有什么优胜之处呢?OK,马上就让我们看看Ti的力量吧!
NVIDIA的三剑客
简单地说,GeForce3 Ti500是2月份发布的GeForce3的高频版本,而GeForce3 Ti则是GeForce3的低价版本: GeForce3 Ti500:
GeForce3 Ti500是目前NVIDIA最快的GPU,采用3.5纳秒的DDR显存,128bit内存总线接口,内核速率为240MHz。
NVIDIA GeForce3 Ti500 示范板,请留意VGA旁的电路
从另一个角度来欣赏
从外观上看的话,GeForce3 Ti500公版和目前市场销售的GeForce3是非常相似的,不过如果仔细看的话,可以发现Ti500的布线已经经过修订。主要改动的地方主要包括了正面VGA输出旁的供电模块经过了精简以降低成本,而在背面的电路也经过了一些移位。事实上,这些还只是我们测试的NVIDIA GeForce3 Ti500示范版的变化而已,如果我们再看看华硕公司的GeForce3 Ti500豪华版的话,就会发现变化更加大:
AGP-V8200T5 Deluxe,图片由华硕公司提供,仅供参考
ELSA公司也给我们发来了该公司的GeForce3 Ti500——ELSA GLADIAC 921 DVI的包装图片,不过图中的那片卡似乎是GLadiac920的黑金版而已,这一点大家请注意:
虽然ELSA说这是GLADIAC 921 DVI的图片 不过看上去更加像是GeForce3的920 DVI黑金版
GeForce3 Ti500的内核为240MHz,4条渲染流水线,每条流水线有2个支持循环贴图的纹理处理单元,在读取一次纹理后,可以进行4重贴图,这也就是所谓的单Pass 4重贴图了。
虽然GeForce3 Ti500和GeForce3使用同样的架构,也就是说两者是具备同样的功能的,但是NVIDIA在随Ti500/Ti200的资料中,特别提到了两个特性:NVIDIA 3D Texture[NVIDIA 3D纹理]和NVIDIA Shadow Buffer[NVIDIA 阴影缓冲]。
——NVIDIA 3D Texture[3D纹理/材质]
目前最普遍应用的纹理是类似256X256这样的2D纹理,而3D Texture[3D纹理]就是指具备三维坐标的纹理,描述方式是256X256X256的样子,较普通的2D纹理增加了一个“深度信息”。其实最早在游戏卡上实现3D Texture游戏卡上实现的最早是ATi的R100/Rage6C——RADEON,很遗憾的是,Radeon的3D Texture由于不支持mip-Mapping,实际的执行效果令人失望,没有什么实用意义。
3D Texture虽然也出现在GeForce3的技术清单中,但是真正的实现确是在雷管XP驱动程序下获得的。在安装了雷管XP驱动以后,OpenGLI ICD驱动版本信息就显示为1.3.0,和雷管III 12.41的1.2.2版OpenGL ICD相比,对OpenGL功能的支持以下的区别:
NVIDIA在介绍其3D Texture[3D纹理]技术的时候,主要突出了以下几点内容:
1、首次实现了3D Texture的4线性的纹理过滤。由于3D Texture比2D Texture增加了一维信息,因此光是使用传统2D纹理贴图时的3线性纹理过滤是不够的。4线性纹理过滤其实相当于对两块3D纹理进行三线性过滤,能够提供真实的的深度感和连贯感,因此,开发人员能够按照其设计意念充分地模拟出各种物料[木头、大理石等]剖开后的效果。
2、支持3D纹理压缩技术。在没有采用压缩技术的情况下,一块256X256X256大小、32bit精度的3D纹理所占用的空间是64MB,如果是512X512X512、32bit精度的3D纹理,其占用的空间更是高达512MB。NVIDIA的nfiniteFX引擎支持4:1甚至8:1的3D纹理压缩,这意味着一张256X256X256的3D纹理如果是经过了压缩以后,其大小就只有8MB了,虽然较普通的2D纹理来说还是非常巨大的,但是却着实让3D纹理变得可行了。
3、nfiniteFX引擎支持3D MIP-mapping贴图。在我们对多边形进行纹理贴图的时候,通常都很难找到一个尺寸和最终生成的多边形的大小刚好吻合的纹理,为了解决这个问题,绝大多数的图形应用程序大都会包含了匹配纹理在不同分辨率下的版本。以传统2D纹理举例,如果原纹理是256x256的话,应用程序的纹理库里可能还会包含64X64、128X128等较低分辨率的同样内容的纹理,这些不同分辨率的纹理也就是所谓的mip map了,使用mip map进行贴图的话,就称之为mip-mapping;当选择了两张分辨率不同但是内容相同的纹理在相应的位置取样后,为了消除纹理接缝、低分辨率mip map的模糊感,3D程序/3D引擎就会对两张2D纹理进行过滤。具备2D Mip mapping和3D纹理贴图能力的3D图形芯片并不一定具备3D MIP-mapping能力,NVIDIA的nfiniteFX引擎则可以实现3D纹理贴图的3D Mip-mapinng,不仅能够提高3D纹理贴图的速度,而且在结合4线性纹理过滤的情况下,提供最佳的3D纹理贴图效果。
4、NVIDIA的nfiniteFX引擎至少实现4种以下的效果:
Volumetric Fog:利用3D纹理生成一团烟雾的效果,具有深度的效果,这也是3D纹理目前在游戏开发中最被经常使用的效果。
Imposters:类似Point Sprit,主要是为了简省使用多个相同模型时需要进行的光照等复杂而重复处理,不过其缺点也和point sprit一样,其尺寸是固定的。
Function Lookup:nfiniteFX引擎的3D纹理除了纹理数据以外,还可以存放各种类型的信息,例如“镜头”的距离、焦距、f-指数等,综合使用这些参数后,nfiniteFX引擎就可以使用3D纹理营造出视野景深的效果。
Procedural Textures and Noise:nfiniteFX引擎的3D纹理可以用于生成程序性的效果和杂讯,例如煤气爆炸、光照、血浆等效果。
——NVIDIA Shadow Buffer[阴影缓冲]
NVIDIA Shadow Buffer是GF3 Ti GPU使用创新的方式来生成光打在复杂对象后在场景中形成的平滑阴影效果,除了需要增加略干新的硬件单元以外,还需要传统的纹理贴图技术共同参与。
为shadow buffer而新增加的特别硬件功能包括了:
指定一块图形内存作为阴影缓冲; 生成shadow map到shadow buffer中; 从shadow buffer中读取shadow map进行数学运算,看看指定像素是否需要进行完全的、部分的或者不需要阴影运算。
实现阴影的技术相当多,例如从最简单的对象直接投射到较精确的stencil buffer[NVIDIA在TNT时代就具备stencil buffer]等。ATi的RADEON也有自己的阴影缓冲技术,被称之为Priority buffer,但是似乎并没有获得广泛的支持。
和使用stencil buffer来生成阴影的做法相比,阴影缓冲可以实现更加复杂、平滑的效果,而且在使用多重贴图的时候,阴影缓冲的性能会更加快。
NVIDIA使用在这张最终幻想电影中实时渲染画面来说明了阴影缓冲的效果。博士的头部阴影就是根据阴影/光照所占的百分比,使用高达256级层次的专利阴影过滤算法来达成的。
NVIDIA在9月10日发布的雷管XP驱动21.81并不能自动识别出GeForce3 Ti500,但是可以透过强制选择GeForce3来安装,安装后的驱动程序面板也可以看到GeForce3 Ti500的信息。NVIDIA给了我们版本号为21.85的雷管XP驱动,该版本的主要改进之处就是可以自动识别Ti系列显示芯片,例如GeForce3 Ti500、Ti200和GeForce2 Ti。 GeForce Ti200: 我们测试的GeForce3 Ti200示范版使用4纳秒的DDR显存,总线宽度为128bit,内核为175MHz。
使用GeForce3 Ti500是和RADEON8500针锋相对的产品,而GeForce3 Ti200的定位就比较乖巧:价格比GeForce3要便宜,但是却具备GeForce3的全部特性[例如DX 8.1、OGL 1.3、HRAA等特性的支持]。很显然,价格适宜、功能齐全的GeForce3 Ti200将会协同GeForce3 Ti500和GeForce2 Ti分别夹击ATi的RADEON8500以及RADEON7500,成为最有竞争力的3D游戏卡。
和去年推出GeForce2 MX不同的是,这次的GeForce3 Ti200只是在频率上作了调整,整体的架构[例如流水线数量、内存总线位宽等]就依然保持NV20的原样。功能上丝毫没有缩水,但是也没有增加类似双头输出这样的功能——因为它还是基于NV20架构的亚。
从布线上来看的话,GeForce3 Ti200的变动比Ti500要大。由于工作频率降低了,内存上的散热片已经去掉了,主芯片上的散热器也换成了类似ELSA MX400那样的被动式散热器。PCB上的元件也做了较大的调整,有助于降低成本,提高竞争力。
GeForce2 Ti:
实际的GeForce2 Ti使用和GeForce2 Ultra一样的带金属层封装
GeForce2 Ti是非常具弹性的产品,从规格上来看的话,GeForce2 Ti芯片本身就是GeFoce2 Ultra,只不过配备的内存规格较GeForce2 Ultra低了一点——为200MHz DDR。
从外观上来看的话,GeForce2 Ti示范版的PCB似乎更加大,而且较多地使用了直立式的电容。由于主芯片的频率达到了250MHz,因此GeForce2 Ti的主芯片也动用了GeForce2 Ultra的散热器。NVIDIA推出GeForce2 Ti的目的是形成GeForce3 Ti200-GeForce2 Ti-GeForce2 Pro-GeForce2 MX400这样一条连贯的中低端产品线,达到见缝插针,满足不同用户的需求。
性能测试
Quake3 ARENA 1.17 demo001
3D Mark2001 1.0 Pro
DroneZmark:
SEPC Viewperf 6.1.2
全屏幕抗失真测试
注:GF2 Pro/GF2 Ti不支持Quincunx Antialiasing,因此不适应该项目测试
性能测试评述
Quake Arena 1.17 demo001:GeForce3 Ti500无疑是Quake3 Arena中的冠军,在HQ模式下,领先GeForce3大约10到15个fps。GeForce3 Ti200的表现也相当的令人满意,HQ 1024X768模式下只是比GeForce3慢3个fps,考虑到其价格的话,这是非常不错的成绩。GeForce2 Ti受制于200MHz DDR的内存带宽,性能表现只是比GeForce2 Pro略好一点。
3D Mark2001 1.0:GeForce3 Ti500的成绩也相当亮丽,领先GeForce3 10%~15%;GeForce3 Ti200略逊色于GeForce3,但是和GeForce2 Pro/Ti相比的话,性能差距实在是不可同日而语的,作为一块攻打中高档主流市场的新产品来说,有了一个相当不错的开头。
DroneZmark:在DroneZmark测试中,我们尽可能地打开了所有的画面品质开关。毫无疑问,GeForce2 Pro、GeForce2 Ti由于缺乏Vertex Program等的可编程特性的支持,较采用NV20架构的GeForce3 Ti系列和GeForce3有相当大的差距,不过DroneZmark还提供了针对GeForce2 Pro/Ulrtra的选项,可以让购买了GeForce2 Pro、GeForce2 Ti的玩家依然可以顺畅的运行游戏。我们特意给出了打开/关闭3D Texture的测试数据,从数据来看打开前后的差距并不大,因此DroneZmark显然并没有完全适用3D Texture,估计只是一些爆炸、光照的特效应用3D Texture而已。GeForce3家族在这个游戏中都有非常流畅的执行速度。
SPEC Viewperf 6.1.2:Viewperf 6.1.2使用固定的OpenGL流水线,并不能发挥GeForce3的可编程特性,因此内核频率只有175MHz的GeForce3 Ti200在AWadvs-04中只获得了63.47分,但是由于NV20默认打开了硬件剖切功能,因此在MedMCAD-01测试中获得了比GeForce2 Ti高接近30%的成绩。GeForce2 Ti由于具备250MHz的内核速率,因此在这个测试中的表现也算不错。
全屏幕抗失真测试:GeForce3 Ti500的FSAA 4X的得分相当耀人,达到了77.1fps,虽然这个分辨率离Quake3高手要求的基本帧速率还有相当一段距离,但是已经基本可以满足不跳帧的要求了,至于FSAA 2X的117.2fps更是意味着首次在Q3 HQ 1024X768下突破了100fps的性能瓶颈,不知道ATi Radeon8500的自适应抗失真技术[从目前的资料来看,ATi Radeon8500的全屏幕抗失真技术依然属于supersampling,较GF3 Ti500的Mulitsampling效能要低不少]能否到这个显示速率呢?
总结
我们本想用RADEON8500一起来比较的,但是很遗憾的是,ATi中国办事处表示目前的样品都还在OEM厂商那里做测试,暂时没有供媒体测试的样品,部分准备推出RADEON8500 第三方版的厂商[例如七彩虹等]则表示要国庆后才有。
那么GeForce3 Ti500到底是否具备维持、巩固NVIDIA领先的市场地位呢?我们觉得这主要有几个因素:
1、价格。RADEON8500 第三方版的最新报价只有190美金,而GeForce3 Ti500的功能其实是要逊色于RADEON8500的,如果不在价格上下文章的话,市场可能会倾向于RADEON8500。问题是,RADEON8500为什么可以做到190美金的价格呢?是否真的像ATi的工作人员所说的产量比NVIDIA高而导致的呢?显然不是...ATi更加像在不惜一切代价,夺回市场份额,NVIDIA肯定会对此作出强烈的反应,结果到底会如何实在是很难说了?。
2、软件支持。在这点上,NVIDIA的GeForce3具有目前最多游戏厂商的支持,加上NVIDIA优秀的驱动程序研发团队不时带来的惊喜,相信ATi还需要一段时间才能跟上。
3、产品线的完善。单靠GeForce3 Ti500以及目前的产品来抗衡ATi似乎还不够,要知道,NVIDIA目前虽然有非常丰富的产品系列,但是在MX200-MX400、GF2 Ti-GF3 Ti200之间其实还有不少的文章可做,未来能否有新产品填补这些空白也是非常值得关注的。
GeForce3 Ti200是相当具吸引力的产品,虽然我们目前还不是很清楚厂商的最终报价[ATi最近的举措其实打乱了NVIDIA高端产品的报价体系],但是估计1500元~1700元之间完成交易还是有很大可能的。
GeForce2 Ti的定位虽然有点尴尬,但是如果NVIDIA能够在GF2 Pro相当的价位提供GF2 Ti芯片的话,估计还是有一定吸引力的。
|