尽管nVIDIA最新的GeForce 3图形芯片早已问世,但由于驱动程序的开发进度滞后使最初送测的GeForce 3显卡表现不尽人意。3个月过去了,驱动程序版本已从4.13.01.1101更新到4.13.01.1241。1241版本的驱动程序通过了微软的WHQL(Windows Hardware Quality Labs 视窗操作系统硬件质量实验室)认证,另外它也是第一个完全支持DirectX 8的驱动程序,支持GeForce 3的nFiniteFX引擎——完整的像素和顶点处理器……以上这些变化都驱使我们对GeForce 3显卡再次进行测试。
我还不太了解GeForce 3,请看:如今,个人电脑技术的发展速度已经远超乎人们想象,即使是狂热的硬件爱好者面对层出不穷的新产品、新技术也会有“措手不及”的感觉。在这里我想作一个大胆的推测:当大部分硬件爱好者开始熟悉英特尔最新的奔腾4处理器的时候,根本没空也来不及去多看一眼GeForce 3。对于还不太了解GeForce 3的读者,可按顺序读下去,我们将尽所能在有限的版面内向大家做细致介绍;如果你早已熟知GeForce 3的新特征,完全可以跳过这部分内容选择阅读自己更感兴趣的章节。
如你所看到或知道的,显示卡市场的竞争正趋于白热化,但真正的“竞争者”却为数不多。在GeForce 3面世以前,ATI Radeon被认为是nVIDIA GeForce 2系列最有力的竞争者,从技术的角度看这种分析有着确凿的依据:Radeon拥有微软的DX8中最先进的几项技术——关键帧插补(Keyframe Interpolation)、四矩阵蒙皮(Four-Matrix Skinning)、环境凹凸映射(Environment Bump Mapping)、特有的3D纹理和HyperZ等。这些技术在GeForce 2上可没有,nVIDIA后来承认他们的GeForce 2只支持微软DirectX 7的规格,同时也明确表示ATI Radeon距离完全的DX8执行硬件尚有很长的一段路要走。唇枪舌剑背后隐藏着杀机,终于2001年2月27日,nVIDIA在英特尔开发者论坛上发布了最新的GeForce 3,nVIDIA宣称这款新的内含无限效果图形处理器单元(nFiniteFX GPU)的图形芯片将改变人们的三维体验。我们首先要承认现在3D卡的消费者已经比以前成熟许多,由于在3dfx Voodoo之后罕有让人情不自禁惊呼“哇!”的产品加之nVIDIA重新定义的6个月的产品更新周期,许多迷恋3D娱乐的玩家或从事3D图形应用的专业人士终于发现实难“配合”3D的发展节奏,于是GeForce 3的发布并没有吸引人们更多关注也是情理之中的事。我们在因特网新闻组及BBS论坛上看到一部分玩家对此的反应是“告诉我GeForce 4和GeForce 5在哪里?”其实这不仅代表了大多数人对nVIDIA的回应,更是对高速发展的3D技术的一种漠然置之。
既然多边形生成率、像素填充率等指标已经无法再吸引人们的目光,nVIDIA想出了新的营销手段,这就是我们前文提到的无限效果图形处理器。测试结果告诉我们“作为目前最先进的图形处理器,GeForce 3不只是快一点,过不了多久它所支持的丰富特效及超前设计就会大派用场。” GeForce 3是第一款完全支持DX8的图形芯片,提供了许多令人“眼花缭乱”的新特性,搭配了已经改良的内存构架以及全新的FSAA(全屏抗锯齿)方式。实际上,GeForce 3为几乎所有的业内人士和与图形应用相关的开发商都留下了深刻印象,他们感慨道“如现实环境般的三维图像效果终于又向个人电脑系统靠近了一大步”。看起来唯一的负面影响来自于偏高的产品售价,最初有消息称成品显示卡的价格将是399美元,但现在我们很欣慰地看到在中国市场上残酷竞争决定的价格要远低于这一标准。
不必说,任何一个实验室或是狂热的游戏玩家都渴望及早“触摸”到GeForce 3显示卡,在国内最早见到的是技嘉(Gigabyte)GV-GF3000显卡,现在它正安静地躺在我们晶合实验室的测试平台上。
技嘉GV-GF3000产品规格(主要基于GeForce 3图形芯片核心技术) * 完全支持可编程特性的nFiniteFX引擎 * 能使性能获得大幅提升的光速内存构架(Lightspeed Memory Architecture) * 能实现高维曲面的曲面(Surface)引擎 * 可编程的顶点处理器(Vertex Shader) * 重新设计的执行程序 * 可编程的矩阵色彩蒙皮(Matrix Palette Skinning)特性 * 关键帧动画插补 * 支持DX8中最新的Morphing效果(通过改变3D模型上特定部分的顶点产生更光滑的表面) * 雾化效果(支持光线照射、仰角及非线性方式) * 透视效果(仿真鱼眼视觉、广阔视角、水折射效果) * 可编程的像素处理器(Pixel Shader) * 适用于产生每像素级精度的Phong方式光照 * Dot3方式凹凸映射(3种凹凸贴图方式其中的一种,也是相对而言最易实现的一种) * 环境凹凸映射(EMBM,第二种凹凸贴图方式) * 可用于编写程序时调用的纹理 * 每像素反射 * HRAA——高分辨率反锯齿效果 * 五点梅花式抗锯齿(Quincunx FSAA)方式 * 内建完整的硬件转换引擎 * 内建完整的硬件光照引擎 * DirectX和S3TC纹理压缩 * 双立方体环境映射能力 * 反射贴图 * 精确的即时环境反射 * 支持硬件加速即时演算的阴影 * 真实的反射凹凸映射 * Z轴纠正凹凸映射 * 在带有反射效果的凹凸贴图上实现Phong方式光照效果 * 高性能的2D渲染引擎 * 为32、24、16、15和8位颜色深度做优化 * 带有阿尔法通道的真彩硬件指针 * 多重缓冲(2倍、3倍和4倍)以产生更平滑的动画和视频率回放效果 * 高品质的HDTV(高清晰度电视)和DVD回放效果 * 高清晰度视频处理器支持HDTV和DVD的全屏、全帧速的视频回放 * 针对影像层的独立硬件色彩控制 * 硬件色彩转换(YUV 4:2:2和4:2:0) * 动态补偿 * 影像8:1缩放 * 每像素色彩调节 * 多视频窗口支持余割(CSC)和过滤效果 * DVD图像阿尔法混合合成
我们手头的这张显示卡采用A5版本的GPU核心(这也说明这是一张正式量产的显示卡),这有别于早期送测样品的A3版本。显示内存采用的是EliteMT 3.8nsDDR SDRAM芯片,实际上它的理论速度极限是260MHz(由于采用DDR技术即相当于520MHz)。nVIDIA为GeForce 3显示卡规定的频率分别是200MHz(核心频率)和460MHz(显存频率),而令我们吃惊的是技嘉送测的这张GF3000显示卡的核心频率与显存频率分别达到219.88MHz和508.29MHz!
另外,从显示卡外观看,量产版本与早期的A3版本的最明显区别(见上图)是采用了新的形状奇特、体积“庞大”的涡轮风扇,我们猜测这种“重量级”装置与前面提到的“超频”有着直接的联系。显示卡上没有提供TV-OUT接口,而是配备了更为实用的DVI(用于连接数字平板显示器)输出端口。
GeForce 3采用0.15微米工艺的GPU中包含了5700万个晶体管,这使它有能力承载更多功能强大的单元如新的无限效果引擎、光速内存构架以及五点梅花式高分辨率抗锯齿功能。nVIDIA透过nFiniteFX引擎以纯硬件方式支持DX8的顶点和像素处理器。关于GeForce 3新特性的细节,已有许多媒体报道过,这里不再赘述。尽管顶点和像素处理器可用CPU防真实现,但GeForce 3却以硬件方式做到了。这许多新特性使GeForce 3的T&L单元拥有比GeForce 2和Radeon的对应部分更强大的功能。我们据此猜测,游戏开发商曾向玩家们承诺过的由超标量多边形构成的三维人物或动画很快便会实现。
光速内存构架与nFiniteFX引擎一样也是GeForce 3众多新特性中最具重要意义的一项。GeForce 3的GPU时钟频率是200MHz,显存频率为230MHz(相当于460MHz),据此数值我们可以推算出它的内存带宽为460MHz(内存工作频率)×128bit(内存总线宽度)÷8(计算数据带宽时位与字节的换算)=7360MB/s,像素填充率为200MHz(图形芯片核心时钟频率,每1Hz表示1个渲染周期)×4(像素渲染管道数量,每1条像素渲染管道在每1周期内处理1个像素)=800MPixels/s,纹理单元填充率为800MPixels/s(像素填充率)×2(每条像素渲染管道每周期内处理的TMU纹理贴图单元数)=1600MTexel/s;像素和纹理单元填充率的指标与GeForce 2相等,甚至低于GeForce 2 Ultra的1000MPixels/s和2000MTexel/s,因此有人会误以为GeForce 3比GeForce 2 Ultra慢。尽管GeForce 3的理论最大填充率低于GeForce 2 Ultra(其GPU时钟频率为250MHz),但光速内存构架使GeForce 3的内存带宽利用效率比GeForce 2 Ultra更高,这会直接体现在软件应用中。GeForce 3可将4个纹理应用到每条单独的通道中,而GeForce 2只能应用2个。尽管GeForce 3仍然拥有4条像素通道(或称之为流水线),每周期可处理8个纹理单元(这些指标与GeForce 2一样),但它能“派遣”2条像素管道同时执行4个纹理单元(其余的2条空闲出来)。在游戏中,这种混合并行处理能力会减少对内存的读、写操作,并将使性能获得明显提升(目前采用多重纹理设计的游戏越来越多,GeForce 3这一先进的设计会随时间推移逐渐展露出来)。光速内存构架不仅使GeForce 3的纹理贴图处理过程更加高效,也通过Z轴压缩(Z-Compression)和Z轴啮合剔除(Z-Occlusion Culling)技术以及交错型内存控制器(Crossbar Memory Controller)更好地利用了内存带宽。
接下来我们要讲到的是GeForce 3另外一个先进的特性的五点梅花式全屏抗锯齿方式。不同于GeForce 2采用的超级取样(Super-Sampling)方式,GeForce 3使用的多次取样(Multi-Sampling)方式仅需更少的填充率就能实现。以前超级取样方式的做法是在更高的分辨率下绘制一幕画面然后进行渲染,现在新的五点梅花方式从被取样像素周围环绕的4个像素中提取一个色彩样本并采用一种新的运算方法计算出最终要渲染的像素的色彩值。效果相当于以前4X抗锯齿方式实现的图像品质,但性能损失比以前更少。
性能测试 我敢打赌无论是对于“亲临前线”的测试工程师还是本文的读者,这一章节的内容绝对是最值得关注的。在你阅读测试结果的同时一定不要忽视:我们测试用的GeForce 3显示卡的时钟频率及显存频率高于nVIDIA规定的默认频率,分别是219.88MHz和508.29MHz(PowerStrip 3.0beta测量结果),因此内存带宽和理论最大填充率分别达到8160MB/s和880Mpixels/s、1760MTexels/s。这块经过“超频”的显示卡在测试中的性能表现将优于运行在标准频率下的同类产品。由于技嘉为GV-GF3000定制的驱动程序还没有到位,我们使用了开篇介绍的4.13.01.1241版本的nVIDIA公版驱动程序。
Quake Ⅲ Arena一直都是3D显卡性能评估时的必测项目,尽管是一款1999年出品的“老”游戏,但作为OpenGL游戏的代表,目前尚无新作能出其右。注意:Quake Ⅲ Arena DEMO测试的结果只能反映3D卡在Quake Ⅲ Arena或是基于Quake引擎的OpenGL游戏中的性能,除此范围并不具说服力。我不知道大家是否还会关心高端3D卡在640×480×16bpp这种“超”低分辨率下的性能表现,但我还是尽己所能将这个测试结果展示出来。在这种分辨率下,显卡的填充率并不会受到显示内存带宽的限制,这也是GeForce 3与GeForce 2 Ultra表现相当的原因。同时我们也看到这种分辨率下开启Quincunx FSAA效果几乎不会对性能表现构成威胁,这也是情理之中的事,目前主流3D卡的填充率都能应付自如更不必说GeForce 3了。在1024×768×32bpp分辨率下,GeForce 3优势明显,这与其重新设计的构架不无关系;即使在开启Quincunx FSAA效果后也有每秒83.5帧的速率,这完全能满足“狂热分子”在游戏中激战的基本要求。1600×1200×32bpp分辨率下,GeForce 3是当之无愧的大赢家,每秒82.8帧的速率令我们大吃一惊,显示器分辨率设置为最高、游戏中全部细节设置均调节到最大依然没有问题,这意味着……GeForce 2 Ultra的表现已经相当勉强,我们不敢保证以每秒49.5帧的速率能取得不错的战绩。在这种分辨率下,GeForce 3的Quincunx FSAA效果只提供了每秒31.9帧的速率,游戏已经不再可玩。
Evolva是一款DirectX 7游戏,采用每像素光照和大量DOT3三点式凹凸映射贴图,游戏中的场景的确非常华丽。这里我们提供了游戏测试的平均速率和最低速率。在1024×768×32bpp分辨率下,GeForce 3在没有开启Quincunx FSAA时表现得相当出色,这不但体现在平均速率,相比之下最低速率反而更能说明问题。虽然无论是56帧还是47帧都会让人觉得牵强,但这种过渡意味着GeForce 3的处理能力并没有由于更多特效而完全耗尽;看看GeForce 2 Ultra稳定的2个30帧值,其实它在1024×768×32bpp普通游戏模式时就已弹尽粮绝,此后CPU替它分担了大量的工作,这就是它所表现出的最低速率始终没有变化的主要原因。最后让我们为开启Quincunx FSAA效果的GeForce 3作个公正的评判:它无法通过来自Evolva高分辨率、全特效的严峻考验。
AquaNox是德国游戏开发商Massive Development最新制作的游戏,该公司以前曾制作过一款名为“阿基米德王朝”的游戏,但反应平淡。他们的新作AquaNox仍然以前作的水下战斗故事为蓝本,此次开发由于加入了大量华丽的特效并对DX8提供了支持,进而引起nVIDIA的关注,于是AquaNox游戏中的部分场景成为nVIDIA发布GeForce 3时最具代表性的演示片段。
我们按AquaMark的默认设置(贴图使用了24MB的纹理,测试设置中可开启针对DX8以及GeForce 3的像素处理器,而GeForce 2由于不具备此功能无法激活此选项)运行了测试。作为DX8游戏的先驱,AquaMark对3D卡提出了严峻考验,当我们看到在640×480×16bpp分辨率下GeForce 3仅跑出了39.3帧的成绩时大失所望,对于这种即时战斗类游戏这是“不及格”的表现。如果按此标准来衡量3D卡,GeForce 2 Ultra简直就是“史前恐龙”……尽管这些都是我们不愿见到的,然而3D技术的进步从不曾以个人意志为转移,亲身体验过AquaMark这样的游戏,终于体会到nVIDIA正在紧锣密鼓地开发“NV25”及“NV30”并非是杞人忧天。(其实AquaMark中支持的最大贴图纹理是40MB,只是看到上面的成绩后我们认为实在没有必要对3D卡继续施以“酷刑”。)
另外我们借此机会对GeForce 3和GeForce 2两代GPU的硬件T&L性能进行比较(选择低分辨率设置的原因是为了更充分地展现硬件T&L的性能):正如大家看到的,新生代的T&L单元所表现出的性能胜出其前辈2.4倍。
3DMark2001是今年MadOnion公司带给我们最大的礼物,作为第一款支持DX8的基准3D测试程序,测试中所展现出的美伦美幻的三维场景令人折服。性能测试部分第4个也是最后一个测试场景其实是测试像素及顶点处理器的功能,但就目前而言,它更像是为nVIDIA GeForce 3量身定做的演示动画。(在3DMark2001的界面中我们还发现,GeForce 3在T&L引擎一栏中显示的内容是“Pure Hardware T&L”——真正的硬件T&L)如果大家觉得总得分的差异太过笼统,不妨看看像素及纹理填充率数据的比较。我们常听到的填充率数据都是来自理论值,根本没有考虑到有限的内存带宽的利用效率,在高分辨率、高色深环境下更是无法达到预期的目标。
上面的结果显示了在1024×768×32bpp分辨率下,真实的像素及纹理填充速度。尽管GeForce 2 Ultra拥有更高的理论填充速度,与GeForce 3相等的内存带宽,但测试结果向我们宣布表面看起来理论指标略逊一筹的GeForce 3在此轮竞赛中以绝对优势胜出,它的制胜法宝是新的交错式内存架构和Z轴隐面剔除技术。即使是在开启Quincunx FSAA时GeForce 3仍可与GeForce 2 Ultra较量,因为它能更有效地使用内存带宽。GeForce 3在纹理单元填充率子项取得的优异成绩应该归功于新的贴图渲染方式“2条像素管道同时执行4个纹理单元,其余的2条空闲出来以应付其他一些更‘贪婪’的特效”。
结论 GeForce 3的确是一款很有“内涵”的芯片,任何一位单凭理论值规格下赌注的看官都会大跌眼镜,它不但在当前的主流应用中捍卫了“3D之王”的荣誉,更展露出决战明日的潜力。
作为目前最先进的图形处理器,GeForce 3不只是快一点,过不了多久它所支持的丰富特效及超前设计就会大派用场。
就技嘉公司送测的这块GV-GF3000显卡而言,我们对它在测试中的性能表现表示满意(由于这款显卡还未大批量投放市场,我们还无法进一步了解到关于驱动程序及捆绑软件甚至售价方面的详情,因此仅对产品性能发表意见)。在与其他媒体对同类产品的评估结果进行比较后,我们发现经过频率提升的GV-GF3000获得了较明显的性能增益。而这一切都是基于极高的产品稳定性(在我们接近3昼夜的测试过程中没有出现任何由不稳定因素产生的异常情况),因此我们相信这与普通玩家的“超频冒险”有着本质的区别。
谈到购买,我们想说的是“无限效果”代价不菲,不过对于有足够预算买得起它的人来说,GeForce 3一定不会令你失望。至于购买时机,nVIDIA的产品更新周期是6个月,因此消费者总能随时看到最新最好的产品。
|