|
||||
SLI、交火不算什么,Larrabee的多内核设计!
目前的GPU全是采用单核芯片设计,图形显示系统要想达到更高的性能只能采用双GPU设计或双卡、四卡并联运行方案。这在成本上往往是用户所不能接受的。而在Larrabee上,INTEL采用多核心设计,这也将是首款采用多核设计的GPU。根据INTEL初步的计算,最初Larrabee的核心数量将会是16个核心,今后按照翻倍的步进也许会升级到32个核心。这是因为要应付目前主流的3D图形的运算,起步至少要16个核心才可以从容应对,但是24个核心的产品也是有可能的,毕竟以目前的生产工艺来看做到这一点完全是没有问题的。
半导体芯片核心
目前我们的半导体芯片核心面积可以做到286平方毫米,NVIDIA的GT200和AMD的RV770就处在这个层次上。因此在Larrabee集成更多的处理核心应该并非难事。假设INTEL要想集成40个处理核心,那么至少需要572平方毫米的芯片。事实上NVIDIA的GT200使用的是65nm制造工艺技术,如果INTEL用最为先进的32nm制造工艺技术,那么芯片的尺寸还会大幅缩小。就目前的INTEL 45nm制造工艺来说,芯片的核心面积可以减小至少50%,但是根据INTEL的说法,只要转产到45nm,甚至可以减小到60~70%的样子。届时Larrabee将能集成更多的处理核心。INTEL推测,40个核心45nm版本的Larrabee其核心面积约为370平方毫米。像NVIDIA的产品线一样,INTEL也会将芯片根据核心数量分成不同的档次,面向不同人群推出。
游戏性能与核心数量的增长趋势
根据INTEL的说法,这种特性在《战争机器》、《F.E.A.R.》、《半条命2:第二章》等游戏中表现最明显,实际性能基本随着核心数量呈线性增长趋势。如果8核心的性能算作1,那么16核心就约等于2、24核心约等于3、32核心约等于4。如果一直这样增长下去,那Larrabee的实力将是恐怖的。不过INTEL也承认,随着核心数量的继续增多,这种线性关系会逐渐减弱,到了40核心只有3.8-3.9,48核心就仅仅4.4-4.6了,64核心甚至可能都不到7。因此如果解决多核心中复杂的数据共享问题及功耗问题,这都是INTEL需要面对的。
除此之外,Larrabee还同时能够支持4路硬件线程。而Larrabee也能够在CPU内核心进行4组套转换。INTEL CPU比如Nehalem都支持2-way多线程,Larrabee则为4-way multi-threadCPU。而GPU产品中支持多线程的则很少。GPU产品通常配备有数十以上的线程硬件转换功能。比如GeForce GTX 200(GT200)在32寄存器/线程时转换为16warp(NVIDIA用语)。根据Larrabee的资料,硬件多线程设计是为了在进行编译的时候减少二级缓存的等待时间为目的。这与GPU的硬件多threading不同。另外Larrabee的硬件多线程比GPU少的原因是架构上的不同。值得注意的是,INTEL指出Larrabee“全面支持IEEE标准单、双精度浮点运算”,但没有透露具体指标。AMD和NVIDIA显卡在单精度方面表现都很出色,RV770系列已经轻松超过1TFlops,不过双精度性能还相差甚远,比如Tesla的单精度性能可达900-1000GFlops,双精度就只有100GFlops左右。如果出Larrabee全双精度浮点运算的话,那么它的通用运算能力要远远强于当前的GPU。
尽管INTEL进军独立显卡市场的野心已然明确,但据消息来源表示,目前很多细节还处于混沌状态。INTEL将会在今年第四季度公开发布详细完整的独立显卡产品线roadmap。到那个时候,Larrabee显卡才会变得更加清晰。相较于GPGPU来说,它最大的优势就在于采用了大家熟悉的x86架构。目前多数的软件工程师仍不熟悉如何将GPU应用在多任务处理及平行运算上,这点就占了不少优势。如果顺利的话,INTEL将肯定在2008年展示Larrabee系列独立显卡。根据比较可靠的消息来看,Larrabee项目其实是隶属于Tera-Scale计划(“万亿级别计算研究项目”。这个计划的重要工作内容,就是分析未来10年内人们对电脑及服务器的应用需求。这一计划涉及的研究领域非常广泛,共有超过400间大学、美国国防部高等研究计划局(DARPA) ,以及像是微软与惠普等相关公司,共同为Larrabee应用进行研究。