AMD今天在2006年超级计算机大会上发布了世界首款“流处理器”,该处理器基于修改过的R580图形处理核心,能够为桌面计算带来强大的浮点运算能力。
当今世界上最强大的超级计算机是IBM的蓝色基因,它由131072个处理器内核组成(65536个双核心处理器),能够提供367 TFlops的峰值运算能力。如果使用AMD的“流处理器”来制造这样一台机器,那么在性能相同的前提下,处理器的数量将大大减少。当然用户也可以使用更多的“流处理器”制造性能超过蓝色基因的计算机。AMD宣称该“流处理器”基于拥有3.84亿晶体管的R580图形芯片,该芯片现在被广泛使用在X1900显卡上。要达到蓝色基因的运算能力,只需不到1000个“流处理器”即可实现,平均每个“流处理器”的运算能力为375 GFlops。
“流处理器”的概念来源于利用大量并行处理器进行协同计算。最近几年来,程序员发现GPU不仅可以担当图形渲染的任务,而且还可以在一些计算量很重的情况下处理数据。BionicFX就是最早利用GPU进行计算的程序员之一。他曾经利用NVIDIA的6800图形芯片处理音频数据。近期斯坦福大学的Folding@Home项目小组宣布,他们已经成功地利用R580图形核心开展了蛋白质折叠方面的研究。
斯坦福大学利用AMD流处理器进行蛋白质折叠的计算
与传统的图形芯片相比,“流处理器”加速卡配备了1GB的DDR3内存,并且为使用流计算的应用程序内置了特殊的内存控制器。考虑到未来会与AMD的协处理平台Torrenza和HyperTransport总线结合,流处理器加速卡还提供了PCI Express接口。该加速卡暂不支持交火(Crossfire)并联技术,但是AMD的发言人Will Willis表示,是否提供该功能取决于服务器厂商。目前,对R580图形芯片的改造成本还比较高,AMD对流处理器加速卡的报价是2600美元,这几乎是X1900显卡价格的5倍。不过相对于另外一家Clearspeed提供的100 GFlops加速卡来说,AMD的流处理器加速卡大约便宜了2/3。
AMD表示,成功推广流处理器的关键在于让应用程序能够充分利用流处理器的计算功能。AMD提供了一种名为CTM的瘦硬件接口来帮助人们简化软件编程。AMD宣称该硬件接口将提供相当于传统3D 应用程序编程接口(API)8倍的性能。CTM将允许用户直接访问GPU的原生指令集和存储器。
目前人们还不清楚在不远的将来会出现什么样的流计算应用程序。不过AMD公司认为,既然该技术旨在提供高性能计算,那么流处理器也会面向个人消费市场。AMD的代表还表示,流处理器对图像和视频的处理同样出色,尤其在H.264高清视频领域更是如此。另外,处理物理效果也将是该处理器潜在的发展方向之一。AMD希望支持流处理器的软件能够在未来2年内出现。
|