很多人还在用单核处理器的今天,你是否认为用上双核处理器很时髦呢?其实未必如此,至少英特尔未必这么认为,因为他们已经开始研发新一代多核处理器,而每个芯片含有60到80个核心。 80核心性能惊人 英特尔Tera-scale运算研究计划共同总监Jerry Bautista说,英特尔研究员正着手研发巨量多核心芯片的光罩技术,以便未来让计算机制造商与软件开发人员更容易修改软硬件,以运用多核心芯片的效能。 Bautista说,这些多核心芯片可能同时内含x86处理核心,以及其它类型的核心。目前绝大多数的英特尔服务器及PC的芯片都采用x86核心。举例来说,未来,一颗64核芯片可能内含42个x86核心、18个加速器(accelerators)以及四个嵌入式绘图核心。 一些实验室,以及像ClearSpeed Technology、Azul Systems和Riken这类公司,已纷纷开发出内建大量核心的芯片,例如ClearSpeed就有一款芯片内含96个核心,但这些核心只能执行某些类型的任务。 去年,英特尔展示一款内含80个运算核心的原型芯片。虽然半导体业界注意这项成就,但马上就令人联想到现实的问题:英特尔能推出采用x86核心的多核心芯片吗? (原型芯片并不含x86核心)这些芯片能执行现有的软件,并搭配现有的操作系统吗?数据流量、散热和延迟(latency)问题,要如何解决? 英特尔的答案基本上是:是的,我们正在设法处理。其中一个想法,本月在圣地亚哥举行的“程序设计语言设计与落实会议”(Programming Language Design and Implementation Conference)中,涉及把所有的核心都用一种metaphorical exoskeleton方法,屏蔽于异质并存的多核芯片(heterogeneous multicore chip)中,让所有的核心看起来像是一系列传统的x86核心,或整体看来有如只是单一的巨大核心。 Bautista说:“这看起来会像是各种资源的大杂汇。目的在简化程序设计。” 在圣地亚哥“国际计算机架构座谈会”上发表的另一论研究报告,则细述一种硬件排程器如何分割运算任务,并把任务分配到同一颗芯片上的各个核心去执行。有了这种排程装置,特定的运算任务就能在更短的时间内完成,Bautista说。这种设计也可防止“热点”(hot spots)冒出来--倘若某个处理器核心因为马不停蹄的运转而开始变热,排程器就可把运算任务转拨到邻近的核心。 一些问题急需解决 英特尔也正设法让多核芯片分享高速缓存,以便加快数据存取速度。今天市售的双核和四核芯片,其核心大多都能分享高速缓存,但仍是个问题。 “当核心增加到八个和16个时,问题就变得相当复杂,”Bautista说。新技术会把各种操作排定优先级。英特尔说,初步测试结果显示,改善快取记忆管理,可让芯片的整体执行效能提升10%到20%。 散热是另一项有待克服的问题。目前,输入输出(I/O)系统需要大约10瓦特的电力,才能以每秒1兆位(terabit)的数据传输速度。英特尔实验室已研究出一种低功率的I/O系统,可以14个百万瓦(milliwatt)的电力,每秒传输5Gb的数据--用电量比目前的5Gbps系统节省14%--并以75个百万瓦达到15Gbps的传统速率。上述研究内容详载于本月在日本VLSI Circuits Symposium会议上发表的研究报告。 要做到核心对核心(core-to-core)通讯,需要低功率I/O系统以及芯片对芯片联系。英特尔研究员兼I/O研究总监Randy Mooney说:“若不改善用电效率,这种目标根本不可能实现。”英特尔主管曾表示,希望五年后能推出大量多核心芯片。但仍有一些问题尚待克服。例如,英特尔目前还没有一款大量多核芯片是根据x86核心制成的。 英特尔的大量多核心芯片可能以所谓“TSV”(Through Silicon Vias)技术为基础。TSV透过成千上万条微细的导线,让外部记忆芯片与处理器连结,而不是靠侧边的一大条线路连结。这种作法可增加频宽。 英特尔独立显卡09年上市 此外,据日本网站报道,英特尔将在2009年推出代号“Larrabee”的独立显卡产品,拥有24或32个核心,2010年进一步增至48个。 英特尔在今年春天的北京IDF期间确认了Larrabee的存在,但只做了一些泛泛介绍,没有给出多少技术细节。根据英特尔高级副总裁Pat Gelsinger的说法,Larrabee是一种可编程的多核心架构,不同的版本会有不同数量的核心,并使用经过调整的x86指令集,性能上将会达到万亿次浮点运算级别。 据分析,2009年出炉的第一代Larrabee产品将采用45nm工艺,集成32个处理核心,搭配大容量缓存,同时也会衍生出只有24个核心的低端版本,主要是屏蔽其中8个核心而来;到2010年,Larrabee将升级到48个核心,并改用新的生产工艺——32nm。值得注意的是,Larrabee里的处理核心为顺序执行核心(In Order),与CPU里的乱序执行核心(Out Order)不同。 根据英特尔首席构架师Ed Davis的演示文稿,Larrebee隶属于英特尔万亿次计算计划,基于可编程架构,主要面向高端通用目的计算平台,至少有16个核心,主频1.7-2.5GHz,功耗则在150W以上,支持JPEG纹理、物理加速、反锯齿、增强AI、光线追踪等特性。考虑到英特尔已将德国天才程序员Daniel Pohl招至麾下,相信Larrabee一定能在光线追踪技术方面取得突破。 预计英特尔将在2008年拿出Larrabee的样品,并进行公开展示,届时也有望得到更多技术细节。
|