异构计算这几年:AMD APU引领未来趋势
  • Kew
  • 2013年06月18日 10:45
  • 0

异构计算的起源

异构计算(Heterogeneous computing)是当今半导体行业的一个热门词汇,上到芯片厂商,下到普通消费者,都对其表现了极大的兴趣,应用范围也是越来越广泛。

但事实上,异构计算却并不是什么新概念,而是由来已久。早在20世纪80年代中期,异构计算技术就诞生了。它主要是指使用不同类型指令集、体系架构的计算单元组成混合系统的一种特殊计算方式。常见的计算单元类别包括:CPU(中央处理器)、GPU(图形处理器)、协处理器、DSP(信号处理器)、ASIC(专用集成电路)、FPGA(现场可编程门阵列)等。

异构计算这几年:AMD APU引领未来趋势

为什么需要异构计算?原因很简单:我们需要越来越强大、越来越高效的计算系统。在过去,随着半导体技术的进步和频率的提升,绝大多数计算机应用不需要结构性的变化,或者特定的硬件加速,即可不断提升性能,但是现代应用经常会碰到内存、功耗方面的限制。此时,引入特定单元、让计算系统变成混合结构就成了必然,每一种不同类型的计算单元都可以去执行自己最擅长的任务。

时至今日,异构计算已经遍布计算行业的每一个领域,上到高端服务器、高性能计算,下到低功耗嵌入式设备(包括智能手机和平板机),无所不在。

CPU与GPU之争

既然异构计算历史如此悠久、普及如此广泛,为什么这几年才成为热门话题,获得如此多的关注?这主要源于CPU、GPU两大核心计算单元的趋势演进。传统上,人们只是通过提升CPU时钟频率、增加内核数量来提高计算能力,而这种方法逐渐遇到了散热和能耗的瓶颈,提升速度也是越来越慢(最典型的例子就是Intel奔腾4),而与此同时,GPU等专用计算单元虽然工作频率较低,却具有更多的内核数量、更强大的并行计算能力,能效远远超过CPU,潜力逐渐被挖掘了出来。

2003年,AMD推出了业内首款x86-64架构处理器,开启了64位计算时代。2006年,AMD、Intel又相继发布双核心处理器,随后便是多核心处理器,改变了以往单纯靠频率提升性能的历史。2007年,NVIDIA、ATI(现属AMD)接连打造了CUDA、Stream,大张旗鼓地启动了GPU极加速计算。

异构计算这几年:AMD APU引领未来趋势

这些都还不是异构计算,但为后续的异构计算发展奠定了坚实的基础,不过在CPU、GPU你追我赶、争先发展的时候,也出现了一种争论,那就是CPU、GPU究竟谁更重要?

CPU名字的意思就是中央处理器,“中央”二字充分体现了其在计算系统中的核心地位,一度有很多年人们买电脑只看CPU而不问其他。CPU因为性能、功耗等问题而脚步放缓的同时,GPU概念横空出世,并开始以更加迅猛的速度发展,无论是晶体管集成度还是运算能力都很快将CPU远远甩在了身后,在系统中的地位日渐与CPU并驾齐驱,甚至渐渐有取而代之的架势。

GPU的重要性毋庸置疑,但它究竟是不是比CPU更重要,这并不是一个简单的是非判断题。CPU性能提升不复当年之勇,但始终都是整个计算系统的心脏;GPU势头再猛,本质属性决定了它也不能越俎代庖,只能干好自己的工作。CPU最大的特点是处理串行任务,一个接一个来;GPU的特长则是对付并行任务,可以同时执行大规模运算。CPU更像是个管家,整个系统的方方面面都需要它的协调;GPU更像是个数学天才,不能事事精通但有自己的独门绝技。可以说,CPU、GPU没有谁比谁重要的问题,只是一个各司其职、各尽其责的问题。二者只有相辅相成,利用自己的特长最大效率地执行自己的任务,共同释放系统潜力,才是正道。

异构计算这几年:AMD APU引领未来趋势

AMD如何打造出APU

既然CPU、GPU都这么重要,都有自己的特长,那么如何才能同时充分地挖掘二者的最大能量呢?很显然,最好的方式莫过于将它们整合在一起,构建一套异构计算系统。

说起来似乎很容易,放一块儿不就完了,但实现起来可没这么简单,因为你同时需要足够强大的CPU、GPU更需要最高效地将二者有机组合在一起,还需要生态系统完善地支持这种架构。

2006年7月底,AMD宣布以54亿美元的高价收购ATI,完成了CPU行业、GPU行业有史以来最重量级的一次整合,AMD也因此成为全球唯一一家同时拥有高性能CPU处理器、GPU显卡、芯片组主板的半导体企业。

异构计算这几年:AMD APU引领未来趋势

这一收购的冲击力是极其强大的,但在最初,几乎每个人都低估了它的意义。看上去只是一家公司通过收购获得了更丰富的产品线,但事实上,AMD下了很大很大的一盘棋。

就在宣布收购的第二天,AMD便迫不及待地宣布要把高性能CPU、GPU做到同一颗芯片上,并在三个月后为这一项目命名为“Fusion”(融聚),又过了两个月再次提出了全新的“APU”(加速处理器)概念,后来甚至还把Fusion写入了公司口号中。看上去似乎是另外一种集成显卡,从主板上转移到处理器中而已,但是关键就在“加速”二字。怎么去加速?答案就是——异构计算。

异构计算这几年:AMD APU引领未来趋势

当然,融聚这条路走得很艰辛。从最初宣布到最终发布,APU花了足足四年半的光阴,期间经历了GPU加速计算的崛起、GPU/GPU地位之争,直到2010年初才开花结果。有意思的是,也就在同一年,Intel 也迅速跟进,发布了Sandy Bridge,将CPU、GPU整合到了一起,虽然被业界戏称为“只不过是在CPU里集成了显卡”,没有实现APU那样的高度融合,但也开始了异构计算的探索之路。

看似简单的CPU、GPU整合为何如此费力?原因就是这不简单。如果只是做另一种集成显卡,那是再容易不过了,但是要把CPU、GPU两种不同的计算单元有机地融合到一颗芯片中,还要发挥二者各自的最高效率,出色地完成串行和并行计算任务,就需要在方方面面保证它们俩的和谐共处,包括各自适当的规模、超高的晶体管集成度、先进的芯片制造工艺、高速的互联总线架构、共享低延迟的内存模式、适当的成本、足够的编程与软件支持,等等。正是在这些方面经历了深入的探索之后,AMD才最终完成了APU,绘就了一张宏伟蓝图。

异构计算这几年:AMD APU引领未来趋势

AMD也没有试图一步到位,而是非常聪明地选择了四步走的持续性战略。第一步,物理整合,CPU、GPU集成到单独一颗芯片上;第二步,平台优化,融合互连增强CPU、GPU之间的交互能力;第三步,架构整合,实现CPU、GPU内存统一寻址;第四步,架构和系统整合,从硬件到软件完全实现异构计算支持。

2011年的Llano就代表着第一步,2012年的Trinity则是第二步,第三步将由今年底的Kaveri迈出。正是这样一步一个脚印,AMD把融合的理念贯彻到了异构计算之中。

异构计算这几年:AMD APU引领未来趋势

APU出现的意义

CPU、GPU是一套计算系统的两大支柱,但除此之外,若有其它计算单元想占据一席之地,甚至与CPU、GPU平起平坐,都是堪比登天。最典型的失败案例莫过于PPU,亦即物理加速单元。它提出了一种很先进的理念,通过专用模块执行物理模拟计算,实现更贴近显示的图形效果,可惜因为本身技术限制,以及发展上的实测,最终只是昙花一现。

AMD提出APU之时,质疑声也是铺天盖地。很多普通用户认为它只不过是起了个新名字的又一种集成显卡而已,不少专业人士也怀疑AMD能否倡导出一种广为接受的新概念。

最终,APU证明了自己,不仅仅是从产品角度,更是从产业角度。

如果简单粗暴地去定义,APU确实属于广义的集成显卡行列,只不过图形核心不在传统的芯片组里,而是转移到了处理器中,但就算是集成显卡,也是开辟了一个全新的时代,重新诠释了整合图形核心,AMD也更愿意用“独显核心”来描述它,以突出其媲美入门级独显的强大性能。由于融入了原ATI的先进GPU技术,计算单元规模大大提高,而且与CPU之间高速互连,整合GPU终于可以抬起头来了,无论在中等分辨率和画质下玩游戏,还是进行一些计算任务,都已经可以轻松胜任。可以说,APU诞生的那一天起,四五百元以下的独立显卡就彻底失去了活路,AMD、NVIDIA相继放弃低端GPU核心的研发就是最好证明。单单从产品层面上看,APU就已经改变了整个中低端PC市场。

当然了,“秒杀集显”仅仅是个开始而已,APU真正的使命远非如此。之所以称自己为加速处理器,关键就在加速二字。传统上CPU、GPU各自为政,只会分开做自己的事情。虽然也有大量的GPU硬件加速应用,但只是在让GPU卖力,CPU成了旁观者。APU则将它们俩拉到一起,共同去执行计算任务,而且可以充分发挥各自的特点,串行、并行计算灵活分配、高效执行,特别是可以通过OpenCL、DirectCompute等加速计算接口,做到真正的1+1>2,这,就是加速的含义。

可以说,APU引领了处理器架构的一次变革。CPU无论是过去的频率为王还是现在的多核心,都无法摆脱单一同构计算,跟不上时代的节奏。GPU的并行规模和可编程性突飞猛进,但毕竟不是通用目的计算单元,不可能独自搞定所有问题。

APU的出现有机地实现了CPU、GPU的二合一。通过将通用运算x86架构CPU核心和可编程矢量处理引擎相融合,APU把CPU擅长的精密标量运算与传统上只有GPU才具备的大规模并行矢量运算结合了起来,双方都能直接读取高速内存。APU综合了CPU和GPU的优势,为软件开发者带来了前所未有的灵活性,使之能够任意采用最适合的方式开发新的应用。简而言之,APU的魅力在于它内含由标量和矢量硬件构成的全部处理能力,是一套精妙的异构计算体系。

异构计算这几年:AMD APU引领未来趋势

一家公司提出的理念是否成功,很重要的一个标志就是能否得到业界的广泛支持,以及同行的跟进。APU诞生以来,生态系统不断完善,支持CPU/GPU系统加速计算的应用日益增多,软硬结合,逐步释放出了APU应有的能量。

5月底,AMD发布会了2013三大系列全新APU产品,大幅提升性能和能效,同时带来了独特的用户体验和至尊的游戏和图形性能。代号Temash的APU是世界首款28nm,四核X86的SOC APU,专为小尺寸触控笔记本和平板电脑设计,最低TDP功耗仅为3.9W;代号Kabini的APU同样采用28nm制程工艺,同时也实现了四核X86 SOC,面向入门级主流笔记本和小尺寸的触控本;针对主流移动平台的代号Richland APU则将其中的GPU提升至GCN架构,同时可与全新的HD8000M系列独立显卡组建双显卡系统,带来更加出色的3D性能表现。在应用方面,AMD加快了与ISV的合作步伐,支持APU加速运算的应用已经达到上千款,涵盖各种用户日常使用的软件。同时得益于APU出色的异构计算性能,全新一代APU还支持诸如脸部登录、手势控制和屏幕镜像等一系列的创新应用。

PC主战场之外,AMD还在次世代游戏主机平台不断发力,索尼PS4、微软Xbox One两大新一代游戏主机的诞生,更是引爆了APU概念。两家巨头不约而同地采用了半定制化的AMD APU异构架构处理器,特别是索尼PS4,不但整合了八个美洲虎新架构的CPU核心、1152个GCN新架构的GPU核心,更是配备了多达8GB GDDR5作为系统内存/显存,首次实现了内存的统一寻址,成为有史以来最强大的APU,也是下一代消费级APU的前奏。这,毫无疑问是对APU架构的最高认可,也让AMD牢牢掌握了游戏行业的命脉。

异构计算这几年:AMD APU引领未来趋势

APU及异构计算的展望

时至今日,APU的概念已经深入人心,不但得到产业链和用户支持,更关键的是,处于竞争态势的Intel、NVIDIA也都在纷纷效仿这种异构体系,将其纳入自己的产品之中。Sandy Bridge、Ivy Bridge、Haswell……Intel的每一代产品在CPU方面都进步缓慢,GPU却是提升很快,而且已经开始加入OpenCL等通用计算能力,已有异构雏形。NVIDIA长期受制于没有自己的CPU作支撑,也已经引入ARM架构,卧薪尝胆准备开发属于自己的ARM处理器,并会在未来与其GeForce GPU整合在一起,同样实现异构计算。可以说,AMD APU成功引导了行业潮流。

但是革命尚未成功、同志仍需努力。在AMD规划的四步走战略中,到2013全新APU发布,才算完成了一大半,下一代APU将会支持内存统一寻址,达成APU发展至关重要的一步那才是真正的APU、真正的融合。

一旦实现异构内存统一访问,APU中的CPU、GPU将会更加无缝地紧密联系在一起,任何计算单元都能访问统一的内存,任何一个单元的更新对其他所有单元都是透明可见的,CPU/GPU计算可以交替进行,应用程序能够始终在最适合的计算单元上最高效地执行。从硬件角度看,CPU、GPU两部分将前所未有的亲密,通过统一访问的内存彻底走到一起。从软件角度看,应用开发将变得无比轻松,任何程序都不必再费心考虑CPU、GPU之间的差异。

异构计算这几年:AMD APU引领未来趋势

这种异构计算体系无论对谁而言,都具有划时代的意义:开发者,编程可以更简单;软件质量,可以拥有更高的性能和能效;操作系统,可以拥有改进的质量保证管理;最终用户,享受到的将是极为丰富的体验。

为了更好地推广APU、异构计算,AMD联合ARM、Imagination、联发科、高通、三星电子、德州仪器、LG电子等一大批半导体行业巨头,共同成立了异构架构系统基金会(HSA Foundation)。这是一个非营利性组织,使命就是制定异构计算的相关标准规范,推广异构计算的应用和普及。该基金会已经吸引了大量业内厂商、组织和学术机构的热情参与,技术标准也正在陆续出炉,异构计算正在迎来一个崭新的明天。

异构计算这几年:AMD APU引领未来趋势

可以说,在异构计算的发展上,AMD的确走在了行业的前列,而且引领着未来的发展趋势。现在Intel、NVIDIA也在走着类似的路子,三强齐聚就是对异构计算光明未来最好的证明。当然,如果Intel、NVIDIA也能加入HSA基金会,无疑善莫大焉。

 

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部0条评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0