在很多人眼里,AMD APU就是把传统处理器、显卡更好地整合在一起而已,事实上APU远不止这么简单,或者说这仅仅是它的初级工作而已。AMD早在八年前收购ATI的时候就提出了“融合”(Fusion)的概念,目标就是将一直相互隔离的CPU、GPU完全融合在一起,为系统、应用来加速——所以才叫做“加速处理器”(Accelerated Process Unit)。
如今经过多年多代产品的发展,在最初融合理念的基础上,AMD又祭出了全新的杀手锏“HSA”(异构系统架构)。这是AMD APU多年积累而来的一个全新里程碑,主要是通过实现CPU和GPU的内存统一寻址,达到一个新的高度。
代号为“Kaveri”的 APU就是最新的结晶,也是有史以来最为强大的AMD APU,身上光环无数:首次采用GlobalFoundries 28nm新工艺制造、首次集成压路机(Steamroller) CPU架构、首次在A系列中集成GCN GPU架构、首次真正引入了HSA。
HSA其实就是AMD最初提出的Fusion融合理念,只不过是更为正式、更能凸显其核心特性的名称,而且这不仅仅是AMD一家的技术,更是得到了ARM、Imagination、联发科、德州仪器、三星、高通、甲骨文、索尼、LG电子、博通、Marvell、威盛、意法半导体、Ubuntu、模拟器件等等这些行业巨头以及清华大学等学术机构的鼎力支持,还共同组建了HSA基金会来推动异构计算事业的发展。
经过几年的铺垫,Kaveri APU第一次将HSA从理论化为了现实,不但集成了最多12个计算核心,还带来了两个重要的异构计算特性:首先是hUMA,即异构统一内存寻址,CPU、GPU第一次可以真正地共享整个内存空间,任意互相访问,且动态分配资源;其次是hQ,即异构队列,CPU、GPU可以平等、灵活地创建、分派工作负载。
抛开复杂的技术,直白点说就是:CPU、GPU从此真正成为一家人,可以齐心协力地一起干活了,而且都能发挥出自己最擅长的本事。
当然,再强的技术也要转换为实用才有价值,这方面APU丝毫不是问题。这些年,GPU硬件加速已经成为潮流,APU更加强大的地方则在于,它不仅仅能在需要的时候调动GPU加速,更能让CPU、GPU携起手来,分别执行各自效率最高的任务,共同做到最大程度的加速。
第一代APU发布的时候,这种应用只有几十款,到了第二代就已经迅速增加到几百款,如今更是突飞猛进、与日俱增,而且涵盖了各种领域,包括图像处理、视频编辑、音频处理、摄影处理、编码解码、加密解密、压缩解压、物理加速、图文办公、语音识别输入、手势识别控制、视频会议、影视游戏,等等等等。
这些领域的诸多应用,都已经、正在和即将针对AMD APU处理器、HSA异构架构进行针对性的优化,双方彼此完美配合,无论工作、娱乐还是生活都能从中获得最高的效率。举几个简单的例子:
-Corel AfterShot Pro:为高级摄影师提供照片和图像的管理、编辑,以及RAW照片导入
-LibreOffice:应用广泛的微软Office替代办公套件,用户超6000万
-X265 HEVC:4K超高清视频编码、解码
-rabbit:可与朋友进行社交聊天、观看电影、玩游戏、听视频教程
Dragon Notes:语音识别和输入
-eyesight:使用标准相机实现手势识别和控制
-暴风影音:国内第一大视频播放器
为了发展壮大HSA异构事业、鼓励和推动更多应用投身其中,AMD还贴心地为开发人员提供了一整套的开发解决方案,从开发工具、编程语言、优化库、一体化开发包、在线资源、开发者论坛等各方面提供全方位的支持与服务,任何已有和新应用都可以轻轻松松地利用HSA让自己旧貌换新颜。每一年,AMD都还会召集业内厂商、专家,共同举办开发者峰会,共同推进HSA的应用和普及。
这其中最激动人心的是,由于HSA 实现了CPU、GPU的内存统一寻址,再也不用分别针对CPU、GPU进行单独编程,从而可以大大简化软件开发者的工作,有助于开发者开发出能更好地利用GPU运算性能和资源的加速应用。在以前,CPU和GPU在开发上是完全独立的,各自使用不同的语言,各自有不同的内存空间,无法统一编程,无法充分挖掘GPU的潜能,现在HAS完美解决了这个问题。
可以预料,未来支持HSA的应用会更加丰富多彩,无论是小白用户做个美图,还是专业人士进行影音处理,或者是大型机构执行高性能科学计算,HSA都有无限的用武之地。
APU合理的设计和优秀的技术,搭配逐渐完善的软件及应用,势必会有越来越多的用户体验到HSA异构架构的独特魅力,给整个计算行业都带来颠覆性的变化。
值得一提的是,Kaveri APU仍然分为两步走,目前已经发布的是桌面版本,面向笔记本移动平台的更多产品即将推出。虽然对此还没有非常明确的情报,但可以从已有产品中推测一二。
桌面版的Kaveri APU集成了最多12个计算核心,包括四个CPU核心、八个GPU阵列,主频最高可达4GHz,而热设计功耗最高95W。相比上一代,CPU/GPU的规格都有了突飞猛进的提升,计算能力大大加强,但是功耗却降低了,这当然得益于28nm新工艺和架构上的优化。
笔记本对于功耗、发热量更加敏感,新工艺、新架构的优势也必将发挥得更加明显,因此可以预见,Kaveri APU不但能带来能耗比更高的移动之“芯”,极大提升笔记本的工作和娱乐性能,更有望在电池续航方面带来惊喜。
总之,无论对于编程开发,还是对于用户体验,HSA都是一次突破性的革命。实现了CPU和GPU内存统一寻址之后,编程和开发将变得轻而易举,硬件资源和性能也将得到全方位的挖掘和释放,从而给各行各业的用户带来更优秀的加速体验,这想想就让人激动不已。
最后再来看看国外权威硬件媒体是如何评价Kaveri APU尤其是HSA的吧:
AnandTech:Kaveri最终兑现了2006年收购ATI时的承诺。AMD终于带来了真正融合的APU/SoC,同时将CPU、GPU作为一等公民对待,允许开发者挖掘两种处理器,互相协作解决复杂问题、促成全新体验。在能同时用到CPU、GPU的测试中,Kaveri看起来棒极了,完全是HSA所保证的那样。
Tom’s Hardware:AMD在推动机构计算方面的努力值得鼓掌,为多个市场领域、硬件厂商、开发人员以及无数终端用户带来了无尽好处。即便是Intel大大增强了自己处理器的图形性能,驱动程序对于计算的支持也在加强,AMD仍然是最值得赞赏的,尤其是在OpenCL推广方面。
ExtremeTech:我们看到了(HSA)特定能力的展现,这是Intel怎么优化也做不到的。这些初期迹象表明,HSA可以大幅度地加速特定操作。如果HSA应用都能像我们在LibreCalc里看到的那样加速,那么AMD APU的远景未来是光明的。