又见神盾局黑手？ GPU/HPC业界暗战揭秘-快科技-科技改变生活

1一段“从未发生过”的历史

还记得上周由我的同事为诸位带来的关于“神盾局”起源——DARPA的精彩解密和回顾么？互联网、GPS、激光、救援机器人甚至是鼠标和义肢，人类生活的方方面面似乎都与DARPA有着密不可分的联系。诚如我们所言，从来没有一个军事机构能够像这个成立于冷战时期，旨在“创造对于竞争对手来说震惊的技术”的神盾局原型这样如此深刻的改变甚至影响我们的生活。也许你的这种感受还不是那么的具体和明显，没关系，今天我们再来给你加点料。

你听说过ExaScale计划么？你知道DARPA曾经并且正在左右着现代GPU的发展么？

又见神盾局黑手？ GPU/HPC业界暗战揭秘

DARPA是一个面向国家安全的军事组织，而GPU与军事和国家安全之间似乎不应该有什么联系，它好像也不是互联网或者鼠标这样的会在一般创造过程中妙手偶得的工具性发明。至于ExaScale计划，光听名字更是完全猜不出这到底是个什么东西。但正是它们之间的组合，让“神盾局”与显卡发生了神奇的反应，并直接影响了后者的发展轨迹以及命运。接下来我们要说的，就是关于DARPA、GPU以及ExaScale计划之间那不为公众所熟知的“黑历史”。

GPU能耗比记录刷新 GTX980/970首发测试 神盾局也跑来左右了GPU的发展？

当然，你懂的，有介于计划所涉及的层级、部门以及其所导致的结果，这显然又将是一段“从未发生过”的历史了……所以还请诸位读者摆正心态，开心就好。

2美利坚的大国重器

美利坚的大国重器

和每一个与“神盾局”发生联系的计划一样，ExaScale计划也是那种“以维护美国国家安全及提升长远未来竞争力为出发点”，但最终却对民用领域产生深远影响的项目，该计划最初的目的是为了让美国能够在超级计算机集群领域继续保持绝对领先的地位。ExaScale计划要求开发者提供能够以最高性能功耗比实现百亿亿次运算能力（Exa FLOP/s）超级计算机集群的技术及解决方案，这需要开发者同时达到两个目标，亦即“百亿亿次运算能力”和“可接受的能耗水平”。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 ExaScale计划是神盾局面向超级计算机集群极限运算能力的一次尝试

毫无疑问，超级计算机集群以及超大规模运算能力早已成了当今世界的“国之重器”，无论对基础科学还是应用类项目而言，超大规模运算集群的部署都是推动进步的先决条件，能够掌握更高运算能力的国家无疑将会在科研领域以及科研进展速度方面获得无法比拟的优势。在一般意义上，超级计算机集群是经由CPU这样的串行处理器大规模并行来实现的，美国在该领域一直拥有绝对领先的优势，极力推广全面禁止核试验条约，然后仅通过运算模拟便能够维持核武库的常备战斗力就是这一优势的最典型例证。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 美国“在内存中维护核武库”的能力源自其在超级计算机集群领域的绝对优势

但是在经历了多年的发展之后，串行处理器的效率，尤其是性能功耗比已经很难再有提升，进一步扩张规模不仅会让功耗代价处在完全不成正比的跃升状态，而且所带来的性能提升也相当有限，2005年之后美国新部署的集群的费效比呈现了明显的劣势，这一现象被称作“计算危机”(crisis in computing)。如果继续在原有结构上加以改进，美国在超级计算机集群领域的优势迟早会被消耗殆尽。为了阻止这一幕的发生，继续保障美国在该领域的领导和领先地位，DARPA祭出ExaScale计划完全不是什么值得奇怪的事。

话说回来，这跟GPU又有什么关系呢？

又见神盾局黑手？ GPU/HPC业界暗战揭秘 GPU是并行计算的典型代表，也是ExaScale计划实现的关键

传统的串行处理器大规模并行方案陷入的瓶颈是导致该项计划诞生的直接诱因，所以ExaScale计划的初衷就在于研发能够替换现有结构的全新超级计算机架构——基于并行/异构运算架构的新一代运算节点，它的主要任务是突破大规模并行计算能力增长的各种障碍并最终实现更高的总运算能力，而我们所熟悉的现代GPU，恰恰是大规模并行运算架构的最典型代表。以GPU来充当运算节点进行并行/异构运算，将可以更轻松的突破串行方案在提升运算能力方面所遇到的障碍。所以DARPA将GPU/并行计算节点视为未来提升超级计算机集群运算能力的关键，并通过投资ExaScale计划的形式开始了对GPU架构研发领域的影响。

既然代表美利坚的神盾局有求于业界，业界又刚好有解决的能力，热（jian）爱（qian）祖（yan）国（kai）的企业家自然责无旁贷，于是Intel、NVIDIA以及AMD都应邀加入到了ExaScale计划当中并获得了来自DARPA的拨款。GPU的世界，从此有了DARPA的影子。

3骑士，吹响号角

骑士，吹响号角

在ExaScale计划的所有参与者当中，Intel无疑是身份最为特殊的一位。它并没有直接的GPU架构，但其所提出的基于X86的大规模并行计算节点模式：MIC，却激起了“神盾局”莫大的兴趣。以此为基础，Intel在ExaScale计划当中顺利的发展了包括PHI计算卡在内的一系列并行计算节点。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 什么计划都少不了Intel

在ExaScale计划的框架内，Intel发展了以Knights Corner为代号的一系列新的并行计算结构，这些结构基于改进型的P54C架构（也就是X86的经典——奔腾架构），并将浮点吞吐指令集从先前的MMX/XMM/YMM更新到了ZMM，新指令集对大家所熟悉的SSE系指令没有兼容性，但却带来了512bit SIMD浮点指令吞吐能力。除此之外，Intel还透过优化Ringbus提升了多核并行的运算有效性，让大量串行运算单元能够有效地并行化并最终融汇成了新的并行运算架构。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 本已消亡的Larrabee被ExaScale计划救活了

基于这些创造，Intel最终带来了名为Xeon Phi的运算卡。初期的PHI可以被理解成是“一块接受CPU分派的浮点运算任务并予以完成的协处理器”，它是一块拥有强大并行吞吐能力的并行运算卡，内部集成了已经并行化的若干个运算节点，最大双精度浮点吞吐能力可达1T Flops。Phi在架构上与Larrabee十分接近，由于采用X86指令，Phi在程序友好性方面有相当大的优势，现有的基于X86体系的超算软件在Phi平台上的重编译工作要小于其他异构解决方案，这给程序的进一步优化创造了理想环境。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 Intel的并行计算解决方案——Xeon Phi

Phi计算卡的发展仍在持续，代号为Knights Landing的新一代架构将运算节点从P54C升级到了Silvermont（也即是Atom采用的架构），理论双精度浮点吞吐能力提升至PHI一代的三倍，而且从形式上摆脱了对处理器的硬性搭配要求。除此之外，有介于PHI实际部署过程中收集到的存储墙方面的问题（亦即单卡本地显存容量远远落后于CPU节点和实际需求量），Knights Landing还将部署基于TSV（穿透硅）技术的堆叠显存体系，以便在运算卡/核心本地实现更大的单节点内存容量。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 下一代Phi架构——Knights Landing

ExaScale计划对Intel的影响是深远的，它给了Intel充分的理由和行动力，让原本打算进军GPU领域并已经事实上失败了的Larrabee架构起死回生。这不仅让Intel有了进一步拓展HPC市场的重要筹码，同时也给基于相近结构的核显架构提供了支持，核显的性能和功能在此基础上正变得日益强大。所以在可以预见的未来，Intel应该都会持续保持对ExaScale计划的高度关注和持续参与，其在并行计算领域的渗透也将越来越广并最终直接影响显示运算领域。

小Tips①：如果你希望回顾Intel Larrabee架构以及异构计算道路的历程，这里有可以帮助你的东西。

4Echelon到Volta

Echelon到Volta

与Intel不同，一直在显示业界耕耘的NVIDIA早早的就凭借GPU进入到了“专职”的并行运算架构领域。早在ExaScale计划启动之前数年，NVIDIA就已经为自己的未来规划好了一条长远的架构发展路线图，正是这份完善的路线图以及NVIDIA在GPU领域的高速发展吸引了DARPA的注意。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 神盾局的黑手同样伸向了NVIDIA

NVIDIA在并行计算领域最早的起点是G80架构，这款架构首次引入了完整可用的GPGPU能力，接下来发布的GT200通过引入Atomic等举措对G80进行了进一步的完善，并为即将到来的Fermi架构创造了基础。在ExaScale计划启动前后，NVIDIA延原定路线图推出了具有重要意义的Fermi架构，通过宏观多级并行以及Unified cache体系最终稳定了GPU通用并行计算的身份和地位，基于Fermi架构的Tesla计算卡受到了HPC业界的广泛关注和大量采用，这让NVIDIA成功进入了HPC领域。到此为止的NVIDIA架构路线发展一直维持着一代架构解决一组阶段性问题，以此来实现通用并行计算与图形相结合的节奏，目标明确而且节奏清晰。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 以这篇论文为标志，NVIDIA彻底登上了神盾局的贼船，N卡的未来也就被确定了

在加入ExaScale计划之后，NVIDIA对自己原有的路线图进行了检讨和修订，并根据ExaScale计划的要求将注意力转向了架构的能耗比以及运算效率层面。在加入计划一年之后，NVIDIA与斯坦福联合发表了一篇名为《Power and Programmability.The Challenges of ExaScale Computing》的论文，在其中首次系统性的阐述了大规模并行逻辑计算结构在不同操作中的能耗状况并分析了阻碍系统提升效率并降低能耗的原因，进而给出了具有针对性的未来架构规划——Echelon。以Echelon架构这一阶段性终点为目标，NVIDIA在Fermi之后先后发布了Kepler和Maxwell架构，这两款架构均以急剧攀升的性能功耗比为最突出特点，在形式上完全契合了ExaScale计划的要求，同时也为HPC领域带来了全新的选择。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 基于NVIDIA Tesla方案的超级计算机集群——美国橡树岭国家实验室计算集群Titan

凭借新架构的理想表现，NVIDIA在给DARPA递交优秀阶段性成果的同时巩固了图形领域的地位，并且迅速扩大了自己的HPC市场份额，大量基于Tesla的HPC集群得以部署。在这一过程中，NVIDIA与Intel一样触碰到了GPU节点异构并行计算模式必须要面对的存储墙问题，而且还发现了与CPU节点通讯过程的总线拥堵问题。有介于此，NVIDIA再次修订了自己的未来架构发展路线图，在其中添加了分别对应存储墙问题以及开辟专属异构通讯总线的Pascal以及Volta架构。

GPU能耗比记录刷新 GTX980/970首发测试 Maxwell的成功与神盾局的介入息息相关

同Intel一样，ExaScale计划对NVIDIA也产生了意义重大的影响，它改变了NVIDIA的整个GPU架构研发方向，大幅提升了性能功耗比要素在逻辑结构研发过程中的影响力和权重，并且进一步完善了其未来图形架构的发展轨迹。今天NVIDIA GPU在显卡市场的优异表现，可以说是直接得益于ExaScale计划的影响。现在正在您机箱当中安静工作着的GeForce GTX 770或者GeForce GTX 980，可以说全都是神盾局左右的产物。

小Tips②：是不是发现很多东西似曾相识却又想不起来？想要再次回顾NVIDIA的图形架构发展历史和意义么？你的小叮当就在这里。

5从胜利迈向更大的胜利

从胜利迈向更大的胜利

与竞争对手相比，同时征战CPU和GPU领域的AMD显然对异构并行计算架构有更多的了解，在将并行节点与串行节点，或者说CPU与GPU结合在一起时也会拥有得天独厚的优势，事实上AMD在ExaScale计划开始之前已经完成了将两者融合在一起的APU。DARPA看中了这一点，于是将AMD也纳入到了ExaScale计划当中。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 神盾局颇为看好AMD在异构计算领域的实力

为了参与ExaScale计划，AMD将旗下的CPU/GPU技术统一融合成了一套完整体系，这就是Fusion和HSA体系。HSA体系的硬件由一枚GPU+CPU组合而成，两者共用一组内存控制器和相同的内存寻址空间，可以交互访问但会分别执行属于各自的代码。其终极目标要求在处理运算任务时，CPU能够根据情况将需要处理的代码交给GPU去执行，甚至完成两者的代码互通。GPU与CPU使用同一套内存体系和内存控制器无疑会降低这一操作过程的延迟，这种由CPU和GPU共同完成任务的执行模式不仅拥有无可比拟的灵活性，而且能够很好的增强整个体系的吞吐能力。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 AMD在加入以前就已经完成了CPU/GPU融合的异构架构APU：Llano

照理说，整个ExaScale计划最大的受益者应该是AMD，因为Intel和NVIDIA在执行该项计划时都有先天的不足——前者在进入计划时并没有并行解决方案，而后者则缺乏处理器的相关技术，同时拥有CPU/GPU以及APU架构的AMD应该是ExaScale计划的希望和最大概率胜出者。AMD无论在技术上、节奏上还是起点高度上都比对手领先了不止一星半点，ExaScale计划仿佛就是为AMD和HSA预设的一般。

那么它在加入计划之后的实际表现呢？

“我们与AMD公司的合作旨在应对软件生态系统目前正面临的主要开发难题，比如实现计算资源利用率最大化、高效率处理数据传输、核心之间依赖关系的降低等。借助改进后的工具，开发者能够轻松优化各种应用程序，使其更好地在功能强大的异构多核架构上运行，同时充分利用可编程平台。作为行业标准的编程环境，OpenCL具有的极大重要性，它可使开发人员专注于应用程序，而不只是芯片架构。我们已经预见到这些工具将推动有深远影响的创新成果产生，带来难以置信的全新应用。”—— Multicoreware公司首席技术官Wen-Mei Hwu，AFDS2011

“AMD将其在GPU和APU计算领域的精深技术带到了Adobe Creative套件的最新版本中。而此次的技术整合让我们能够给专业的创意工作者提供激动人心的创意方案和快如闪电的性能表现。”——Adobe创新媒体解决方案部产品副总裁Winston Hendrickson，AFDS2012

“Mali系列GPU核心已经占据了20%的Android智能手机市场，在Android平板的GPU市场上占有率高达50%，2012年总计出货超过1.5亿颗Mali GPU核心，有16家合作伙伴推出了基于Mali核心的SoC处理器，OEM厂商出货了200种产品。正在开发中的Mali GPU核心将进一步支持HSA特性，比如GPU可以直接访问CPU页面列表，CPU与GPU的完全一致性、GPU页面默认支持计算任务以及GPU的自我弹性调度等。”——ARM副总裁Gem Davis，AFDS2012

“Oracle已经提出了‘Project Sumatra’(苏门答腊岛工程)，利用通用计算标准OpenCL为其提速。在特定事例当中，使用GPU进行处理将获得超过CPU三倍以上的性能提升。Oracle还将与AMD合作进行一个代号为Sumatra的原始开放码计划，目的就是希望能够让JAVA开发者可以更简易地利用异质架构来进行各式各样的JAVA应用开发”——Oracle Java平台副总裁Nandini Ramani，AFDS2012

“融合概念AMD已经走在的前沿，而全新的融合产品不仅带来了新性能、新功能，还迎来的全新革命性架构——HSA异构系统”——AMD CEO Lisa Su，APU13

“从2012开始，AMD便与其它合作伙伴共同成立了一个HSA异质系统架构基金会(HSA Foundation)。这个基金会的主要工作就是在来制定标准化且开放的异质运算模式，目的就是希望能让开发者可以更快速方便地开发支援HSA架构的应用程式。自这个基金会成立以来，几乎每个月都又2~3个新成员加入，并且随着合作伙伴的增加，HSA架构的应用层面也愈来愈广泛。”——AMD全球院士暨异质系统架构基金会总裁Phil Rogers，APU13

又见神盾局黑手？ GPU/HPC业界暗战揭秘 这就是AMD在获取ExaScale计划资金之后干的最多的事儿——开会和背书

嗯，听上去确实挺令人振奋的，加入ExaScale计划之后的AMD在历次会议上都被人们称道和追捧，“应用层面也愈来愈广泛”，HSA看上去颇受业界及诸位大佬们的好评啊。那么然后呢？

然后？然后似乎就没有什么然后了。实物在哪儿？能够向Exa Flops运算能力前进的解决方案在哪儿？应用HSA体系的HPC集群在哪儿？订单在哪儿？

你问我们，我们问谁去……

又见神盾局黑手？ GPU/HPC业界暗战揭秘 AMD在ExaScale计划当中的存在相当……虚无

自从发布Llano APU之后，除了不具备实用性，仅用来完成基本测试的Sandia国家实验室系统之外，AMD没有再给DARPA以及业界提供任何实际性的面向ExaScale计划的动作。我们没有听到任何关于AMD正式退出ExaScale计划的消息，我们也确实看到了集显性能各种提升的新APU，并且一次又一次的听到关于HSA的重大进展，听到一位又一位业界大佬对HSA和AMD盛赞有加，听到AMD宣布一个又一个辉煌的胜利。但是四年过去了，除了几台价值10万美元左右的低功耗小型服务器之外，我们并没有看到具有决定性意义的HSA系统解决方案实物，没有看到APU在运算领域、或者是显示集成PC以外的任何领域有所表现，没有看到HSA实现了什么别人实现不了的应用或功能，甚至不知道HSA究竟在哪里。

在一片欣欣向荣的背书声中日间稀薄，这就是AMD参与ExaScale计划过程的最大特征。

小Tips③：没错，AMD也有过机会，这机会很早以前就被我们揭示过，不信你可以点击这里。

6自己的历史，要由自己书写

自己的历史，要由自己书写

一两千万美元的一期投资看似并不多，甚至就算是再多十倍的投资其实都不是什么大数目，单靠这些小钱钱并不能从本质上影响架构研发的进展并且直接塑造什么独特的技术优势。但是DARPA的ExaScale计划拥有更多深层次的意义，它是一张入场券，一份推销自己的筹码，同时也是一个能够催促前进的路标。拥有并把握它的人将会获得能够更畅快进入HPC领域的一张重要门票，一个能够更好地推广自己产品甚至定制游戏规则的机会，还有向前发展所需要的宏观技术方向和推动力。谁能获得这张门票，谁就拥有了许多无形的优势和机会。

神盾局的门票发的还是公平的，可拿到门票的选手们的表现却不尽相同。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 Intel参与ExaScale计划的重要斩获——天河二号计算机集群

ExaScale计划第一阶段（2010.6~2011.6），Intel将MIC转化成了Larrabee架构以及PHI计划，NVIDIA则拿出了Fermi/Kepler架构以及远景目标的Echelon架构，IN的共同点在于提出了架构级的实际解决方案，并且通过论文和试验模型的形式对未来的发展路径进行了规划和试验性展示。与之相映成趣的是AMD组织了数场围绕HSA体系的会议，邀请数位在业界有相当影响力的大佬与会并盛赞/畅想了HSA体系那令人振奋的优势及其美好未来，然后并没有给DARPA提供具有实际意义的或者可用的硬件/体系性成果。

ExaScale计划的第二阶段（2011.6~2013.6）演变成了实际的对抗，参与者需要将一阶段的架构及计划付诸于行动，以一系列基于旗下架构/解决方案的超算实体接受DARPA以及整个市场的检验。得益于ExaScale计划核心目的的指导，这一阶段的大规模HPC集群大多进入了异构化的形态并且表现不俗。较晚出现的Intel PHI斩获了包括天河2号在内的一系列重要HPC集群并且正在迅速扩大着Intel异构架构的份额；NVIDIA则获得了包括Titan以及天河1A等大单，并且与PGI合作在编译器领域开始了拓展；AMD在此阶段则仍旧几乎没有体系性的异构架构解决方案，也没有将任何HSA体系的最新研究进展部署到大规模集群当中，只能继续开会宣称HSA在纸面上解决了这样或者那样的问题，这种状态显然无助于提升AMD在HPC领域的市占率。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 天河一号A是不亚于Titan的NVIDIA Tesla大单

在ExaScale计划的第三阶段（2013.6~2016.6），Intel和NVIDIA继续了各自的长远架构规划以及更先进的超算集群计划，并且根据第二阶段获得的经验（性能功耗比以及存储墙对HPC集群的影响）对架构发展进行了必要的修正和补充。Intel公布基于Knights Landing架构的下一代PHI计算卡以及堆叠内存计划，并将之前获得的部分成果延伸到了核显领域，集成新一代核显的Skylake处理器将于明年中到来；NVIDIA则积极地将架构设计结果转化成了显卡领域的优势，发布Maxwell架构并公布了后续的Pascal以及Volta架构计划，将3D memory/NV LINK纳入到路线图当中并继续通过对高效并行计算的研究推动着旗下GPU架构的发展，而且通过后两者获得了Summit以及Sierra这两组下一代超大规模HPC集群的订单。

AMD在此时的表现已经基本上与ExaScale计划脱节了。HSA的关键节点在ExaScale计划第三阶段开始时刚好在Tonga架构当中完成，但AMD却跳过了这一架构，而且依旧没有给出任何体系化的解决方案，所有关于HSA以及融合计算的东西都还只是规划或者纸面上的酝酿。从ARM到SoC再到APU，AMD每年都在宣称即将部署些什么，但这些计划最终基本上都不了了之，甚至连那些声称能够通过HSA/APU取得“惊人幅度提升”的软件和应用也大多不知所踪。如果一定要列举AMD在HPC领域最新的成绩，那也就只有FirePro-S刚刚拿了一个Green500第一名，不过遗憾的是，该系统与ExaScale计划和HSA体系均无直接关联。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 AMD在ExaScale计划当中最大的斩获——让APU变成了只为低端集成用户的存在

ExaScale计划在过去数年间的进行过程似乎带来了一个副产品，那就是它已经成了检验“脚踏实地”与否的优秀对象。Intel和NVIDIA在事实上算是实践了这四个字，而对于AMD，我们不知道该怎么评价它。不过有一点是可以肯定的，在NVIDIA GPU当中体现明显的来自ExaScale计划的积极影响，显然没有同样作用在AMD的GPU架构当中……

现在，你对AMD近年来在GPU领域表现的成因，是不是又有了新的理解呢？

7神盾局手中的GPU未来

神盾局手中的GPU未来

诚如我们在第二页所言，ExaScale计划是一个面向大规模并行计算领域的计划，这让它与GPU架构有了相当大的重合度。它就像一剂催化剂一样，虽然没有直接带来新的技术或者决定性的变革，但却在方向和速度上极大地刺激并促成了GPU/并行运算架构的高速发展。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 得益于与NVIDIA的合作，IBM也更深的介入到了ExaScale计划当中

得益于ExaScale计划的存在以及积极介入，Intel成功的将Larrabee图形架构实体化，并且由此而加速了并行计算协处理器和核显架构的发展。NVIDIA的GPU架构发展也因此而有了修改的参照和目标，Kepler/Maxwell攀升的性能功耗比，以及Pascal/Volta的发展路线确定都与之有着密不可分的联系。

ExaScale计划深度还在存储环节影响了GPU业界在2015年以后的发展轨迹，在来自图形端的压力明显还未大到必须部署大容量堆叠显存（现有的普通显存解决方案完全可以在成本可控的前提下提供本地8GB容量及350GB/S的带宽，足够下一代GPU使用）的前提下，PHI/Tesla在实际应用当中所暴露出来的单节点内存总量严重不足的问题成了堆叠显存实用化的直接推手，Hybrid Memory Cube以及3D memory都是对存储墙做出的回应。无论Intel还是NVIDIA，都在执行ExaScale计划的过程中明确了自己所面临的问题以及接下来的发展轨迹，并以此为目标推动着GPU/并行计算架构的发展。

与之形成鲜明对比的，是AMD在所有领域的尴尬处境。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 ExaScale计划对显卡业界的延伸影响——堆叠内存

对待ExaScale计划令人失望的态度和实际行动并不是导致现阶段AMD弱势的唯一原因，但却是众多原因当中相对显著的那一个。即便不考虑DARPA的拨款以及HPC领域营收对资金匮乏的AMD的意义，仅仅是没能抓住ExaScale所提供的一系列隐形/内在便利条件就足以给AMD创造颇多潜在的发展阻力了。

ExaScale计划的空白让AMD失去了“主心骨”，只能夹在Intel和NVIDIA中间，在行为上被动的根据对手们的动作来做出机械性回应（这其中甚至包括了HBM），这让它丧失了体系化发展、游戏规则制定以及在研发上取得决定性先机等多种机会，想要靠AMD当前的资源和能力，尤其是持续了数年的纸上宏图去重新定义异构计算并完成推广，可能性究竟还有多大是一个并不难回答的问题。

AMD也许有这样或者那样可以让某些粉丝兴奋的特性或者技术，比如说mantle，但这些东西的方向性缺乏指导所以实际效果相当有限，最终也很难在统一目的的统合之下形成一股有效的前进动力。正因为此，AMD长期以来的各种转化才会变得相当无效。而这种转化的无效以及查漏补缺式的架构发展，最终导致了当前GPU业界竞争环境的疲软。

又见神盾局黑手？ GPU/HPC业界暗战揭秘 感谢神盾局，GPU以及显卡应该不会失去未来

不过值得庆幸的是，ExaScale计划给GPU业界的持续发展提供的希望。毫无疑问，即便AMD不存在了，NVIDIA也会在ExaScale计划的框架下为同Intel竞争而继续完善自己的并行计算架构，对该方向研究的成果将会继续被转化成GPU架构以及桌面图形领域的进步，这便是当前这种不健康的竞争环境下我们仍旧未曾对GPU业界失去信心的重要原因——就算AMD彻底停止GPU研发，NVIDIA也不会停止。

看来，我们似乎应该感谢DARPA，因为拜“神盾局”所赐，我们的图形世界应该还会继续延续下去，起码在理论上是如此。这份希望意味着未来，有未来，就会有精彩。

文章出处：中关村在线

相关报道

最热文章排行查看排行详情

邮件订阅

分享到