近日,龙芯在《中国科学:信息科学》期刊上公布了下一代处理器微架构“GS464E”的设计,并公开了相关数据测试结果。我们有幸拿到了第一手数据资料,马上和大家分享。
龙芯现有两个多核桌面处理器,分别是四核心的3A-1000、八核心的3B-1500,内核均为2006年定型的GS464微架构——GS是龙芯英文学术代号Godson的缩写,464代表采用4发射64位架构。
处理器微架构的重要性相当于设计图纸,有了它才能进行工程实现。如今,老旧的GS464核心已经不堪重任,各项性能指标都与当前国际主流CPU差距越来越大,无法适应竞争激烈的芯片市场。
其实从2011年起,龙芯就启动了新一代微架构“GS464E”(E代表增强型)的设计工作,历时三年左右开发完成。
GS464E开发之初,龙芯就把Intel Ivy Bridge、IBM Power7当时世界上最先进的两个架构作为其对标产品,参数上也比较接近。如下表所示:
接下来是龙芯GS464、GS464E正式流片之前一些小程序的验证情况,第三列是参考Intel Ivy Bridge的数据。
可以看出,龙芯GS464E在架构设计上比GS464有了质的提升,各项指标远远超过,并且绝大多数参数都已经接近Ivy Bridge,甚至在分支误预测率、浮点程序性能上有些有所超越。
由此可见,龙芯团队的处理器结构设计能力,与世界领先的Intel正在逐步缩小。
据悉,基于GS464E架构的龙芯3A2000、3B2000已经完成流片,并于2015年4月回到龙芯公司。
龙芯3A2000为单路四核桌面版本,龙芯3B2000则是支持双路八核、四路十六核的服务器版本。由于是新架构的第一版产品,制造工艺仍旧是40nm,主频仍然是1GHz左右。
以下是龙芯提供的3A2000的部分实测数据:
龙芯3A2000、3A1000的SPEC CPU2000测试对比
SPEC CPU 2000是国际上通用的CPU性能测试程序,其数据对CPU计算性能有很大的参考性。可以看到,无论是定点(整数)分值还是浮点分值,3A2000比3A1000都有了1倍甚至2倍以上的提高。
龙芯3A2000、3A1000的内存带宽测试对比
龙芯3A 2000的内存带宽性能在各方面普遍要比龙芯3A1000提升了十多倍。
龙芯技术工程师透露,上一代龙芯3A在设计上由于经验不足、考虑不周全,导致内存带宽上表现太弱,成为主要瓶颈,结果导致用户体验表现较差。
这一代重点解决了这个问题,在主频没有提升的情况下,用户体验得以大跨步的提升。虽然和主流Intel产品还有很大差距,但是在架构设计上的差距已经越来越小。
为了和目前市面上主流的CPU架构设计进行直观的比较,龙芯还给出了按照SPEC/GHz分数作为参考分值,对不同架构的SEPC 性能对比:
可以看出,GS464E已经接近Intel、AMD现在市场上的主流架构性能,与Intel Core i3-550和AMD FX-8320基本相当,与Intel Core i5-2300略有差距,同时明显强于Intel Atom、VIA Nano、ARM Cortex-A57等低功耗架构。
而且,3A2000的编译器还没有充分优化,未来还有进一步提升的空间。
正如龙芯公司自己所说的那样,龙芯在过去几年的市场检验中发现了自己的不足,找到了瓶颈问题,加以针对性的改进。这次GS464E的推出,从数据上看比上一代GS464的确有了大幅度的提升。
虽然龙芯的主频还要比Intel/AMD慢很多,整体性能依旧落后不少,但同频性能接近i5-2300已经证明新架构实力的确强悍。
3A2000作为新架构的第一个产品还有一定的验证性质,未来如果能采用更新的28nm工艺,再继续提升主频,应该有资格尝试和Intel的商用主流CPU一较高下。