一、前言:新工艺新架构 迎战黄氏刀法
作为当今唯一拥有高性能CPU处理器、高性能GPU显卡、高性能芯片组主板三大平台的AMD,要同时面对来自Intel、NVIDIA两大巨头的残酷竞争,怎一个难字了得。
CPU处理器被打压几乎十年之后,全新的Zen锐龙实现了华丽丽的逆袭,而面对老黄的精湛刀法,7nm全新工艺、RDNA全新架构的Radeon RX 5700系列也终于吹响了反击的号角,虽然还不足以彻底扳倒对手,但也终于给高端玩家们端上了一道别样的大餐。
有关RDNA架构、Navi核心、RX 5700系列显卡,之前我们已经有了详尽的解读,这里再提炼一些要点共同回顾。
GCN架构沿用了八年之久,如今A卡终于新生,引入了全新设计的RDNA架构,首个核心代号为Navi,面向中高端游戏市场,而且和第三代锐龙处理器一样采用了最新的台积电7nm制造工艺,同时在游戏卡上首发PCIe 4.0,还在A卡历史上第一次引入了GDDR6显存。
需要强调的是,RDNA是一个全方位重新设计的架构,并不是GCN的又一个升级版,也不是与GCN的混合体。
新工艺新架构意味着更高的集成度、更小的核心、更强的性能、更好的能效,RDNA Navi也不例外。
Navi核心集成了103亿个晶体管,相比Vega 64 125亿个少了大约18%,但核心面积只有251平方毫米,相比Vega 64 495平方毫米小了足足一半,因此单位面积性能提升了足足1.3倍。
尽管晶体管更少、面积更小,Navi核心的性能相比于Vega 64却提升了14%,同时功耗降低了23%,能效比因此大涨50%。
RDNA架构主要从三大方面进行了变革,包括CU计算单元、缓存、流水线。
计算单元虽然看起来每一组还是64个流处理器,数量没变,但这个数字是AMD反复设计后与处理资源最为平衡的的组合,同时整个计算单元的结构进行了彻底重组,和GCN时代完全不一样了。
Navi核心的计算单元一共分为40组,每组64个流处理器、2个标量处理器、4个64位双线性过滤单元,总计80个、2560个、160个,执行延迟更低,单线程性能更强,缓存效率更高,整体计算能效比GCN架构有着巨大的提升,而且可适应从游戏到计算各种负载。
缓存方面,RDNA架构设计了一套多级一致性结构,每个双CU组合内都有自己的零级缓存,与ALU单元的载入带宽翻番,增加了四组新的一级缓存(都是16-way 128KB),降低了二级缓存(16-way 4MB)的拥堵,整体延迟和功耗大大减低,并全面支持Delta数据压缩(DCC)。
整个图形引擎也做了重新调整,更加顺畅高效,包括几何引擎、64个纹理单元、4个增强的ACE异步计算引擎(ACE),负载分配更加均衡,可以在更低的功耗下达成更高的频率,能效更高。
Radeon显示引擎也大幅跃进,支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,针对高分辨率HR显示器优化,可输出4K/240Hz、8K/60Hz,而且都只需一根数据线即可达成,同时还优化了VR头显显示。
Radeon多媒体引擎则大大改进了视频编解码,增加了新的H.265 HDR/WCG编码器,全面支持H.264 1080p600、4K150、8K30解码和1080p360、4K90编码,H.265 1080p360、4K90、8K24解码和1080p360、4K60编码,VP9 4K90、8K24解码,整体编码速度加快40%。
规格方面,RX 5700 XT有40个计算单元、2560个流处理器、64个ROP单元、256个纹理单元,核心频率提供三个级别:
拷机等高负载下的基准频率(Base Clock) 1605MHz、典型游戏负载下的游戏频率(Game Clock) 1755MHz、芯片体质决定的极限加速频率(Boost Clock) 1905MHz——注意最后的加速频率是否能够达到要看功耗和散热空间是否允许,不同显卡的最高加速频率也会不一样。
显存搭载了8GB GDDR6,位宽为256-bit,等效频率14GHz,带宽为448GB/s。
整卡功耗为225W,8+6针辅助供电。
RX 5700减少到36个计算单元、2304个流处理器、144个纹理单元(图中有误),ROP单元不变,频率基准1465MHz、游戏1625MHz、极限1725MHz,显存不变,整卡功耗为180W,也是8+6针辅助供电。
AMD显卡第一次引入GDDR6显存,RX 5700 XT、RX 5700的规格是一样的,都是256-bit 8GB,带宽高达448GB/s。
PCIe 4.0的加入使得AMD在处理器、主板、显卡三大件上同时首发,应用前景是相当广阔的,除了翻番的带宽可以提高游戏数据传输速度、降低延迟、缩短加载速度,特别对于内容创作大有裨益,可以轻松处理器8K60fps这样的超清视频。
RX 5700系列还带来了FidelityFX图形技术,这是一系列画质增强技术的组合,而且完全开源,面向开发者提供完整的开发包,可轻松植入游戏,并且已经得到了诸多游戏开发商和引擎的支持。
首先是“Radeon Image Sharpening”,简称RIS,出自TXAA抗锯齿开发者,是一种动态适应性的画面锐化技术,解决因为后期处理、抗锯齿造成的画面偏软、细节模糊问题,让画面看起来更锐利、细节更清晰。
然后是“Radeon Anti-Lag”,简称RAL,可以大大缩短从鼠标点击到游戏响应的时间,幅度基本都在30-35%左右。
RDNA架构将是AMD GPU显卡未来多年的基石,接下来我们将看到采用7nm+工艺的第二代版本RDNA 2,看路线图有望明年初和我们见面。
对于大家非常关注的光线追踪技术,在下一代RDNA架构上,AMD会通过硬件单元,支持特定的光线追踪效果在游戏中实时渲染。
即便到了更遥远的未来,AMD也不会将光线追踪全部一股脑扔给硬件来本地处理,否则效率会非常低下,而是将借助云计算、软件辅助达成一种混合架构,实现全场景的光线追踪,保证画面效果的同时,不会给本地硬件太大的压力。