GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测
  • 上方文Q
  • 2017年08月14日 21:46
  • 0

【Vega架构解析:AMD GPU五年来最革命性进步】

不知不觉,Radeon这个显卡品牌已经诞生17年了,也伴随太多DIYer走过了青春岁月,而时代在变化,Radeon面临的需求也越发多样化。

AMD在技术白皮书中特别指出,除了传统游戏不断冲击视觉技术极限,GPU还面临着更广泛需求的挑战,从机器学习到专业视觉化,从虚拟化到虚拟现实,GPU的计算能力也在快速跟上,以满足超大数据集的需求,但是GPU存储能力并未得到显著提升。

为此,AMD全新设计了Vega架构,这也是GCN图形架构诞生五年以来,AMD GPU最革命性的变化。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

不过,新核心的变化实在太多了,涉及几乎所有方面,而且很多都过于专业,所以这里我们之挑选其中几个要点和大家分享。

1、Vega 10:高集成度的大核心

Vega架构的第一个产品是“Vega 10”,一个相对大规模的芯片,面向高分辨率游戏、VR虚拟现实、高性能计算和机器学习、高负载工作站等领域。

它采用14nm LPP FinFET工艺制造,集成了125亿个晶体管,核心面积486平方毫米。

相比之下,28nm工艺的上代大核心Fiji集成了89亿个晶体管,面积却有596平方毫米,也就是说Vega 10核心晶体管规模多了整整40%,面积却缩小了18%!

另外,同样14nm工艺的Polaris 10核心集成57亿个晶体管,核心面积232平方毫米,Vega 10与之相比晶体管多了1.2倍,面积增大了1.1倍,集成度也有所提高。

Vega 10核心经过优化后,可以充分利用FinFET工艺的低漏电率优势,频率也高于以往任何Radeon显卡,官方标称最高加速频率就有1.67GHz,而实际运行中完全可以超过1.7GHz,实测中甚至见到过1.75GHz。

相比之下,上代Fiji核心最多只能加速到1GHz左右,Polaris 10最高则是超过1.3GHz。

Raja表示,14nm工艺对CPU和GPU来说都很平衡,在CPU上可以实现高频率,GPU上则可以实现高集成度,比如Vega就因此比Fiji核心要小得多,但是性能高出很多。

Vega 10核心依然有64个计算单元、4096个流处理器,规模上和Fiji是一样的,但凭借高进的架构和更高的频率,单精度浮点计算性能达到了惊人的13.7TFlops(每秒13.7万亿次计算),而且还支持16位数学计算,半精度浮点性能达27.4TFlops。

Vega 10还是AMD第一个使用了Infinity Fabric互连设计的GPU核心,也就是Zen处理器里的那一套。这种低延迟的SoC型互连总线可以在芯片的不同模块之间提供一致性通信,也使得芯片设计更加弹性灵活,可以做到模块化,能随时根据需要加入不同配置和模块。

Vega 10芯片中,Infinity Fabric连接着图形核心与其他主要逻辑模块,包括显存控制器、PCI-E控制器、显示引擎、视频加速器等等,也为未来的APU奠定了基础。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

2、全新显存架构和高带宽缓存控制器(HBCC)

GPU通常需要在本地显存中保存所需要数据集或者资源的全部,因为走PCI-E等外部通道的话,将无法保证足够的带宽或延迟。

随着软件内存管理的日益复杂,这对开发者提出了越来越高的挑战,而显存成本又决定了不可能把容量做到特别大。

为此,Vega架构可以将本地显存作为末级缓存使用。如果GPU要访问的部分数据不在显存之内,可以通过PCI-E总线获取所需内存页面,并保存在高带宽缓存中,而不是让GPU停下来,等待完成全部所需资源的复制。

页面通常比整个纹理等资源小得多,复制可以迅速完成,后续访问就直接从缓存中拉取,延迟自然非常低。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

这主要得益于Vega架构新增的高带宽缓存控制器(HBCC),可以将远程内存作为本地缓存使用,同时可以将本地显存作为末级缓存使用。

HBCC支持49位寻址,最多能访问512TB虚拟寻址空间,而现代CPU的寻址空间也不过48位,同时比最多10+GB的显存也多了几个数量级。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

HBCC被视为Vega架构中最大的革新,简单地说可以把整个系统内存当做显存来使用,相当于一块显卡可以拥有TB级别的高速显存,无论性能还是容量都不是事儿。

换言之,它实现了某种程度上的一体化内存池,这部分AMD称之为“HBCC内存区”(HMS)。

Radeon Pro SSG之所以能板载2TB SSD,就是得益于这种设计,消除了从GPU到SSD之间的隔阂,可以直接访问其中的数据,从而大大降低延迟和过载。

为了将这种设计发挥到极致,Vega架构其他部分也做了针对性调整,比如说二级缓存就扮演着中心角色,容量翻番到4MB,所有图形区块都直接与其相连,而以往像素引擎是有自己的缓存的。

当然,HBCC设计也需要开发者去学习适应,才能挖掘和释放其最大潜力,而且它也不是必须使用的,开发者如果对显存容量和性能没有特别高的要求,仍然可以走传统路线。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

显存方面,Vega搭配了第二代高带宽显存HBM2,类似Fiji那样与GPU核心整合封装,使用硅中介层与GPU物理互连。

得益于新的技术和工艺,HBM2最多可以堆叠8个,单颗容量最大8GB,Vega专业卡就用了两颗供16GB,RX Vega家族则配备了两颗供8GB。

同时,HBM2每个堆栈的位宽达1024-bit,因此只需很低的频率,就能提供极高的带宽。

在显卡驱动控制面板中,用户可以根据自己的需要,手动调整HMS的容量范围。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

3、下一代计算单元(NCU)

AMD GCN架构的核心模块是计算单元(CU),Vega也是如此,但同样做了全面翻新,官方称之为下一代计算单元(NCU)。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

NCU的一个亮点变化就是加入了快速堆叠运算(Rapid Packed Math/RPM),允许两个FP16半精度的运算同时执行,并支持丰富的16位浮点和整数指令集,包括FMA、MUL、ADD、MIN/MAX/MED、Bit Shift等等。

一般来说,日常游戏、3D渲染对单精度FP32、双精度FP64要求比较高,而在大规模深度计算中,FP16半精度十分关键。

Vega首次支持半精度计算,每个NCU拥有64个ALU,可以灵活地执行紧缩数学操作指令,比如每个周期可执行512个8位数学计算,或者256个16位计算,或者128个32位计算。这不仅充分利用了硬件资源,也能大幅度提升Vega在深度学习上的性能。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

RPM专门用于加速FP16半精度的运算速度,比如新的着色器可以利用RPM,在AMD一直引以为傲的TressFX毛发渲染中,将每秒能渲染的头发数量增加一倍,因此,RPM可以帮助GPU核心进行更快更强的的物理计算。

NCU还可以同时进行计算和图形处理,并且能够根据负载不同而变换SIMD单元宽度,结果就是以往需要多个计算单元才能完成的任务,现在只需一个就能搞定,不会造成浪费。

种种改进结合,Vega 10核心可以每秒钟执行27万亿次浮点计算,或者55万亿次整数操作。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

4、下一代几何引擎

Vega的整个几何引擎针对更高三角形吞吐量做了优化,增加了新的快速硬件路径,比以往更有弹性、可编程性。

Vega几何引擎里的创新很多,最具代表性的当属新的原语着色器(Primitive Shader),可以合并部分几何处理流水线,抛弃隐藏的、没必要的原语,代之以新的高效着色类型,而且启动非常快,每时钟周期的峰值原语剔除率是以前的四倍。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

Vega 10拥有四个几何引擎,加入了新的原语着色器之后,每时钟周期的最大原语吞吐量可以超过17个,而以前只能做到4个。

同时,Vega架构还加入了新的智能负载分配器(IWD),可以根据实际情况持续调整流水线设定,更好地平衡各个几何引擎之间的负载,提高利用率。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

5、下一代像素引擎

随着4K/5K/8K超高分辨率和240Hz高刷新率显示器的出现和普及,以及VR虚拟现实的进一步发展,显卡像素吞吐能力也面临着越来越大的压力,Vega为此重新设计了像素引擎,加入了大量新功能。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

比如说流式传输光栅器(Draw Stream Binning Rasterizer/DSBR),可以消除GPU上非必要的处理和数据传输,提升性能、降低功耗。

Vega支持区块光栅化渲染(tile-based rasterization)和像素集成读取(binning),可以进一步提高流处理器的利用效率,降低CPU分派3D图像渲染指令的压力。这两种渲染技术在移动GPU上早已大行其道,NVIDIA GTX 750系列开始也加入了支持

Vega能够及时剔除无效的渲染单元,在片上高速缓存内执行光栅化,同时打破了以往架构像素和纹理访问的不一致,实现硬件存储一致性,也就是各级缓存的数据都是最新的,二级缓存统一为渲染后端服务。

AMD表示,DSBR技术开启之后,能在游戏中获得10%的帧率提升,同时节约最多33%的显存带宽,而且不会增加功耗。

而在SPECviewperf 12 energy01专业性能测试中,DSBR更是带来了超过一倍的性能提升。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

另外,Vega的新一代像素引擎还集成了最广泛、最完整的DX12 Feature Level 12_1功能特性,并完全支持Vulkan 1.0。

因此,Vega 10非常适合高级图形技术开发,以及体验新技术。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

6、丰富的显示输出

A卡在显示输出方面一贯有很强的特点和优势,Vega也不例外。

它支持DisplayPort 1.4标准和HDR3、MST、HDR和各种高精度色彩格式,也支持HDMI 2.0,最高能输出4K/60Hz、12位色彩通道、4:2:0编码,DisplayPort、HDMI也都支持HDCP内容保护。

当然了,FreeSync技术必不可少,支持大量可变刷新率游戏,同时也有FreeSync 2,可将HDR内容低延迟地映射到附加显示器上。

Vega和Polaris一样可以最多支持六屏输出,但是位深、分辨率和刷新率都更高,比如在32-bit HDR模式下,支持最多两台4K 120Hz、三台5K 60Hz(单数据线)、三台8K 30Hz、三台4K 60Hz,64-bit HDR模式下还支持一台4K 120Hz、一台5K 60Hz。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

视频解码方面,Vega支持HEVC/H.265 Main10,分辨率最高4K/60Hz,以及10-bit HDR,H.264同样可以做到4K/60Hz,VP9也能支持4K。

编码方面,HEVC/H.265格式支持1080p240、1440p120、2160p60,H.264则支持1080p120、1440p60、2160p60,相比Polaris又有了明显进步。

甚至是在SR-IOV虚拟化中,Vega可以直接共享GPU的视频编解码加速,最多支持16个同步用户对话。

当然还有显示器,AMD主推的FreeSync技术已经广泛普及,支持型号超过了200款,规格也十分齐全,分辨率2K到4K、刷新率60Hz到144Hz应有尽有。

而在FreeSync的基础上,AMD还推出了增强同步(Enhanced Sync)技术,支持240Hz以上的更高刷新率显示器,可以最大程度地减少卡顿。

另外,AMD还在新驱动中优化了游戏响应时间,降低帧延迟,尽可能消除游戏画面的撕裂。

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测

GTX 1070/1080杀手来袭!AMD RX Vega 56/64显卡首发评测


文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部0条评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0