一、前言:堆料并不是唯一 RTX30 PGF首创ARGB-LED灯效
2018年诞生的NVIDIA Turing是一个非常优秀的GPU构架,除了带来实时光线追踪技术与DLSS深度学习抗锯齿技术之外,还在每个CUDA核心中加入了一个INT32的单精度整数单元,使得GPU可以同时进行整数与浮点计算,单个流处理器的执行效率提升了36%之多。
而新一代Ampere GPU架构更进一步,一个特别的厉害之处在于,它将原本只能进行整数运算的INT32单元进行了改进,使之既能不仅可以运行整数运算,在浮点云算较多的时候也能进行单精度浮点运算,最大化的利用了每一个流处理器的运算资源。
因此,Ampere GPU只需付出很少的晶体管数量作为代价,就将FP32单元的数量翻倍,也可以理解为流处理器数量翻倍,于是我们就看到了拥有10496个流处理器的- RTX 3090、8704个流处理器的- RTX 3080以及5888个流处理器的GeForce RTX 3070。在Turing时代,这本身是不可想象的事情,但是Ampere做到了。
当然,Ampere GPU的改进不仅仅只是如此,它还有更高效率的第二代RTX核心、第三代Tensor Core、能够实现秒进游戏的RTX IO技术等等。这些我们会在后文详细介绍。
今日,我们收到了索泰送来的GeForce RTX 3070 PGF OC,这是目前索泰最强的RTX 3070 显卡,下面我们来看看它的表现如何!
索泰GeForce RTX 3070 PGF OC最大的特点就是采用了ARGB-LED技术打造的个性化灯光系统,这套ARGB信仰灯简直是让你爱不释手。
显卡正面有大量的ARGB-LED元素,支持索泰幻光同步技术,可以通过显卡直接控制机箱风扇、CPU散热器的灯效。
在做工方面,采用了12相供电电路设计,8条6mm纯铜镀镍热管以及2个鲨鱼盾鳞风扇组成的散热系统可以轻松压制240W的TGP。
从GPU-Z的截图可以看到,GeForce RTX 3070 PGF OC的Boost频率达到了1785MHz,比公版的1725MHz高了60MHz,TDP也从公版的220W提升到240W,还有17%的可上拉空间,足够3070的超频要求。
二、安培构架带来了哪些改进
相较上一代图灵构架的GeForce RTX 20系列显卡,安培构架主要带来的如下改进:
1、8nm制程工艺
图灵构架使用的12FFN工艺,在754mm2的面积内集成了186亿只晶体管。安培构架使用的是三星8N工艺,在628mm2的芯片内部集成了280亿只晶体管。算下来晶体管密度提升了83%之多。
2、整合INT32与FP32单元
图灵的INT32单元只能做整数运算,闲置率很高。
为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
3、将ROP单元从内存控制器中分离
传统的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而NVIDIA安培构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
比如GeForce RTX 3070与GeForce RTX 3080一样都有6组GPC,ROP单元数量同样都是96个。
4、第二代RT Core
NVIDIA通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得NVIDIA安培构架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以达到20Giga Rays/s。
5、第三代Tensor Core
第三代Tensor Core的效率是第二代的4倍,即便安培构架将每个SM多单元流处理器中的Tensor Core减半,它依然能达到图灵2倍的效能。
6、RTX IO技术
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
除了以上技术之外,NVIDIA安培构架还支持PCIe 4.0、NVIDIA Reflex等技术,就不再一一叙述了。
三、外观:8条6mm纯铜热管
索泰GeForce RTX 3070 PGF OC有非常绚丽的灯光表现。显卡三围尺寸为315mm*122mm*61mm,厚度为2.5槽。
中间的风扇使用特定倾斜角度的暗影疾风扇叶,以多达13个叶片的设计,大幅增加风压和风量,能够轻松吹透散热器。
左右2个风扇使用特定倾斜角度的鲨鱼盾鳞仿真扇叶设计,有11个叶片。
RGB背板,支持幻光同步,可以通过索泰的FireStorm来单独控制灯效。
底部视角图。
顶部视角图。
双8pin供电接口。
3个DP 1.4与1个HDMI 2.1接口。
史无前例的8热管散热系统,镀镍处理,热管直径是6mm。
PCB板背部有一个PowerBoost控制芯片,这也是PGF系列独门武器,能够大幅度提升显卡的电气性能,即便是高负载下也能保持供电稳定。
12+2相供电设计,每项供电2个MosFET,采用上下桥方式连接。
供电电路特写,MosFET采用的是UBIQ的QA3111。
GA104-300- A1核心,5888个流处理器,核心面积392.5mm2,拥有174亿个晶体管。
旁边是8颗三星GDDR6显存,单颗容量1GB,总容量8GB。频率14GHz,位宽256Bit,显存带宽448GB/s。
四、理论性能测试:运行频率可达2040MHz
1、3DMark
在2K分辨率3DMark Fire Strike Extreme测试中,GeForce RTX 3070 PGF OC图形分数达到了16837分,核心温度最高72℃,核心运行最高频率为2040MHz,最高风扇转速1826RPM,最高功耗244W。
在4K分辨率3DMark Fire Strike Ultra测试中,GeForce RTX 3070 PGF OC图形分数达到了8606分,核心温度最高71℃,核心运行最高频率为2040MHz,最高风扇转速1239RPM,最高功耗244W。
不论是2K分辨率还是4K分辨率,GeForce RTX 3070 PGF OC的性能都比公版强2%。与GeForce RTX 2080 Ti相比,2K分辨率能够领先3%,4K分辨率则有7%的优势。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,GeForce RTX 3070 PGF OC图形分数达到了13693分,核心温度最高71℃,核心运行最高频率为2040MHz,最高风扇转速1836RPM,最高功耗243W。
在4K分辨率3DMark Time Spy Extreme测试中,GeForce RTX 3070 PGF OC图形分数达到了6808分,核心温度最高70℃,核心运行最高频率为2010MHz,最高功耗246W。
2K分辨下,GeForce RTX 3070 PGF OC的性能与公版相同,比GeForce RTX 2080 Ti差了3%;到了4K分辨率时,GeForce RTX 3070 PGF OC比公版强了1%,比GeForce RTX 2080 Ti强了3%。
五、光追与DLSS游戏测试:大部分游戏都可以在2K分辨率下流畅运行
1、古墓丽影:暗影
4K分辨率下,默认最高画质的帧率为61FPS。
开启RTX之后帧率掉到了37FPS。
同时开启RTX + DLSS技术,帧率能够到提升到55FPS。
GeForce RTX 3070 PGF OC可以在《古墓丽影:暗影》中满足1080P与2K分辨率下开启光追的帧率需求,不过如果想要在4K下体验光追,除了要打开DLSS之外,还要适当降低画质。
2、德军总部:新血脉
4K分辨率下开启最高画质,GeForce RTX 3070 PGF OC的帧率为117FPS。
开启RTX之后帧率仅有67FPS。
同时开启RTX和DLSS技术之后,帧率提升到了113FPS。
《德军总部:新血脉》这款游戏对于GeForce RTX 3070 PGF OC来说没有任何压力,即便是4K分辨率,GeForce RTX 3070 PGF OC都能在开启光追的时候达到67FPS的帧率,如果再打开DLSS技术,帧率可以提升到113FPS。
3、轩辕剑7
4K分辨率下开启最高画质,GeForce RTX 3070 PGF OC的帧率为80FPS。
打开RTX之后,帧率仅掉了2FPS,还有78FPS。
同时开启RTX + DLSS,帧率能到115FPS。
《轩辕剑7》对GeForce RTX 3070 PGF OC同样也是没有任何压力,在4K分辨率下同时开启RTX + DLSS技术之后,帧率可以到115FPS。
不过这款游戏看起来开启光追几乎不会有性能损失。
4、赛博朋克2077
1080P分辨率下开启最高画质,GeForce RTX 3070 PGF OC的帧率为98FPS。
打开RTX自后,帧率迅速掉到了40FPS。
开启DLSS之后,帧率提升到了75FPS。
《赛博朋克2077》是目前对于硬件需求最为苛刻的光追游戏,GeForce RTX 3070 PGF OC也只能满足1080P下的帧率需求。
在2K分辨率下,GeForce RTX 3070 PGF OC默认最高画质的帧率是67FPS,开启光追后直接掉到了25FPS,再打开DLSS之后,帧率提升了110%,达到了53FPS。如果想要更加流畅的体验游戏,需要适当降低部分画质。
六、温度与超频测试:烤机67度、GPU可再超频100MHz
1、温度测试
使用Furmark来对GeForce RTX 3070 PGF OC进行烤机测试,测试时室温为26度。
运行FurMark 23分钟之后,GeForce RTX 3070 PGF OC的功耗保持在237左右,烤机频率1635MHz,温度67度,风扇转速1712RPM。
2、超频测试
GeForce RTX 3070 PGF OC的加速频率高达1785MHz,比公版的1725MHz高了60MHz。下面看看他还有没有超频的能力。
经过多次尝试,发现核心频率还能再拉100MHz,此时Boost频率已经达到了1885MHz,比公版高出160MHz。显存频率则可以超频到16GHz,显存带宽512GB/s,同时也将功耗上限拉到最高的280W。
超频之后3DMark Fire Strike Extreme图形分数从达到了18305分,相比默频时的16837分提升了9%,最高运行频率达到了2145MHz,最高温度66度,最高功耗271W。
如果是和公版相比,超频后的公版GeForce RTX 3070的比公版的分数高了11%,
七、总结:灯光与性能都是亮点
仅仅在5年前,绝大多数玩家还是在1080P分辨率下运行游戏。2016年6月30日,GTX 1070发布,这是第一款真正能在3000元价位流畅运行2K游戏的GPU,自此2K显示器开始普及。
而现在的GeForce RTX 3070同样也是3000元的价位,已经能够流畅运行4K游戏的GPU。
可以这样说,GeForce RTX 3070的诞生将会极大加快4K显示器的普及进程。
2年前,图灵构架正式来到玩家面前。与以往的显卡相比,图灵GPU最大的革新就是新增了光线追踪计算单元,也让玩家第一次在游戏中感受到了实时光线追踪技术所带来的震撼画面。
然而,NVIDIA这条路走的可谓是充满坎坷,其中的艰难一言难尽。不过现今相信已经没有人再去质疑光追了。
不过实时光线追踪对于硬件消耗过大,比如在《赛博朋克2077》中,开启RTX之后,帧率一般都会暴跌60%以上。即便是索泰GeForce RTX 3070 PGF OC这样的显卡在2K分辨率下开启光追时也仅有25FPS。但是NVIDIA另外一项黑科技DLSS技术的加持下,帧率能够获得近乎100%的提升,从而达到了53FPS这样一个相对流畅运行的帧率。
市面上大部分非公RTX 3070虽然标称Boost频率很高,但是实际运行频率并不高,在不超频的情况下很少有超过2000MHz的。而索泰GeForce RTX 3070 PGF OC别看Boost频率只有1785MHz,但是在3DMark中的运行频率可以达到2040MHz。核心还可以再超频100MHz,实际运行频率可以达到2145MHz。
在温度控制方面,索泰GeForce RTX 3070 PGF OC满载时有240W,烤机23分钟后温度能控制在67度,风扇转速1712MHz。这在非公RTX 3070中算是较好的成绩。
当然,这块显卡最大卖点还是赏心悦目的ARGB-LED灯效,目前很难找到比它灯光效果更好的显卡。