一、前言:安培顶级旗舰降临 价格达1.2万
或许很多同学对于这一次RTX 3080/3090在流处理器数量上翻倍的提升感到不可思议。毕竟从2013年的GTX 780 Ti到2019年的Titan RTX,流处理器数量仅仅只是从2880个提升到了4608个。也就是整整6年的时间,流处理器数量仅仅只是增加了60%而已。
而此次完整的GA102核心竟然有10752个流处理器,相当于 Titan RTX的2.33倍,如此巨大的提升的确是很多年没有出现过了!
PS:上一次N卡大幅提升流处理器是8年前的GTX 680,1536个流处理器数量是GTX 580的三倍,性能则提升了30%!
相较上一代图灵构架的RTX 20系列显卡,安培构架主要带来的如下改进:
1、8nm制程工艺:
图灵构架使用的三星12FFN工艺,在754mm2的面积内集成了186亿只晶体管。安培构架使用的是三星8N工艺,在628mm2的芯片内部集成了280亿只晶体管。算下来晶体管密度提升了83%之多。
2、整合INT32与FP32单元:
图灵的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
3、将ROP单元从内存控制器中分离:
传统的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而安培构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
比如即将发布的RTX 3070与RTX 3080一样都有6组GPC,ROP单元数量同样都是96个。
4、第二代RT Core:
NVIDIA通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得安培构架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以达到20Giga Rays/s。
5、第三代Tensor Core:
第三代Tensor Core的效率是第二代的4倍,即便安培构架将每个SM中的Tensor Core减半,它依然能达到图灵2倍的效能。
6、RTX IO技术:
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
除了以上技术之外,安培构架还支持PCIe 4.0、NVIDIA Reflex等技术,就不再一一叙述了。
9月初,NVIDIA一共发布了3款GA10X核心的显卡型号,此前已经解禁了RTX 3080,今天我们将向大家展示位于顶端的RTX 3090的详尽性能评测。
RTX 3090基于GA102-300-A1核心,拥有7组GPC,82组SM单元共计10496个流处理器、112个ROP、328个纹理单元、328个第三代Tensor Cores、82个第二代RT Cores。搭配24GB GDDR6X显存,显存频率19.5GHz、位宽384Bit、带宽936GB/s。
由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition,我们拿规格与之完全一致的影驰RTX 3090金属大师来进行测试。
RTX 3090的详细规格如下:
对比RTX 3080,RTX 3090的流处理器数量、Tensor Core、 ROP单元、显存带宽、纹理单元都提升了20%左右。
TDP也从RTX 3080的320W进一步提高到了350W,这恐怖是有史以来TDP最高的单芯片N卡。
而价格,也达到了史无前例的11999元起。
GeForce RTX3090 金属大师购买链接:京东(12199元)
GeForce RTX3090 大将购买链接:京东(11999元)
二、影驰RTX 3090金属大师图赏:铝合金压铸上盖 + 18相供电设计
金属大师卡如其名,整个卡充斥了浓厚的金属气息,高强度铝合金压铸一体式上盖顶部勾勒着错落有致的不规则线条,银灰色的金属表面看上去比很多RGB显卡更有高端的感觉。
一体化的合金金属背板可以加固显卡防止PCB板变形,背板的尾端做了开孔处理,可以加速空气的流通。
3个90mm风扇,每个风扇11片扇叶。
底部视角图。
与RTX 3080一样,都是3个DP 1.4a与1个HDMI 2.1接口。
双8Pin供电接口,加上PCIe插槽的供电,一共可以提供375W的功耗。
寒光星散热器,内置6条6mm镀镍复合热管,大面积的纯铜散热底座。显存与MOSFet散热部分采用一体化压铸方式与主散热器连接在一起。
市面上的顶级非公显卡大多是10层PCB,RTX 3090金属大师采用的是12层PCB板,可以大大减少各个电子元件之间的信号干扰,提升显卡的电气性能,增加高频高负载下的稳定性,同时也有利于GPU冲击更高的频率。
GA102-300-A1核心,10496个流处理器,核心面积628.4mm2,拥有283亿个晶体管。
另外还设计了9+5+4相供电电路设计。
美光的GDDR6X显存,一共有24颗(正反各一半),单颗容量1GB,总容量24GB。频率19.5GHz,位宽384Bit,显存带宽936GB/s。
PCB板背面也有12颗GDDR6X显存。
三、测试平台:5.2GHz的i9-10900K + XPG 850W 金牌电源
测试平台如下:
为了降低CPU的瓶颈效应,我们将i9-10900K的核心频率超频到了5.2GHz,Ring频率超频到了4.8GHz。
主板用的是ROG MAXIMUS XII EXTREME。这款主板采用16+0供电,16相供电全部给了CPU核心,0相给核显。MosFET升级为TDA21490,这是目前最高规格的一体化MOSFET,导通电流也从55A提高到了90A,可以轻易提供超过1000W的输出功率。
芝奇皇家戟F4-4000C15D 8GBx4套装,不仅拥有4000MHz的频率,15-16-16-36的时序也是低的吓人,比绝大部分3000MHz频率的内存都要低,不过默认电压1.5V也算是比较高的了。
长江存储致钛PC005 Active 512GB SSD,顺序读写速度分别为3500MB/s,2900MB/s。不依赖模拟SLC缓存也能保持550MB/s的稳定写入速度,同时寿命远远高于市面上绝大多数TLC SSD。
酷冷至尊P360 ARGB水冷散热器,应该是市面上颜值最高也最易安装的水冷散热器,可以很轻松的压制5.2GHz的i9-10900K处理器。
为了应对RTX 3090高达350W的TDP,我们将电源换成了XPG CORE REACTOR 850 GOLD,单路12V输出电流70.8A,12V输出功率达到了850W。
120mm FDB液体动态轴承风扇。
全模块化设计。
华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync 技术、IPS+量子点面板、10bit色彩、DisPlay HDR1000认证。依旧是目前市面上顶级的电竞显示器。
四、理论性能测试:领先RTX 3080 12%左右 默频可达1950MHz
1、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 3090图形分数达到了19599分,核心温度最高68℃,核心运行最高频率为1920MHz,最高风扇转速1516RPM,最高功耗355W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 3090图形分数达到了9968分,核心温度最高67℃,核心运行最高频率为1920MHz,最高风扇转速1515RPM,最高功耗336W。
在3DMark Time Spy测试中,2K分辨率下,RTX 3090的分数只比RTX 3080多了11%,相比RTX 2080 Ti多了39%。到了4K分辨率下的测试,这2项领先幅度分别提升到了12%和50%。
2、3DMark
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 3090图形分数达到了23388分,核心温度最高64℃,核心运行最高频率为1950Hz,最高风扇转速1528RPM,最高功耗361W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 3090图形分数达到了12126分,核心温度最高65℃,核心运行最高频率为1935MHz,最高风扇转速1519RPM,最高功耗358W。
3DMark的结果也同样类似,在2K与4K分辨率下,RTX 3090比RTX 3080分别强了11%、12%。不过相比RTX 2080 Ti,RTX 3090在2K分辨率下能有43%的优势,4K分辨率下则能领先51%。
五、4K游戏性能测试:比RTX 3080快了11% 比RTX 2080 Ti强44%
1、APEX英雄
在4K分辨率下,RTX 3090的帧率依然突破了百帧,比RTX 3080多了13帧,领先幅度为10%;相比RTX 2080 Ti多了46帧,强了48%。
2、使命召唤16:战区
在《使命召唤:战区》中,RTX 3090达到了117帧,比RTX 3080多了14帧,领先幅度为14%;比RTX 2080 Ti高出43帧,领先幅度超过了58%。
3、GTA V
在4K分辨率下,《GTA V》才能发挥出显卡的真正性能,RTX 3090跑出了103帧,比RTX 3080多了10帧,领先幅度为11%;相比RTX 2080 Ti则多出了31帧,领先幅度为43%。
4、刺客信条:奥德赛
《刺客信条:奥德赛》这个游戏不愧是显卡杀手,在4K分辨率下,RTX 3090也这是刚好过了60帧,比RTX 3080多了13帧,领先幅度为25%;相比RTX 2080 Ti则能多出22帧,领先幅度为52%。
5、德军总部:新血脉
NVIDIA最新的GeForce 456.38驱动在这个游戏中的测试有了比较明显的下降,因此我们冲洗测试了所有的显卡。
RTX 3090在《德军总部:新血脉》中跑出了161FPS的成绩,比RTX 3080多了16帧,比RTX 2080 Ti多了44帧。
6、地平线:零之曙光
在《地平线:零之曙光》这个游戏中,RTX 3090的帧率为81FPS,比RTX 3080高了12帧,领先幅度为17%;和RTX 2080 Ti相比,能多出26帧,领先幅度为47%。
7、孤岛惊魂5
在《孤岛惊魂5》中,RTX 3090的帧率为107FPS,比RTX 3080多了9帧,领先优势为9%;比RTX 2080 Ti则多了30帧,领先幅度为39%。
8、古墓丽影:暗影
在《古墓丽影:暗影》中,RTX 3090的帧率为91FPS,比RTX 3080多了8帧,领先幅度为10%;相比RTX 2080 Ti则多了28帧,领先优势为44%。
9、绝地求生
《绝地求生》中,RTX 3090在4K分辨率下依然能跑出148FPS,比RTX 3080强了10%,比RTX 2080 Ti则要强了48%。
10、微软模拟飞行
《微软模拟飞行2020》果然是真硬件杀手,RTX 3090在4K分辨率下也没能超过60FPS(虽然只差了一帧),但是比RTX 3080强了9%,比RTX 2080 Ti则要快了44%。
11、死亡搁浅
RTX 3090在《死亡搁浅》能够很轻松的跑出123FPS,比RTX 3080的112FPS高了11帧,领先幅度为10%;和RTX 2080 Ti相比则多了38帧,强了45%。
12、巫师3
在《巫师3》中,RTX 3090依然能在4K分辨率下测得103FPS的帧率,比RTX 3080高了11帧,领先幅度为12%;和RTX 2080 Ti相比则多出了31帧,领先优势为43%。
13、无主之地3
《无主之地3》是RTX 3090第二款没能到65帧的游戏,和RTX 3080相比能够有10%的优势,与RTX 2080 Ti相比优势幅度接近38%。
14、战地5
在4K分辨率下,RTX 3090在《战地5》中依然跑出了130FPS,但是只比RTX 3080多了7帧,只领先了6%;比RTX 2080 Ti多了41帧,领先优势为46%。
15、战争机器5
在《战争机器5》中,RTX 3090的帧率为91FPS,比RTX 3080多了11帧,领先幅度为14%;与RTX 2080 Ti相比则能多出27帧,领先了42%。
综合测试数据来看,在4K分辨率下,影驰RTX 3090金属大师的性能比RTX 3080强了11%,这个幅度比规格之间的差异低了不少,不过和RTX 2080 Ti相比,RTX 3090金属大师能高出44%的帧率。
比起2年前的旗舰GTX 1080 Ti,RTX 3090金属大师性能提升了整整1倍。
很显然,RTX 3090这个级别的显卡并不是为1080P或者2K而准备的,不过我们还是测试了这2个分辨率的帧数。
1080P分辨率完全无法发挥RTX 3090的性能,即便是i9-10900K超频到全核5.2GHz依旧也存在着巨大的瓶颈。在这个分辨率下,RTX 3090只比RTX 3080强了6%,比RTX 2080 Ti也就高了22%。
2K分辨率的表现稍微好了一点,RTX 3090相对RTX 3080的领先优势略微提升到了8%;比起RTX 2080 Ti,领先幅度也升到了36%。
六、超频测试:能超的核心都给了RTX 3090 最高运行频率可达2160MHz
此前RTX 3080的超频能力的确是令人失望,来看看影驰RTX 3090金属大师的表现如何。
RTX 3090金属大师的规格与公版完全相同,不过其超频能力实在是令人惊讶,在GPU频率提升了220MHz,显存频率从19.5GHz超频到21GHz的情况下,依然能够通过各种测试。
另外,GDDR6X显存超频到21GHz之后,带宽也超过了1000GB/s。
稍显可惜的是,显卡锁了350W的功耗上限。
先将核心频率超频到1915MHz,显存不超。测得的3DMark Time Spy Extreme图形分数为10442,比默频的9968高了474分,提升幅度约为5%。
GPU的最高频率达到了2160MHz,最高功耗355W,最高温度也只有70度,风扇转速1552RPM。
接着我们将GPU核心频率超频到1915MHz,显存频率从19GHz超频到21GHz之后,3DMark Time Spy Extreme的图形分数提高到了10504,提升了60分,可以看出超显存并没有太好的效果。
七、温度与功耗测试:单烤FurMark整机505W 温度70度
1、温度测试
使用Furmark来对RTX 3090进行烤机测试,测试是室温为26度。
将Furmark的参数设定为1920*1080分辨率、0AA。运行22分钟之后,影驰RTX 3090金属大师的温度稳定在70度附近,没有上升的迹象,显卡的功耗稳定在330~350W区间跳动。满载时1604RPM的转速将噪音控制得不错。
即便是将TDP提升到了350W,影驰RTX 3090金属大师的散热器系统也能够比较轻松的应对。
2、功耗测试
分别测试待机、与Furmark烤机功耗,另外我们还会加上游戏功耗测试,测试的游戏项目为《巫师3》。
测试所用的电源为威刚XPG CORE REACTOR 850 GOLD金牌电源。
在5.2GHz i9-10900K + 皇家戟F4-4000C15D 8GBx4平台上,几款显卡的待机功耗都差不多,在90W左右,影驰RTX 3090金属大师稍高一些,达到了95W。
在运行《巫师3》时,影驰RTX 3090金属大师的平台功耗达到了496W,比RTX 3080高了45瓦,比RTX 2080 Ti高了正好100W。
在进行FurMark烤机时,RTX 3090金属大师的整机功耗为505W,比RTX 3080高了40W,比RTX 2080 Ti高出95W。
八、光线追踪与DLSS测试:光追效率强于图灵
为了方便与此前的测试结果进行对比,我们依然选择《堡垒之夜》、《德军总部:新血脉》、《古墓丽影:暗影》、《光明记忆:无限》、《控制》、《战地5》这6款游戏进行光线追踪与DLSS性能测试。
1、堡垒之夜
RTX 3090在默认情况下能达到104FPS的帧率,开启光线追踪之后,帧率会暴跌至31FPS。开启DLSS技术之后帧率又回升到了71FPS。
2、德军总部:新血脉
《德军总部》开启光追之后,RTX 3090的帧率从161FPS掉到了93FPS,开启DLSS能让帧率回升到147FPS。
3、古墓丽影:暗影
《古墓丽影:暗影》开启光追对于帧率没有太大的影响,RTX 3090只是从91FPS掉到了56FPS,打开DLSS后帧率提升到了80FPS。
4、光明记忆:无限
《光明记忆:无限》应该算是目前为止光追效果最好的游戏之一,开启光锥之后帧率跌的也比较厉害。RTX 3090开启光追之后直接从满帧120FPS掉到了48FPS。开启DLSS之后,游戏帧率又回到了112FPS。
5、控制
《控制》支持DLSS 2.0技术,RTX 3090开启DLSS之后游戏的帧率达到了82FPS,甚至超过了默认的71FPS。
6、战地5
《战地5》开启光追之后帧率下降的并不多,RTX 3090只是从130FPS掉到了81FPS,不过开启DLSS之后帧率提升也非常有限,仅有20%左右。
开启光追之后,2块图灵显卡的帧率都是从220%调到了100%,跌幅约为55%;而RTX 3
080的降幅则是52%,RTX 3090的降幅是51%。从这里可以看出新一代的RTX 3080/3090逛追效率要稍高于RTX 2080/2080 Ti。
与光追相反,RTX 3080/3090开启DLSS之后帧率提升为80%左右,低于RTX 2080/2080 Ti的90%。由此看来即便是使用了第三代Tensor Core,但是在单元数减半之后,多少会对DLSS性能造成一些影响。
PS:《德军总部:新血脉》在最新GeForce 456.38-WHQL驱动中帧率都有不同幅度的降低,我们重新测试了所有显卡的成绩。
九、总结:RTX 3090能打又能超、RTX 3070也值得期待
在整个测试过程中,RTX 3090给笔者印象最深的就是它的超频能力。此前我们曾经测试过多快RTX 3080显卡,将GPU频率提升40MHz都无法通过稳定性测试。而RTX 3090就能在将核心频率超频220MHz,显存频率从19.5GHz提升大21GHz的情况下通过各种测试,实在是令人惊讶。
出现这种情况,比较合理的解释就是NVIDIA将体质最好的GA-102核心用来制造更加高端的RTX 3090,而RTX 3080能超的只是极少部分,想要超频只能凭用户自己的运气了。
从规格上来说,不论是流处理器数量、显存位宽、ROP以及纹理单元上来看,RTX 3090的规模都比RTX 3080高了整整20%,此前我们预计RTX 3090的性能应该能有15%的提升。
不过实际测试情况多少还是有一点不及预期!在4K分辨率下,RTX 3090的游戏性能只是刚好比RTX 3080强了11%,相比RTX 2080 Ti则有着44%的提升。
至于光线追踪,RTX 3090搭载了82个第二代RT Core,在开启光线追踪之后,性能损失要低于上一代的RTX 2080 Ti。就我们测试的6款光追游戏来看,在关闭RTX的情况下,RTX 3090的性能比RTX 2080 Ti强43%左右,而在都打开光线追踪技术之后,RTX 3090的领先幅度会提升到54%。
与光追相反,虽然RTX 3090集成了第三代Tensor Core,不过由于数量爆减,DLSS的性能提升幅度并不是太理想。RTX 2080 Ti在开启DLSS技术之后游戏的帧率能够有87%的提升,而RTX 3090则只有78%的提升。
在温度方面,我们手上这块影驰RTX 3090金属大师在进行了FurMark 22分钟的烤机测试之后,GPU的核心温度被控制在70度,而功耗也非常接近于满载。
对于电源的选择,由于NVIDIA严格限制了8Pin供电接口与PCIe x16接口的供电功率,因此双8pin供电接口的显卡整卡功率是很难超过375W的。我们在单烤GPU的时候,RTX 3090的整机功耗在500W左右,考虑到威刚XPG CORE REACTOR 850 GOLD金牌电源的转换效率,此时电源的实际输出功率约在470W左右。
对于大多数同学来说,一款单路供电750W的金牌电源足以满足日常使用需求。双路12V电源则至少要求单路12V电流值能超过36A,也即是至少需求额定900W以上的双路电源。
对比RTX 3080与RTX 3090,对于大多数没有特殊需求的游戏玩家而言,毫无疑问5499元的RTX 3080拥有无与伦比的性价比。而11999元的RTX 3090拥有24GB GDDR6X显存,可以用来完成很多图形设计相关的工作。
最后是对RTX 3070的一些期待!
或许有很多同学根据RTX 3080的8704个流处理器是RTX 3070 5888个流处理器 数量的1.5倍来推断RTX 3080的性能也是RTX 3070的1.5倍。而RTX 3080性能是RTX 2080 Ti的1.3倍,从而得出结论RTX 3070的性能比RTX 2080 Ti差了20%,与RTX 2080 Super相当。
其实这种算法是错的,对于高端显卡而言规格提升50%并不能带来50%的游戏帧率提升。
从RTX 3090的测试数据我们也看到了,它的规格参数方面比RTX 3080高了20%,但实际游戏性能只有11%的提升。因此RTX 3080的游戏帧率是不可能比RTX 3070高1.5倍的。
更合理的算法是,RTX 3080的流处理器数量是RTX 2080 Ti的2倍,性能高了30%。非常巧合的是RTX 3070的流处理器数量也是RTX 2080的2倍整,由此换算,RTX 3070的性能应当比RTX 2080强30%,与RTX 2080 Ti相当。
考虑到RTX 3070在ROP方面没有被阉割,与RTX 3080同样是96个,因此在抗锯齿性能方面会有比较亮眼的表现。但由于其显存带宽只有448GB/s,与RTX 2080 Ti的616GB/s存在着较大差距,因而在4K分辨率下的表现相对RTX 2080 Ti可能会稍有不如。
由此得出的结论就是,在1080P/2K分辨率下,RTX 3070的性能可以媲美RTX 2080 Ti,但在4K分辨率下可能会有一些差距。不过对于3888元售价的RTX 3070来说,它本身就是一块针对2K144Hz而设计的GPU,如果你是在2K甚至1080P分辨率下进行游戏,RTX 3070将是非常合适的选择。
当然如果你有4K需求,传说中提升了带宽的RTX 3070 Ti应该是能完全战胜RTX 2080 Ti的。
我们将会在10月份首发NVIDIA GeForce RTX 3070的评测,希望能给大家带来一些惊喜!
GeForce RTX3090 金属大师购买链接:京东(12199元)
GeForce RTX3090 大将购买链接:京东(11999元)