一、前言:首款256Bit位宽的RTX 4070系列显卡
2022年9月,RTX 4070 Ti在发布前爆出了个乌龙,由于其性能可以媲美RTX 3090 Ti,NVIDIA有意将它命名为RTX 4080 12GB。
但是192Bit位宽的RTX 4080玩家是绝对无法接受的(就算性能再强也无济于事),NV最终顺应民意做出了妥协,这才有了售价6488元的RTX 4070 Ti。
2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。
首先上市的是RTX 4070 SUPER,现在轮到了RTX 4070 Ti SUPER,这是首款拥有256Bit显存位宽的RTX 4070系列显卡,同时还采用了更高一级的AD 103核心,但售价依旧维持6488元不变。
这是完整的AD103核心,是为RTX 4080 SUPER准备的,芯片面积378.6平方毫米,集成了多达459亿个晶体管。
AD103核心内部组成可以分为7组GPC、40组TPC、80-组SM,每一组SM 128个CUDA核心,整个核心总计10240个CUDA核心。
AD103-275核心,也就是RTX 4070 Ti SUPER,直接屏蔽掉了下面一组GPC,一共还剩6组GPC、33组TPC、66个SM单元共8448个流处理器。
另外,它还有264个第四代Tensor张量核心、66个第三代RT光追核心、264个纹理单元、96个ROP单元以及48MB二级缓存。
RTX 4070 Ti SUPER详细规格参数如下:
可以看到,RTX 4070 Ti SUPER与其他4070相比,显存位宽从192Bit升级到了256Bit,带宽达到了672GB/s,再配合48MB二级缓存,应付4K游戏不会有太大问题。
RTX 4070 Ti SUPER和RTX 4070 Ti一样没有FE公版,本次首发采用的是影驰大将版本,价格6488元。
二、影驰RTX 4070 Ti SUPER大将图赏:11+2相供电设计 8条6mm复合热管
整卡大小为333*140*62mm,三槽厚度。
正面有3个特制静霜风扇,风扇直径92mm,支持智能启停,在温度低于60度时停转。
风扇特写。
全尺寸金属背板,尾部还采用了镂空设计,气流可直接吹透,提升散热效率。
顶部视角图。
16Pin供电接口。
标准的一个HDMI、三个DisplayPort接口。
两段式散热器,一共有8条6mm复合热管,这热管数量在RTX 4070 Ti SUPER应该是最多的一档。
GeForce RTX 4070 Ti SUPER 大将为8层PCB,紧凑设计严谨合理,电气性能更好。
11+2相供电电路设计,满足285W整卡功耗非常富余。
PCB板背面。
RTX 4070 Ti SUPER采用的是AD103-275核心,芯片面积378mm2,拥有459亿晶体管。
GPU旁边是8颗美光GDDR6X显存,单颗2GB,总容量16GB,等效频率21GHz,带宽672GB/s。
核心供电特写。
三、测试平台:i9-14900K + ROG MAXIMUS Z790 DARK HERO主板
测试平台如下:
1、i9-14900K
在锐龙7 7800X3D与i9-14900K之间,选了后者。
2、ROG MAXIMUS Z790 DARK HERO主板
这块主板设计了20+1+2的供电电路,每相供电配备一个日系富士通 MIL 系列10K黑金固态电容,一个MICRO FINE粉末化超合金电感,以及一个90A的DrMOS。
整个供电电路可以提供超过1500W的功率输出,就算是使用液氮极限超频也没问题。
3、七彩虹CVN DDR5-6600 16GBx2内存
七彩虹CVN DDR5 6000 16GB x2套条,时序34-44-44-108,电压1.4V。
4、七彩虹iGame LQ360 Ultra W水冷散热器
5、七彩虹iGame P850G Ultra W电源
6、玩家国度PG27UQ ROG 27英寸IPS电竞显示器
用了多年的华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync 技术、IPS+量子点面板、10bit色彩、Display HDR1000认证,直到现在依旧是市面上顶级的电竞显示器。
四、理论性能测试:3DMark最高运行频率2760MHz 风扇转速不超过1300RPM
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070 Ti SUPER图形分数达到了28577分,核心温度最高62℃,热点温度最高75℃,核心运行最高频率为2760MHz,最高风扇转速1207PM,整卡最高功耗283W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070 Ti SUPER图形分数达到了14155分,核心温度最高63℃,核心运行最高频率为2760MHz,最高风扇转速1285RPM,最高功耗291W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 4070 Ti SUPER图形分数达到了24024分,核心温度最高64℃,核心运行最高频率为2745Hz,最高风扇转速1305RPM,最高功耗289W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070 Ti SUPER图形分数达到了11878分,核心温度最高64℃,核心运行最高频率为2760Hz,最高风扇转速1215RPM,最高功耗291W。
五、1080P游戏性能测试:比RTX 3090 Ti强8%
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试结果汇总如下:
1080P分辨率下,RTX 4070 Ti SUPER的帧率基本能跑到140FPS以上,比起RTX 3090 Ti要快了8%,比RTX 4070 Ti则快了5%。
六、2K游戏性能测试:比RTX 3090 Ti强5%
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试结果汇总如下:
七、4K游戏性能测试:与RTX 3090 Ti不分胜负
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试结果汇总如下:
4K分辨率下,RTX 4070 Ti SUPER只有2款游戏帧率不足60FPS,但他们都能支持DLSS 3。
与RTX 4070 Ti相比,能够领先9%;至于RTX 3090 Ti,二者互有胜负,差距仅有0.3%。
八、StableDiffusion体验:SDXL可将生图速度提升200%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI 中获得翻倍的性能。
本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。
我们生成20张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时8分钟。
使用SDXL加速之后,耗时仅为2分59秒。
结合终端数据,可以看到RTX 4070 Ti SUPER使用默认加速器时,生图速度只有2.2it/s,而在TensorRT加持下,生图速度直接到了6.9it/s,提升幅度为200%。
九、DLSS3游戏测试之一:4款DLSS3游戏
此次我们一共测试了8款游戏,包括4款支持DLSS 3的游戏:《3DMark》、《毁灭全人类》、《星空》、《微软模拟飞行》。
另外还有4款同时支持DLSS与光追的游戏:《光明记忆》、《生死轮回》、《赛博朋克2077》、《霍格沃茨之遗》。
所有DLSS 3以及光追测试都是在2K分辨率下进行。
1、星空
最高画质下,RTX 4070 Ti SUPER帧率81FPS。
开启DLSS 3之后,帧率为159FPS,提升幅度将近100%。
2、微软模拟飞行
2K分辨率最高画质下,RTX 4070 Ti SUPER的帧率为122FPS。
开启DLSS 3之后,帧率达到了257,提升111%。
3、毁灭全人类2:重新探测
最高画质下,RTX 4070 Ti SUPER的帧率为154FPS。
开启DLSS 3之后,帧率来到了276FPS,近乎翻倍。
4、3DMark
DLSS 2模式下帧率为164FPS,比默认的71FPS提升了131%。
DLSS 3的成绩为172FPS,相比默认提升了142%。
十、DLSS3游戏测试之一:4款支持DLSS3的光追游戏
1、光明记忆:无限
开启光追时,游戏的帧率为126FPS。
开启DLSS 3之后,帧率提升到了258FPS,提升了105%。
2、生死轮回
开启光追之后,游戏的帧率仅有78FPS。
打开DLSS 3之后,帧率提升到了225FPS,提升幅度为158%。
3、赛博朋克2077
开启光追时,帧率为49FPS。
这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了174FPS。
4、霍格沃茨之遗
开启光追时,帧率为73FPS。
打开DLSS 3之后,帧率来到了204FPS,提升幅度高达179%。
测试数据汇总如下:
十一、实际功耗测试:2K游戏平均功耗232W
1、烤机测试
将Furmark的参数设定为1920*1200分辨率、0AA。
运行13分钟之后,影驰RTX 4070 Ti SUPER大将的温度稳定在66度附近,功耗稳定在285W,烤机时GPU频率为2085MHz,CPU风扇转速只有1705RPM。
2)、真实游戏功耗测试
1、GTA V
1080P分辨率下,RTX 4070 Ti SUPER的功耗为119W,而RTX 3090 Ti则高达218W。
2K分辨率下,RTX 4070 Ti SUPER功耗是162W,运行频率2760MHz,温度45度。
RTX 3090 Ti的功耗为277W,运行频率2040MHz,温度50度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是227W,而RTX 3090 Ti功耗为378W。
2、绝地求生
1080P分辨率下,RTX 4070 Ti SUPER的功耗为234W,而RTX 3090 Ti则高达394W。
2K分辨率下,RTX 4070 Ti SUPER功耗是230W,运行频率2730MHz,温度59度。
RTX 3090 Ti的功耗为404W,运行频率2010MHz,温度86度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是277W,而RTX 3090 Ti功耗为433W。
3、古墓丽影:暗影
1080P分辨率下,RTX 4070 Ti SUPER的功耗为251W,而RTX 3090 Ti则高达374W。
2K分辨率下,RTX 4070 Ti SUPER功耗是2560W,运行频率2730MHz,温度61度。
RTX 3090 Ti的功耗为400W,运行频率20250MHz,温度65度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是270W,而RTX 3090 Ti功耗为432W。
测试数据汇总如下:
RTX 4070 Ti SUPER在1080P、2K与4K分辨率下的游戏功耗分别为214W、232W、263W,大约是RTX 3090 Ti的60%。
十二、总结:眼馋RTX 4080的可以下手了
本次测试小结如下:
1、性能
受制于192Bit显存位宽,RTX 4070 Ti在1080P和2K分辨率下的性能表现虽然可以媲美甚至超越RTX 3090 Ti,但是受制于192Bit位宽,它在4K分辨率下表现不尽如人意,与RTX 3090 Ti慢了大概10%。
而现在,拥有256Bit位宽的RTX 4070 Ti SUPER则是全面战胜了RTX 3090 Ti,也完全可以应付运行4K游戏的帧率需求。
我们所测试的12款3A游戏,仅有《赛博朋克2077》与《星空》这2款游戏帧率没达到60帧,而刚好这2款游戏都能支持DLSS 3,在开启此功能之后,帧率可以从56FPS提升到120FPS以上。
至于其他10款游戏,帧率都在70FPS以上。
在1080P分辨率下,RTX 4070 Ti SUPER比RTX 3090 Ti强了8%,比RTX 4070 Ti强了5%,比起RTX 38080 Ti则是强了15%之多。
2K分辨率下,RTX 4070 Ti SUPER依旧能够领先RTX 3090 Ti约5%,比RTX 4070 Ti快了6%,比起RTX 3080 Ti则有15%的优势。
4K分辨率下,RTX 4070 Ti SUPER与RTX 3090 Ti互有胜负,二者性能差异不到0.5%,相比RTX 4070 Ti则能领先9%。
2、能效比
进入RTX 40系之后,TGP不再代表显卡的真实功耗,而是指功耗墙,正常情况下的运行功耗会远低于TGP数字。
总体来看,RTX 4070 Ti SUPER的游戏功耗约为RTX 3090 Ti的60%,考虑到性能上的提升,因而在能效比方面,RTX 4070 Ti SUPER几乎是前代卡皇的2倍。
我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下RTX 4070 Ti SUPER的平均功耗是214W,而RTX 3080 Ti是314W,RTX 3090 Ti则是356W。
2K分辨率下,RTX 4070 Ti SUPERi在6款游戏中的平均功耗是232W,RTX 3080 Ti和RTX 3090 Ti则分别是332W、390W。
4K分辨率下,RTX 4070 Ti SUPER在6款游戏中的平均功耗为263W,而RTX 3080 Ti已经跑到了350W的TGP上限,RTX 3090 Ti则高达428W。
4、DLSS 3和光追
目前可玩的DLSS 3游戏已有60余款,此次我们测试了9款。
在开启DLSS 2之后,游戏帧率提升幅度为81%。打开DLSS 3,游戏帧率提升幅度达到了140%。
由于RTX 3090 Ti不支持DLSS 3技术,因此在这些游戏中的帧率已经是全面落后于RTX 4070 Ti SUPER。
至于光追,RTX 4070 Ti SUPER拥有66个第三代RT Core,开启光追之后,游戏帧率平均下跌53%,而RTX 3090 Ti下降幅度达到了60%,新一代的光追单元运算效率比前辈要高了不少。
5、AI性能
如今RTX GPU的AI性能已经独步天下,即便是不适用TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion画图首选,而今在TensorRT加持下,RTX 4070 Ti SUPER的生图速度可以直接提升200%以上,至此已无任何对手。
至于价格,也许你曾经对于RTX 4080强悍的性能心动不已,但面对其9499元的售价只能望而却步。
现在RTX 4070 Ti SUPER同样拥有256Bit位宽以及16GB大容量显存,在性能上的差距有只有15%左右,但是价格只有6499元,足足便宜了3000元之多。
眼馋RTX 4080的玩家可以动手了,而这就是RTX 4070 Ti SUPER诞生的意义。