一、前言:RTX 40全系布局完毕 生产力表现相差几何?
经过接近一年的布局,RTX 40系列终于全部推出,涵盖了所有价位,最具代表性的,就是RTX 4090、RTX 4070 Ti、RTX 4060 Ti这三款显卡。
得益于RTX 40系列全新的Ada Lovelace架构,以及TSMC 4N工艺,更高的能效,更小的面积,带来的性能提升非常显著。
就以RTX 4060 Ti举例,只需要185mm2的核心面积,就集成了220亿晶体管;而RTX 3090 Ti的核心面积达628mm2,晶体管数只有280亿!
除了Ada Lovelace架构和TSMC 4N工艺的提升,不得不提还有二级缓存容的变化,RTX 40系开始采用大缓存的路子,让指令命中率得到了极大的改善,也使得处理核心和缓存之间可以传输更多数据。
对于RTX 4090这样的新一代的卡皇来说,同样保留了384bit位宽,影响自然不大。从RTX 4070 Ti/4060 Ti开始,位宽锐减至192bit/128bit,但配合更大的二级缓存、更高的频率,带来了非常可观的性能提升。
这也能看出老黄依然发挥了精准刀法,将每款显卡的各种规格精准划分,能满足的就坚决不多给。
对于RTX 40系列的游戏性能我们也测过不少,相信读者对它们的差距也比较清晰了,这篇文章就从生产力角度对比这三个档次的显卡,看看性能相差有多少。
为了更直观对比,在评测中我们也会加入上代卡皇RTX 3090 Ti,更直观地了解隔代的性能差异。
话不多说,我们现在就进入测试!
二、AV1编码测试:11倍于RTX 3090 Ti 相同画质下码率、体积更小
评测平台:
RTX 40系显卡加入了AV1编码支持,它是一种新兴的开源免版税视频压缩格式,也被视为HEVC替代品。
全新 AV1 编码器的编码效率提升了 40%,可带来更高分辨率和更清晰的画质,而视频制作和直播的创意工作流也由此得以加速。
它的特点就是在相同的码率下,拥有更好的视频质量,或在较低的视频码率,不会有太多的性能损失。
此轮AV1转码测试中,我们使用的工具是剪映Pro,这是一款免费的全能易用的视频编辑工具。
我们将体积659MB(1分32秒、60Mbps码率)的8K视频,输出为4K分辨率的视频,码率为推荐、导出格式为AV1 视频编码。
由于NVIDIA RTX40显卡都搭载了双NVENC编码器,在编码速度是一致的,我们就只放进RTX 4090、RTX 3090 Ti的对比。为了更直观感受到区别,我们还测试了Intel的UHD 770核显。
PS:虽然AMD锐龙7 7900的Radeon 780M集成显卡/RX 7000系独显也支持AV1编码,但生态支持实在太差了,软件方的适配又一直不到位,无法发挥出最大性能,故不加入。
对比图表中,用时最长的是RTX 3090 Ti,因为它并不支持AV1编码,主要工作是交给CPU完成,效率也是三个当中最差的,转码长达6分钟28秒。
Intel UHD 770(酷睿i7-13700)虽然也支持AV1编码,但也需要CPU参与进来,同时进行解码、编码工作,导致在这个过程中CPU和核显占用率都在100%,发挥得还是较为吃力,但花费时间稍快一些,只需要2分29秒就完成了。
RTX 40显卡用时是最短的,这是因为将NVENC编码器加入AV1支持后,可以实现硬编,效率也是对比图中最快的,只需要30秒就能够转换完成,是RTX 3090 Ti的11倍,也是Intel UHD 770的5倍。
以上的对比结果,也能看出RTX 40系加入AV1编码加速后,带来的效率非常显著,这对于视频创作者也是非常至关重要的。
我们也测试了三个不同编码的体积,导出的AV1编码的视频大小为294MB,码率27Mbps;
HEVC(H.265)编码的视频大小为340MB,码率31Mbps;
H.264编码的视频大小为396MB,码率36Mbps;
AV1的码率是最低的,体积也是最小的,这本质上其实就是压缩算法的不同。
在此章节的开头也提到过,AV1可以做到在低码率下,也不会有太多的性能损失。
下面我们就对比三个不同码率下的视频细节。
将同一帧的画面放大到200%以上,可以看到在细节上,对肉眼的区别微乎及微,观感并未有太多影响,相信也不会有人拿着放大镜去看视频吧?
三、SPECview测试:RTX 4090当之无愧最强 RTX 4070 Ti与RTX 3090 Ti持平
对于生产力这方面,我们使用了SPECview这个专业级、符合工业标准的OpenGL图形显示卡效能测试分析软件。
SPECview使用C语言编写,用于测量运行在OpenGL应用程序接口之下硬件的3D图形性能,其包含8个专业图形测试场景,Energy、Medical、Catia、Cero、Maya、SNX以及主要基于OpenGL 4.0架构的Solidworks和基于DirextX架构的Showcase。
这些软件能够反应测试显卡和CPU在压力测试环境下的具体表现,最后给出的帧数结果,可以很直观了解到该显卡在专业级工作时的硬件性能表现,非常具有参考性。
以下所有显卡都在同一平台测试,保持CPU、内存一致,SPECview的测试分辨率为4K。
RTX 4090在SPECview的4K分辨率测试中,3dsmax得分为217.91、catia为90.04、creo为128.82、energy为93.98、maya为512.47、medical为44.46、snx为43.15、solidworks为306.63。
RTX 4070 Ti在SPECview的4K分辨率测试中,3dsmax得分为142.72、catia为58.71、creo为116.31、energy为52.16、maya为361.54、medical为26.9、snx为28.57、solidworks为183.54。
RTX 4060 Ti在SPECview的4K分辨率测试中,3dsmax得分为63.63、catia为38.23、creo为92.15、energy为30.33、maya为222.81、medical为17.16、snx为19.43、solidworks为111.81。
RTX 3090 Ti在SPECview的4K分辨率测试中,3dsmax得分为149.54、catia为63.37、creo为112.41、energy为43.3、maya为378.45、medical为24.89、snx为26.82、solidworks为196.09。
SPECview测试中涵盖了大部分3D建模等生产力所使用的软件,成绩当之无愧最好的是RTX 4090,整体领先了RTX 3090 Ti有57.5%。
RTX 4070 Ti在表现也相当出色,虽然只有12GB显存,但表现与24GB显存的RTX 3090 Ti旗鼓相当。
而RTX 4060 Ti自然是要弱一些,对比RTX 4070 Ti近乎砍半,但在部分场景下也能满足生产力的需求。
四、其它测试:RTX 4090渲染测试依然领先 RTX 4060 Ti效率只有RTX 4070 Ti一半
1、V-RAY
V-Ray是一款计算机图像渲染软件,它能够提供精细的光照、全局照明、镜头失真模拟等核心功能,并且支持CPU和GPU渲染,可以制作出照片级别的渲染效果。此外,它还作为引擎被maya等3D建模渲染工具所使用,拥有相当广的使用场景。
最新版本进一步划分了测试项目,提供了针对CPU的V-Ray、针对CUDA显卡的V-Ray GPU CUDA和针对RTX设备的V-Ray GPU RTX。
我们此项目只测试V-Ray GPU RTX。
RTX 4090的成绩为4312 vrays。
RTX 4070 Ti的成绩为3126 vrays。
RTX 4060 Ti的成绩为1905 vrays。
RTX 3090 Ti的成绩为2868 vrays。
——Blender
Blender作为一款免费开源的多平台轻量级全能三维动画制作软件,也是许多人用于3D创作的选择。
使用RTX 4090进行渲染,monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为6758.71、3199.56、3162.83,总分13121.1。
使用RTX 4070 Ti进行渲染,monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为3753.95、1800.01、1864.84,总分7418.8。
使用RTX 4060 Ti进行渲染,monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为2222.77、1054.93、1132.49,总分4410.19。
使用RTX 3090 Ti进行渲染,monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为3221.83、1947.9、1641.06,总分6810.79。
——Ocrane
Octanebench是 OTOY出品,一个带物理模拟的实时3D渲染引擎。它使用GPU取代CPU进行运算,和传统的在CPU上进行图像渲染不同,这基本上是个全新的领域。显卡是一个非常理想的并行计算设备,而且在执行像渲染这样的高并行任务时,在一台计算机内塞入多张显卡明显比多个CPU容易。
并且Octanebench加入了对NVIDIA RTX硬件加速的支持,下面的测试我们默认启用RTX功能。
RTX 4090的成绩为1400.89分。
RTX 4070 Ti的成绩为775.97分。
RTX 4060 Ti的成绩为439.19分。
RTX 3090 Ti的成绩为739.7分。
从以上这V-RAY、Blender、Ocrane这三项结果来看,表现最好的是RTX 4090无需质疑。
而RXT 4070 Ti的表现,比RTX 3090 Ti的表现还要略好一些,不过差距并不是太大。
RTX 4060 Ti的表现远不如上面几款,只有RXT 4070 Ti的将近一半性能。
五、总结:生产力需求你会怎么选?RTX 4070 Ti表现很惊喜
经过AV1、SPECview、V-RAY、Blender、Ocrane等专业项目的测试,可以看出,NVIDIA RTX 40这三个档次的显卡,性能差异不光体现在传统光栅/光追游戏上,生产力上也做到了精准的划分,不得不佩服老黄的刀法。
RTX 4090当之无愧是新一代的卡皇,毕竟硬件规格在这里摆着,4K游戏/生产力需求都可兼得,可以涵盖多个使用场景,非常全能,实力不俗。
作为新一代卡皇,单单只玩游戏上也未免太浪费了些,所以也有不少专业用户会采购当代卡皇用于工作室3D渲染、视频剪辑等需求,最大程度发挥出它的价值。
RTX 4070 Ti的表现是让笔者最惊喜的,虽然规格看起来略逊一筹,但各项生产力中,都可以与RTX 3090 Ti持平了,要知道前者只有12GB的显存、200W的TGP功耗,而后者显存就有24GB、TGP功耗就达到了450W!
只需一半功耗、一半显存就能实现上代卡皇的实力,这也得益于Ada Lovelace架构和TSMC 4N工艺带来的能效比提升,带来的优势更是可见一斑!
RTX 4060 Ti毕竟主打1080P游戏旗舰卡,显存也偏少,想要用于生产力也未尝不可,只是效率略差一些,更合适应急时使用。
这些全新的RTX 40系显卡,都拥有双NVENC编码器和支持 AV1编码,对于视频剪辑、直播推流等这类需求,再由超高效的 NVIDIA Ada Lovelace 架构提供AI算力支持,带来的效率也非常可观,让使用者大受裨益。
综上所述,RTX 4090在生产力、游戏表现上都堪称全能,完全可以满足专业用户的苛刻需求,但价格只适合顶级玩家或者设计师等职业人群;RTX 4070 Ti规格、价格都比较适中,可以兼顾游戏、生产力,性价比无疑是最高的;RTX 4060 Ti建议只用于游戏场景。
看到这里,相信你也知道该怎么选择了吧?