RTX 40系列生产力该选谁？RTX 4070 Ti表现惊喜小超上代卡皇-快科技-科技改变生活

一、前言：RTX 40全系布局完毕生产力表现相差几何？

经过接近一年的布局，RTX 40系列终于全部推出，涵盖了所有价位，最具代表性的，就是RTX 4090、RTX 4070 Ti、RTX 4060 Ti这三款显卡。

得益于RTX 40系列全新的Ada Lovelace架构，以及TSMC 4N工艺，更高的能效，更小的面积，带来的性能提升非常显著。

就以RTX 4060 Ti举例，只需要185mm2的核心面积，就集成了220亿晶体管；而RTX 3090 Ti的核心面积达628mm2，晶体管数只有280亿！

除了Ada Lovelace架构和TSMC 4N工艺的提升，不得不提还有二级缓存容的变化，RTX 40系开始采用大缓存的路子，让指令命中率得到了极大的改善，也使得处理核心和缓存之间可以传输更多数据。

对于RTX 4090这样的新一代的卡皇来说，同样保留了384bit位宽，影响自然不大。从RTX 4070 Ti/4060 Ti开始，位宽锐减至192bit/128bit，但配合更大的二级缓存、更高的频率，带来了非常可观的性能提升。

这也能看出老黄依然发挥了精准刀法，将每款显卡的各种规格精准划分，能满足的就坚决不多给。

对于RTX 40系列的游戏性能我们也测过不少，相信读者对它们的差距也比较清晰了，这篇文章就从生产力角度对比这三个档次的显卡，看看性能相差有多少。

为了更直观对比，在评测中我们也会加入上代卡皇RTX 3090 Ti，更直观地了解隔代的性能差异。

话不多说，我们现在就进入测试！

二、AV1编码测试：11倍于RTX 3090 Ti 相同画质下码率、体积更小

评测平台：

RTX 40系显卡加入了AV1编码支持，它是一种新兴的开源免版税视频压缩格式，也被视为HEVC替代品。

全新 AV1 编码器的编码效率提升了 40%，可带来更高分辨率和更清晰的画质，而视频制作和直播的创意工作流也由此得以加速。

它的特点就是在相同的码率下，拥有更好的视频质量，或在较低的视频码率，不会有太多的性能损失。

此轮AV1转码测试中，我们使用的工具是剪映Pro，这是一款免费的全能易用的视频编辑工具。

我们将体积659MB（1分32秒、60Mbps码率）的8K视频，输出为4K分辨率的视频，码率为推荐、导出格式为AV1 视频编码。

由于NVIDIA RTX40显卡都搭载了双NVENC编码器，在编码速度是一致的，我们就只放进RTX 4090、RTX 3090 Ti的对比。为了更直观感受到区别，我们还测试了Intel的UHD 770核显。

PS：虽然AMD锐龙7 7900的Radeon 780M集成显卡/RX 7000系独显也支持AV1编码，但生态支持实在太差了，软件方的适配又一直不到位，无法发挥出最大性能，故不加入。

对比图表中，用时最长的是RTX 3090 Ti，因为它并不支持AV1编码，主要工作是交给CPU完成，效率也是三个当中最差的，转码长达6分钟28秒。

Intel UHD 770（酷睿i7-13700）虽然也支持AV1编码，但也需要CPU参与进来，同时进行解码、编码工作，导致在这个过程中CPU和核显占用率都在100%，发挥得还是较为吃力，但花费时间稍快一些，只需要2分29秒就完成了。

RTX 40显卡用时是最短的，这是因为将NVENC编码器加入AV1支持后，可以实现硬编，效率也是对比图中最快的，只需要30秒就能够转换完成，是RTX 3090 Ti的11倍，也是Intel UHD 770的5倍。

以上的对比结果，也能看出RTX 40系加入AV1编码加速后，带来的效率非常显著，这对于视频创作者也是非常至关重要的。

我们也测试了三个不同编码的体积，导出的AV1编码的视频大小为294MB，码率27Mbps；

HEVC（H.265）编码的视频大小为340MB，码率31Mbps；

H.264编码的视频大小为396MB，码率36Mbps；

AV1的码率是最低的，体积也是最小的，这本质上其实就是压缩算法的不同。

在此章节的开头也提到过，AV1可以做到在低码率下，也不会有太多的性能损失。

下面我们就对比三个不同码率下的视频细节。

将同一帧的画面放大到200%以上，可以看到在细节上，对肉眼的区别微乎及微，观感并未有太多影响，相信也不会有人拿着放大镜去看视频吧？

三、SPECview测试：RTX 4090当之无愧最强 RTX 4070 Ti与RTX 3090 Ti持平

对于生产力这方面，我们使用了SPECview这个专业级、符合工业标准的OpenGL图形显示卡效能测试分析软件。

SPECview使用C语言编写，用于测量运行在OpenGL应用程序接口之下硬件的3D图形性能，其包含8个专业图形测试场景，Energy、Medical、Catia、Cero、Maya、SNX以及主要基于OpenGL 4.0架构的Solidworks和基于DirextX架构的Showcase。

这些软件能够反应测试显卡和CPU在压力测试环境下的具体表现，最后给出的帧数结果，可以很直观了解到该显卡在专业级工作时的硬件性能表现，非常具有参考性。

以下所有显卡都在同一平台测试，保持CPU、内存一致，SPECview的测试分辨率为4K。

RTX 4090在SPECview的4K分辨率测试中，3dsmax得分为217.91、catia为90.04、creo为128.82、energy为93.98、maya为512.47、medical为44.46、snx为43.15、solidworks为306.63。

RTX 4070 Ti在SPECview的4K分辨率测试中，3dsmax得分为142.72、catia为58.71、creo为116.31、energy为52.16、maya为361.54、medical为26.9、snx为28.57、solidworks为183.54。

RTX 4060 Ti在SPECview的4K分辨率测试中，3dsmax得分为63.63、catia为38.23、creo为92.15、energy为30.33、maya为222.81、medical为17.16、snx为19.43、solidworks为111.81。

RTX 3090 Ti在SPECview的4K分辨率测试中，3dsmax得分为149.54、catia为63.37、creo为112.41、energy为43.3、maya为378.45、medical为24.89、snx为26.82、solidworks为196.09。

SPECview测试中涵盖了大部分3D建模等生产力所使用的软件，成绩当之无愧最好的是RTX 4090，整体领先了RTX 3090 Ti有57.5%。

RTX 4070 Ti在表现也相当出色，虽然只有12GB显存，但表现与24GB显存的RTX 3090 Ti旗鼓相当。

而RTX 4060 Ti自然是要弱一些，对比RTX 4070 Ti近乎砍半，但在部分场景下也能满足生产力的需求。

四、其它测试：RTX 4090渲染测试依然领先 RTX 4060 Ti效率只有RTX 4070 Ti一半

1、V-RAY

V-Ray是一款计算机图像渲染软件，它能够提供精细的光照、全局照明、镜头失真模拟等核心功能，并且支持CPU和GPU渲染，可以制作出照片级别的渲染效果。此外，它还作为引擎被maya等3D建模渲染工具所使用，拥有相当广的使用场景。

最新版本进一步划分了测试项目，提供了针对CPU的V-Ray、针对CUDA显卡的V-Ray GPU CUDA和针对RTX设备的V-Ray GPU RTX。

我们此项目只测试V-Ray GPU RTX。

RTX 4090的成绩为4312 vrays。

RTX 4070 Ti的成绩为3126 vrays。

RTX 4060 Ti的成绩为1905 vrays。

RTX 3090 Ti的成绩为2868 vrays。

——Blender

Blender作为一款免费开源的多平台轻量级全能三维动画制作软件，也是许多人用于3D创作的选择。

使用RTX 4090进行渲染，monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为6758.71、3199.56、3162.83，总分13121.1。

使用RTX 4070 Ti进行渲染，monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为3753.95、1800.01、1864.84，总分7418.8。

使用RTX 4060 Ti进行渲染，monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为2222.77、1054.93、1132.49，总分4410.19。

使用RTX 3090 Ti进行渲染，monster、junkshop、classroom三个场景中每分钟处理的样本数量分别为3221.83、1947.9、1641.06，总分6810.79。

——Ocrane

Octanebench是 OTOY出品，一个带物理模拟的实时3D渲染引擎。它使用GPU取代CPU进行运算，和传统的在CPU上进行图像渲染不同，这基本上是个全新的领域。显卡是一个非常理想的并行计算设备，而且在执行像渲染这样的高并行任务时，在一台计算机内塞入多张显卡明显比多个CPU容易。

并且Octanebench加入了对NVIDIA RTX硬件加速的支持，下面的测试我们默认启用RTX功能。

RTX 4090的成绩为1400.89分。

RTX 4070 Ti的成绩为775.97分。

RTX 4060 Ti的成绩为439.19分。

RTX 3090 Ti的成绩为739.7分。

从以上这V-RAY、Blender、Ocrane这三项结果来看，表现最好的是RTX 4090无需质疑。

而RXT 4070 Ti的表现，比RTX 3090 Ti的表现还要略好一些，不过差距并不是太大。

RTX 4060 Ti的表现远不如上面几款，只有RXT 4070 Ti的将近一半性能。

五、总结：生产力需求你会怎么选？RTX 4070 Ti表现很惊喜

经过AV1、SPECview、V-RAY、Blender、Ocrane等专业项目的测试，可以看出，NVIDIA RTX 40这三个档次的显卡，性能差异不光体现在传统光栅/光追游戏上，生产力上也做到了精准的划分，不得不佩服老黄的刀法。

RTX 4090当之无愧是新一代的卡皇，毕竟硬件规格在这里摆着，4K游戏/生产力需求都可兼得，可以涵盖多个使用场景，非常全能，实力不俗。

作为新一代卡皇，单单只玩游戏上也未免太浪费了些，所以也有不少专业用户会采购当代卡皇用于工作室3D渲染、视频剪辑等需求，最大程度发挥出它的价值。

RTX 4070 Ti的表现是让笔者最惊喜的，虽然规格看起来略逊一筹，但各项生产力中，都可以与RTX 3090 Ti持平了，要知道前者只有12GB的显存、200W的TGP功耗，而后者显存就有24GB、TGP功耗就达到了450W！

只需一半功耗、一半显存就能实现上代卡皇的实力，这也得益于Ada Lovelace架构和TSMC 4N工艺带来的能效比提升，带来的优势更是可见一斑！

RTX 4060 Ti毕竟主打1080P游戏旗舰卡，显存也偏少，想要用于生产力也未尝不可，只是效率略差一些，更合适应急时使用。

这些全新的RTX 40系显卡，都拥有双NVENC编码器和支持 AV1编码，对于视频剪辑、直播推流等这类需求，再由超高效的 NVIDIA Ada Lovelace 架构提供AI算力支持，带来的效率也非常可观，让使用者大受裨益。

综上所述，RTX 4090在生产力、游戏表现上都堪称全能，完全可以满足专业用户的苛刻需求，但价格只适合顶级玩家或者设计师等职业人群；RTX 4070 Ti规格、价格都比较适中，可以兼顾游戏、生产力，性价比无疑是最高的；RTX 4060 Ti建议只用于游戏场景。

看到这里，相信你也知道该怎么选择了吧？

相关报道

最热文章排行查看排行详情

邮件订阅

分享到