一、前言:不要小看了RTX 3070
新一代Ampere架构的GeForce RTX 30系列显卡可能是近年来争议最大的GPU!特别是RTX 3080以三倍数量的流处理器只带来了60%的性能提升,老黄在发布会上承诺的综合性能2倍于RTX 2080的目标似乎并未实现。
有鉴于此,大部分玩家对于RTX 3070的性能表现并不看好。悲观一点的甚至认为其性能还比不过RTX 2080 Super,更别说RTX 2080 Ti了。
RTX 3070的性能真的如此不堪吗,当然不是!
首先必须要承认图灵构架的优秀。从Kepler到Maxwell到再到Pascal,每一个CUDA核心都就是由FP32单元构成,Turing构架则在每个CUDA核心内部增加了一个INT32单元,以此提升了30%的运算效率。
不过由于游戏运行时对浮点运算的需求远远高于整数运算,因此Turing构架中的INT32单元大部分时候都是闲置的。
新一代Ampere架构的最大改进就是让这些INT32单元既能做整数运算,也能做浮点运算。因此RTX 3070是货真价实的5888个流处理器,可能比不上同样流处理器数量的图灵GPU(毕竟还有INT32单元额外的30%加成),但是绝对远远强于2944个流处理器的RTX 2080。
除此之外,Ampere架构还有一点改进让RTX 3070获益匪浅。
传统的GPU构架中的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而安培构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
RTX 3070虽然显存位宽只有256Bit,不过却与RTX 3080一样同样拥有6组GPC,因此ROP单元也是96个。以往的GPU构架,256Bit位宽只能有64个ROP。
基于以上二点改进,就注定了RTX 3070的性能将不容小觑。
RTX 3070的详细规格如下:
RTX 3070采用的是GA104-300核心,基于三星8nm制程工艺,拥有6组GPC,46组SM单元共计5888个流处理器、96个ROP、184个纹理单元、184个第三代Tensor Cores、46个第二代RT Cores。搭配8GB三星GDDR6显存,显存频率14GHz、位宽256Bit、带宽448GB/s。
RTX 3070的显存带宽和RTX 2080 Ti之间相差了将近40%,到底对于实际性能会有怎样的影响,待后面的测试为你解开谜团!