再看Maxwell架构:改变不是一丁点
随着架构的不断变化,NVIDIA流处理器的组合方式也在随之变动。费米、开普勒时代每一组叫一个SMX,全称为“Streaming Multiprocessor Extreme”(极致流式多处理器),麦克斯韦上则是SMM,全称为“Maxwell Streaming Multiprocessor”(麦克斯韦流式多处理器)——这是第一次把代号名称放进去。
和此前Kepler架构每组SMX拥有192个流处理器不同的是Maxwell架构中的每组SMM只拥有128个流处理器,每组都有自己的一个多形体引擎2.0、八个纹理单元,而且每组SMM中还进一步细分为四个逻辑控制核心,每个逻辑控制核心中拥有32个流处理器。
GM107核心架构图
单个SMM核心架构图
NVIDIA表示这么做的好处就是让线程调度更加合理,而且流处理器的利用率会更高,带来最直观的好处就是内核性能提升35%,能耗比提升一倍(GM107)。
另外在具体内核方面,Maxwell架构的二级缓存从Kepler的56KB暴增到了768KB,这是Maxwell和Kepler架构最大的区别之处,这么做带来的好处就是更有利于GPU查询,线程利用效率更高。
此外Maxwell架构还增加了每时钟周期的指令数(IPC),改进了负载均衡与基于编译器的调度,引入了更快的H.264编码、解码,并改进了NVENC编码引擎,可用于ShadowPlay。此外还加入了新的GC5电源状态,睡眠更深入,待机更省电。
最重要的一点是,在同为28nm制造工艺的前提下,Maxwell相比Kepler架构在单位面积上的流处理器密度增加了30%,晶体管密度增加了15%,这是非常难能可贵的。而GM107的核心面积也因此控制到了148平方毫米,比此前预测的156平方毫米缩小了不少,另外它的TDP也只有区区60W,仅靠PCI-E接口就能保证供电了,无需外接辅助供电。
而这次的GM204则集成了5.2亿的晶体管,核心面积398平方毫米。共计16组SMM/2048个CUDA核心、16个几何单元、64个ROPs光栅单元以及128个纹理单元,集成了256bit显存控制器。
另外一个细微的变化是GM204的CUDA核心性能相比GK104提升了40%,此前GM107核心只能提升35%,看来是架构方面又有了细微的变化。
性能方面,NVIDIA官方号称它可以达到GK104核心的两倍。从官方提供的性能对比来看似乎也确实如此,部分游戏中甚至达到了两倍以上。