Maxwell架构细节解析:流处理器变化巨大
随着架构的不断变化,NVIDIA流处理器的组合方式也在随之变动。费米、开普勒时代每一组叫一个SMX,全称为“Streaming Multiprocessor Extreme”(极致流式多处理器),麦克斯韦上则是SMM,全称为“Maxwell Streaming Multiprocessor”(麦克斯韦流式多处理器)——这是第一次把代号名称放进去。
和此前Kepler架构每组SMX拥有192个流处理器不同的是Maxwell架构中的每组SMM只拥有128个流处理器,每组都有自己的一个多形体引擎2.0、八个纹理单元,而且每组SMM中还进一步细分为四个逻辑控制核心,每个逻辑控制核心中拥有32个流处理器。
NVIDIA表示这么做的好处就是让线程调度更加合理,而且流处理器的利用率会更高,带来最直观的好处就是内核性能提升35%,能耗比提升一倍。
而GM107核心中共拥有五组SMM,也就是640个流处理器,后端则拥有16个ROPs光栅单元、两组显存控制器(位宽128bit)。
另外在具体内核方面,Maxwell架构的二级缓存从Kepler的56KB暴增到了2MB,这是Maxwell和Kepler架构最大的区别之处,这么做带来的好处就是更有利于GPU查询,线程利用效率更高。
此外Maxwell架构还增加了每时钟周期的指令数(IPC),改进了负载均衡与基于编译器的调度,引入了更快的H.264编码、解码,并改进了NVENC编码引擎,可用于ShadowPlay。此外还加入了新的GC5电源状态,睡眠更深入,待机更省电。
最重要的一点是,在同为28nm制造工艺的前提下,Maxwell相比Kepler架构在单位面积上的流处理器密度增加了30%,晶体管密度增加了15%,这是非常难能可贵的。而GM107的核心面积也因此控制到了148平方毫米,比此前预测的156平方毫米缩小了不少,另外它的TDP也只有区区60W,仅靠PCI-E接口就能保证供电了,无需外接辅助供电。