GeForce GTX 660 Ti正式发布了,适中的价格和性能不得不惹人喜爱,不过这次我们不谈这个,而是看看比较另类的显存配置。
GTX 660 Ti依然基于GK104核心,只不过进行了二次精简。完整的GK104应该有四个64-bit显存控制器,总位宽256-bit,就像GTX 670/680那样。这四个控制器每个都对应着8个ROP单元、128KB二级缓存,关掉一个控制器也会关掉对应的ROP单元和二级缓存。
GTX 660 Ti就是这样,屏蔽了其中一个显存控制器而只剩下192-bit,同时损失了25%的ROP单元和25%的二级缓存。如果是在30寸显示器上开启高倍抗锯齿,GTX 660 Ti就会有些吃力,但是在22寸显示器上,基本不会有瓶颈,这正是NVIDIA权衡了三种方案后最终为GTX 660 Ti选择了保留流处理器而删减显存的原因所在。
128-bit、256-bit都是“正常”的显存位宽,都是2的整数次幂,很容易搭配512MB、1GB、2GB、4GB等容量的显存。192-bit、384-bit就有些“另类”了,显存容量也要相应地改成768MB、1.5GB、3GB之类的。
因此按照标准设计,192-bit位宽的GTX 660 Ti应该搭配1.5GB或者3GB显存,但是前者显得有些少,Radeon HD 7870/7950可都是2GB,而后者又太多了,对主流应用来说太浪费,12颗显存颗粒成本也不低。
于是NVIDIA选择了第三种方案2GB,并为此又一次使用了混搭设计。
之所以说又一次,是因为我们在上代GTX 550 Ti上就见识到了这种不走寻常路的规格。它也是192-bit显存位宽,通过混合使用128MB(1Gb)、256MB(2Gb)的显存颗粒达成了1GB总容量,其中两个64-bit控制器各使用两颗128MB,第三个使用两颗256MB。
GTX 660 Ti的做法如出一辙,不过因为总容量翻番到2GB而又有所不同:两个控制器各搭配了两颗256MB,第三个是四颗256MB,也都是来自海力士。至于为什么不用单颗512MB(4Gb)的,也很简单:非常稀少、成本太高。
为了给单个64-bit控制器挂上四颗显存,NVIDIA把它们分布在了显卡PCB的正反两面。看过PCB照片就很容易发现,正反对应都有颗粒的那四颗就是它们,而其余四颗的对应面都是空焊的,不管公版还是非公版都是如此。
这种非对称的混搭设计巧妙地解决了显存容量问题,但其实也有隐忧。在对称设计中,每个控制器的显存容量都是相同的,很容易在所有控制器之间进行交错操作,达到子系统的性能最大化。
而在非对称设计中,192-bit带宽、6GHz频率的总带宽为144.2GB/s,显存容量2GB的时候只有其中1.5GB可以享受到完全的交错操作,剩下的512MB只能与单个内存控制器通信,所以带宽也就是总量的1/3,仅仅为48GB/s。
但是接下来最重要的问题,NVIDIA是如何解决这一问题来搞定那部分显存带宽的,就没有任何资料了,谁也不清楚内部到底是怎么回事。这显然是NVIDIA的一个小秘密。
幸运的是,这个小小的缺憾似乎并没有对性能产生实际影响,至少是还没有测出来,GTX 550 Ti就展现了应有的实力,GTX 660 Ti也是如此。再考虑到GK104本身计算能力就偏弱,显存带宽就没那么重要,大多数用户就可以不用去管它了。