今年五月份,NVIDIA宣布了基于GK110大核心的高性能计算卡Tesla K20,但只介绍了几种新技术,对确切规格却语焉不详。今天,德国同行Heise.de终于揭开了最后的谜底。
GK110核心采用台积电28nm工艺制造,集成晶体管数量多达恐怖的71亿个,内部安排了15组SMX阵列,每组192个流处理器,总计拥有2880个,但为了提高良品率,NVIDIA最终只开启了其中的13组,也就是2496个。早先有传闻称只会屏蔽一组,但看起来如此一个超大核心确实很“难产”。
Tesla K20的核心频率为705MHz,浮点性能单精度3.52TFlops、双精度1.17TFlops。比之AMD FirePro W9000在单精度上慢了八分之一,但双精度快了将近五分之一,而且在将理论性能转化为实际性能方面,NVIDIA显然会做得更好。
显存方面位宽是384-bit,容量搭配5GB GDDR5并支持ECC错误校验,带宽200GB/s。最初宣布的时候显存容量有6GB、12GB、24GB几种选择,但最终却是“不规则”的5GB,必然是不同带宽、容量颗粒的混合搭配了,但不知道为什么要这样。
Tesla K20计算卡的热设计功耗为225W,6+8针辅助供电,散热方面面向服务器的被动静音设计,面向工作站和桌面的则是主动风扇。
该卡支持Dynamic Parallelism、Hyper-Q、GPUDirect等最新加速计算技术,但需要配合新发布的CUDA 5.0。
Tesla K20定于今年11月初开始量产,4-5周后全面上市。美国橡树岭国家实验室已经拿到了第一批样卡,并计划使用14592块Tesla K20建造新的超级计算机“泰坦”(Titan),2013年完工。
有趣的是,GK110核心始终没有用于桌面显卡的迹象,日前更是有爆料称明年的下一代会直接用改进版GK114而不是GK110,不过Heise.de又说明年就会看到GK110 GeForce。
GK110核心:可以清楚地看到15组SMX,但只会启用13组