通过NVIDIA官方网站上的一份PDF技术文档,我们确认了上周的一则消息:基于Fermi新架构的Tesla 20系列专业计算卡仅有448个流处理器。
根据NVIDIA最初公布的规格,完整的Fermi核心由16组SM阵列构成,每组之中又有32个流处理器(NVIDIA称之为CUDA核心),总共512个,但在Tesla 20系列上屏蔽了两组SM阵列即64个流处理器。
与此同时,Tesla 20的显存位宽标注为384-bit,而在NVIDIA的原始计划中,Fermi架构应该要搭配512-bit位宽的。
如此精简的原因也很简单:控制功耗。Tesla 20系列的典型功耗就已经有190W,最大功耗则可达225W,使用了六针和八针两个PCI-E辅助供电接口。如果开启全部512个流处理器,整卡功耗势必会超过250W,对于一款单芯显卡来说着实太热,恐怕得历史性地需要两个八针供电接口。
Tesla 20专业卡的命运也让我们不得不担忧未来的桌面型号,不知道NVIDIA会不会同样被迫妥协,或者孤注一掷拿出全规格怪物?至少在NVIDIA网站上针对Fermi架构的介绍中,依然在说512个处理器。
Tesla 20系列完整规格一览:
1、GPU核心:
- 流处理器数量:448个 - Shader单元频率:1.25-1.40GHz - 电压:1.05V - 封装:1981针BGA 42.5×42.5毫米(不是核心尺寸)
2、显存:
- 类型:GDDR5 - 位宽:384-bit - 显存频率:1.8-2.0GHz - 容量: Tesla C2050 3GB/24颗32M×32 GDDR5 Tesla C2070 6GB/24颗64M×32 GDDR5
3、整卡:
- PCB电路板:十层 - 系统接口:PCI-E 2.0 x16 - 物理尺寸:4.376×9.75英寸(11.12×24.77厘米),双插槽 - 功耗:不高于225W
4、输出接口:一个Dual-Link DVI-I
5、供电接口:一个六针、一个八针
6、性能:双精度计算最高600GFlops
7、技术特点:
- 支持下一代IEEE 754-2008双精度浮点标准 - 支持ECC(错误校验码)以提高可靠性和精确度 - 一级、二级多层缓存体系 - 支持C++编程语言 - 支持最多1TB系统内存 - 并行内核执行、快速上下文切换、10倍速度原子指令、64位虚拟寻址空间、系统调用与递归函数
Tesla C2050/C2070 GPU计算处理面向工作站客户,售价2499/3499美元,还有相应的1U计算系统Tesla S2050/S2070,面向数据中心客户,售价12995/18995美元,均将在2010年第二季度上市。