2009年十一期间,NVIDIA第一次向我们展示了代号Fermi的全新图形架构,不过几乎完全是关于通用计算的,展示了NVIDIA开辟新领域的决心。到了今年初的CES 2010上,NVIDIA终于首次公开拿出了Fermi架构高端型号GF100,展示立体多屏环绕技术3D Vision Surround的同时,内部运行了几个新的演示DEMO。
今天,NVIDIA终于公开了Fermi GF100在游戏架构方面的诸多特性,这才是普通消费者最为关心的,也是我们要和大家分享的。
不过我们仍未看到最终零售版的GF100显卡,不少关键的核心参数也暂时缺失,所以如果你急切地想知道下边这些内容,抱歉要失望了。
- 核心面积 - 时钟频率 - 产品型号 - 实际功耗 - 零售价格 - 游戏性能
Fermi芯片至今仍未开始真正的批量生产,而核心面积在很大程度上决定着良品率,良品率又是时钟频率的前提,功耗和性能又都是建立在频率基础上,它们又都是价格的组成要素。当然了,GF100必须要比Radeon HD 5870速度更快,而且领先幅度要尽量高;功耗和价格也已经不可避免地要更高,只看能控制到什么程度了。
下边是2009年9月1日拍摄的Fermi GF100内核照片:
一、GF100游戏架构的两颗新心脏
我们已经知道,GF100采用台积电40nm工艺制造,集成大约30亿个晶体管,包含512个流处理器(SP),或者按照NVIDIA官方的说法是CUDA核心。32个这种核心组成一个流式多处理器阵列(SM),然后再四个组成一个图形处理集群(GPC)。GF100就是这样的三层分级架构:4个GPC、16个SM、512个SP。
此外GF100还有64个纹理寻址单元、256个纹理过滤单元、48个ROP单元,显存位宽384-bit,搭配GDDR5颗粒。核心/Shader/显存频率都没有定夺,显存容量也尚待确定。
GF100 | GTX 295 | GTX 285 | 9800 GTX+ | |
流处理器 | 512 | 2 x 240 | 240 | 128 |
纹理寻址/过滤单元 | 64/256 | 2 x 80 / 80 | 80 / 80 | 64 / 64 |
ROP单元 | 48 | 2x 28 | 32 | 16 |
核心频率 | ? | 576MHz | 648MHz | 738MHz |
Shader频率 | ? | 1242MHz | 1476MHz | 1836MHz |
显存频率 | ? GDDR5 | 999MHz GDDR3 | 1242MHz GDDR3 | 1100MHz GDDR3 |
显存带宽 | 384-bit | 2 x 448-bit | 512-bit | 256-bit |
显存容量 | ? | 2 x 896MB | 1GB | 512MB |
晶体管 | 3B | 2 x 1.4B | 1.4B | 754M |
制造工艺 | TSMC 40nm | TSMC 55nm | TSMC 55nm | TSMC 55nm |
价格 | $? | $500 | $400 | $150 - 200 |
先看一下NVIDIA最新公布的比较详尽的GF100架构图,接下来我们就详细阐述其中的几个重点之处。