最近的桌面显卡领域的确是热闹非凡,NVIDIA和AMD也相继迈入了新时代:首先,GT200 GeForce GTX 280/260登场,在一片争议中树立了新的旗舰地位(双芯的暂且放一边);接着,Radeon HD 4850在AMD的默许下公开偷跑,性能评测和实际产品已经满天飞,给很多人带来了非常意外的惊喜,并迫使NVIDIA拿出了55nm工艺的新版核心仓促迎战;现在,RV770 Radeon HD 4870/4850正式发布了,AMD的绝地反击战也正式打响。
ATI Radeon HD 4800系列官方推广网站:http://www.unleashonetera.com/
RV770核心由台积电采用55nm工艺生产,集成9.56亿个晶体管(此前传言是9.65亿个),比同样工艺的上代RV670多出2.90亿个,也就是43.5%,不过与14亿个晶体管的65nm GT200还差不少,只相当于后者的68.3%。再加上不同的工艺,RV770和GT200的核心面积相差悬殊,这点只要看看对比图就很明显了:
粗略地说,一块RV770晶圆能切割出大约220个核心,而一块GT200晶圆只能切割105个左右。
规格方面,RV770集成了800个流处理器(一度被认为是480个),是RV670的2.5倍,同时纹理单元增至40个,ROP单元还是16个,不过进行了彻底改造,加强了硬件反锯齿(AA)处理,这点后边会看到效果。
高端版本Radeon HD 4870核心频率750MHz,搭配512MB GDDR5显存,位宽256-bit,频率900MHz,等效数据率3.6Gbps(QDR),实际带宽115.2GB/s,已经超过了使用448-bit 999MHz 896MB GDDR3的GeForce GTX 260的111.9GB/s,浮点性能1.2TFlops,是史上第一块浮点性能达到1TFlops以上的单芯片显卡。新型GDDR5显存第一次露面就展现了不俗的实力,而NVIDIA很可能要到明年下半年才会开始采纳GDDR5。
低端版本Radeon HD 4850核心频率降至625MHz,改用单插槽散热,显存是目前常用的GDDR3,规格为256-bit、512MB、993MHz、2Gbps、63.6GB/s、1.0TFLops。由于频率较低,其带宽还不如HD 3870和9800 GTX,但并不影响出色的性能。
Radeon HD 4870显卡功耗最高160W,单、双卡系统电源额定功率建议至少500W和600W,而且每块显卡需要两个六针外接电源插头;Radeon HD 4850显卡功耗最高110W,单、双卡系统电源额定功率建议至少450W和550W,而且每块显卡需要一个六针外接电源插头。
Radeon HD 4850官方建议零售价199美元,早已大量上市,实际价格最低只有170美元左右;Radeon HD 4870官方建议零售价299美元,定于7月8日上市,不过已经有多家显卡厂商宣布了各自的产品,而且开始在渠道里出现。
官方高清图赏(点击放大):
具体架构方面,RV770相当于RV670的增强版,而且不仅仅是增加了480个流处理这么简单,在很多方面都有所改进,特别需要指出的就是显存控制器的变化。
从R520开始,ATI引入了一种环形总线架构“Ring Bus”,可以提供很高的速度和带宽,之后R600对其进行了升级,内部数据带宽高达100GB/s,这是ATI一直引以为豪的技术。不过,这种技术也有一个致命的缺点,就是容易造成带宽和能量浪费,不利于控制功耗,尤其是AMD现在一直在追求更好的每瓦特性能。鉴于此,RV770放弃了Ring Bus,改用了更传统的中心交换式架构“Switched Hub”。
在这种架构下,传往显示控制器、PCI-E界面、UVD2引擎等的数据不要绕远路,因此有利于节约能耗,而且放弃环形总线能有效降低延迟,因为数据现在是点对点发送的。当然,这种设计的缺点就是带宽会降低不少,但事实上现在的显卡一般并不需要那么高的带宽,ATI显然是高估了R520、R600的带宽需求量。
那么降低带宽是否会伤害多路CrossFire?AMD显然考虑到了这一点,在RV770架构中加入了新的“CrossFire Sideport”,作用是在多颗GPU之间进行协调通信。当然,RV770这种单芯片显卡是用不到它的,而要等到R700这种单卡多芯片架构,这也再次凸显了AMD坚持发展多路并联架构的决心。
RV670环形总线架构
RV770中心交换式总线
之前我们说了,RV770虽然还是16个ROP单元,但进行了完全重新设计,对硬件AA处理予以特别关照,再加上流处理数量的猛增,RV770的AA性能比RV670提高了一大截。
现在该看看3D游戏性能了,分为RV770单卡和双卡CF两大部分。
还有功耗:
数据和图表就能说明一切,这里就不再赘言了,只说说AMD提出了一个新指标“单位面积性能”,也就是每平方毫米(平方厘米)芯片核心能带来多少浮点或游戏性能。结合之前对比的RV770、GT200核心面积、性能数据,对比如下:
每平方毫米的浮点性能(GFlops)
每平方厘米的游戏帧率(FPS)
每平方厘米的功耗(焦耳)
小结:
这些天来,Radeon HD 4850不断给我们带来惊喜,事实也不断证明,在200美元价位上,Radeon HD 4850的竞争力可以说是无可匹敌的,是这一档次上最值得选购的产品。9800 GTX虽然降到了199美元,但性能与HD 4850差了一截;新的55nm 9800 GTX+也不完全是其对手,而且贵30美元,上市日期也要等半个多月。
Radeon HD 4870的表现也相当出色,简单概括就是300美元的代价换来了450美元的GeForce GTX 260的性能水准,有时候甚至不比600美元的GeForce GTX 280差多少,因此和其小弟一样都是出色性价比的典型代表,也贯彻了AMD最近的显卡策略。
顺便说说GPGPU通用计算问题。NVIDIA的CUDA技术已经开发得相当不错,收购Ageia后将PhysX物理加速引入到自己的显卡中就是最出色的成果之一,也是其杀手锏技术。虽然AMD的显卡通用计算也颇有造诣,但实际应用还是略差一些,不过另一方面,AMD有自己的处理器,可以从CPU和GPU两方面同时着手,与Intel-Havok携手就是明证,而这是NVIDIA所做不到的,也是NVIDIA坚持强调GPU重要地位的根本原因。当然了,现在的显卡通用计算应用还只是个开始,总体来说相当不成熟,还有待硬件、软件厂商深入挖掘、长期发展,现在取得的些许成果并不太值得夸耀。
当然,由于NVIDIA和AMD采用了大相径庭的核心架构和技术,应用程序和3D游戏的优化就显得很重要,尤其是考虑到一些非技术层面的问题,事情就更难说了。未来是开放的,就看游戏和通用计算开发商如何利用双方的硬件了。
最后附上两段官方高清演示视频,也是AMD日前演示Cinema 2.0时用到的:
Ruby与巨型蜘蛛怪: http://download.amd.com/Corporate/AMD_RUBY_S04.mov
蝎子: http://download.amd.com/Corporate/Cinema/AMD_FINCHER_HD.mov