[依旧为单核设计 1950XTX保守中求胜]
处理器已经双核了,内存也已经双通道了,显卡也能SLI了,种种迹象表明双数代表了性能的飞跃。从ATi最新旗舰产品X1950XTX来看,它依旧采用了单核设计,使用了经过优化的R580核心,也就是所谓的R580+,在显示技术上没有任何突破,基本上沿用了我们所知的X1000系列技术特点,不过X1950XTX作为ATi最新旗舰性产品,自然需要有独到之处,而这个最大亮点就是首次搭载了GDDR4显存颗粒,默认频率达到了2GHz。
ATi在X1000系列显卡中给我们带来了多款实用性技术,一举摆脱如只支持SM2.0、DX9.0B等老旧显卡印象,尤其是X1800XTX这款显卡凭借先进技术及全规格在各种测试中都表现不错,而其后续产品X1900XTX更是延续了X1000系列显卡的技术特点,并在管线等方面做出了突破,使X1900XTX的性能达到了新的境界,而ATi的竞争对手NVIDIA却正在酝酿7950GX2。
NVIDIA 7950GX2使用了全新的构架,通过两颗G71核心,在不惜工本的前提下,达到了前所未有的性能,由于构架修改很大,所以至今7950GX2还备受驱动程序的困扰。从SLI技术在到双核心显卡,NVIDIA每一次变革,都会给业内带来不小的影响,而从现在的情况来看,双核显卡时代显然是来的早了一些。
我们知道ATi X1950XTX依旧采用了单核心设计,并且使用了R580的优化版R580+核心,在驱动兼容性及游戏兼容性上已经达到了较高的造诣,而通过搭载频率更高的GDDR4显存,将核心的潜力完全发挥了出来,从而造就了最强的单核显卡,而且最为重要的是X1950XTX的市场售价定位在3999元。
[卧薪尝胆 R580+强势推进]
NVIDIA长期采用高端显卡频繁推新的手段,将ATi渐渐拖入性能竞争的怪圈,在工艺短期内无法革新的大环境下,两家显卡巨头都采用了革新显卡构架来提升性能的方法,NVIDIA使用两颗G71核心捆绑成G7950GX2,并借由全新的Quad SLI技术使显卡在高分辨率下的性能显著提升,由于捆绑了两颗G71核心,所以整卡售价达到了4999-5999元。从ATi最新推出的X1950XTX显卡来看,ATi并没有采用双核心的设计,依旧采用单核,不过这次的1950XTX史无前例的采用了GDDR4显存颗粒,默认频率达到了2GHz,通过超高的显存通道性能达到了整体提升显卡性能的目的,价格为3999元。
ATi X1950XTX可谓是酝酿已久,以至ATi在6-7个月之内没有推出任何新产品,其专著度可见一般。X1950XTX推出的目的主要是为了取代如今的X1900XTX,而其主要的竞争对手为7900GTX和7950GX2。作为ATi最新旗舰性产品的X1950XTX依然是一款标准的DX9.0C显卡,并没有采用DX10的设计。这主要是因为显卡采用的核心为R580+。
我们都知道X1900XTX采用的核心为R580,其实R580+核心就是R580的升级版本,与上一版本核心相比,R580+继承了其优良的血统,而通过优化修改也支持了GDDR4显存,更为重要的是R580+在功耗、发热量等方面都得到了很大的改进,对于超频狂来说,这可能会使一个好消息。
从上表我们看出X1950XTX与X1900XTX相比,规格上非常近似,除了采用的显存不同以外没别的区别,不过正是这点微弱的差别使X1950XTX的性能提升巨大。
[挑战极限 X1950XTX技术分析]
从规格分析上我们知道X1950XTX采用了革新后的R580核心,也就是所谓的R580+,从技术上来看,它与R580所支持的技术基本相同,并没有开创出任何新的内容。R580+也使用了90nm制造工艺,48个像素着色处理器,8个顶点着色处理器,支持PCI Express x16,动态工作电压和工作频率控制,双DVI输出支持,R580+的晶体管数目依然是3.84亿个。
作为R580的近亲,R580+继承了R580的全部能力,包括Ultra-Threaded Shader Architecure(超线程渲染结构)、Shader Model 3.0、改良的显存控制器Ring Bus Memory Controller、用于屏蔽不可见渲染的Hyper-Z、HDR+AA(高动态渲染加上全屏抗锯齿,这是ATi引以为傲的技术)、128位的浮点指令渲染、自适应的抗锯齿、AVIVO等。
ATi的研究工作表明,自从微软2001年在DX8中导入可编程的渲染引擎后,渲染处理在游戏中变得非常普遍,而渲染指令的复杂度也在以每年1.8倍的速度增长。渲染指令大致可以分为两类:纹理操作和算术处理操作,随着游戏的进步,算术处理操作的比重正在不断加大,最近的游戏研究表明算术操作:纹理操作=5:1,下一代游戏的比重还在加大。算术操作和纹理操作最大的不同在于,纹理操作依赖于显存容量和带宽等外部因素,当外部条件不足时增加纹理处理单元对性能没有帮助,而算术操作能力不取决于外部因素,是由GPU内集成的算术操作单元的能力和数量决定的。这两者之间相互还有关系,通过像素渲染程序可以生成纹理,通过渲染调整还可以减少纹理模板的数量,这两种办法都可以用来降低存储纹理所必需的显存和带宽。
在微软提出的SM3.0规范中,最重要的新特性就是像素渲染的动态分支控制。在早期的SM中所有的指令和纹理拾取都要在每个像素上面施加一次,不管他们是否需要,而流控制则可以根据实际情况在需要的像素上执行渲染。ATi的设计正确理解了流控制的愿意,认为动态流控制提倡的是让不同数据块执行不同的操作,为实现此目的,X1000系列引进了新的超线程技术,它通过一个庞大的联合线程计数器、小线程单元、专门的分支执行单元和一个巨大的、高性能的任务堆栈列表,在高速动态流控制和扩展并行处理之间取得最佳平衡。
[R580+之Ultra-Threads Shader Engine]
为了更加有效的同时运行多线程运算,X1950XTX加入了智能化的线程分配处理器——Ultra-Threading Dispatch Processor(超线程分配处理器)。
Ultra-Threaded Pixel Shader Engine能把一个较大的Pixel Shader的运算分拆为大量较小的执行序,然后平均的分给各个Pixel Shader Core Unit,在同样的Shader程序下其执行序被分割成细少的Pixel Blocks,排除了部份Unit需要等待其它Unit完成的结果而造成闲置,减少了不必要的延迟并提供更快的执行效率。
这个Ultra-Threading分配引擎也可以在某些像素着色引擎空闲时重新分配新的任务。这样的情况多数发生shader在等待数据或者完成了任务的时候,比如在纹理存储进缓存或显存的过程中。
而ATi X1950XTX在运算分支程序的时候,能够把每个线程的分成很多个4X4像素的小块来分别处理,在这样的一个像素块里碰到两条不同分支的机会就非常小,降低了出现SI2D的机会,这可以使动态分支拥在更高的运算效率。
ATi的Ultra-Threading设计还能够提高Pixel Shader 3.0动态分支的性能。动态分支被认为是Pixel Shader 3.0的重要新特性,可以让Pixel Shader根据计算出来的数值来跑不同的分支或者循环。如果正确使用的话,动态分支能显著的提高显卡3D性能。例如在使用shadow map的时候,如果要对阴影作边缘柔和取样,使用动态分支可以在遇到不需要作取样像素的时候就跳过去,以节省大量的pixel shader计算资源。但是需要注意的是,目前显示核心的Pixel Shader都是采用传统的SIMD架构,动态分支的运作往往会破坏掉程序的并行性,使得动态分支带来的益处被浪费掉。
[R580+之Ring Bus Memory Controller]
除了加强了Pixel Shader引擎的效率外,X1950XTX沿用了显存控制器技术,称为“Ring Bus Memory Controller”。传统显卡技术,为了提高显存的传输效率,通常都会用直接提高内存的带宽,不过提高带宽只能为提高突发传送时带来便利,但如果程序并不需要太高的带宽,则更高的带宽也是枉然,相反有效地运用显存宽带才是最重要。X1950XTX不仅使用了Ring Bus Memory Controller技术,而且由于使用了GDDR4显存,所以显存带宽也得到了大幅度提升,为Ring Bus Memory Controller又增加了新的亮点。
在Ring Bus的架构下,Client Interface会向显存控制器作出读取要求,而控制器同样会安排数据由显存颗粒中读取,但却不会回传至显存控制器,而只是把东西放在Ring Bus,然后Client Interface自行由Ring Bus取回所需要的数据封包,因此显存减少回传的工作,达到减少延迟而令效率提高的目的。
如图所示,X1950XTX显卡内置两个256位的总线环,环路总线围绕在内核心的周围,这样可以简化线路设计及使连接处于最优化状态。这意味着任何时候内核各部件都能处于最短的连接线路状态,这样在显存进行数据写入操作过程中有效降低延迟及降低信号品质。正是因此,X1950XTX可以支持象GDDR4这样的高频率显存,而传统的显存架构之所以不能支持高频GDDR4显存,很大原因就是核心内部线路之间的串扰等原因所造成的。
[售价3999元 ATi的疯狂]
作为X1900XTX升级版本的X1950XTX,推出伊始价格就定在了3999元,这个价格显然是具有震撼性的,作为最新的旗舰产品,作为搭载了最新GDDR4显存颗粒,频率2GHz的产品,3999元的价格令人匪夷所思。
X1950XTX与7950GX2
[测试平台及测试项目]
◎ 综合性能测试部分
● 3DMark05
● 3Dmark06
◎ 游戏性能测试部分
● DOOM3
● Half Life 2
● FarCry v1.33
● QUAKE4
● FEAR
● 细胞分裂3 混沌理论
● SAM2
● Prey
[ATi X1950XTX综合性能 3DMark05]
[ATi X1950XTX综合性能 3DMark06]
[ATi X1950XTX游戏性能 DOOM3]
[ATi X1950XTX游戏性能 Half Life 2]
[ATi X1950XTX游戏性能 FarCry v1.33]
[ATi X1950XTX游戏性能 QUAKE4]
[ATi X1950XTX游戏性能 FEAR]
[ATi X1950XTX游戏性能 细胞分裂3 混沌理论]
[ATi X1950XTX游戏性能 SAM2]
[ATi X1950XTX游戏性能 Prey]
[测试总结]
从我们的一些测试表明,ATi X1950XTX的性能是可圈可点的,这主要是得益于其采用的GDDR4显存,巨大的显存带宽为R580+核心的性能发挥提供了条件。我们可以看到,即便是应对7950GX2,越是在高分辨率高特效下,X1950XTX的成绩越发接近,也可以说X1950XTX在高复杂场景下,性能降低甚至要比7950GX2还要少。
而X1950XTX和7900GTX一决高下后,显然7900GTX在很多测试项目中都落后于X1950XTX,单核显卡最强的名号已被X1950XTX夺走。在技术方面虽然X1950XTX没有做出什么惊人之举,基本沿用了R580核心的特点,不过在我们实际使用中发现,由于性能的提升,我们在HDR+AA等大量消耗资源的应用时效果更为出色。毋庸置疑,X1950XTX将成为目前真正单卡中最快的。
在价格方面,X1950XTX史无前例的3999元低价,而NVIDIA 7950GX2的性能虽然得益于其双G71核心的设计十分突出,不过也正是因此,使其售价达到了4999-5999元,即便是采用单核心设计的7900GTX也无法与3999抗衡。X1950XTX的加入为高端显卡市场注入了新鲜活力,而与其自身相比的话,3999元的售价显然是更具杀伤性的,一场大战在所难免,我们拭目以待。