“电脑画质电影化,显示芯片惊世作”,这是前段时期广大DIYer再也熟悉不过的广告语了。NVIDIA为了打破ATI Radeon9700 Pro一枝独秀的局面,对代号为NV30的GeForce FX显示芯片进行了大肆渲染,并一致强调GeForce FX是“电影级”的显示芯片。一方面,可以摆脱过去被ATI Radeon9700 Pro逼得无力还手的尴尬;另一方面,给自己的“忠实用户”一个信心,希望重新夺回性能之王的宝座。可是,这一切,并没有如NVIDIA所愿。正当人们还在为其“怪兽级”显卡GeForce FX5800 Ultra欢呼时,ATI的又一重磅炸弹——Radeon9800Pro悄然降临。
2003年3月7日,ATI推出了针对原有R300核心重新设计和改进后的全新R350核心新产品——Radeon 9800/Pro,它们主要是针对目前高档游戏发烧级用户市场而开发的。
Radeon 9800 PRO与Radeon 9700 PRO、GeForce FX5800 Ultra主要规格对比:
Radeon 9800 Pro Radeon 9700 Pro GeForce FX 5800Ultra
制造工艺 0.15微米 0.15微米 0.13微米
晶体管数目 1.1亿 1.1亿 1.25亿
核心频率 380MHz 325MHz 500MHz
显存频率 680MHz DDR-I 620MHz DDR-I 1000MHz DDR-II
显存容量 128MB/256MB 128MB/256MB 128MB/256MB
显存类型 DDR-I (128MB)DDR-II (256MB) DDR-I DDR-II
显存位宽 256-bit 256-bit 128-bit
显存带宽 22.4GB/s 19.8GB/s 16GB/s
DirectX版本 9.0++ 9.0 9.0+
是否支持OpenGL 2.0无限着色指令技术 YES NO NO
三角波输出 380 MT/s 325MT/s 350 MT/s
象素填充速度 3.04 GP/s 2.6 GP/s 4 GP/s
AA 填充速度 18.24 Billion/s 15.6 Billion/s 16 Billion/s
Z压缩比例 24:1 6:1 4:1
颜色压缩比例 6:1 6:1 4:1
渲染管线数 8 8 8
每管线纹理处理数 1 1 2
顶点着色引擎 2.0+ 2.0 2.0+
浮点着色引擎数量 4 4 浮点阵列
顶点着色指令 65,280 1,024 65,280
象素着色引擎 2.0 (F-buffer) 2 2.0+
象素着色引擎数量 Unlimited 64 1,024
浮点像素精度 96-bit (4×24-bit) 96-bit (4×24-bit) 128-bit (4×32-bit)
FSAA 6x 6x 8x
FSAA 方法 Multisampling Multisampling Multisampling
显存带宽控制技术 HyperZ III+ HyperZ III LMA III
图象增强技术 SmoothVision 2.1 SmoothVision 2.0 Intellisample
AGP标准 1x/2x/4x/8x 1x/2x/4x/8x 1x/2x/4x/8x
输出端口 VGA, DVI ,TV-Out VGA, DVI ,TV-Out VGA, DVI ,TV-Out
显示模式 2x 400MHz DACs 2x 400MHz DACs 2x 400MHz DACs
在上表中列出了ATI Radeon 9800 Pro的主要特性,下面要对其主要新特性进行简单介绍。
1、浮点像素精度
在ATI Radeon 9700/ Pro中R300 VPU是支持96位FP(Floating Poin,浮点)精度,而GeForce FX可以支持到128位FP精度。但是在Radeon 9800 Pro新产品中却没有对此参数进行改进,仍旧只支持96位、64位和32位FP像素精度。因为ATI相信96位FP像素精度对于当前所有生产周期的游戏开发都是足够的,即使在今天,还没有任何游戏在任何一块支持DirectX 9标准的视频卡上需要用到包括高精度FP色彩的所有特性。不过在不久的将来用户们就有希望可以利用这些全部特征,因为ATI的R350和RV350已经为他们做好了准备。这样由ATI提供的、支持DirectX 9和OpenGL 2.0标准的下一代游戏平台在今年就可以玩了。
2、支持DirectX 9++
这里所说的“DirectX 9++”并不是一个标准版本,而是与以前的Radeon 9700(支持DirectX 9.0)和GeForce FX(支持DirectX 9++)对DX9标准的支持程度相比,表明Radeon 9800系列产品对DX9标准的支持比GeForce FX更加全面、更加良好。因为它现在可以支持DX9标准中的浮点3D材质(Floating Point 3D Textures)、 浮点立体贴图(Floating Point Cube Maps)、 多点目标补偿(Multiple Render Targets)、映射转移(Displacement Mapping)技术。
Radeon 9800/PRO
的DirectX 9++与标准的DirectX 9.0所支持的特性比较如下:
支持技术选项 标准DirectX 9 DirectX 9++
浮点3D材质(Floating Point 3D Textures)技术 NO YES
浮点立体贴图(Floating Point Cube Maps)技术 NO YES
Multiple Render Targets多点目标着色技术 NO YES
Displacement Mapping贴图转换技术 NO YES
N-Patches表面处理技术 NO YES
3、SMARTSHADER
这是ATT的一种浮点象素着色的处理技术,目前在Radeon 9800系列显卡中它已经从Radeon 9700 PRO中的2.0升级到2.1版了。ATT为了进一步增强这种技术,重新设计了电路,强化了硬件处理的过程,使能对同一象素进行无数次的处理而无需从显存读取数据,通过这种技术可以使用一种新的像素处理技术F-Buffer,它可以处理更加复杂的效果,是下一代电影技术所必需的。
ATT Radeon 9800 PRO与NVIDIA GeForce FX5800Ultra在像素着色处理技术上的比较。
技术选项 Radeon 9800PRO GeForce FX 5800 Ultra
Maximum Anisotropic Filterting Setting(最大各向异性过滤倍数设定) 16X 8X
Correct AA Gamma Correction(百万分之一错误纠正技术 YES NO
Maximum Distinct AA Samples(最大清晰样本倍数 6X 4X
2ND Generation 6X AA/16X AF(是否支持下一代6X AA/16X AF) YES NO
4、F-Buffer
F-buffer(Fragment stream FIFO buffer)技术是R350核心芯片的最大技术亮点,它通过了一些技术处理进一步优化了图形处理器的性能。以往象素的处理过程大部分用软件完成,处理过程要反复读取显存中的数据,所以所耗时间就比较长。NVIDIA GeForce FX相对于Radeon 9700 PRO的一个主要优点就是可以执行长度达1024指令的pixel shader程序。而Radeon 9700 显卡核心芯片R300中的pixel shader程序的长度被限定在了64条指令以内,对于开发者来说如果想要生成更加绚丽、逼真的图像还是显得有点力不从心。为了生成更加复杂的效果,R300必须进行多流程渲染(multi-pass rendering),虽然多流程渲染的确不错,克服了不少技术限制,但是它却成了性能杀手,使得图形处理器平白的增加了很多不必要的工作。在Radeon 9800 PRO产品中加强了硬件处理的能力,这大大提高了显卡的处理速度。使得象素和浮点的着色过程更加迅速,效果更好。
R350的F-buffer允许它执行任意指令长度的pixel shader程序,这比NVIDIA GeForce FX又进了一步。F-buffer主要用于存储渲染流程中的中间结果,这样就避免了把所有的像素都写入帧缓存,提高了工作效率。把中间结果存储到一个FIFO缓存中,不仅提供了在传统的多流程技术中大大提升性能的潜力,也跨过了一大堆问题。比如,多流程渲染不能处理透明或者半透明。
5、SMOOTHVISION 2.1
ATI Radeon系列芯片技术能够对图象进行多种增强处理,这种处理技术就称之为“SMOOTHVISION”。众所周知,Radeon 9700 PRO 有着杰出的抗锯齿处理功能和适应各向异性过滤功能,在游戏中表现尤为突出。在Radeon 9800系列产品中,ATT优化了内存控制器,使得内存控制器读、写数据时在更宽的带宽下效率更高,同时使得内存控制器的性能向着AA和AF级别有着更大的提高,达到了下一代的6X AA/16X AF标准。这种收益在1024×768显示模式下使用4x或者6x模式抗锯齿处理功能时效果更加明显。
6、HYPER Z III+
图象的渲染过程会吞噬大量的显存带宽,如果不对渲染过程加以控制的话,那么22.4GB/S的峰值带宽会转眼被吞食。ATI使用了Hyper ZIII技术来对内存带宽进行有效的控制。随着3D游戏越来越复杂,ATI也大幅度增强了Hyper ZIII技术,在Radeon 9800 PRO中改名为Hyper ZIII+,它能够更加有效的控制显存带宽,使显存发挥最高的效率。
另外ATI还采取了几种不同的措施来使得R350更高效的利用显存带宽。R350核心频率为380MHz,而R300的核心频率为325MHz。为此,ATI进一步改进了其VPU的显存控制器,以适应在繁重的应用过程中的读写操作,这种优化将会明显的提升显卡在抗锯齿应用方面的性能。最后,R350还具有了用于Z-buffer读写的改进的缓存,来帮助高带宽应用时传递像素的Z轴数据。ATI宣称这种缓存专为stencil buffer数据做了优化,可以帮助开发者在诸如Doom III这样的游戏中使用stencil shadow volumes来创建更加逼真的阴影效果。
以上就是Radeon 9800 PRO显卡产品的主要新特性,通过这些新技术,就大大减轻了原先Radeon 9700PRO处理负荷,加快了浮点和象素的处理过程,而且可以使显存更有效的发挥作用。