如今,在显卡市场中的价格战风暴是愈演愈烈,无论哪家厂商,都有推出了几款低价产品的举动,在这些竞争产品中,当然也少不了RADEON系列和GeFoece4系列产品。但是众多低价产品相比之下,究竟哪一款才是人们心目中真正的高性能显卡呢?最近,nVIDIA的老对手ATi频频出击,新一代中端显卡之王RADEON9000横空出世,誓要击败nVIDIA性价比之王GeFoece4 Ti4200,到底RADEON9000有什么过人之处,还是让我们来做个深入浅出的横向对比吧。
GeFoece4 Ti4200
采用咖啡色PCB,公板线路设计及nVIDIA建议的标准散热风扇。重新设计了风扇和散热器的表面图案,天蓝和银白相间的色调简洁、明快,显得很时尚。散热器的鳍片是经过冷锻工艺后成型,重量很沉,决非一般的铝合金片状散热器所能比拟。豪华的散热器加上11叶的强劲风扇,很好的解决了显卡的散热问题。稳压供电模块元件采用了大量的优质电容,以及带屏蔽罩的扼流线圈,确保了显卡工作的稳定。
技术特性
l nFiniteFX第二代多边形与动画运算
主要由两个可编程(将指令自由组合可得到千变万化的效果)部分组成:1. 顶点渲染(Vertex Shaders),2. 象素渲染(PixelShader),而nFiniteFX引擎被nVIDIA称为继硬 件 T&L引擎之后又一项重大改进。第二代nFiniteFX强力引擎将爆发GeForce4的全部潜能, 内部增加一个额外的可编程顶点渲染单元,以达到1+1>2的目的。
l 顶点渲染
程序设计师能够对特定物体每一个顶点,指定特别的运算程序,却不需要CPU干预。顶点渲染可以处理包括个体和环境的所有动态贴图,这将使得细腻的效果不再是图象中主要任务的专利,而是整幅图象都可以更加真实生动。
仿真骨架运动(Skeletal Animation)和矩阵调色贴皮(Matrix Palette Skinning),这一特性类似于Radeon8500的动态骨架(skeletalanimation)和4矩阵贴皮。不过由于采用两个顶点渲染引擎,Geforce4芯片的处理能力较Geforce3有很大提高,支持高达32个矩阵的,贴皮甚至超越了Radeon8500。通过特殊的程序改变物体表明形状个别顶点残影(Per-Vertex Motion Blur):不同顶点的透明模糊化,用来表示真实的地形设定内积凹凸贴图(Dot Product Bump Mapping, Per Pixel Bump Mapping)层雾化(Layered Fog):NV显卡的雾化效果相当出色,多数游戏里比Radeon8500正确。
l 硬件T&L
由GPU来画三角形及其后处理——期间三角形的顶点描述数据就是完全由这个Vertex Shaders引擎完成。首先是双顶点着色引擎,并行高效处理数据和指令(分配给每个引擎不同的任务必须依赖GPU核心的管理)。优化的流程降低了指令的延迟,提高了运行效率,满打满算的确是三倍。Geforce4 Ti4200/4400/4600按照225~300的频率不同,每秒分别能处理7500万~1亿个顶点。
l 第二代光速显存架构(Lightspeed memory Architecture)
利用显存带宽的技术,显存交错控制单元(Crossbar Memory Controller)、4路高速缓存(Quad Cache)、无损Z缓冲压缩(Lossless Z Compression),快速Z缓冲清除(Fast Z-Clear)、视性子系统(Visibility Subsystem)构造之第二代Z轴闭塞剔除功能(Z-OcclusionCulling)、自动预先加载(Auto Pre-Charge)等很多功能的综合体,着眼点在显存带宽的更好利用以及节约Z缓冲的带宽需求,加快数据交换速度。
l Accuview 高分辨率反锯齿
最高性能和无损的Quincunx AA质量,专用Accuview Multisampling取样可确保稳定的兼容性,新的子象素取样位置可带来经过改进的AA质量,独有的高质量4×S渲染模式。
l 阴影缓冲器、DirectX和S3TC纹理压缩、双立方形环境贴图功能、反映贴图、正确的实时环境反映、硬件加速实时阴影、真实反映凹凸立体贴图、Z-correct凹凸立体贴图、在反映立体贴图上进行Phong-style光源效果处理、高水平的256位2D演绎效果、全屏、全帧速HDTV和DVD内容播放的高清晰度视频处理器(HDVP)。
RADEON9000 Pro
公版墨绿色PCB6层版设计,银白色铝合金小型散热系统,覆盖的面积只有核心芯片大小,这多少影响到显存的散热性和超频的稳定性,采用HY -3.6高速DDR显存。
六层PCB版设计,六层板有三个或四个信号层、一个接地层、以及一个或两个电源层,以提供足够的电力供应。显卡PCB板,作为数字讯号的处理核心,防止“相互干扰”显得非常关键。为了使数字讯号“纯净”工作,信号迹线的布局与长度至关重要,这就需要六层PCB板的布线方式。它的设计宗旨是尽量避免由于其它迹线的干扰,造成信号失真。一条迹线过长,或者信号频率过高,相互干扰的可能性便会大增,所以要求在相邻的两条迹线之间,留出足够大的间距。有些迹线必须限制它的最大长度,以确保信号的“完整性”。
l 4管线架构
RV250保留了R200的4条像素管线,不过每条像素管线只有一个材质处理单元,而R200的像素管线配置了两个像素处理单元。这也就意味着如果RV250的像素管线在一个流程(pass)中只能处理一个材质,而R200却能处理两个材质。不过,R200和R250都可以利用“loop back”在一个流程中处理多次材质。比如,R200每个流程可以“loop back”3次,而RV250每个流程可以“loop back”6次,因此理论上它们在一个流程中处理的最大材质数是一样的。这样的改变可以简化GPU的结构,同时使得RV250在未来应用复杂Pixel shader特效的游戏中具有一定的优势。
l 可编程的Piexl Shader和Vertex Shader处理单元
SMARTSHADER是ATi的一项核心技术,它其实就是DirectX 8/8.1中的Piexl Shader和Vertex Shader扩展指令集,目前它提供了Pixel Shader 1.1和Vertex Shader 1.4的支持。 为了进一步的精简RV250,它的Vertex Shader单元从R200的两个减为一个,但是对其做了进一步的优化,这样的结构同GeForce3非常的相似。
l 高性能的各向异性过滤
RADEON 9000 Pro所采用的全屏抗锯齿和各向异性过滤都是通过SMOOTHVISION来实现的,ATi称SMOOTHVISION技术可以在保证性能的前提下提高图像的质量。它分别提供6种级别的抗锯齿和16级的各向异性过滤。
l 优秀的视频回放质量
RADEON 9000 Pro提供了对于1.4版的Pixel Shader的支持,虽然还不能与RADEON 9700一样生成实时的电影效果的图像,但是用于消除视频回放过程中出现的马赛克(De-Blocking)已经足够了。其中用于De-Blocking的技术称为FULLSTREAM,它可以明显的改善流媒体等图像质量较低的视频回放过程出现的“马赛克”现象,对于现在非常流行的DivX也是非常有用。
l 双显示器支持
RADEON 9000 Pro相对于RADEON 8500在这个方面做了不少改进。RADEON 8500内部分别整合一个RAMDAC和一个TMDS来提供对于VGA和DVI显示器的输出,如要实现对于双VGA显示器的支持必需通过板载RAMDAC来实现,还需要通过ATi Rage Theatre芯片来提供对于TV-out输出的支持。
这样看来,GeFoece4 Ti4200与RADEON 9000 Pro在技术上不相伯仲,Ti4200的优势在于拥有强大出色的驱动程序,其优化能力更是每一款的驱动程序有质的改变,OpenGL接口方面有比ATi更加兼容,速度快,贴图错误少的优势。而RADEON 9000 Pro不仅仅是RADEON 8500的简化版,还在RADEON 8500的基础上做了改进和优化,特别是在多显示器支持和视频回放方面,是第一颗在视频回放过程中应用了Pixel Shader的低价GPU芯片。