[NVIDIA技术系列之统一构架] DX10最大特色之一就是引入了统一渲染方式。所谓统一渲染架构,最容易的理解方式就是Shader单元不再分离,显示核心不再为Shader类型不同而配置不同类型的Shader单元,对于主流的显示核心,Pixel Shader单元以及vertex Shader单元的概念都应该已经非常熟悉了,而在统一渲染架构中这两种Shader单元将不再分离,转而所有的Shader单元都可以为需要处理的数据进行处理,不管和是Pixel Shader数据还是Vertex Shader数据。而调配哪几组Shader单元负责处理什么数据或者进行什么样子类型的计算,则由一个被称为small sets of instructions(SSI)的部分来控制。这样在硬件上,设计者就无需为不同的着色引擎设计不同的执行单元,只要按照所对应的接口以及操作方式全部融为一体,仅设置一种独立的Shader执行单元。此外,统一渲染架构将令GPU的角色由单纯为Game Rendering提升至Game Computing的理念,统一着色引擎设计更适合异类运算工作,例如Physics运算、影像编码运算等,让显卡的应用范畴大幅提升。 CSAA抗锯齿 CSAA抗锯齿功能是G80系列显卡的一个新特性,这个特性也被G86 G84很好的保留了下来,这意味着使用G86或G84显卡的玩家将会拥有更好的游戏画面。CSAA抗锯齿提供了Coverage和Geomery两种采样模式,除了可以支持目前普通的2x、4x和 8x (NVIDIA显卡可以支持8xQ)采样率外,还可以通过将多种采样模式复合提供8x、8xQ、16x和16xQ四种全新的抗锯齿采样模式。其中16xQ CSAA提供了更完美的AA效果,同时NVIDIA表明,在大部分情况下,使用16x AA模式可以达到4x MSAA模式相似的性能,这将让大多数的游戏都可以立即享受到16x AA模式带来的画质。 128Bit浮点精度HDR+AA NVIDIA最先在NV40中引入了HDR动态渲染技术,不过,由于在NV40/G70中,NVIDIA采用了OpenEXR做为HDR运算的缓存格式,使得GeForce 6/7系列显卡都只提供了对OpenEXR的16位浮点(FP16)贴图、过滤、混合、存储支持(即高精度动态范围)。然而在DirectX 9.0模式下运行FP16时,会占用到原本属于FSAA(全屏抗锯齿)的缓冲区域,使得在开启HDR效果后无法进行FSAA处理。这就导致NVIDIA的GF6/GF7系列显卡在游戏中无法同时支持FSAA和HDR。由于G8X的ROPs在设计已经可以支持FP16和FP32的混合,无论是FP16还是FP32都能够进行全屏抗锯齿功能,因而在G8X核心上,NVIDIA实现了HDR+AA的模式。 Shader Model 4.0 Shader Model 4.0的引入除了以统一着色器架构让着色器操作的硬件执行更为灵活有效外,还大大的提升了着色器可用资源。DirectX 10还引入纹理阵列来鼓励游戏编程者使用DirectX 9时代限于硬件资源而不敢使用的巨型纹理。并还特别引进流输出模式绘制预测来降低CPU在3D应用时的负载,这些都使得DirectX 10游戏能够在3D建模、场景和物件的复杂度大大提升,整体提升了游戏的真实度和游戏体验。