[显卡超频总论]
和CPU超频一样,显卡超频对于每个玩家来说实在有着太大的诱惑力,就拿近期春风得意的Radeon9550来说,这样超频潜力巨大的显卡如果不拿来超频可实在对不住NV和ATI分频必较的频率锁定策略。CPU超频不外乎超外频和倍频,但超频的效果和方法又是不尽相同的。对显卡超频可以选择核心超频和显存超频,那么究竟是超核心好还是超显存好?核心和显存是超的越高越好吗?对支持不同类型的显卡来说核心频率和显存频率哪一个更为重要?
当然首先需要弄明白的是核心频率和显存频率对显卡性能的作用。这也需要我们从显卡工作的流程来说起。显卡工作时先从显存中将描述3D图形外观的顶点数据读出,根据这些三角形顶点数据以及像素Z值、Apala值来确定3D图形大致的外观以及不同物体在空间上的纵深关系,当然形成的这个外观就像“风筝”的骨架一样,不同物体之间呈现的空间关系也因为此时还没有光影变化以及凹凸贴图所表现的层次感,看起来就像人眼具有透视功能一样,可以透过前面的物体看到后面的物体。在外形确定之后,便接着从显存中读取纹理数据,将工作交给像素处理单元进行合成处理,即为“风筝“糊上外衣,同时光影效果、阴影过渡也在这个阶段计算出来,完成这两个阶段之后将处理好的数据放入显存里,进行下一任务的处理。
从上面可以看出在整个过程中,主要有两个关键步骤,顶点数据的处理和像素纹理的填充,具体说来就是GPU在单位时间内的“三角形生成数量“以及”像素填充率“,GPU本身的三角形处理能力,如何计算?通常我们将一颗具有Vertex Shader或者T&L能力显卡的核心频率乘以顶点处理单元的流水线再除以4(指每4条指令完成一个三角形的生成)。这样可以算出GPU的多边形生成率,当然这个数值只是从理论上计算出现来的。很明显在一块显卡的流水线单元确定之后我们所能做的就只能通过改变GPU核心的时钟频率来提高三角形生成率。像素填充率则是一个我们经常会听到的厂商用来衡量显卡性能的参数,那么那些填充率的数值是怎么得来的呢?显卡的像素填充率=显卡的核心频率X像素渲染管线的数目。同样的要想提高像素填充率最为可行的方法就是对核心频率就行超频了。从这两个重要参数与核心频率的关系来看,提升GPU核心频率对显卡性能提升应该会是相当明显的。
小知识:三角形生成数量
3D显示卡用来表示性能优异的主要指标中有一项是“每秒种可生成多少万个三角形”,或“每秒可处理多少三角形”。从以上我们得知,电脑显示3D图形的过程中首先是用多边形(三角形是多边形中最简单的)建立3维模型,然后再进行着色等其它处理,物体模型组成的三角形数量多少将直接影响重现后物体外观的真实性,显卡每秒生成三角形的数量越多,也就能在保障图形显示帧速率的前提下为物体模型建立更多的三角形,以提高3D模型的分辨率。
小知识二:像素填充率
象素填充率也是衡量3D显示卡性能的的主要指标之一。通俗地说:即为显卡像素处理单元在单时钟周期内能完成的图形渲染像素的数量,它决定了3D图形显示时可能达到的最高帧速率,直接影响3D显卡运行时的显示速度。相对构建3D外观模型的顶点数据运算来说,像素填充率的工作量和复杂程度要远比其大的多、周期上也要长的多,因此它的数值高低要比三角形生成率更为重要一些。
除去像素填充率外,我们最常见的另外一个衡量显卡性能好坏的参数就是显存带宽了。这个比较容易理解,即显示芯片与显存之间以及显存与RAM DAC(数模转换器)之间在单位时间内数据交换量的大小,众所周知,随着3D游戏对场景细节和纹理精细度的日益提高,在传输顶点数据同时包含着越来越多的光影信息,连同Z缓冲器、帧缓冲器和纹理缓冲器 对显存带宽的占用,显存带宽曾一度成为制约显卡性能发挥的瓶颈。DDR2甚至更高频率的DDR3、256Bit显存位宽的出现都是为缓解显存带宽不足的压力。显存带宽的计算方法为:显存带宽=显存的时钟频率X显存位宽/8。可以看出这是一个完全取决于显存性能的参数,显存位宽即所谓的64Bit、128Bit、256Bit之分了,我们选购显卡在确定了需要的位宽同时,也只能通过超取显存频率来提高显存带宽了。
[显卡超频的思考]
由上可知提升显卡核心频率可以提高单位时间内显卡的多边形生成能力和像素填充能力,缩短建模和渲染的周期,而提升显存频率则可以使显卡在核心的高效工作下保证“后勤”部分的数据“吞吐”不至于跟不上。所以从理论上可以推出在大部分情况下,提升核心频率会显著提升显卡性能,同时可以推想出由于显存位宽处于“后勤”供应位置,如果显存频率提升幅度超过核心频率提升幅度,即当核心频率不能满足应用,单纯提高显存频率也是不能带来性能增益的。这一点显存频率和核心频率还是有着一定的依存关系的。
为了验证这些推理是否正确,我们选用了五块基于不同DirectX标准的显卡:Radeon7500、Ti4200、NV5950U,GF4MX440SE、GFX5200增强版,对于支持DirectX7的GF4MX440和Radeon7500采用了3Dmark2000、3Dmark2001SE、Quake3四款软件测试,对于支持DirectX8和DirectX9的显卡用3Dmark2001SE、3Dmark03、Aquamark3、Quake3四款软件来测试,超频以50Mhz为标准,比较核心和显存分别在提升和降低相同频率下的成绩差异。
测试结束我们得出以下三个结论:
1、 在绝大多数情况下,核心超频明显比显存超频更能提高系统性能。但在一些特殊情况,如显卡显存位宽缩水、填充纹理数据比较大的情况下,显存超频效果会比核心超频更为明显一些。
2、 核心和显存频率应该保持一定的比例,过高提升单方面频率,并不会带来性能的大幅提升的。
3、 针对不同的显卡,超频的侧重点也不一样,要量卡而行。
下面我们将分别用实例来对上面三点进行实证。