为什么要有GPU?说实话,这个问题有些难回答,不过我们依然从过往的一些回忆中引出GPU的概念。虽然民用显卡可以追溯到上世纪的80年代,但当时的并没有GPU的概念,而所谓的显卡更多的被成为显示适配器(Display Adapter),仅能用于简单的文字和图形输出,在处理3D图像和特效是主要还是依赖CPU。
真正的GPU,也就是Graphic Processing Unit(图形处理器)的概念,最早是由NVIDIA在1999年发布GeForce 256图形处理芯片时首先提出的,核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等等。GPU的出现使得显卡减少了对CPU的依赖,尤其是在3D图形处理时取代了部分原本CPU的工作,而这一切都要归功于GPU引入的硬件T&L( Transform & lighting,坐标转换和光源)功能。
本质上来说,3D图形的渲染是由复杂的坐标转换和光源运算组成的,当显卡还没有T&L功能时,坐标处理和光源运算都是由CPU来处理的,也就是所谓的软件T&L。不过由于CPU的任务繁多,除了T&L之外,还要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上复杂3D游戏的要求。
而GPU从硬件上支持T&L以后, CPU就得以从繁重的运算中解脱出来。首先,3D模型可以用更多的多边形来描绘,这样就拥有了更加细腻的效果。其次,CPU不必再计算大量的光照数据,直接通过显卡就能获得更好的效能。虽然后来的GPU取消了T&L,采用全新的Shader Model来完成3D建模和光影效果,但就当时来说,硬体T&L技术是GPU的标志。限于篇幅,关于T&L更多的细节这里就不再一一赘述。
下面要说一下GPU的工作原理,虽然这和今天的主题看起来离得有些远,不过考虑到能够对下面章节更好的阐述,我认为还是很有必要的。简单的说,GPU的主要功能就是完成对3D图形的处理即生成渲染。一般来说,GPU的图形处理流水线可分为以下五个阶段:
1、 顶点处理:这个阶段GPU读取描述3D图形外观的顶点数据并根据顶点数据确定3D图形的形状及位置关系,建立起3D图形的骨架。在支持DX8以后的GPU中,这些工作由硬件实现的Vertex Shader(顶定点着色器)完成。
2、 光栅化计算:显示器实际显示的图像是由像素组成的,我们需要将上面生成的图形上的点和线通过一定的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例如,一条数学表示的斜线段,最终被转化成阶梯状的连续像素点。
3、 纹理帖图:顶点单元生成的多边形只构成了3D物体的轮廓,而纹理映射(texture mapping)工作完成对多边形表面的帖图,通俗的说,就是将多边形的表面贴上相应的图片,从而生成“真实”的图形。TMU(Texture mapping unit)即是用来完成此项工作。
4、 像素处理:这阶段(在对每个像素进行光栅化处理期间)GPU完成对像素的计算和处理,从而确定每个像素的最终属性。在支持DX8以后的GPU中,这些工作由硬件实现的Pixel Shader(像素着色器)完成。
5、 最终输出:由ROP(光栅化引擎)最终完成像素的输出,1帧渲染完毕后,被送到显存帧缓冲区。
所以通俗一点来讲,GPU的工作就是完成3D图形的生成,将图像映射到相应的像素点上,并且对每个像素进行计算确定最终颜色,最后完成输出。