[凤凰涅槃 PCI—Express]
时代需要,应运而生
由于显示技术的迅速发展,显卡的图形接口必需不断发展进步才能满足日益增大的数据传输带宽需求。从早期80年代的ISA接口的8.33MB/S到90年代PCI接口的133MB/S,再之后进入显卡3D时代的AGP接口将传输速率提升至2.1GB/S,每一次提升都是呈几何级增长。然而,面对现今及日后3D显示技术的不断进步,AGP已经不能满足庞大的数据传输运算的需要,应该有一种全新的接口来取代AGP的地位,这时,拥有4GB/S起始传输速率的PCI—Express面世了。
AGP插槽与PCI—E插槽的对比
我们所熟知的应用于显卡接口的PCI—Express其实是PCI—E 16X的接口,它提供的4GB/S传输带宽远远高出AGP8X的2.1GB/S。但实际上这只是PCI-E的一种工作模式,而PCI—E本身也并不是像AGP一样只为显卡而生。
现行的PC总线构架
全新的PCI—Express构架图
PCI—Express是一种通用的总线规格,它最早由Intel所提倡和推广(也既是之前的3GIO),它最终的设计目的是为了取代现有计算机系统内部的总线传输接口,这不只包括显示接口,还囊括了CPU、PCI、HDD、Network等多种应用接口。从而可以像Hyper—Transport一样,用以解决现今系统内数据传输出现的瓶颈问题,并且为未来的周边产品性能提升作好充分的准备。以往计算机系统的各种设备共用一个带宽,采用了并行互联,这大大影响了系统整体的性能表现,同时并行信号由于相互干扰也严重制约了日后速度的进一步提升。而PCI—E则采用了串行互联方式,以点对点的形式进行数据传输,每个设备都可以单独的享用带宽,从而大大提高了传输速率,而且也为更高的频率提升创造了条件。
同时,PCI—E还有多种不同速度的接口模式,这包括了1X、2X、4X、8X、16X以及更高速的32X。PCIE 1X模式的传输速率便可以达到250MB/S,接近原有PCI接口133MB/S的二倍,大大提升了系统总线的数据传输能力。而其它模式,如8X、16X的传输速率便是1X的8倍和16倍。可以看出PCI—E不论是系统的基础应用,还是3D显卡的高速数据传输,都能够应付自如,这也为厂商的产品设计提供了广阔的空间。
双工模式,带宽增倍
AGP8X的最大带宽为2.1GB/s,而PCIE16X的采用将使这一数值提升到4GB/s,也许在某些人看来这种性能的提升并不能算是惊人,但事实上这并不是PCIE真正的潜能,实际上PCIE接口还可以工作在全双工模式下。在这种模式下PCIE显卡接口将会拥有两条专用的通道,每一条专用通道只作单向的数据传输,因此两条通道同时工作便可以使PCIE 16x的传输速率达到8GB/S。不过有些遗憾的是,这种全双工模式现在还并没有得到Intel最新一代芯片组915/925的支持,这主要是由于全双工模式还有一些技术问题尚待解决。不过在技术高速发展的今天,这种小问题应该很快便会得以解决,我们也期待着PCIE能尽早展现其最完美的一面。
供电问题,依然严峻
还有一点不得不提,作为新一代的显卡接口,由于Intel电源标准的升级,之前通过5V转换3.3V为显卡供电的模式发生了很大变化,如今的PCI—E接口则改用12V直接供电。因此PCI—E能够提供高达70W的电源输出,与AGP接口的30W相比提高多达一倍,这也使目前的绝大部分中低端显卡产品可以从外接电源输入中解脱出来,只依靠PCI—E接口的供电便可以满足使用需求。不过对于今后功耗巨大的新一代高端显卡产品来说,70W的供电显然还是杯水车薪,看来外接电源依然会成为未来高端显卡必不可少的配置。
[众说纷纭 HSI能否胜任]
既然对于显卡来说,PCI Express接口替代AGP接口是大势所趋。那如何让产品在市场中平稳过渡,顺利的完成新老交替呢?这正是厂商们目前最需要考虑的问题。在这个问题上,nVIDIA和ATi采取了完全不同的策略。nVIDIA并没有对现有图形核心进行重新设计,只是通过加入桥接芯片实现了兼容,而ATi则截然相反,他们通过对原有几款图形核心的重新设计,实现了原生(Natively)的PCI—E。
nVIDIA此次发布的nVIDIA GeForce PCX系列产品均具有PCI—E标准在带宽与功能上的优势,但nVIDIA的这一代PCI—E产品并没有采用原生的PCI Express GPU,而是通过高速互联HSI(High-Speed Interconnect)技术,采用桥接芯片能高速执行双向互联协议转换,从而将支持AGP接口的产品转化为支持 PCI Express接口的产品。为此,nVIDIA专门设计的一颗HSI桥接芯片,这颗芯片可以把PCIE的串联信号转换为GPU核心支持的AGP并联信号。由于这颗芯片的出现,nVIDIA就可以在不对核心进行任何修改的情况下,把现有的支持AGP接口的产品转换成支持PCIE接口的产品。
nVIDIA的做法是一种现在看来很明智的做法,在接口技术过渡的初期阶段,由于技术和市场原因,并不能对市场需求作出很准确的判断,这就会使厂商左右为难,然而nVIDIA的HSI桥接芯片则可以通过简单的方式实现对两种市场的满足。这样一来,不但将风险降到了最低,也能节省对现有核心及PCB板进行重新设计的成本,从而更好的节省时间,全力投入到下一代核心的研发之中。
除此之外,对于nVIDIA的HSI芯片还传出这样的声音:由于Intel的新一代主板芯片组产品915/925仅仅提供了对PCIE接口的支持,而没有为AGP的产品做任何保留。这就为消费者带来了极大的不便,因为有许多人还在购买和使用AGP8X的显卡产品,平台的革新无疑会使他们的付出变得没有任何价值。而主板厂商为了吸引更多消费者,也希望自身的主板产品能够提供对PCIE和AGP的双重支持。这样一来,桥接就成了最佳的解决方案,而nVIDIA的HSI芯片也很有可能被选用。
虽然nVIDIA一再强调,HSI桥接芯片的应用将不会影响其利用PCI Express总线技术的主要优势,同时也不会对带宽产生制约,但从技术上分析,这种说法显然还是难以令大多数人信服。因为前面提到过AGP8X的传输带宽只有2.1GB/S,而PCIE16X的总线带宽却是4GB/S,如何能够让这一巨大的带宽差距通过简单的一颗HSI桥接芯片得以转化呢?让我们来详细看看HSI的内部结构。
首先,由于HSI芯片直接安置在显卡PCB板上,因此它与图形芯片之间的信号传输距离相对较短。这就很好的解决了之前AGP插口以及主板等因素的限制,可以在PCB板上进行自由的改动设计。事实上,通过在电路板上进行一些附加设计,nVIDIA成功地实现了将AGP的带宽峰值提升至AGP 16X(4.2GB/s)的技术,因此此时的GPU输出接口并不是只有AGP 8X(2.1GB/s)的速度。这样一来就不会存在由于AGP带宽过低而造成的瓶颈。
其次,所谓的PCI Express X16上下行传输速率各有4GB/s,其实只是理论速度。由于PCI—Express采用了串行数据包来进行数据传输,数据线要同时分担地址、数据、控制信号、错码等,因此实际的有效传输率只有大概3GB/s。再加上一般显卡主要是作数据下行传输(数据从CPU传送到GPU),而对上行传输(由GPU到CPU)来说一般只需要1GB/s的带宽,3GB/s带宽并不能被完全充分的利用,这样一来总的有效带宽加在一起只有4GB/s,而非理论上的8GB/s。由于AGP 16X采用了并联传输方式,所以有效传输率能够达到理论上的4.2GB/s,足够支持PCI—Express X16所要求的总频宽。总结以上分析,nVIDIA的HSI桥接方案是绝对有效及可行的。
综上所述,nVIDIA的桥接方法确实是一种可行的方案,而且这种设计也并没有在很大程度上对PCIE的性能造成影响。虽然与ATi的原生技术相比并不能完全发挥出PCIE的全部性能,但综合PCIE目前的发展状况,这也不失为一种很好的折衷方法。
[阵容齐整 nVIDIA的PCX家族]
与以往的市场策略类似,nVIDIA这次推出的采用PCI—E接口的产品同样针对不同的市场定位进行了划分,分别面向高、中、低端不同市场用户的需要。并以PCX5900、PCX5750、PCX5300和PCX4300来命名。
PCX4300:PCX 4300采用与MX4000完全相同的核心,由于不能提供对于DX9的支持,因此只能是面向入门级的PCI—E市场。采用了半高型PCB设计,显卡整体的做工和用料都还不错,因为图形核心的发热量并不是很大,所以在样卡上仅是采用一片大的散热片进行被动散热工作。
PCX5300:它面向于低端主流的产品市场,采用了与FX5200相同的核心,也既是NV34。核心及显存频率也与FX5200的250/400MHz相同,通过HSI桥接芯片实现了对PCI—E的支持。
PCX5750:采用与FX5700标准版相同的NV36核心,频率为425/550MHz,面向主流市场,应付主流游戏没有任何问题。
PCX5900:采用之前广受欢迎的5900XT核心,但频率较之FX5900XT略有降低,正式发布时应为390/700MHz。基于DX9的优秀设计为玩家提供了强大的游戏性能,同时全新的接口也应该会在一定程度上对其性能提升有所帮助。
当然了,nVIDIA最新推出的采用新一代NV40核心的Geforce 6800系列显卡,也同样会有采用PCI—E接口的产品。作为顶级的图形卡,搭配PCI—E接口的Geforce 6800将会为消费者提供超乎想象的强劲性能。
6800GT PCIE版:这款显示卡在规格上和AGP8X的Geforce 6800 GT显示卡相同,但是采用PCI Express 16x接口,并附带HSI转接芯片。其内核及显存的工作频率分别是350MHz和1GHz,搭载256bit 256MB GDDR3显存。
6800Ultra PCIE版:这是目前市面上最顶级的nVIDIA显卡,同样是通过桥接芯片实现了对PCIE的支持。0.13微米制造工艺、16管线、256bit GDDR3高频显存、35.2 GB/s的位宽、400Mhz核心频率、1.1GHz内存频率,性能空前强大。
[近看PCX5900]
作为这次评测的主角,也作为nVIDIA的PCX系列目前已经推出的最高端产品,还是让我们一起来近距离看看PCX5900会有怎么样的表现吧。
从显卡的正面图片可以看出,由于采用先进的生产工艺,核心发热量已经被很好的控制在较低的限度。因此散热片体积较小,风扇转速也较低,保持了运行中的安静。
将散热片卸下后,我们见到了PCX5900的庐山真面目,可以清晰看到核心及桥接芯片。
再来看看显卡背面。同样是密布着各种电子元件,显示出产品高端的本色。
PCX5900采用了和之前AGP8X版本的FX5900XT完全相同的核心。同时PCX5900的实际运行频率为390(核心)/700(显存)。尽管与AGP8X版本的5900XT的400(核心)/700(显存)存在差距,但从nv方面传来的消息显示,他们对该产品的性能表现充满信心。
由于nVIDIA的PCIE显卡采用了外部桥接芯片进行转换,因此还需要一块桥接芯片。nv的最大的竞争对手的口号是“有路何必搭桥”,近日nv的内部文件也显示nv其实对于竞争对手的“原生PCI-E”方式表示了一定的置疑。其实不论是原生也好,桥接也罢,消费者所真正关心的还是性能和成本,只要产品满足消费者对性能的要求和对较低购置成本的渴望,不论产品采用了什么样的实现方式,都一定会受到消费者的追捧。
显存同样是2.8纳秒的mBGA颗粒,与之前的AGP8X产品没有区别。
供电部分,由于采用了桥接PCIE接口,PCX5900对旧有的PCB设计进行了改进,供电电路集中在显卡左侧,可以看到众多高品质电容及高级电器元件。由于PCI-E可以有效的解决产品的供电需求,所以在产品上我们没有发现之前AGP8X版本所附带的独立供电接口。
至于接口部分,曾经的第一批PCIE产品由于设计上的问题,不能够与915/925主板很好的兼容,需要一块转接卡才能被正确识别。
而现在的产品已经经过了重新修改,能够很好的与主板兼容,同时稳定性也大大增强。
[产品测试]
测试平台:
测试说明:
1.有测试关闭声音
2.所有测试关闭垂直同步
3.我们在测试中所有游戏和测试软件都打开三线性过滤,不使用默认设置。
4.产品送测初期我们遇到了一些困难,由于送测的PCX5900工程样板的默认频率只有350/550MHz,远低于FX5900XT的400/700MHz,这让我们很困惑。不过我们也还是通过提升频率进行了400/700MHz这一频率下的性能测试,并最终选定了这组成绩作为测试结果。因为在这一频率下我们才能够与采用AGP8X的FX5900XT进行对比,以更直观更公正的方式说明PCX5900的真实性能。同时,在测试结束后我们也受到了确定的消息,nVIDIA最终推向市场的PCX5900将采用390/700MHz的额定频率。
5.关于驱动:由于我们目前能够获得的驱动有61.34和61.45两个版本,因此我们分别对两个版本驱动下显卡的性能进行了测试和对比。
从以上的多项测试成绩我们可以看出,采用全新PCIE接口的PCX5900性能表现还是值得肯定的,不过它基本上还只是保持了与FX5900XT相同的性能水平,因此并没有带给我们太多的惊喜。
再来看看两款驱动的对比,61.34的成绩很一般,甚至让人有些失望,因为它相比AGP8X的产品几乎没有什么提高。而61.45则表现不错,首先是比61.34有了大幅提高,同时也初步显示出PCIE的性能优势。两个版本驱动的成绩对比也能带给我们一些启事,那便是PCIE产品刚刚面世,现有的驱动还不一定能很好的发挥出性能的真实优势。
我们也选择了AGP8X接口的FX5900XT的测试成绩进行了对比。FX5900XT的成绩和PCIE版本的性能提升幅度在下面的两个表格中有所体现。
与AGP8X版本相比,采用PCI—E接口的PCX5900在各项目中的性能提升幅度:
这其中3Dmark03的性能提升幅度最多,达到了16%,而在Aquamark3的两组数据上也分别有13%和5.2%的增长,此外其它游戏和测试项目也都有5%左右的性能提升。不过同时也要考虑到测试PCX5900使用了Intel最新的925X平台,全新LGA775的CPU,以及DDR2—533MHz的内存,这样一来成绩的提升究竟是因为显卡自身性能的提升还是由于平台整体性能的提升就很难判断了。
[总结]
PCI—Express的推出使我们迎来了一次平台的革新,这其中最大的受益者自然是对传输带宽有巨大需求的显卡产品,高达8GB/S的传输带宽既能使现有的产品性能得以提升,也为未来更高端产品性能的发挥创造了前提。
不过就目前的情况来看,第一代的PCI—E产品并没有带来性能上的巨大提升,也许是构架设计中还存在一些不完善的地方,也许是驱动程序对全新构架的利用还不充分,抑或是桥接技术没有真正发挥出PCIE的潜能。也许随着周边平台的不断完善,随着驱动程序的不断改进,PCIE的真实性能会逐渐展示在我们面前,但不论如何我们还是需要耐心的等待一段时间。