[为何苦苦追求前端总线频率的提升]
去年年末,Intel发布了目前性能最为强大的Pentium4平台产品,那就是拥有1066MHz前端总线速度的i925XE主板和Intel Pentium4 Extreme Edition 3.46GHz处理器。我们驱动之家也收到了Intel的送测样品,这里就和大家一起分享一下对这套平台的测试与分析。
Pentium 4系列处理器从诞生之初便与众不同,最早的Willimate内核的Pentium4就开始采用400MHz的前端总线频率,后来伴随着处理器主频的提升更是不断提升前端总线频率到533MHz、800MHz,甚至现在的1066MHz。为什么这款处理器需要如此高的前端总线频率呢?这是由于Pentium 4的设计理念有区别于以前的Pentium III处理器和AMD的Athlon XP处理器,它采用了一种超长的流水线设计,Intel将其命名为NetBurst构架。
关于流水线的概念大家一定都已经很熟悉了,它就是指将每条任务需要完成的步骤加以分解,每一个步骤称为一个级,所有的CPU运算操作都是由这些级组成的。设计流水线,也就是分解设计这些级的过程,流水线既可以设计的短一些比如20级,也可以长一些比如31级。众所周知,Intel Pentium4 Northwood核心的流水线突破了20级。在Prescott核心上,流水线长度更是达到前所未有的31级。31级流水线和20级相比就是任务分解的更细了,但最终运算结果两者都是一样的。显而易见,31级流水线每级的任务要简单一些,所需的晶体管或门电路也就要少,每级完成任务的时间也相应降低。对CPU设计来说,流水线中每级的速度越快,CPU的频率上限就越高,并且高频率下的稳定性也得以增强,这正是Pentium 4可以轻易提升频率的原因。
当然凡事有利也有弊,超长的流水线和长度较短的流水线相比,其一大弊端就是:很难保证流水线中所有的级都处于满负荷的工作状态,也就是说超长流水线的工作效率要低下一些,这也是初期低频Pentium 4不如同频PentiumIII的主要原因之一。同Northwood核心相比,Prescott的流水线长度又增加了50%,这必然进一步造成效率的损失,会消耗掉其它方面改进得来的提升。所以改进的超长流水线,只是为了Prescott频率的提升做准备,如何让数据更快的填满就成了Pentium4克服性能弱点的关键。于是Intel在Northwood里把L2 Cache增加到了512KB,同时前端总线速度也在不断的提升。无论是Cache容量的增大,还是前端总线速度的增加对于Pentium4来说都是至关重要的。而现在P4EE的2MB三级缓存和1066MHz前端总线正是迎合了这一需求。
不仅如此,超长流水线还会带来其他一系列问题。当核心频率越高时,越容易出现缓存没有数据供给处理器处理的情况,这无疑是以浪费核心时钟周期为代价的。而且,目前系统架构中的内存子系统速度与处理器的速度相比是非常慢的,基于NetBurst架构处理器中的ALU算术单元更是以处理器时钟的两倍频率运行,因此处理器需要浪费很多时间来等带新数据的到来。
此外,虽然目前处理器的分支预测功能准确性已经达到了95%甚至更高,但毕竟还有5%的分支预测错误存在,一旦分支预测出错,就意味着处理器需要清空所有流水线中的数据,并重新进行运算和数据的传输。所谓分支预测,我们知道普通程序运算时的程序指令通常都包含各类型的条件选择和分支语句,通过具体的验证条件决定程序执行路线。但CPU的执行单元有些不同,它为了节省在验证语句处消耗的等待时间,必须通过一项特殊的预测机制,估计程序可能会选择的线路直接执行,然后在后面进行验证。如果预测正确当然万事大吉继续往下执行,但如果发现之前的预测错误,那么就必须返回原地重新开始,之前的指令就会被作废。而更为麻烦的是,超长流水线在出现分支预测错误时会造成更多的损失,因为流水线越长,出现分支预测错误的机会就越多,如果预测错误,很多在管线内的指令会被清掉,重新填满流水线的时间也就越多。毫无疑问这将花费更多的时间,整体性能也会严重下降。因此不断的提升前端总线的频率以及处理器的主频也正是解决分支预测出错的有效方法。
而除了超长流水线的NetBurst架构之外,Pentium4加入的采用SMT技术的Hyper Threading,通过充分利用处理器的空闲运算单元,能够有效的提升处理器在大数据量吞吐和多任务下的性能表现。这意味着处理器能够在同一时间内处理更多的数据信息,也就对处理器的数据需求提出了更高的标准,难怪具有HT功能的Pentium4处理器多数的前端总线频率都达到了800MHz。现在1066MHz前端总线产品的发布也是为了让超线程更加充分的发挥其特点。
以上这些Pentium 4处理器在架构和技术特点上的需求,决定了更高的前端总线是未来的发展方向,而Intel为了在竞争中取得优势,也不得不继续这样做,这也是为什么要苦苦追求前段总线频率不断提升的原因所在了。
[P4 EE 3.46GHz——能有多大的力量]
此次我们收到的处理器为P4 EE 3.46GHz,我们先来对这款产品加以一定的了解和分析吧。这款产品最为突出的特点便是具备了266MHz的处理器外频,因此能够与1066MHz的前端总线很好的配合。再来看看核心,也许有人会误以为这款具有目前最高外频并且采用LGA775封装的处理器会是一颗Prescott核心的产品,但实际上它采用的核心是应用于Xeon处理器的Gallatin内核,这款内核依然采用了0.13微米的制造工艺,有8KB的一级缓存、512KB的二级缓存以及令人感到窒息的2MB大容量三级缓存。说到这里大家应该已经清楚了,除了2MB的三级缓存,这款核心与之前的Northwood没有任何区别,而它的LGA775封装也是为了满足现有平台的需要。
不过,和大部分Pentium 4处理器中的L1和L2高速缓存所不同的是,这个版本的第三级高速缓存是与处理器核心单独协调工作的,这意味着高阶高速缓存内的数据是不会复制到低阶的高速缓存中取得,也就是数据不会由L2 传到L3高速缓存中。
而首先采用1066MHz前端总线的Prescott系列处理器,将是2005年2月中旬推出Pentium 4 6xx系,其主要是通过对现有的Intel Pentium 4 5xx系列进行了改良,核心代号为Prescott 2M,故名思义就是把现有Pentium 4 5xx系列的Prescott核心,由1MB L2 Cache提升至2MB L2 Cache。除此之外,它还加入了ESIT加强型Speed Step以减低电量及热量,同时它也会支持EM64T,因此能够支持64bit的操作系统。
通过照片对比我们能够发现,从处理器正面的封装方式我们看不出这款产品与普通的Prescott核心有什么区别,照片中上为Gallatin核心的P4 EE,下为普通的LGA775封装P4处理器。
不过处理器的背面通过电容的数量还是很容易判断出不同的。可以看出由于采用不同的核心并且增加了2MB的三级缓存,因此电容数量多出不少。照片中上为Gallatin核心的P4 EE,下为普通的LGA775封装P4处理器。
[i925XE——相似的规格更强的性能]
如果说i925XE与i925X的不同之处在那里,那答案只有两点,首先是i925XE实现了对1066MHz前端总线频率的支持,其次便是它取消了对ECC内存的支持。
下面这张i925系列的构架图清晰地显示了i925X和i925XE的功能,而通过与ICH6系列南桥的搭配,它们完全具备相同的扩展功能。
从规格表来看,我们发现其实i925XE与i925X相比并没有质变,它完全源于i925X,我们甚至认为这款芯片是从众多i925X芯片中选拔出的性能出众者,是制程技术提升的产物,主板厂商甚至只需要做一些小小的调整便能够将i925XE的芯片使用在原有的主板上面。虽然目前能完美搭配这款芯片组的处理器只有我们今天见到的P4 EE 3.46GHz,不过相信很快便会有6XX、7XX系列的处理器面世,它们都将支持1066MHz的FSB,因此i925XE将可能会有很长的市场寿命,只是目前还不清楚未来的双核心处理器能不能和i925XE很好的兼容,我们很期待,相信所有人都很期待。
对于内存的支持,i925XE还是比较保守的,当大多数人认为Intel会让这款芯片组直接支持DDR2-667,从而充分发挥DDR2的高频率优势时,它却依然止步于DDR2-533。当然这里也有两个主要的阻碍,首先虽然DDR2-667相比DDR2-533的频率提升只有66MHz,但二者的价格差异却是不成比例的。其次,当DDR2-667运行在333MHz的内存频率下时RAM其实是工作在异步状态下的,这可能会造成许多后遗症,Intel自然不敢轻易尝试。
不过任何问题总是有解决的办法,尽管Intel公布的数据显示i925XE只支持DDR2-533,但是我们依然能够通过超频来达到提升性能的目的。方法很简单,只要调整处理器外频与内存频率的比例就行了。其实这种方法在FSB800MHz的时候就已经被采用,玩家通过将比例调整为1比1.33,从而能够使用DDR2-533来提升性能。而当FSB增加到1066MHz后,通过相应的方法我们便能够使用DDR2-711的内存了。当然,这时候你就需要搭配DDR2-667的内存条了,因为能够超频为DDR2-711的DDR2-533毕竟是少数。
[近观intel 925XE主板]
这是英特尔送来的925XE的工程样板(3相供电),它支持双通道DDR2-533内存和1066MHz FSB的奔腾4处理器。其他的部分和915/925X基本相仿,保留了PCI Express 16X图形接口,以及4组S-ATA Port。
DDR2的内存插槽,最大支持4GB的内存容量。DDR2在去年的推广可以说相当不顺利,高昂的销售价格,系统整体性能的不平衡都使消费者对DDR2内存不是很感冒。不过随着1066MHz的平台推出,DDR2的前景也会更加光明,因此在这块主板上Intel只为DDR2留下了位置。
扩展槽方面,这块主板提供了一个PCIE x16和两个PCIE x1,为了兼容现有的PCI产品,还另外设置了4个PCI插槽。
存储接口方面,i925XE提供了对4个SATA设备的支持,而对于SATAII的支持我们可能要等到下一代芯片组产品了。
主板的供电部分同样是不惜工本,采用三相供电,三组四对的MOSFET管,厄流线圈上加了保护。
接口方面这款产品也非常丰富,包括了数码音频输出,火线接口和RJ45网络接口。并有多声道音频输出,不过4个USB接口有一些拥挤,插拔大体积设备不太方便。
在主板上我们还见到了4Pin的接口,也许是为了保证给主板更好的供电支持,也可能是为单独需要4Pin电源供电的设备预留的供电接口。
[DDR2市场生力军-易胜Elixir DDR2-533]
此次测试平台搭配的内存为易胜(elixir)的DDR2-533。让我们先来对这一品牌的内存加以了解:易胜Elixir这一品牌是南亚科技针对现货需求市场所成立的第二品牌,成立于2001年,由于采用了台湾内存制造大厂的原厂模块,因此产品品质十分出色。易胜elixir产品皆经过严格的品质控管及完整的测试流程,从IC颗粒到模块封装层层把关。另外,为满足消费者使用需求,elixir特别重视内存模块与主机板的间容性,与华硕、技嘉、微星、精英等主机板制造业者密切配合,能够提供稳定可靠的模块。产品主要为装置于桌上型计算机及笔记本电脑的内存模块及显卡采用的内存颗粒,包括最新一代的DDR2- 533 及DDR466、DDR400等,容量从1GB到128MB。
此次易胜送测的DDR2-533也是他们推出的新产品,产品规格如下:
此次送测的易胜(Elixir)DDR2-533容量为单条256MB,采用了6层PCB,保证了高频率下工作的稳定性,由于单条容量只有256MB因此只有4颗FBGA封装的显存颗粒。
搭配的颗粒为elixir的DDR2显存颗粒,当然是南亚的自家产品。颗粒编号为N2TU51216AF-37B。
通过内存上的标识我们能够很直观的了解到产品的各项参数,这款产品的标准时序为“4-4-4-12”,是比较常见的规格。
从上面的规格表中我们发现易胜Elixir DDR2-533的价格分别是256MB为400元,512MB为800元。与市场上其它品牌产品的价格相比有很大的优势,如此低的价格能够保证内存的产品品质吗?才后面的测试中我们将会得到解答。
当然,随着Intel对PCI-E和DDR2的大力推广,多家厂商也都加大了DDR2的生产力度,相信用不了多长时间,DDR2的内存价格便会由于供过于求的市场关系而出现一路下滑的情况,很快就能够被普通消费者所接受。
[实际性能测试-系统性能、处理器性能]
为了更详细的了解i925XE主板的性能,以及相对于i915和i925X它的性能有多少提升,我们对这套系统进行了测试并将数据列表如下。前端总线频率的进一步提升会让我们看到怎样的性能表现呢?
系统综合性能测试:
这三项系统性能测试软件具有一定的代表性,能够综合的考察系统的整体性能。其中PCMark04在测试中受内存性能以及CPU处理能力的影响比较大,因此这两部分性能比较强的平台在总分上也会有突出的显示。可以看到i925XE与P4EE 3.46G的组合得到了5281的高分,1066MHz的前端总线频率功不可没。而Business winstone和MCC Winstone的测试项目则更加全面,既有日常的多种应用软件又有多种媒体应用,不过可以看出,这两项测试i925XE的表现虽然很强劲,但依然与现有的i925X平台处于同一水平。
我们认为,虽然处理器外频从200MHz提升到了266MHz,而前端总线频率也从800MHz增加到了1066MHz,但增加的频率和带宽并没有从整体上为系统带来很大的性能变化,这其中的主要原因是由于P4 EE版本的大容量高速L3缓存,已经提供了远远强于标准版本P4的效能,因此在此基础之上的前端总线的频率提升所带来的效能增加并不明显。不过前端总线频率的提升还是从理论上解放了内存与处理器之间原有的瓶颈,这一点我们继续用测试成绩来说明问题。
处理器性能测试:
从测试成绩来看,不论是考察处理器理论性能的PCMark04的CPU得分,还是SiSoftware Sandra中的处理器算术性能及多媒体性能测试中,i925XE与P4 EE 3.46G的组合确实有着不错的表现,不过平心而论,性能提升有限,并没有什么特别之处。
[实际性能测试-内存性能、图形处理性能]
内存性能测试:
与处理器在外频增加后性能提升不大相反,内存系统的性能在1066MHz前端总线频率的带动下性能提升十分明显。由于前端总线频率与内存频率完全相同,因此原有的系统瓶颈已经完全别打破,这在现有的条件下也能最大限度的发挥系统的整体性能。同时我们也再一次深刻的体会到,不能单单只注重处理器的运算频率和效能,更要考虑到平台各个部分的整体平衡性。
为了验证内存频率的提升是否会继续带来内存读写性能的提升,我们尝试进行了超频。超频的方法很简单,在默认的状态下处理器前端总线FSB的频率与内存的频率是1:1的关系,在目前的系统下也就是同为266MHz。我们只需要将主板的分频比设置为3:4,这样在处理器外频不变的情况下内存的最高频率便能够提升到354.67MHz,我们便能够由此来对内存进行超频,并且检验内存的品质。
这是CPU-Z下内存的默认信息,它默认能够支持4-4-4-12的设置下工作于266MHz的频率。
而当我们将处理器FSB和内存的分频比调节为3:4之后,CPU-Z中已经显示内存模块此时的频率为354.7MHz,已经是DDR2-710的水平,参数设定也依然为4-4-4-12。这一步还并不能确定超频是否成功,我们还需要通过软件的测试检验在现有频率下内存模块是否能够正常的工作,只有通过全部测试才能证明超频是成功的。
测试结果表明内存超频后依然能够稳定的运行,同时内存带宽的大幅提升也带来了测试成绩的提高,内存的读写性能被进一步挖掘出来。由此我们也能够感觉到易胜DDR2-533内存优秀的品质,超频是检验内存模组的最佳方法,DDR2-533能够工作在710MHz的状态下,已经说明了问题。虽然易胜(Elixir)还是一个大家不太熟悉的品牌,但相信有优良的品质做保证,随着渠道的不断完善和DDR2内存市场的进一步扩大,易胜的产品一定会越来越受到关注。
3D图形性能测试:
3DMark系列软件不但测试显卡的性能表现,其中CPU和内存的性能也起到了关键性作用,1066MHz的前端总线频率也使测试成绩有所提高,不过同样不明显。
[普及型产品才是最终需求]
通过以上几部分的测试,我们也对i925XE平台和P4 EE 3.46GHz处理器的整体性能有了一定的了解。可以说外频的提升并没有为处理器带来多大的性能提升,也许正如我们前面分析的,大容量的三级缓存构架已经很大程度上缓解了处理器对高速数据传输的需要,因此外频的提升作用不大。
但对于内存系统来说,前端总线的频率提升却带来了性能的进一步飞跃。与之前版本的i9XX系列芯片组不同,i925XE首次将处理器与内存之间的瓶颈打破,这也是能够最大程度发挥系统性能的前提。
不过i925XE并没有支持DDR2-667也不能不说是一个遗憾之处,因为有许多人都期待着i925XE芯片组能够支持DDR2-667,更高的内存频率无疑会进一步提升系统的整体性能。当然了,我们还是能够通过超频的方式来实现更高的性能表现的。对于未来的应用来说,i925XE确实比现有的芯片组更为合适,对高频率DDR2内存频率的支持自不必说,而考虑到未来处理器的更新,i925XE也比自己的前任具备更强的延展性。
然而我们倒是希望i925XE能够与现有的主流处理器进行搭配,因为P4 EE过高的价格和并不十分出色的性能严重的影响了消费者的购买欲望,而对ECC内存支持的取消会不会也正是Intel将这款芯片组推向主流的一种暗示呢?