本文编译自国外硬件评测媒体AnandTech,不代表本站观点,仅供参考。
纵观历史,这应该是Intel新架构在市场上普及耗时最长的一次了。2008年11月3日,Nehalem架构以Bloomfield高端四核心的形式第一次登场亮相,但更主流的Lynnfield花了将近一年的时间才现身。即使P55主板定在了99美元价位,Intel Nehalem还是拱手让出了100-200美元的处理器区间。在这里,我们要么选择2006年Conroe架构的升级版Penryn,要么就是AMD的Phenom II。
从100美元到200美元,最佳选择当然是AMD。无论是价格诱人的Phenom II,还是没有三级缓存的Athlon II,AMD完全控制了100-200美元市场,而今天我们看到的代号Clarkdale的Intel首批32nm处理器,正是为这一市场特别设计的。
严格来说,Clarkdale并非Nehalem,而是Westmere,在Nehalem的基础上,改用32nm工艺晶体管,并增加一些加密解密指令集而来,就是Westmere了。
Clarkdale是双核心版的Westmere,并整合了45nm GMA图形核心。没错,这是史上第一个板载图形芯片的Intel处理器(不算Atom的话)。明年我们将看到Sandy Bridge,图形核心(GMA)会与处理器(CPU)集成在同一个内核(Die)里,但在那之前我们得再一次面对Intel惯用的多芯片封装(MCP)。
Clarkdale之所以没有把CPU和GMA整合在同一个Die里边,主要是Intel仍在采取使用最佳工艺抢占一切的策略。32nm晶圆厂正在用于CPU生产,但45nm晶圆厂也不能闲置,所以就用来制造GMA了。
不幸的是,Clarkdale并非尽善尽美。记得Nehalem架构集成的内存控制器么?Clarkdale又把它给踢了出来,安置在45nm GMA Die里。这样的好处是GMA内存访问速度超快,但对CPU核心来说就慢多了。事实上,这是Intel P45/X48等老一代芯片组使用的内存控制器的延生版。
CPU和GMA之间是使用QPI总线连接的,所以带宽不是一个大问题,但延迟不幸受到了影响。因为这里的内存控制器是为前端总线(FSB)架构优化的,访问时间会比LGA775处理器更长。Sandy Bridge也许不会存在这个问题,但那是一年后的事儿了。
和Lynnfield一样,Clarkdale使用的也是LGA1156封装接口,理论上支持所有P55主板,但需要更新BIOS,不过P55芯片组没有视频输出单元,主板也没有VGA/DVI/HDMI等视频输出接口,所以想利用Clarkdale的GMA图形核心,你只能再买一块新的H55、H57或者Q57主板。
H/Q系列芯片组带有所谓的弹性显示界面(FDI),基本上就是CPU和芯片组之间的一个连接,负责视频传输。H/Q系列主板上也会带有各种各样的视频接口。H5x/Q57主板就可以支持 Clarkdale的整合显示输出。
5系列芯片组的规格对比如下:
支持Rapid Storage存储技术应该是H57相比于H55最大的优势了,Q57则是为商务客户增加了一些安全和管理功能。H系列面向消费市场,Q系列则是给企业客户的。
再说Clarkdale处理器,Intel此次一共发布了七款型号(Clarkdale移动版本有十一款):
处理器型号 |
主频 |
核心数/线程数 |
三级缓存 |
Turbo加速最高频率 |
TDP |
千颗批发价 |
Intel Core i5-670 |
3.46GHz |
2 / 4 |
4MB |
3.76GHz |
73W |
$284 |
Intel Core i5-661 |
3.33GHz |
2 / 4 |
4MB |
3.60GHz |
87W |
$196 |
Intel Core i5-660 |
3.33GHz |
2 / 4 |
4MB |
3.60GHz |
73W |
$196 |
Intel Core i5-650 |
3.20GHz |
2 / 4 |
4MB |
3.46GHz |
73W |
$176 |
Intel Core i3-540 |
3.06GHz |
2 / 4 |
4MB |
N/A |
73W |
$133 |
Intel Core i3-530 |
2.93GHz |
2 / 4 |
4MB |
N/A |
73W |
$113 |
Intel Pentium G9650 |
2.80GHz |
2 / 2 |
3MB |
N/A |
73W |
$87 |
六款Core i5/i3架构基本相同,都是每核心256KB二级缓存、所有核心共享4MB三级缓存(Lynnfield/Bloomfield都是8MB),不过i5支持Turbo加速,i3则没有。i5-661的GMA频率较高(900MHz),功耗也更高。
从价格上来说,Clarkdale系列确实很贵,Core i5-670/661/660/650都在170美元之上,非常不值。还有Turbo加速频率较高、还多两个核心的Lynnfield,比如Core i5-750要196美元,但不支持超线程。你也可以选择AMD Phenom II X4 965,价格相近,多线程性能更佳。
另外在双核心架构上,Turbo加速作用不大,毕竟关掉一个核心之后就成了非常落伍的单核心,频率稍稍提升8%左右根本没有什么价值,而且Core i3还不支持这一特性。
处理器 |
主频 |
Turbo加速最高频率 |
|
双核心激活 |
单核心激活 |
||
Intel Core i5-670 |
3.46GHz |
3.60GHz +3.9% |
3.73GHz +7.7% |
Intel Core i5-661 |
3.33GHz |
3.46GHz +4.0% |
3.60GHz +8.0% |
Intel Core i5-660 |
3.33GHz |
3.46GHz +4.0% |
3.60GHz +8.0% |
Intel Core i5-650 |
3.20GHz |
3.33GHz +4.2% |
3.46GHz +8.3% |
Intel Core i3-540 |
3.06GHz |
N/A |
|
Intel Core i3-530 |
2.93GHz |
N/A |
完美的HTPC平台
AMD Radeon HD 5000系列独立显卡率先实现了Dolby TrueHD和DTS-HD Master Audio高清音频格式通过HDMI接口的源码输出,而Intel Clarkdale则是第一个做到这一点的集成显卡,搭配H55、H57、Q57主板均可,当然八声道LPCM HDMI输出也是支持的。
测试显示,这一技术工作得几近完美,使用Intel提供的PowerDVD 9升级版播放蓝光没碰到任何问题。HTPC玩家想必会欢呼雀跃了。
PowerDVD针对Windows 7做了大量改进,提供了漂亮的媒体中心界面,但还需要改进。虽然可以在其中选择源码输出音频编码,但这种设置却不会记忆,必须手动选择TrueHD或者DTS-HD MA。另外,播放盗版、非加密的蓝光总是比正规内容容易得多。
内存性能:不怎么Nehalem
让我们从最重要的地方——内存性能开始。Nehalem架构集成了内存控制器,但Clarkdale又倒退了一步,将内存控制器放到了GMA图形核心里。
更糟的是,Clarkdale自带的芯片组还是P45的延生版,是为FSB而非QPI优化的。看看下边的数字先:
型号 |
L1延迟 |
L2延迟 |
L3延迟 |
Intel Core i7-975 |
4 clocks |
10 clocks |
34 clocks |
Intel Core i5-750 |
4 clocks |
10 clocks |
34 clocks |
Intel Core i5-661 |
4 clocks |
10 clocks |
39 clocks |
AMD Phenom II X4 965 |
3 clocks |
15 clocks |
57 clocks |
Intel Core 2 Duo E8600 |
3 clocks |
15 clocks |
一级和二级缓存延迟没变,Bloomfield、Lynnfield、Clarkdale都是4个周期和10个周期,但Clarkdale的三级缓存延迟慢了5个周期,毕竟其非核心频率较低。Bloomfield的非核心频率都是2.66GHz,Clarkdale Core i5降到了2.40GHz,Core i3和Pentium则是2.13GHz和2.00GHz。
型号 |
内存延迟 |
读取带宽 |
写入带宽 |
复制带宽 |
Intel Core i7-975 |
45.5 ns |
14379 MB/s |
15424 MB/s |
16291 MB/s |
Intel Core i5-750 |
51.5 ns |
15559 MB/s |
12432 MB/s |
15200 MB/s |
Intel Core i5-661 |
76.4 ns |
9796 MB/s |
7599 MB/s |
9354 MB/s |
AMD Phenom II X4 965 |
52.3 ns |
8425 MB/s |
6811 MB/s |
10145 MB/s |
Intel Core 2 Duo E8600 |
68.6 ns |
7975 MB/s |
7062 MB/s |
7291 MB/s |
再看内存延迟和带宽就更糟了。Clarkdale的内存延迟比Lynnfield高了76%之多,这非常可怕,从内存得分也可以看出。内存带宽也从最高15GB/s完全跌到了10GB/s之下,只比Core 2略高一点。
我们看到这种类似Nehalem架构的改动版,加上45nm P45芯片组封装在一起,效果并不好,内存延迟真的很伤人。
Intel GMA HD:集成显卡好多了
Clarkdale集成的图形核心有两个叫法,一是延续传统的GMA HD,在驱动文件和检测工具里都是它,二是HD Graphics,Intel在各种宣传文档里的称呼。这里就称之为GMA HD。
GMA HD使用了45nm工艺,Inte让显示核心的性能稍微加强了,但本质上和G45是同样的架构,只是速度稍快。想看到完全GPU \CPU合一的Larrabee还得好多年。
G45 GMA X4500HD拥有10个流处理器,GMA HD则增加到了12个,还有一些内部增强和性能改进,整体性能提升大约会有20%。
集成显卡的性能很孱弱,Intel无疑是糟糕的。其他产品能在低画质下得到30FPS以上的帧率,Intel可能只有个位数。
Clarkdale有了一些变化,Intel也终于带来了一个相比于其他方案有一些竞争力的集成显卡。这里我们选择Core i5-661和AMD的Phenom II X4 965+790GX(板载128MB显存)进行对比。后者是当前最好的集成主板,如果Clarkdale能够与之抗衡甚至接近,就足够令人满意了。
同时还加入了G45的对比,到没有NVIDIA GeForce 9400,后者与790GX差不多,但实际产品非常罕见。
要记住,Core i5-661是Intel最快的集成显卡,Core i3和Pentium都要弱不少,所以这里只代表Intel的最好水平。
游戏测试从《蝙蝠侠:阿卡姆疯人院》开始。对集成显卡来说,所有画质特效都得关掉,分辨率这里设为1024×768。
该游戏在集成显卡上运行得还算流畅,画面也不错。GMA HD和790GX都跑到了35FPS,是G45的两倍多。相信换用i3应该也会有30FPS。
接下来是《龙腾世纪》。这次集成显卡就对付不了了,像是PS2上的《国王密使》。GMA HD超过了40FPS,比790GX还快一些,G45就慢得不得了了,I3就更悬了。
在《战争黎明2》上,GMA HD以15FPS继续领先,不过最低帧率只有3.4FPS,,不具备可玩性,即使这样也比G45好太多了。
到了《现代战争2》,Intel还是输了,790GX领先大约40%。
火爆的《魔兽世界》里,AMD再次取胜,领先接近50%。
《鹰击长空》的胜者还是AMD,已经逼近60FPS,不过GMA HD也不错,而且比G45强太多了。
总结下来,Intel在集成显卡上取得了明显进步,已经足以和AMD、NVIDIA抗衡,也算是兑现了一次承诺,虽然集成显卡整体仍然比较羸弱。希望Sandy Bridge上会更好,而且我们也真的需要集成显卡的性能能在现有基础上翻一番。很快AMD就会发布下一代800系列,有望改变这一局面。
下边再来看看功耗。
尽管CPU和GMA的工艺双双升级,但Core i5-661的待机系统功耗仍然高于Core 2 Duo E8400+G45,只是比AMD的好一些。
满载功耗在MPC Classic Home Cinema播放1080p x264高清视频的时候测量,结果基本同上。
AES-NI:加密解密提速
Westmere(Clarkdale)增加了六条新的加密、解密x86指令集,可提高AES的计算速度,因此称之为“AES-NI”,不过真正重量级的还得等接下来的AVX和Sandy Bridge。
对商业客户来说,经常需要使用Windows 7 BitLocker等技术对硬盘数据进行加密保护,AES-NI就可以提高这类应用的速度。
一般来说,在Windows 7上打开BitLocker会对磁盘性能产生影响,理论测试成绩损失比较明显,实际应用影响则稍小一些。数据每次写入磁盘都必须先行加密,这必然会消耗CPU资源,实现了硬件加速的Clarkdale应该会好一些。
测试中,首先在OCZ Summit固态硬盘、Windows 7操作系统上运行PCMark Vantage硬盘子项,然后打开BitLocker重测一遍,最后把CPU换成不支持加速的Core i5-750。
Processor |
PCMark Vantage HDD |
% of Unencrypted Performance |
Clarkdale - Unencrypted |
16713 |
|
Clarkdale - Bitlocker Encryption |
13785 |
82.5% |
Lynnfield - Bitlocker Encryption |
11744 |
70.3% |
可以看出,BitLocker造成的性能损失在Lynnfield上达到了30%,而Clarkdale上降低到了不足20%,加速效果明显,对企业客户来说是个好消息。
测试主板与平台
下边是本次测试用的Intel原厂主板:
看起来不错,但完全没有任何超频选项,甚至不能调整内存频率和时序,好像是十年前的板子。
而且Intel只送测了一颗Core i5-661,196美元,在这块板子上也无法降频模拟Core i3。
好在还有华硕的P7H57DV-EVO,能够关闭Core i5-661的Turbo模式、降低倍频,从而模拟Core i3-540/530。GMA HD频率始终都是900MHz,因此注意图形性能好于真正的i3处理器。非核心频率可能也略高一些,但尚需确认。
还有微星的H57M-ED65,也是H57芯片组。
测试平台配置:
Motherboard: |
ASUS P7H57DV- EVO (Intel H57) Intel DX58SO (Intel X58) Intel DX48BT2 (Intel X48) MSI DKA790GX Platinum (AMD 790GX) Gigabyte GA-MA790GP-DS4H (AMD 790GX) Gigabyte GA-MA790FX-UD5P (AMD 790FX) |
Chipset Drivers: |
Intel 9.1.1.1010 (Intel) AMD Catalyst 8.12 |
Hard Disk: |
Intel X25-M SSD (80GB) |
Memory: |
G.Skill DDR2-800 2 x 2GB (4-4-4-12) G.Skill DDR2-1066 2 x 2GB (5-5-5-15) Corsair DDR3-1333 4 x 1GB (7-7-7-20) |
Video Card: |
eVGA GeForce GTX 280 ATI Radeon HD 5870 (Windows 7) |
Video Drivers: |
NVIDIA ForceWare 180.43 (Vista64) NVIDIA ForceWare 178.24 (Vista32) ATI Catalyst 9.12 (Windows 7 x64) |
Desktop Resolution: |
1920 x 1200 |
OS: |
Windows Vista Ultimate 32-bit (for SYSMark) Windows Vista Ultimate 64-bit |
SYSMark 2007
今天测试的第一个项目,也是惟一一个综合性测试工具,能全面衡量一台机器的性能。
i5-661的得分已经和i7-860不相上下,因此除非运行多线程测试,这个双核心四线程处理器已经足以媲美四核心处理器。
模拟而来的i3-540/530虽然没有Turbo,但还有超线程,性能已经超越四核心Core 2 Quad Q9400,并且接近133美元的Phenom II X4 965。
至于上代双核心Core 2 Duo已经完全落伍了,这也正是Core i3的取代对象。
Adobe Photoshop CS4
此测试不能100%的压榨四核处理器,无法体现四核处理器的优势,因此i5-661和Q9400速度差不多,但比同价位的i5-750差远了。i3-540/530也都不错,性能与Athlon II X4接近,已经超过了Q6600、E8600等前辈。
DivX 8.5.3 with Xmpeg 5.0.3
在DivX测试里,视频编码需要更多核心,双核心的Clarkdale只略好于Q9400。i3-540/530倒还可以,相当于Athlon II X4 630。
x264 HD Video Encode Benchmark
这次Clarkdale系列明显偏慢,还不如Q9400和X4 630,i5-661也只略好于Q6600。如果你经常大量进行X264视频编码,还是考虑Lynnfield或者四核Ahtlon/PhenomII吧
Windows Media Encoder 9 x64 Advanced Profile
i5-661仍然没有预期得快,i3-540/530更慢,如果你是视频发烧友,应该还要考虑四核吧。
3dsmax 9 - SPECapc 3dsmax CPU Rendering
和视频编码一样考验CPU,i5-661还是慢于Q9400,i3-540/530好于E8600但不如Q6600。
CineBench R10
单线程测试中,Clarkdale很不错。i5-661此时可以加速到3.60GHz,成绩遥遥领先。i3-540/530也能加速到3GHz左右,成绩同样不错,已经和E8600、X4 965差不多。
多线程就不一样了,物理四核心让双核心四线程的Clarkdale明显居于下风。
POV-Ray 3.73 Beta 23
光线追踪是Clarkdale最惨的地方,i5-661还不如X4 630,i3-540/530落后不多。
Blender 2.48a
和POV-Ray相反,3D渲染是Clarkdale的拿手好戏,不过i5-661的性能和价格还是不成比例,i3-540/530就好多了。
PAR2多线程文件恢复
i5-661虽然性能略好,但不要忘了其高高在上的价格,因此性价比差了很多。
WinRAR文件恢复
多线程负载越轻,Clarkdale表现就越好,intel可借此来对抗Athlon II X4 600 系列。
Excel 2007
Intel相信Clarkdale在商务领域最擅长的就是Excel,但结果同上。
Sony Vegas Pro 8蓝光光盘创建
i3-540/530依然良好,可以作为Athlon II X4 600系列的新对手了,但i5-661明显还是不符合其身价。
Sorenson Squeeze FLV创建
同上。i5-611可以对抗 Athlon II X4 630,而i3在AMDAthlon II X4/X3之间。
Windows 7实际应用
之前的测试都是在Windows Vista下完成的,这一部分看看Windows 7系统如何。
x264高清视频编码完全不如三核心、四核心,7-zip也差不多。只有在Sonar 8多音轨项目,i5-661终于对得起自己的价格了。
游戏性能
从价格来说,各处理器表现还不错,Core i3 540和530成功超过AMD Athlon II X3。在《辐射3》、《求生之路》、《Crysis》三款偏向单线程的游戏里,Clarkdale表现都很出色,但是《Far Cry 2》支持多线程,Q9400、X4 965就更好了。
Windows 7游戏性能
《蝙蝠侠:阿卡姆疯人院》里i5-661性能很不错,符合身价,但在《龙腾世纪》和《战争黎明2》里就稍差一些了。
还是那句话,上述游戏测试中i3-540/530的GMA HD图形核心频率也是运行在最高的900MHz,而实际应该是733MHz,所以用户买到Core i3后获得的真正性能会稍低一些。
超频
使用Core i5-661工程样品和原装风扇,在默认电压下最高可以超到3874MHz,关闭Turbo可以继续稍微提高到3884MHz。
下边加压,最高可达4.28GHz。
换用水冷散热并加压,我们在1.438V下获得了4.85GHz。
内存性能取决于QPI总线倍频,所以QPI频率应该尽量接近主频。看看QPI倍频分别为12x和14x的成绩:
Bloomfield存在低温bug,也就是极限超频温度过低的时候容易突然断电,Clarkdale则基本解决了这个问题。在-115℃的超低温下,频率超到了6.2GHz,SuperPI 1M的成绩已经不到7秒钟。虽然偶尔还会碰到低温bug,但大多数测试都顺利完成。
不过注意,外频超过230MHz的时候QPI频率就跟不上主频了,对内存性能影响很大,所以虽然在6.5GHz上也能完成一些3D测试,但也只有SuperPI 1M性能在超频后提升明显,SuperPI 32M因为内存频率只有1600MHz而不济,3DMark05性能只相当于Bloomfield 5.4GHz的最好成绩。
功耗
Lynnfield相比于Bloomfield最大的优势之一就是待机功耗低很多,但Clarkdale因为封装了45nm GMA HD图形核心,待机功耗增加了不少,已经接近Core i7-920。这也可能是华硕主板的部分原因,但尚需确认。
满载功耗就是Clarkdale闪光的地方了,甚至大大低于Core 2 Duo E8600。
结语
在开始测试Clarkdale之前,我们不得不联系Intel,希望他们能解释一下为什么把价格定得这么高。Core i5-661的价位完全高于其表现,而且这还不是Clarkdale最贵的型号!最高端型号Core i5-670甚至逼近300美元,性能却比不过竞争对手卖200美元的四核心。
Intel承认这些型号有些贵,但也不指望它们的出货量能有多大。除非对集成的GMA HD图形核心很感兴趣,相信大多数人都会选择Lynnfield Core i5-750而非Clarkdale Core i5-661。真正贡献销量的应该还是Core i3。它们不像低端Lynnfield那样砍掉了超线程,只是没有了价值不大的Turbo动态加速,丢掉的不过是单核心下133MHz或者266MHz的频率而已。
Core i3系列是款不错的双核处理器,在多线程应用中已经具备与Athlon II X4的竞争的实力。
不过还是要指出,今天测试的Core i3都是模拟而来的,特别是图形核心频率没有降到应用的733MHz,因此成绩会和实际零售版有所不同。
HTPC玩家应该会喜欢Clarkdale。它自带的图形核心不但支持硬件解码,还有Dolby TrueHD、DTS HD-MA的HDMI源码输出,经测试工作得相当完美。
AES-NI指令集对企业客户也颇具吸引力,能将BitLocker对磁盘性能的影响减少15%左右,搭配固态硬盘非常合适。
另外还是要抱怨一下Clarkdale的封装形式。一块基片上的双Die“胶水式”封装像极了当年的Pentium D,特别是内存控制器反而又脱离了CPU,对内存性能影响很大。只能等待Sandy Bridge纠正这一切了。
最后回到价格上。Core i3的性价比比Core i5好,Core i5几乎没有一款值得推荐,和AMD相比差太多了。如果Intel能把Core i5的价格也降下来,才能有能力和空间与AMD竞争,也才是低端消费者的真正福音。