在经历了Core的辉煌、Penryn的延续、Nehalem的初现之后,人们普遍对Intel的下一代微处理器架构充满了期待,不过有些期待并不确切,和Nehalem架构的设计初衷存在偏差。这里我们就简单地谈谈平常被忽视的一些地方,也是很重要的几个方面。
首先需要指出,Nehalem架构的重点是改进高性能计算(HPC)、数据库和虚拟化性能,而游戏性能的地位很次要,因为那首先是显卡的任务。也许在物理技术更加依赖处理器之后会有所不同,但起码现在不是这样。这一点我们可以参考HEXUS.net昨日放出的测试,在3DMark和3D游戏方面,Nehalem并不见的就比Penryn好。
那么为什么呢?因为大多数游戏在乎的是更快的缓存和更高级的整数性能,特别是现阶段的Intel处理器对缓存依赖相比AMD严重得多。与P4和K8相比,Core的整数性能有了很大提升,因此游戏表现更出色,而Nehalem在这方面进步幅度很小,有的地方甚至在倒退。看看新的缓存系统:Nehalem每个核心配备了2×32KB一级缓存和256KB二级缓存,共享8MB三级缓存,延迟分别为4个、12个和40个周期,而Penryn一级缓存延迟仅为3个周期,二级缓存延迟虽然是14个周期,但容量每两个核心多达6MB,总量是Nehalem的12倍。注意这里说的只是高端的完整版,低端的“阉割版”不予考虑。
在Penryn上大多数游戏的二级缓存未能命中的几率很小,而Nehalem就不同了。虽然集成了内存控制器,但帮助并不大,三级缓存的低速度和二级缓存的小容量影响很大。
当然这也不全是坏事儿,Nehalem的整体性能仍然有了较大改进。Core、Penryn都很不错,但在高性能计算、数据库性能方面仍然不如AMD Opteron,而Nehalem将会改变这一局面。
大多数数据库代码并不能真正很好地利用Penryn架构,每循环指令数还不到0.5个,因此大多数时候都要被迫等待。Nehalem的超线程(SMT)技术能较好地解决这一问题:一个线程等待内存,另一个可以继续工作,反之亦然。
第二,四路(或八路)Nehalem系统只需要保持四个(或八个)三级缓存的同步即可,而类似的Tigerton需要保持八个二级缓存的同步,这就是为什么说Nehalem的缓存架构很适合服务器性能、但对游戏性能并不重要的原因。
还有一点,我们一直说Nehalem是一种全新架构,其实它仍是基于Core架构改进而来的,只不过变动幅度较大而已。这从IDF现场Intel对其的称呼和Core i7这种命名上都可以体现出来。
说了半天枯燥的技术问题,下边来看看IDF上展示的ehalem服务器系统吧。具体频率不详,但可以看到16个线程(应该是双路四核心)、单条8GB总量144GB的MetaRAM DDR3内存。