浅谈Nehalem架构真正奥妙 系统多图展示
  • 上方文Q
  • 2008年08月20日 10:14
  • 0

在经历了Core的辉煌、Penryn的延续、Nehalem的初现之后,人们普遍对Intel的下一代微处理器架构充满了期待,不过有些期待并不确切,和Nehalem架构的设计初衷存在偏差。这里我们就简单地谈谈平常被忽视的一些地方,也是很重要的几个方面。

首先需要指出,Nehalem架构的重点是改进高性能计算(HPC)、数据库和虚拟化性能,而游戏性能的地位很次要,因为那首先是显卡的任务。也许在物理技术更加依赖处理器之后会有所不同,但起码现在不是这样。这一点我们可以参考HEXUS.net昨日放出的测试,在3DMark和3D游戏方面,Nehalem并不见的就比Penryn好。

那么为什么呢?因为大多数游戏在乎的是更快的缓存和更高级的整数性能,特别是现阶段的Intel处理器对缓存依赖相比AMD严重得多。与P4和K8相比,Core的整数性能有了很大提升,因此游戏表现更出色,而Nehalem在这方面进步幅度很小,有的地方甚至在倒退。看看新的缓存系统:Nehalem每个核心配备了2×32KB一级缓存和256KB二级缓存,共享8MB三级缓存,延迟分别为4个、12个和40个周期,而Penryn一级缓存延迟仅为3个周期,二级缓存延迟虽然是14个周期,但容量每两个核心多达6MB,总量是Nehalem的12倍。注意这里说的只是高端的完整版,低端的“阉割版”不予考虑。

在Penryn上大多数游戏的二级缓存未能命中的几率很小,而Nehalem就不同了。虽然集成了内存控制器,但帮助并不大,三级缓存的低速度和二级缓存的小容量影响很大。

当然这也不全是坏事儿,Nehalem的整体性能仍然有了较大改进。Core、Penryn都很不错,但在高性能计算、数据库性能方面仍然不如AMD Opteron,而Nehalem将会改变这一局面。

大多数数据库代码并不能真正很好地利用Penryn架构,每循环指令数还不到0.5个,因此大多数时候都要被迫等待。Nehalem的超线程(SMT)技术能较好地解决这一问题:一个线程等待内存,另一个可以继续工作,反之亦然。

第二,四路(或八路)Nehalem系统只需要保持四个(或八个)三级缓存的同步即可,而类似的Tigerton需要保持八个二级缓存的同步,这就是为什么说Nehalem的缓存架构很适合服务器性能、但对游戏性能并不重要的原因。

还有一点,我们一直说Nehalem是一种全新架构,其实它仍是基于Core架构改进而来的,只不过变动幅度较大而已。这从IDF现场Intel对其的称呼和Core i7这种命名上都可以体现出来。

说了半天枯燥的技术问题,下边来看看IDF上展示的ehalem服务器系统吧。具体频率不详,但可以看到16个线程(应该是双路四核心)、单条8GB总量144GB的MetaRAM DDR3内存

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

浅谈Nehalem架构真正奥妙 系统多图展示

 

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0