AMD于今天发布了代号上海的第二代四核心Opteron服务器处理器。有关其详细情况这里不再赘述,直接进入整体——性能考察。
测试平台包括AMD Shanghai Opteron和Intel Harpertown Xeon两套,均采用Supermicro 2U机架,主板分别是H8DMU+和X7DWN+,内存分别是16GB DDR2-800 R-DIMM和16GB DDR2-800 FB-DIMM,其他保持相同:希捷Cheetah 15.5K SAS硬盘用来安装Windows Server 2008企业版操作系统和SQL Server 2008企业版软件,磁盘阵列采用Promise Vtrak J300S,由六块希捷1TB SAS硬盘组成RAID 0,控制器是LSI Logic 8480E MegaRaid。
参测处理器有三款,分别是上海核心的Opteron 2384 2.7GHz、巴塞罗那核心的Opteron 2356 2.3GHz,以及Intel方面Harpertown核心的Xeon E5472 3.0GHz。测试中有时候还会考察各处理器分别搭配四条内存和八条内存的情况,当然总容量保持16GB不变。
本次测试所用的基准软件是Quest Software出品的Benchmark Factory for Databases,能通过ODBC或Native原生方式连接Oracle、SQL Server、DB2、Sybase、MySQL等多种数据库。这是一款性能和代码可扩展性测试工具,能模拟数据库用户和事务情况,重建真实应用或非生产环境的模拟工作流。管理员可以使用它衡量数据库随着用户负载增加、应用和平台改变时候的可扩展性。
Benchmark Factory提供了大量测试项目,还能生成自定义报告。本次考察选择其中的AS3AP、Scalable Hardware CPU、Scalable Reads三个项目,都是测试关系数据性能的。
每次测试都有Load 1-5五个负载点,从Load 1到Load 5负载越来越高。
引子:待机功耗测试
上海2.7GHz相比巴塞罗那2.3GHz频率更高,但系统功耗却降低了6%,还不足200W,性能每瓦特指标确实有不小的改善。
另外AMD平台使用四条和八条内存的待机功耗差异只有7W,基本可以忽略,而Intel平台多达49W。Xeon 3.0GHz搭配四条内存的时候功耗比上海高出30%,增加到八条则高出56%。FB-DIMM内存的劣势非常明显。
一、AS3AP
每秒事务处理数量(越高越好)
Load 1-3差别不大,不过Intel平均领先15%;在Load 4各套系统几乎完全没有区别;到了Load 5上海领先11%。
上海虽然比巴塞罗那快17%,但Load 1-4的性能提升幅度都不到2%,在Load 5领先了11%,但还是不如频率增幅。
CPU利用率(越低越好)
上海和巴塞罗那差别很小,不过到了Load 5后上海更好一些;Intel在Load 1-3低很多,Load 4和上海基本相同,Load 5稍差一些,甚至高于巴塞罗那。
满载功耗(越低越好)
AMD明显胜出:上海比巴塞罗那低了12%,Intel在四内存时比上海高27%、八内存时高46%。
注意:四内存Intel平台之所以用虚点表示,是因为并没有对其进行实际测试,而是根据待机功耗做出的推断。下同。
性能每瓦特(越高越好)
由于性能互有胜负,功耗又明显更低,上海的性能每瓦特指标轻松领先,Load 1-5均是如此,而且优势越来越大,最多比Intel超出28%或47%。
二、Scalable Hardware CPU
每秒事务处理数量(越高越好)
Intel取得完胜,领先上海平均约17%。上海2.7GHz和巴塞罗那2.3GHz在Load 1-3还是相差无几,不过到了Load 5能领先25%之多。
CPU占用率(越低越好)
和AS3AP测试差不多,上海与巴塞罗那基本处于同一水平,且都高于Intel。
满载功耗(越低越好)
AMD再次轻松取胜,不过领先的幅度不如AS3AP之下明显,分别在17%和27%左右。
性能每瓦特(越高越好)
虽然Intel的性能更好了一些,功耗落后幅度也小了,但性能每瓦特方面还是上海占优,与Intel四内存相比有三个负载点更好、一个相同,而八内存的Intel平台就不行了。另外可以看出上海相比巴塞罗那提升的幅度非常大。
三、Scalable Hardware Reads
每秒事务处理数量(越高越好)
五个负载点中Intel领先前三个,最多26%,最后两个上海领先,但仅仅2%。
另外上海2.7GHz在低负载点还是比巴塞罗那2.3GHz好不到哪儿去,但到了Load 4/5就快得多了。
CPU占用率(越低越好)
与之前的测试结果类似。
满载功耗(越低越好)
不出意外,上海至少也要比Intel节能20%。
性能每瓦特(越高越好)
上海和四内存的Intel平台在Load 1/2完全相同,但Load 3-5下大幅领先,最多35%。另外巴塞罗那也要普遍好于八内存的Intel平台。
小结:
从测试结果看,上海的数据库性能与Intel Xeon 3.0GHz相比还是很有竞争力的,很多时候甚至还领先对手,特别是上海的频率还低300MHz。至于功耗,上海就是毫无疑问的赢家了,这一方面要感谢新的45nm沉浸式光刻工艺,另一方面则是因为Intel平台使用的FB-DIMM内存太过耗电,Intel处理器本身节省下来的能耗完全被抵消掉了。
此前我们还提到过,上海支持智能预取(Smart Fetch)技术,允许处理器核心在空闲的时候进入暂停状态(Halt State),从而降低最多21%或者说15W的功耗。这进一步巩固了AMD的优势。
与第一代巴塞罗那相比,上海的进步更是非常明显的,少则也有10-15%,毕竟有着更高的频率、更大的三级缓存、更充足的内存带宽。
如果参考Intel的Tick-Tock发展模式,那么巴塞罗那是AMD的Tick,上海就是Tock,一次很成功的升级。
另外我们还知道,Intel将在明年初发布新一代Nehalem Xeon,而这次Intel在微架构方面针对服务器应用做出了大范围改进,有着与AMD平台类似的原生四核心设计、QPI直连总线、大容量三级缓存等等。而到了明年晚些时候,AMD将拥有六核心的“伊斯坦布尔”。
毫无疑问,2009年无论对AMD还是对Intel都是非常有趣而又充满挑战的一年。