在德国汉堡举行的2010年国际超级计算大会上,TOP500.org组织公布了第35届全球超级计算机五百强排行榜,中国新近研发完成的“星云”(Nebulae)高居亚军位置,一举创造了中国在这项排行榜上的傲人新纪录,同时中国“天河一号”排在第七位。这样,中国不但打破了美国对前三甲的长期垄断,也第一次在前十名中占据了两个席位。
“星云”超级计算机是前十强中的唯一一名新成员。它位于深圳国家超级计算机中心,由曙光公司的曙光TC3600刀片系统集群组成,内部采用Intel Xeon X5650 2.66GHz六核心处理器、NVIDIA Tesla C2050计算卡,总计120640个计算核心,运行Linux操作系统,最大浮点性能1.271PFlops(全球第三个突破1PFlops大关),峰值可达2.9843PFlops,甚至超过美洲虎28%之多,是全球理论性能最高的超级计算机。
位于天津国家超级计算中心的中国“天河一号”(Tianhe-1)上次位列第五,目前最大性能仍保持在563.1TFlops不变,滑落至第七位。此前紧随其后的美国国家航空航天局Ames研究中心的“Pleiades”(出自SGI公司)升级到772.7TFlops,超过天河一号达到第六位。
非常有趣的是,星云和天河一号都采用了CPU为基础、GPU做辅助加速的混合计算架构,浮点性能的大幅提升也都得益于GPU的加盟,这应该代表了超级计算机的一种未来发展方向,也是GPU通用计算的成功典范。
中国内地本次有24套系统上榜,与稳步下滑的德国持平,位列美国(282)、英国(38)、法国(29)之后,另外中国香港也有一套系统入围,中国台湾则已从榜上消失。
数量上第四,中国超级计算机的性能则首次达到了第二位,超过德国而仅次于美国。
Cray公司打造、位于美国橡树岭国家实验室计算科学中心的“美洲虎”(Jaguar)虽然没有任何变化,但仍然保住了冠军宝座。该系统基于Cray XT5-HE系统、AMD Opteron 2435 2.6GHz六核心处理器,总计224162个处理核心,最大浮点性能1.759PFlops(每秒千万亿次计算),峰值可达2.331PFlops,功耗6950.6W。
曾经的王者、全球首次将超级计算机浮点性能带往PFlops级别高度的IBM“走鹃”(Roadrunner)这两年来没什么变化,因而滑落到了第三位。
其他要点:
1、五百套超级计算系统总共使用了5135413颗计算核心,总的最大性能为32.429PFlops,峰值性能48.512PFlops。最后一名的最大性能为24.7TFlops,六个月前能排在第357名,但比上次的倒数第一仅提升了23.5%,速度明显变慢。
2、前十名中只新增了一套系统(中国星云),同时也只有一套系统升级(超过中国天河一号的美国(Pleiades)。美国依然在前十名中占据七个名额,另外三个属于中国和德国。
3、处理器方面,Intel以408套系统遥遥领先(比上次增加6套),其中EM64T架构403套、IA-64安腾架构5套,总计50416个计算核心,另外AMD 47套(增加5套)、IBM Power 42套、Sun Sparc 2套、NEC 1套。
4、四核心处理器占据了多达425套系统,拥有六个乃至更多核心的处理器也已经进入25套,其中AMD、Intel不久前各自发布的十二核心Opteron 6000系列、八核心Xeon 7500系列已经分别进入5套和2套系统。
5、制造厂商方面,IBM、惠普分别提供了198套和185套系统,而半年前是186套、210套,惠普终于丢掉了领先优势。其他厂商Cray 21套、SGI 17套、戴尔17套。
6、IBM不但数量超过惠普,总的性能也继续领先,占总体的33.6%(半年前35.1%),而惠普为20.4%(半年前23.0%)。其他超过5%的还有Cray 14.8%、SGI 6.6%。
7、操作系统方面,Linux广泛用于405套系统(这还不算RedHat、SUSE发行版),微软Windows HPC 2008也占据了5套。
8、功耗方面(现在记录实际功耗),只有22套系统经确认超过一兆瓦,位列第一的美洲豹为6.95兆瓦,第二的中国星云未公布相关指标,全部平均397千瓦,平均能耗比为195MFLOPS每瓦(一年前150MFLOPS每瓦)。
9、前五十强的门槛是102.8TFlops,美国比例40%,IBM系统比例24%、性能比例27%,Cray系统比例20%、性能比例27%,按位置分布60%位于研究实验室内、28%位于大学内,只有一套系统使用千兆以太网互联,Cray XT用于其中10套系统,处理器份额方面Intel 48%、AMD 26%、IBM Power 22%,平均核心49080个(半年前44338个)。