NVIDIA今天宣布,已经有多家服务器厂商推出了全球第一批由ARMv8 64位处理器、NVIDIA Tesla计算卡组成的高性能计算系统。在此之前,Tesla已经先后支持x86、Power两大平台。
ARM一直试图进入桌面、服务器领域,也有不少芯片、系统厂商在尝试,但似乎都不得要领,进展有限,Intel、AMD也纷纷倡导微型服务器理念,捍卫x86的地位。
ARMv8 64位架构在设计之初就考虑了服务器应用,因而更加适合微型服务器、Web服务器等需要高能效的地方,但是因为性能并非ARM架构的特长,征战高性能计算还是比较意外。
NVIDIA表示,CUDA 6.5开发平台已经支持64位ARM架构,可以与之形成完美搭档,可能会和新服务器一同发布。
目前这类服务器配备的处理器是Applied Micro X-GeneARM64,2011年ARMv8架构宣布的同时它就高调出现了,今年初又披露了一些具体情况:自主设计乱序超标量四发射架构,PMD模块化设计(每模块两个完整CPU核心且共享二级缓存)、支持四通道DDR4内存。
首批公布的方案采用台积电40nm工艺制造,每个模块8400万个晶体管,面积14.8平方毫米,0.9V电压下即可跑到3GHz的高频率,而平均功耗不过约4.5W,下一代将采用28nm工艺。
这次采用的具体规格没有披露,另据AnandTech报道说是八核心,2.4GHz。
它搭配的计算卡是NVIDIA次顶级的Tesla K20,开普勒架构的GK110核心,2496个流处理器,320-bit 5GB GDDR5显存,浮点性能单精度3.52TFlops、双精度1.17TFlops,热设计功耗225W。
首批这类ARM+NVIDIA加速系统有三款,将于7月份上市。它们分别是:
- Cirrascale RM1905D:1U服务器,两颗X-Gene,两块Tesla K20,低成本,适合私人云、公众云、HPC、企业应用。
- E4 EK003:3U双主板服务器,两颗X-Gene,两块Tesla K20,低功耗,适合地震研究、信号与图像处理、视频分析、追踪分析、Web应用、MapReduce编程处理。
- Eurotech:模块化的Aurora HPC服务器配置,高密度,高能效,基于专利的Brick技术,配备直排液冷散热。
话说,NVIDIA自主设计的64位丹佛架构ARM处理器也快出来了,这显然是在给自家的产品铺路。