此次在日本举行的新闻发布会邀请的客座演讲嘉宾为东京大学石川裕博士,石川在东京大学的研究工作主要是是研究用MIC计划产品能组建怎样的HPC系统。
石川裕,东京大学研究生院情报理工学系计算机科学专业教授
石川自称选择MIC的主要理由是“单独的GPU无法运转”,没有主CPU的辅助GPU在通用计算中的作用也无从发挥,而集成多个x86核心的MIC就不一样(按:这也就是之前提到过的为什么NVIDIA要开发自家CPU Denver的原因)。此外作为单一CPU架构组成的MIC,另一个有利之处就是通用性要比GPGPU高。
石川研究组目前的主要课题是开发使用MIC的HPC用操作系统与应用软件。今后的研究方向将不仅限于发挥MIC的计算能力,也将注意提高I/O部分的性能。石川称:“HP的计算能力不仅仅用于单纯的科学计算,在细胞、结构生物学等需要解析大量数据的应用也能发挥作用,为此需要改善I/O性能。”石川研究组今后的目标是开发满足并行计算性能和I/O性能同时提高要求的硬件和软件。
石川举例说明MIC架构的优点,包括通用性、开放性和Intel给予的研发支持
石川说明后Peta(即Exa)Scale级别系统的要求和解决方法,针对需进行大量数据解析的应用,需要着重于提高I/O性能、浮点运算性能和并行计算性能
石川研究组的另外一个针对ExaScale的课题就是故障。ExaScale级别的硬件肯定需要比之前更多的能源,而Skaugen和石川都提到目前工艺制造出的ExaScale级别超级计算机功耗完全超出范围,根本无法运行,所以改进工艺降低功耗是个很重要的课题。
集成大量CPU的ExaScale超级计算机的强大能力使得它如果遭到硬件故障宕机一日,后果不堪设想。石川研究的另一个课题就是在HPC遭遇硬件故障无法使用之前导出和备份运算数据。
石川研究组开发的软件架构,HPC中主CPU运行Linux Kernel,MIC运行Micro Kernel,通过PCI-E界面连接并共用网络接口
小结
Intel已经在Knights系列产品和MIC架构上投入了巨额资金和研发力量,并且此技术目前还毫无进入消费级别市场的迹象。Larrabee计划也早已取消,未来Intel的集成GPU采用MIC技术的可能性也很低,可能只会达到共用指令集的程度。
Intel、NVIDIA相继在目标为ExaScale计算能力的道路上越走越远,此外还有IBM和Oracle在虎视眈眈,没有拿出HPC计划的主流芯片企业只剩AMD一家,相信在2018年为ExaScale设定的目标达成年到来前业界还会有一番龙争虎斗。