最新一期超级计算机500强排行榜上,NVIDIA Tesla加速计算表现平平,风头被新崛起的Intel Xeon Phi协处理器给抢了过去,不过致力于高性能计算的NVIDIA也有绝招:CUDA 5.5已经结束了内部Beta测试,进入RC候选发布阶段。
CUDA 5.5最大的变化当属首次提供了对ARM架构的完整支持,可在ARM平台上进行原生编译,而不再局限于x86。
同时,新版本还引入了交叉编译(cross compilation),ARM Binary既可以在ARM系统上原生执行,也可以在更快的x86系统上执行。
这背后就是NVIDIA在努力打造的“CUDA on ARM”。此前的GTC 2013技术大会上,NVIDIA就向大家展示了一个名为Kayla的开发平台,基于Tegra 3处理器、GK117图形核心,目的就是让大家上手在ARM架构上进行CUDA开发,为明年的Logan Tegra 5做准备,后者将成为第一款支持CUDA的移动处理器。
CUDA on ARM的意义是很深远的。首先在消费领域,NVIDIA希望通过此举发挥其SoC的计算能力,推动Tegra处理器的深入发展,就像他们在PC上做的那样。其次在高性能计算领域,NVIDIA肯定想完全基于自家平台搭建系统,而不再让Tesla计算卡依附在Intel/AMD x86处理器上。
CUDA 5.5还对MPI进行了优化,包括在所有Linux发行版上更快的Hyper-Q、MPI负载优先级区分等等,并增加了向导式的性能分析优化。
CUDA 5.5 RC候选版官方下载: https://developer.nvidia.com/cuda-pre-production