问:天河一号A在性能、效率、能耗方面相比上代都有了大幅提升,这背后主要是在哪些方面进行了改进?
杨灿群:天河1A这一代系统的实际性能、计算效率大幅度的提高,主要有几个方面的原因,包括自主研发的新高速网络系统,软件优化后提升了应用效率,以及NVIDIA Tesla并行计算GPU的加入。
问:天河一号A如今已经是全球最快超级计算机,为了保持这种优势,我们未来需要有怎样的努力和创新?NVIDIA未来将对中国的超级计算机发展提供怎样的支持?
刘光明:中国的高性能计算机发展经历了30多年的历程,从1978年的银河1开始,一直到现在的天河一号A。这些努力并不是为了争得一个世界第几的排名,确确实实是我们国家急需这样的高性能计算能力。作为天河来讲,在突破千万亿次大关的过程中,遇到了世界性的难题。从2005年到2007年,我们一直在进行研究,最终决定采用异构架构,即通用处理器和专用加速处理器结合的方式突破这一难题。这中间我们试验过自己的军用流处理器FT100,去年也尝试过AMD的GPU,最后发现了NVIDIA的芯片性能更好。
这里大家需要注意一点,高性能计算机能够做出来,做出Linpack测试到世界第一,并不等于能够在实际应用中用好。这是两个问题,如何在异构结构下有效的编程是下一个大的挑战。我们有一个专门的团队从几年前就在开展这项工作,现在已经得到了不错的成绩,但未来还有很多的任务要做。
黄仁勋:刘博士说的很对,并行计算面临的困难非常多,但正确解决这些困难带来的效益也非常可观。整个行业过去30年都在努力想要解决并行计算的难题,却几乎没有一家得到成功。直到CUDA的出现,我们终于找到了CPU+GPU的异构计算模式。这项革命性的技术花费了NVIDIA公司多年的时间和数十亿美元的投资。NVIDIA在并行计算领域的投资超过世界上任何一家企业。因为CUDA,并行计算现在有一个非常光明的前景。不过,在这一领域我们仍然面临着非常多的挑战。未来,我们将更加紧密的同刘博士的团队合作,创造下一台更强的超级计算机系统。
中国已经认识到超级计算机对未来各个领域的重要性,NVIDIA非常荣幸能够在中国的超级计算机发展中提供自己的支持。世界现在已经越来越小,科技领域的发展能够让全世界每一个人受益,中国超级计算机的进步实际上可以造福整个人类。我们将提供自己最出色的工程师来帮助中国建造更高速的超级计算机,帮助他们更有效的进行并行计算编程,并在中国的所有高校普及并行计算教育。我相信,未来每一个从高校毕业的计算机技术人员都将必备并行计算知识。串行计算是过去式,并行计算才代表了未来。