NVIDIA公司的GPU技术大会(GTC)日前在美国开幕,公司CEO黄仁勋在会上做了主题演讲。一改之前对未来产品计划三缄其口的风格,黄仁勋在此次大会上预告了下两代GPU架构。继特斯拉和费米之后,两款新核心的代号仍然以著名物理学家命名,分别是Kepler(开普勒)和Maxwell(麦克斯韦)。
按照黄仁勋在会上的描述,2009年推出的费米比2007年的特斯拉(G80)在每瓦双精度浮点性能上提升了近一倍。而2011年底将推出的开普勒会把双精度浮点性能提升4倍以上。开普勒会基于28nm工艺制造,引进多项类似CPU的功能特色,比如虚拟内存、Non-blocking(非阻塞)I/O等。
再过两年到了2013年,22nm工艺打造的麦克斯韦就将来临,每瓦双精度浮点性能相比费米提高10倍,相比特斯拉提高接近16倍。
从之前的每年甚至每半年更新下一代GPU,到现在的每两年升级架构。黄仁勋解释称,NVIDIA认为GPU架构升级如果不能伴随着制程提升则意义不大。因此,他们今后的每一次大规模架构升级都将和制程升级同步进行。但在两次升级中间,最终产品线仍然会进行更新,因此GeForce系列游戏GPU仍会每年推出新产品。
GTC首日会议上,NVIDIA公司还展示了多个基于DX11技术的游戏Demo。比如下面这两张截图,就演示了曲面细分技术的顶级效果(由于会上进行的是3D演示,因此现场拍照很难看到细节)。
据称该Demo中每秒会处理13亿个多边形,由于曲面细分技术的应用,画面的几何图形复杂度是普通游戏的500倍,每秒钟数据量高达80GB。
第二个Demo演示的是烟雾流体模拟和光照效果。一个机器人放出烟雾,另一个机器人则在对面扇风。真实感的体积烟雾效果由100万个三维像素组成,每秒运算20万亿次,背后由多颗Fermi支撑。
最后一个Demo演示的是波浪的模拟,海面被分割为50万个粒子,与固定物体进行互动模拟真实海浪的物理效果。
另外,黄仁勋还在会上演示了真正的下一代DX11作品《H.A.W.X.2》,曲面细分和3D技术的应用让游戏中的环境细节栩栩如生。
除了游戏方面,NVIDIA还展示了GPU在其他领域的应用。比如Adobe就上台演示了名为“plenoptic lense”的下一代照相技术。其镜头模仿昆虫的复眼,可在感光元件上生成稍有不同的大量小尺寸图像,再由GPU实时运算组合成一幅最终的画面。这种成像模式的独特优势在于,可以在拍照后再进行数字对焦,将焦点转换到任意一个距离上。“拍虚了”这种状况将从此不复存在。
最后一个震撼性的宣布是,NVIDIA表示已经和PGI公司合作,开发出了CUDA-x86编译器。使用CUDA编写的程序将可以编译为x86执行程序,在任意一台没有NVIDIA GPU的PC上运行。从此CUDA应用开发不再依赖于NVIDIA GPU,开发者也不需要考虑用户是否有GPU来运行自己的程序。不过,目前已经确认CUDA-x86不会免费发放,PGI将以商业产品的形式销售CUDA-x86编译器。