NVIDIA推出CUDA 6 大大简化并行编程
  • sunshine
  • 2013年11月15日 17:29
  • 0

2013年11月14日—美国加利福尼亚州圣克拉拉—NVIDIA(英伟达™)今天发布了NVIDIA CUDA 6——全球最普遍的并行计算平台与编程模型的最新版本。

CUDA 6平台让并行编程变得比以往更加轻松,让软件开发商在利用GPU加速科学、工程、企业以及其它应用时能够大幅缩短所需时间和减少所耗费的精力。

它包含全新的性能增强内容,让开发者只需替换掉基于CPU的现有库,即可快速令应用程序速度提升8倍。CUDA 6的主要特性包括:

统一内存(Unified Memory)–让应用程序能够读写CPU与GPU存储器,无需在这二者之间手动复制数据,从而简化了编程。另外也让开发者能够更轻松地用各种编程语言在应用程序中添加对GPU加速的支持。

插入式库(Drop-in Libraries)–只需用GPU加速的库来替代现有的CPU库,即可自动加速应用程序的BLAS和FFTW运算,最高令其速度提升8倍。

多GPU 扩展–重新设计的BLAS和FFT GPU库最多能够在单一节点的8颗GPU上自动扩展性能,可实现每个节点9 Teraflops以上的双精度性能,支持比以往更大的工作负荷(最高512GB)。多GPU扩展还可以用在全新的BLAS插入式库上。

桑迪亚国家实验室可扩展算法部门经理 Rob Hoekstra 表示: “通过自动应付数据管理,统一内存让我们能够快速制作出在GPU上运行的内核原型并降低代码复杂度,从而最高可令开发用时缩短一半。当我们确定未来的编程模型选项并将更复杂、更大型的代码移植到GPU上时,这一功能将非常实用。”

Fabric Engine公司首席执行官Paul Doyle指出: “我们的技术现已帮助各大工作室、游戏开发商以及动画师制作出了视觉效果绝佳的3D动画与特效。这些客户一直催促我们添加对NVIDIA GPU加速的支持,然而实践证明,在处理复杂的制作场合时内存管理是一大难题。借助统一内存,内存管理实现了自动处理,从而让Fabric编译器能够针对NVIDIA GPU,让我们的客户能够实现最高10倍的应用程序速度提升。”

除了这些全新特性以外,CUDA 6平台还提供了一整套编程工具、GPU加速的数学库以及文档和编程指南。

CUDA Toolkit版本6预计将于2014年初问世。当它可供下载之时,CUDA-GPU计算注册开发者计划将会提醒大家。想要参加该项计划,敬请点此注册。

如需了解有关CUDA 6平台的更多信息,敬请于11月18-21日在丹佛举办的SC13大会上光临613号NVIDIA(英伟达™)展台、访问NVIDIA CUDA网站。

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0