NVIDIA CUDA 4.0 RC版发布新特性解析-快科技-科技改变生活

NVIDIA CUDA 4.0 RC版发布新特性解析

上方文Q
2011年03月05日 17:39
0

首次宣布一周之后，NVIDIA今天公开发布了GPU通用计算开发包的CUDA 4.0 RC候选版，并提供给开发人员下载使用。

如果你是一位GPU计算开发人员，或者对这方面有兴趣，可以在NVIDIA官方网站上注册并获得这个新的开发包，地址为： http://developer.nvidia.com/object/cuda_4_0_RC_downloads.html

CUDA 4.0作为一个全新版本，功能特性自然增加了不少，主要涉及应用程序移植的简化、多GPU编程的加速、开发工具的增加和改进三个方面。下边我们就结合NVIDIA的官方演示文稿，一起看看CUDA 4.0的新特性。

从超级手机到超级计算机：NVIDIA正在将自己定位成一家“超级”计算公司，CUDA 4.0就是这条路上的重要里程碑。

CUDA发展之路：2007年1.0版，只有研究人员和一些尝鲜者体验；次年升级为2.0版，吸引了科学家和高性能计算领域；2009年3.0版，掀起了应用程序创新的风潮；如今4.0版诞生，意味着将有更广泛的开发人员加入CUDA阵营。

CUDA 4.0三大进步：应用程序移植的简化、多GPU编程的加速、开发工具的增加和改进。

为了简化应用程序的移植，CUDA 4.0带来了统一虚拟寻址(UVA)、GPUDirect 2.0、Thrust C++模板化算法与数据结构。

CUDA 4.0支持多个线程共享一个或者多个GPU，同时单个主线程也可以访问所有GPU，可以充分发挥多GPU的联合优势，即使是单线程程序也能从多GPU中获得更好性能。

无需拷贝的映射机制(No-copy Pinning)，减少系统内存占用、避免过载，并且支持Windows、Linux系统和所有CUDA GPU。

C/C++语言方面也增加了新特性，包括新建/删除、虚拟功能和Inline PTX等等。

Thrust C++模板化算法与数据结构，强大的开源C++并行算法和数据结构，类似C++ STL标准模板库；可在编译时自动选择最快的代码路径，在多核心CPU与GPU之间分配工作，编译速度加快5-10倍。

GPU加速图形处理：全新的NVIDIA Performance Primitives NPP函数库，图像处理加速10-36倍。

层纹理：适合以标准尺寸、格式处理多重纹理，性能更快，而且不会出现采样残影。

旧版的GPUDirect 1.0侧重于改进网络间通信，2.0版则侧重于改进节点内通信效率，支持P2P内存访问、传输和同步，代码更少，编程效率更高。

在此之前，同一节点内的不同GPU互相访问，需要绕道系统内存并进行两次拷贝。

现在就不用理会系统内存了，不同GPU可以直接进行传输，一次拷贝搞定。

不过要注意，GPUDirect 2.0仅支持Fermi费米架构的Tesla 20系列高性能计算卡，而且需要64位的Linux、Windows操作系统。

统一虚拟寻址：之前系统内存、GPU显存都是彼此互相独立的，现在则融合在一起，为所有CPU、GPU提供单个统一的寻址空间。

但是这项技术也有同样的限制，只适用于Fermi Tesla 20系列和64位系统。

开发工具方面首先是可视化编译器的自动性能分析，并为内核分析提供了新的用户界面。

cuda-gdb调试同样增加了大量新功能，尤其是Fermi架构支持GPU Binary反汇编。

而且操作系统支持在Linux的基础上增加了苹果Mac OS。

此外NVIDIA还提供了新的专业开发工具Parallel Nsight Pro 1.5，这是业界第一个针对微软Visual Studio的GPU加速应用开发环境。

CUDA特性总览

CUDA注册开发人员项目

NVIDIA CUDA开发资源

CUDA第三方生态系统

CUDA计算研究与教育

PGI CUDA-x86编译器

GTC 2011技术大会

好文点赞
水文反对

此文章为快科技原创文章，快科技网站保留文章图片及文字内容版权，如需转载此文章请注明出处：快科技

观点发布网站评论、账号管理说明

热门评论

{for c in All}
         <div class="pluninfo"> 
      
      <div class="pluninfo_head" style="height:auto;">
        <div class="pface">
              {if (c.UserName=="") ||(c.UserName=="guest")} 
              <a href="javascript:;"><img src="//11.mydrivers.com/m/images/v1/qianshui.jpg"></a> 
             {else}
              <a href="javascript:;" onclick="userCommentInfo(${c.UserID});"><img src="//passport.mydrivers.com/comments/getusertouxiang.aspx?uid=${c.UserID}&size=medium"></a> 
              {if (c.UserID== 278470)} <span class="zuozhe">作者</span>{else}
            <span class="jibie">${c.userlevel}</span> {/if}
          {/if}
       </div>
        <div class="plcenter">
          <div class="pluninfo_top1"> <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">  {if (c.UserName=="")||(c.UserName=="guest")} ${c.AUserName}{else}${c.UserName}{/if}</span> 
                 {if (c.Cfrom!="" && c.Cfrom != "mobile")}<span onclick="downapp_float();" title="下载驱家新闻客户端，展示小尾巴" class="span_from dev ${c.Cfrom}">${c.model}</span>{else}<span class="span_from dev {if (c.model!= "手机用户" && c.model!="")} browser{else} ${c.Cfrom}{/if}">{if (c.model!= "手机用户" && c.model!="")}<img src="${c.bwimg}">{/if}${c.model}</span>{/if}   
                </div>
          <div class="pluninfo_top2"><span>${c.IPAdd}</span><span>${c.PostDate}</span></div>
        </div>
        <div class="plright"><img src="//11.mydrivers.com/m/images/v1/plun_moreinfo.svg" alt=""/> 
          <div class="pedite_img" style="display: none;"><img src="//11.mydrivers.com/m/images/v1/triangle-up.svg" alt=""/></div>
          <div class="pedite" style="display: none;">
            <ul>
              <li><a href="javascript:;" onclick="ShowMyReply(${c.ID})" class="huifu">回复</a></li>
              <li> <a href="javascript:;" onclick="userReport(${c.ID},${c.TitleID})" class="jubao">举报</a></li>
              <li><a href="javascript:;" class="taoyan">讨厌</a></li>
              <li> <a href="javascript:;" class="dels">删除</a></li>
            </ul>
          </div> 
        </div>
      </div>
      <div style="clear:both"></div>
       
      
      <div class="pluninfo_center">${c.Content}
           {if (c.RevertContent!="")}
          	  <div class="yinyong">
        <div class=" plunxx_center1">
        <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">{if (c.RevertUserName=="")} ${c.RevertAUserName}{else}${c.RevertUserName}{/if}的原贴：</span>
             ${c.RevertContent}
        </div> 
		  </div>
           {/if}
      </div>
       
      
      <div class="pluninfo_bottom">
        <div class="fayan">
          <ul>
            <li><a href="javascript:;" id="s_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'support',${c.Support})" class="zhichi">支持[${c.Support}]</a></li>
            <li><a href="javascript:;" id="o_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'oppose',${c.Oppose})" class="fandui">反对[${c.Oppose}]</a></li>
            <li onclick="ShowMyReply(${c.ID})">回复</li>
          </ul>
        </div>
      </div>
       
      
      
      <div class="div_huifu" id="div_reply_${c.ID}"></div>
      <div style="clear:both"></div>
       
    </div>
   {/for}

查看全部评论

相关报道

邮件订阅

0 | 0| 0 | 0