共耀光芒： Google Gemma 优化后可在NVIDIA GPU上运行-快科技-科技改变生活

共耀光芒： Google Gemma 优化后可在NVIDIA GPU上运行

Kew
2024年02月23日 23:03
0

借助TensorRT-LLM，Google全新开放语言模型可在NVIDIA AI平台(包括本地 RTX AI PC)上加速运行

2024年2月21日，NVIDIA携手Google在所有NVIDIA AI平台上发布面向Gemma的优化功能，Gemma是Google最先进的新型轻量级2B和 7B开放语言模型，可在任何地方运行，从而降低成本并加快特定领域用户案例的创新工作。

NVIDIA 和 Google的团队紧密合作，利用NVIDIA TensorRT-LLM(用于优化大语言模型推理性能的开源库)，在数据中心的NVIDIA GPU、云计算和搭载NVIDIA RTX GPU 的PC上运行时，加速Gemma性能(Gemma由创建 Gemini 模型的相同研究和技术构建)。

这使开发者能将全球高性能 AI PC中超过1亿台搭载NVIDIA RTX GPU的用户作为潜在用户进行开发。

开发者还可在搭载 NVIDIA GPU 的云端运行Gemma，该实例拥有141GB HBM3e显存，速度为4.8TB/秒，Google将于今年部署该实例。

此外，企业级开发者还可利用NVIDIA丰富的工具生态系统(包括依托NeMo框架的 NVIDIA AI Enterprise和 TensorRT-LLM)，对 Gemma 进行微调，并将优化后的模型部署到生产应用中。

详细了解有关 TensorRT-LLM如何加快 Gemma 推理速度的更多信息，以及面向开发者的其他信息：包括 Gemma 的多个模型文件和模型的 FP8 量化版本，以上这些都使用 TensorRT-LLM 进行优化。

您可在NVIDIA AI Playground 上直接通过浏览器体验 Gemma 2B 和Gemma 7B。

Gemma 即将上线Chat with RTX

NVIDIA Chat with RTX 技术演示版也即将支持 Gemma，该Demo使用检索增强生成(RAG) 和 TensorRT-LLM 软件，为用户提供在本地 Windows RTX PC 上的生成式AI功能。

视频链接：https://www.bilibili.com/video/BV1Ky421z7PT/

借助Chat with RTX，用户可将 PC上的本地文件轻松连接到大语言模型，利用自己的数据打造个性化聊天机器人。

由于模型在本地运行，因此可快速生成结果，而用户数据则保留在本地设备上。与依赖基于云的 LLM 服务不同，Chat with RTX 可让用户在本地 PC 上处理敏感数据，而无需与第三方共享这些数据或连接互联网。

好文点赞
水文反对

此文章为快科技原创文章，快科技网站保留文章图片及文字内容版权，如需转载此文章请注明出处：快科技

观点发布网站评论、账号管理说明

热门评论

{for c in All}
         <div class="pluninfo"> 
      
      <div class="pluninfo_head" style="height:auto;">
        <div class="pface">
              {if (c.UserName=="") ||(c.UserName=="guest")} 
              <a href="javascript:;"><img src="//11.mydrivers.com/m/images/v1/qianshui.jpg"></a> 
             {else}
              <a href="javascript:;" onclick="userCommentInfo(${c.UserID});"><img src="//passport.mydrivers.com/comments/getusertouxiang.aspx?uid=${c.UserID}&size=medium"></a> 
              {if (c.UserID== 1466686)} <span class="zuozhe">作者</span>{else}
            <span class="jibie">${c.userlevel}</span> {/if}
          {/if}
       </div>
        <div class="plcenter">
          <div class="pluninfo_top1"> <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">  {if (c.UserName=="")||(c.UserName=="guest")} ${c.AUserName}{else}${c.UserName}{/if}</span> 
                 {if (c.Cfrom!="" && c.Cfrom != "mobile")}<span onclick="downapp_float();" title="下载驱家新闻客户端，展示小尾巴" class="span_from dev ${c.Cfrom}">${c.model}</span>{else}<span class="span_from dev {if (c.model!= "手机用户" && c.model!="")} browser{else} ${c.Cfrom}{/if}">{if (c.model!= "手机用户" && c.model!="")}<img src="${c.bwimg}">{/if}${c.model}</span>{/if}   
                </div>
          <div class="pluninfo_top2"><span>${c.IPAdd}</span><span>${c.PostDate}</span></div>
        </div>
        <div class="plright"><img src="//11.mydrivers.com/m/images/v1/plun_moreinfo.svg" alt=""/> 
          <div class="pedite_img" style="display: none;"><img src="//11.mydrivers.com/m/images/v1/triangle-up.svg" alt=""/></div>
          <div class="pedite" style="display: none;">
            <ul>
              <li><a href="javascript:;" onclick="ShowMyReply(${c.ID})" class="huifu">回复</a></li>
              <li> <a href="javascript:;" onclick="userReport(${c.ID},${c.TitleID})" class="jubao">举报</a></li>
              <li><a href="javascript:;" class="taoyan">讨厌</a></li>
              <li> <a href="javascript:;" class="dels">删除</a></li>
            </ul>
          </div> 
        </div>
      </div>
      <div style="clear:both"></div>
       
      
      <div class="pluninfo_center">${c.Content}
           {if (c.RevertContent!="")}
          	  <div class="yinyong">
        <div class=" plunxx_center1">
        <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">{if (c.RevertUserName=="")} ${c.RevertAUserName}{else}${c.RevertUserName}{/if}的原贴：</span>
             ${c.RevertContent}
        </div> 
		  </div>
           {/if}
      </div>
       
      
      <div class="pluninfo_bottom">
        <div class="fayan">
          <ul>
            <li><a href="javascript:;" id="s_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'support',${c.Support})" class="zhichi">支持[${c.Support}]</a></li>
            <li><a href="javascript:;" id="o_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'oppose',${c.Oppose})" class="fandui">反对[${c.Oppose}]</a></li>
            <li onclick="ShowMyReply(${c.ID})">回复</li>
          </ul>
        </div>
      </div>
       
      
      
      <div class="div_huifu" id="div_reply_${c.ID}"></div>
      <div style="clear:both"></div>
       
    </div>
   {/for}

查看全部评论

相关报道

邮件订阅

0 | 0| 0 | 0