在2021年7月30日至8月2日上海新国际博览中心举行的第十九届ChinaJoy上,高通公司携手腾讯游戏公共研发运营体系(CROS)向现场玩家展示了5G时代下GVoice基于骁龙强劲AI能力所实现的成果。
现如今,蓬勃发展的移动游戏产业已成为一个创新技术融合的平台,为数字娱乐多元化的先进技术提供了良好的发展环境。聚焦于游戏语音处理技术,高通技术团队与腾讯游戏语音GVoice通过将AI降噪及回声消除算法写入高通AI引擎,实现了从软件处理层面到芯片层面的飞跃。怀揣着为广大游戏爱好者提供行业领先的更清晰的沉浸式娱乐体验的目标,腾讯游戏语音团队与高通技术团队在骁龙主题馆中介绍了新一代GVoice产品是如何联合芯片与终端厂商克服实时通讯技术在互动游戏中的重重挑战,以及其在众多热门游戏中的技术应用。
降能提效 解决实时语音痛点
作为用户体验的关键点,高清晰的实时语音是多人互动游戏成功道路上不可或缺的。然而想要获得语音功能上的成功却并不简单,相较于传统通话,应用于移动游戏中的语音通话需要更为严苛的性能消耗标准。没有先进的算法和顶级性能的引擎支持,开发团队很难达到理想的语音体验。
手机从软件到硬件设计的初衷,都是最大限度得确保传统通话场景的清晰性,稳定性。从而让传统通话场景下背景噪声干扰最小,系统采集到的语音信号信干比更高,通话质量得到保障。反观游戏场景,用户在使用语音的过程中,语音通话的同时游戏背景音乐音效也在不断播放,同时拾音距离变远,从而使得背景噪声大于人声信号,大大提升了降噪和回声消除的难度 。另外游戏场景,游戏本身占用了大量CPU,内存资源,而留给语音算法的资源非常有限。如何在有限资源的场景下,高效得进行语音处理,得到高清晰的语音用户体验,成为行业一座必须翻越的大山。
针对上述问题,腾讯游戏语音GVoice与高通技术团队合作提出了创新解决方案。为了消除游戏背景音对玩家造成的通话干扰,手游语音通话首先需要优化现有算法,通过机器学习的方式,提升AI降噪的泛化能力,降低算法复杂度,减小模型大小,从而提升整体语音体验。
芯片级处理技术 高清的语音体验
那么,GVoice游戏语音算法与骁龙移动平台在语音处理上究竟碰撞出怎样的火花呢?杂音的减少、开黑队友清晰的沟通、更低的性能开销给你答案!
语音算法的首要任务是抑制各种背景噪音与回声。GVoice团队采用循环神经网络降噪算法,针对游戏场景进行了海量训练,取得了比传统通话更加优异的音质表现。传统通话算法的平均杂音时长比例为11.5% ,而GVoice 的平均杂音时长比例为3.4%。同时充分利用高通AI引擎上高通Hexagon DSP超强的AI计算能力,深度定制优化GVoice算法后,降噪,回声消除等算法效果实现了进一步的飞跃。相比于传统的算法,其降噪效果平均提升约10dB左右。
GVoice & VOIP杂音时常比例对比
传统通话将算法运行在CPU上面,而GVoice将算法移植到高通AI引擎中的Hexagon DSP里面,利用了Hexagon DSP的AI计算能力以及并行运算能力,显著释放CPU资源,从而实现了最小的音频CPU性能开销,收益最大化。整机耗电量下降20mA/s,GVoice所占的音频CPU资源在原有基础上减少约30%,玩家可以在享受高清晰语音互动的同时免受手机发烫的困扰。
创新生态合作 迈向数字娱乐更高峰
腾讯游戏语音GVoice联合高通技术团队突破了游戏语音处理技术的一大难关,达成了更优的降噪效果以及更低的资源消耗。通过定制游戏语音模式的方案,适配定制化音频通路,协同芯片厂商、手机厂商联合调优,显著提升了游戏语音体验。
目前GVoice游戏语音服务已全面覆盖腾讯自研及代理游戏语音产品能力,也向全球开发者开放。采用信号处理与人工智能融合的新一代语音处理架构体系,拥有优于业内同类产品50%以上的降噪效果、回声抑制能力、低性能消耗的特色。
鉴于在游戏语音前沿技术领域的成功探索,GVoice团队和高通公司以及部分手机厂商也联合将相关成果通过中国通信标准化协会,正在推进此方案的行业标准化落地。可以预见5G移动平台与游戏语音的拓展合作将加快游戏语音算法核心技术领域的研发成果落地于更多商用产品的步伐,将赋能越来越多的游戏开发者,实现让亿万玩家在移动平台上获得高清畅快娱乐体验的愿景。