8月31日消息,在本月的第86次AVS标准会议上,由腾讯天籁主导的AVS3语音编码项目,已获得显著进展!
测试结果显示,在纯净语音场景、网络损伤场景等多场景下,能够实现极低码率下的高质量通话,向实现AVS3音频标准落地更近了一步!
本次AVS会议,腾讯侧提交的技术方案,来自于腾讯首款自研神经网络语音编解码器Penguins。
传统的语音编解码器,包括AVS、ITU-T等标准语音编码器,在码率降低到10kbps以下时,语音质量下降明显,影响用户体验。
为应对此挑战,腾讯会议天籁实验室联合腾讯AI Lab,推出的腾讯首款自研神经网络语音编解码器——Penguins。作为新一代的AI Codec,实现了6kbps下的高质量通话,在主观质量上也非常接近原始参考信号,媲美OPUS在20kbps的质量。
Penguins作为新一代AI codec,不仅能够将编解码效率提升300%,还充分考虑到了用户体验与使用场景,尽可能地降低码率和算力,维持与现有编码器同等音质的同时,普惠更多的接入机型。当前,Penguins已经在腾讯会议(驾驶模式、弱网模式等)和QQ等多个产品中规模应用,支持亿级用户的顺畅沟通。
此外,在网络不佳时,Penguins会体现出极大的竞争力,比如降低网络损伤情况下的卡顿率,提升通话的流畅度和清晰度等。
据了解,AVS是国内多媒体领域最重要的标准化组织。2002年6月,国家原信息产业部科学技术司批准成立了数字音视频编解码技术标准工作组(AVS),面向我国的信息产业需求,联合国内企业和科研机构,制(修)订数字音视频的压缩、解压缩、处理和表示等共性技术标准。其中,AVS音频组负责组织制定音频编码技术标准。当前,AVS标准已经演进到第三代。