星火语音大模型多项指标领先 通用人工智能时代语音王者还是科大讯飞
  • cici
  • 2024年01月31日 17:51
  • 0

2024年开年,国产大模型持续开“卷”。1月30日,科大讯飞在安徽合肥正式举办了星火认知大模型V3.5升级发布会,除了带来星火认知大模型V3.5以外,还首次发布了星火语音大模型,科大讯飞称,星火语音大模型首批37个主流语种已超越OpenAI推出的Whisper V3;在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升0.25,拟人度超83%,在智能语音技术保持国际领先水平。此外,星火语音大模型已深度赋能汽车、客服、陪伴机器人、家庭等更多应用场景,助力千行百业数智化生产力提速。

[MD:Title]

在发布会上,科大讯飞董事长刘庆峰表示,大模型带来语音技术发展的全新机会。科大讯飞在语音技术上已深耕二十余年,多年来在语音识别、语音合成等多领域始终保持源头技术创新迭代,并斩获大量国际权威赛事冠军。比如语音识别技术方面,科大讯飞蝉联多届国际多通道语音分离与识别大赛CHiME冠军,语音合成技术方面,科大讯飞获国际语音合成大赛Blizzard Challenge十四连冠。在国内,科大讯飞还是首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心的承建方,被誉为语音技术与AI领域的“国家队”。

[MD:Title]

“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们的目标和梦想一天都没有变。”在通用人工智能时代,科大讯飞也紧抓大模型时代机遇,星火语音大模型的发布不止助力无障碍沟通,还能“百搭”更多场景,赋能实际应用,带来产业和人类生活的革新。

在技术优势上,借助大模型底座与国产算力平台,讯飞星火语音大模型将更多语音表征解耦,并融入到大模型预训练中,提升了韵律表现力和拟人度,突破了复杂场景识别效果的上限,提升了语料稀缺小语种的效果。刘庆峰表示:“借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

为了让星火语音大模型深度赋能千行百业,科大讯飞还率先将星火语音大模型用在自有C端硬件产品上。根据刘庆峰介绍,搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。升级后的多语种自动识别将支持35种语言,兼具增强式翻译技术提供中英双语服务。发布会现场还展示了一段对日本人、法国人与俄罗斯人的街头采访视频,生动展现出讯飞翻译机在多语种自动识别让国际沟通更便捷的真实写照,为不同国家人种的跨语言沟通提质增效,升级后的翻译机化身随身AI翻译助手,获现场及线上观众“点赞”。

[MD:Title]

除了赋能C端硬件产品,在行业端,星火语音大模型还深度赋能汽车、客服、家庭、陪伴机器人等实际应用场景,带来更深层次的人机交互变革。比如赋能汽车智能座舱、智能导航和音乐控制等交互体验更智慧快捷、赋能陪伴机器人、导购机器人和辅诊机器人在各自领域发挥重要作用,加速机器人产业的革新;赋能穿戴式设备等产品拥有更自然的语音交互能力。对于千行百业而言,星火语音大模型可以组成“百搭”CP,切实解决实际应用过程中的痛点,赋予产业变革更多的可能性。

正如刘庆峰所说:“当年从DOS界面到Windows界面成就了微软的传奇,从键盘到触摸诞生了苹果的神画,我觉得这一次全语音的自然交互一定会推动整个产业出现新一次的繁荣。”科大讯飞星火语音大模型的发布,带来了人机交互新变革,也再次夯实通用人工智能时代科大讯飞语音王者地位。

 

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0