习惯了在导航里听“志玲姐姐”温柔的指示,也习惯了和不动声色的Siri交流,有没有想过换上自己的专属AI声音,在独一无二的情境中实现智能交互?日前,网易有道全新升级语音合成的声音定制和声音复刻功能,从录制到试听整个过程只需要5分钟,即可让私人订制的AI声音为你“开嗓”,在日常生活的多种用途里“个性发声”。
语音合成,即TTS(Text-To-Speech) ,是将文字转化为声音并且朗读出来,让机器生成自然动听的人类语言。近年来,随着AI技术的发展,越来越多的AI合成声音被企业接受并投入商用。例如,网购时的智能客服和开车时的语音导航,都是现代人再熟悉不过的AI之声。然而,制约这一技术大规模应用的桎梏在于,过往亲近人类的语音合成需要签约配音员进行录制和标注,再加上一定的训练时间,使得整个过程不仅周期长,收费也不便宜。
为了突破这一瓶颈,网易有道上线了声音定制和声音复刻功能,这是语音合成技术(TTS)的个性化应用,以科技进展把复杂的事情变得简单:通过在平台录制5-20句话,得到与用户本人在音色和发音风格上相似的声音模型,从而快速地复刻(定制)用户原声。在很短时间内,有道的声音复刻技术就能完成文本分析、声学模型和声码器三个关键步骤,依托神经网络和迁移学习技术,让音色达到很高的还原度。从录制到试听的整个过程,只需要5分钟。
这是网易有道AI技术赋能生活的又一生动实践。目前,语音合成已经融入日常工作生活的方方面面,从智能客服到语音导航,从孩子听故事、用户学习陪伴的情境,到元宇宙的虚拟角色的自我表达,都需要一个有温度的“科技好声音”——此前,有道AI语音团队4人小组用了半个月的时间,将明星欧阳娜娜时长仅几十分钟的语料完美复刻,创造出了以假乱真的惊艳效果。从此,AI“欧阳娜娜”得以全天候陪伴用户学习英语,让更多人看到了大众偶像助力个人学习的可能。
图:有道词典明星语音功能界面示例
为了让用户轻松体验到这项技术,网易有道专门研发了有道智云-个性化语音定制平台,只需登录有道智云AI开放平台,打开有道声音定制页面,依次点击“智能语音服务”“个性化语音定制”和“免费试用”,在安静的环境中说不低于5句话、5分钟左右即可生成自己的专属音色。活动期间,每个用户均可在有道智云AI开放平台官网免费体验3次,定制3个语音。
据悉,个性化语音定制已在有道词典、有道乐读、导航播报等多种产品中广泛应用,让用户能以最喜欢的声音为伴,来为自己的学习、工作和生活锦上添花。试想,孩童可以在妈妈的AI声音中听完一整本童话,粉丝可以被偶像的AI声音激励着刻苦学习,这也是网易有道一直以来的愿望:为人与人的美好互动贡献力量,让教育科技充满人文关怀,走进日常生活的每一个角落。