二、全新的语音交互体验:以最自然的方式进行对话 毫无机械感
讯飞星火V3.5的第一大特性,就是提升了大模型的语音交互能力。
在讯飞星火V3.5版的APP界面底部,新增了一个机器人的图标,点击即进入到全语音交互界面。
在语音交互中,注入了两种音色输出,即聆小玥(女声)、聆飞逸(男声)。
我们测试了几个问题,来考察下讯飞3.5的语音交互能力。
首先是讯飞星火 V3.5的对话视频。
讯飞星火 V3.5 的全语音交互体验极为流畅,首先在音色上,完全消除了“机器感”,几乎不会出现前后音调不搭的情况,声音听上去就像是真人在你旁边说话一样。
其次,其AI合成的声音自然逼真,甚至连语气词,例如“嗯”、“这个”、“那个”等都运用的恰到好处。
并且,语音输出语速适中,该快的时候快,该慢的时候慢,如果有一个外行人在身边,真的会认为这是一个真人在说话,拟人化程度相当惊人。
另外,在对话中,讯飞星火 V3.5 的反应特迅速,一般都是笔者的话音刚落,它就能立即作出回应,并且对语义的理解能力相当精准,对问题的判断相当准确,相比其他的语音助手答非所问、自问自答、反应慢半拍的情况,可以说讯飞真正做到了跟人“交互”的程度。
接着是文心一言V4.0的语音交互。
文心一言V4.0在前几天还是不具备语音交互的,但这两天也推送了支持语音交互的新版本,我们也来测试一下它的语音交互能力。
在我们的测试中,文心一言V4.0的声音连贯性比较和谐,几乎不会出现断裂和不自然的过渡,但回答的细腻程度不及讯飞星火V3.5,而且一些问题都是直问直答,没有扩展性,并且缺少一些过渡用于,就有点像手机语音助手的那种感觉,听着会有一些紧巴巴的感觉,给人的感受没有讯飞那么自然。
最后是ChatGPT4.0的语音交互。
通过视频我们可以感受到,ChatGPT4.0的语音输出字句前后也比较自然,但还是会出现一些语调不均的情况,听着会让人有些别扭。
而且,由于网络连接不稳定,在语音交流过程中偶尔会出现等待时间过长的情况。