快科技4月9日消息,字节跳动正式推出原生全双工语音大模型Seeduplex,基于“边听边说”的全新架构,彻底打破传统AI语音交互“一问一答”的局限,实现自然实时对话。
目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。
Seeduplex的核心突破的是改变了传统半双工“听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破:
精准抗干扰:模型具备持续的“倾听”能力,从而能更好地理解用户所处的声学环境,准确忽略背景噪音和无关对话。在复杂场景下,相比半双工模型,其误回复率和误打断率减少了一半。
动态判停:模型能联合语音和语义特征,综合判断用户意图,可实现更自然的对话节奏控制。面对用户的思考犹豫,模型能耐心倾听;在用户说完后,又能快速响应。相比半双工模型,其抢话比例相对下降了40%。
多维度评测显示,Seeduplex在对话的流畅度和节奏感上,均显著优于传统的半双工方案及行业主流App的语音通话功能;在判停表现上,模型相比半双工方案提升了8%,展现出更接近自然对话的分寸感。
对话流畅度MOS分提升12%,整体通话满意度提升8.34%,其打断响应表现已略优于真人对话平均水平,让人机交互更贴近自然交流状态。
工程落地方面,该模型依托字节跳动自研LLM底座,通过架构创新、海量语音预训练、推理优化及稳定性保障,有效解决了高并发场景下的卡顿问题,可支持亿级用户稳定使用。
目前,用户更新至豆包App最新版,在“打电话”语音通话界面即可体验该功能。





