字节跳动推出全双工语音大模型Seeduplex:豆包打电话交流更自然
科技
科技 > 人工智能 > 正文

字节跳动推出全双工语音大模型Seeduplex:豆包打电话交流更自然

凤凰网科技讯 4月9日,字节跳动推出原生全双工语音大模型Seeduplex,目前已全量上线豆包App。该模型基于“边听边说”的全新框架设计,相比上一代半双工端到端语音模型,实现了听与说同步的实时交互,在对话节奏、自然度和抗干扰能力上有所提升。

据官方介绍,Seeduplex通过模型架构创新与训练优化,攻克了高并发下的卡顿与稳定性等工程挑战。在精准抗干扰方面,模型具备持续“倾听”能力,能理解用户所处的声学环境,准确忽略背景噪音和无关对话。复杂场景下,误回复率和误打断率较半双工模型减少50%。在动态判停方面,模型联合语音和语义特征综合判断用户意图,面对用户思考犹豫时能耐心倾听,用户说完后快速响应,抢话比例较半双工模型下降40%,判停表现提升8%。

多维度评测显示,Seeduplex在对话流畅度和节奏感上均显著优于传统半双工方案及行业主流App的语音通话功能。该模型已在业界率先实现规模化落地,可为上亿用户提供连续高质量的实时语音交互体验。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载