字节推出中英同传新模型:模拟音色 延迟近专业同传译员水平
科技
科技 > 人工智能 > 正文

字节推出中英同传新模型:模拟音色 延迟近专业同传译员水平

凤凰网科技讯 7月24日 字节跳动今日正式推出端到端同声传译模型Seed LiveInterpret 2.0。该模型主打中英双向互译,其翻译准确率与响应延迟均接近专业人类同传译员水平。

Seed LiveInterpret 2.0基于全双工语音生成理解框架,能够实时处理语音输入并几乎同步输出目标语言翻译。

官网展示Seed LiveInterpret 2.0使用过程

官网展示Seed LiveInterpret 2.0使用过程

该模型实现了平均2-3秒的语音到语音延迟,具备实时模仿不同说话人音色以保留身份特征的能力,并支持对上下文、文化背景及包括绕口令、诗词、美食文化在内的复杂表达的理解与互译。

模型测评显示,在语音到文本同传任务中,其中英互译质量评分为74.8(满分100),领先第二名系统58个百分点。在更难的语音到语音任务中(业界仅3家支持),其综合质量得分达66.3分,同样远超基准系统。同时,该模型在语音到文本和语音到语音场景下的首字/首音输出延迟分别仅为2.21秒和2.53秒。

字节推出中英同传新模型:模拟音色 延迟近专业同传译员水平

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载