字节推出中英同传新模型：模拟音色延迟近专业同传译员水平

下载客户端
独家抢先看

凤凰网科技讯 7月24日 字节跳动今日正式推出端到端同声传译模型Seed LiveInterpret 2.0。该模型主打中英双向互译，其翻译准确率与响应延迟均接近专业人类同传译员水平。

Seed LiveInterpret 2.0基于全双工语音生成理解框架，能够实时处理语音输入并几乎同步输出目标语言翻译。

官网展示Seed LiveInterpret 2.0使用过程

官网展示Seed LiveInterpret 2.0使用过程

该模型实现了平均2-3秒的语音到语音延迟，具备实时模仿不同说话人音色以保留身份特征的能力，并支持对上下文、文化背景及包括绕口令、诗词、美食文化在内的复杂表达的理解与互译。

模型测评显示，在语音到文本同传任务中，其中英互译质量评分为74.8（满分100），领先第二名系统58个百分点。在更难的语音到语音任务中（业界仅3家支持），其综合质量得分达66.3分，同样远超基准系统。同时，该模型在语音到文本和语音到语音场景下的首字/首音输出延迟分别仅为2.21秒和2.53秒。

字节推出中英同传新模型：模拟音色延迟近专业同传译员水平

亲爱的凤凰网用户: