面壁智能VoxCPM 1.5上线并开源:高采样音频克隆,生成效率翻倍
科技
科技 > 人工智能 > 正文

面壁智能VoxCPM 1.5上线并开源:高采样音频克隆,生成效率翻倍

凤凰网科技讯 12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。

其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载