阿里通义开源Fun-CosyVoice3-0.5B 提供零样本音色克隆能力
科技
科技 > 人工智能 > 正文

阿里通义开源Fun-CosyVoice3-0.5B 提供零样本音色克隆能力

凤凰网科技讯 12月15日,阿里通义宣布开源Fun-CosyVoice3-0.5B,该版本提供了zero-shot(注:零样本)音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。

此外,通义推出轻量化版本Fun-ASR-Nano模型,总参数量压缩到0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。

值得一提的是,通义还增强了Fun-ASR模型,噪声场景准确率93%、支持歌词与说唱识别。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载