阿里通义开源Fun-CosyVoice3-0.5B 提供零样本音色克隆能力

下载客户端
独家抢先看

凤凰网科技讯 12月15日，阿里通义宣布开源Fun-CosyVoice3-0.5B，该版本提供了zero-shot（注：零样本）音色克隆能力，只需要你提供一段3秒以上的参考音频，即可复刻其音色并合成新语音，并且支持本地部署和二次开发。

此外，通义推出轻量化版本Fun-ASR-Nano模型，总参数量压缩到0.8B，推理成本更低，现已开源，支持本地部署与定制化微调。

值得一提的是，通义还增强了Fun-ASR模型，噪声场景准确率93%、支持歌词与说唱识别。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低，导致网站不能正常访问，建议升级浏览器

谷歌(Chrome)浏览器下载

360安全浏览器下载