阿里语音大模型在Speech Arena斩获中国第一 全球排名第五
科技
科技 > 互联网 > 正文

阿里语音大模型在Speech Arena斩获中国第一 全球排名第五

快科技5月28日消息,据媒体报道,在全球权威AI评测平台Artificial Analysis的语音排行榜(Speech Arena)上,阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分的Elo评分位列全球第五、国产第一。

在ASR(将语音转为文字)、Chat(端到端的语音理解与对话)以及TTS(将文字转为语音)三个核心赛道,该模型均斩获全国第一,实现语音交互领域的“大满贯”。

阿里语音大模型在Speech Arena斩获国内第一 全球排名第五

语音大模型的能力可拆解为三个层次:听得准(ASR)、说得好(TTS)和聊得棒(Chat),三者各自独立又相互依赖,共同构成完整的语音交互体验。

此前,阿里语音大模型家族的另外两款模型——Fun-Realtime-ASR和Fun-Realtime-AudioChat,已在同一平台登顶,分别斩获“听准”“听懂”“会聊”三项指标全球第一,整体表现超越GPT-Realtime-2等国际顶尖语音模型。

阿里语音大模型家族目前已深度融入千问App、高德地图、钉钉等国民级应用,提供实时语音转文字、智能导航交互、会议纪要生成等核心服务。

此外,该模型还提供企业级定制接口,支持金融、医疗等行业场景的灵活适配。阿里语音团队开源的FunASR、CosyVoice等多款模型,在GitHub上累计获得了数万星标,深受海内外开发者关注。

阿里语音大模型在Speech Arena斩获国内第一 全球排名第五

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载