


一个神秘模型——HappyHorse-1.0悄然登顶Artificial Analysis的AI Video Arena排行榜,力压Seedance和可灵。
从昨天开始,它在文本转视频(无音频)赛道便登顶第一。根据当前实时数据,其Elo分数已达到1375,直接甩开第二名Seedance 2.0大概100分左右。
这个分差相当夸张,简直是断层式碾压。要知道,从第二名的Seedance 2.0到第十名,相差也不过50分左右。
在图像转视频(无音频)赛道,它更是跑出了1409的恐怖高分,刷新了该榜单的历史纪录。
而在有音频赛道,目前HappyHorse-1.0也已经拿下全球第一的成绩,超越Seedance 2.0。
多方消息称,HappyHorse-1.0出自阿里旗下张迪领衔的淘天集团未来生活实验室。
屠榜视频Arena
Artificial Analysis的Video Arena的排名机制,是数千名真实用户在完全不知情的情况下,对两段生成结果进行盲测对比得出的Elo体系。
也就是说,多数用户在不知道视频由哪家模型生成的情况下,选择了HappyHorse-1.0。
我也迫不及待地上手试了一下,在连续几次盲测都选中「欢乐马」之后,我开始感觉它的实力真的不容小觑。
先看第一个案例:
对比两个视频,可以明显看出右边的生成效果更具真实感,细节也更加丰富。无论是整体色调还是镜头的设置,都很像一个电影开场。
而左边的嘛……虽然提示词要求“血红色的天空背景”,但这天空未免也太红了,有点过于夸张。
选择之后答案揭晓:右边是「欢乐马」,左边是Pyramid-Flow。
再来看看这个:
很显然,右边的画面更加自然,特写-近景-远景的镜头切换也很流畅,完全还原了提示词要求的“长枪短炮”的新闻发布会场面。
相比之下,左边的效果一开场就显得有些怪异,主人公站的位置不太合理,也没有营造出足够热烈的现场氛围。
答案揭晓——右边是「欢乐马」,左边则是Veo 3.1 Lite。
接下来是第三个案例:
可能因为输入了提示图片,这两个模型的生成效果乍一看差不多。
但我还是选择了右边。原因是左边的镜头拉近速度有点太快了,不太符合现场专注工作的安静氛围。
并且右边的镜头拉近之后,会发现人物脸上的纹理被还原得更好,更具真实感;而左边人物则显得面部太光滑了。
投票之后,答案又揭晓了:右边还是这匹「欢乐马」,左边则是PixVerse V6。
盲测了十几个案例之后,但凡出现「欢乐马」的,我大部分都选中了,只有少数几个案例我没有选择「欢乐马」而选了其他模型。
这实力可想而知,也难怪空降屠榜了。
根据目前已知消息,Happy Horse-1.0采用40层单流Transformer架构,原生支持音视频同步生成,仅需8步去噪即可输出1080P视频。
在H100显卡上生成5秒片段仅需38秒,推理速度较传统模型大幅提升。其技术突破包括多模态统一建模、无CFG引导生成等。
原生支持中文(包括粤语)、英语、日语、韩语、德语、法语。
更重要的是,据说完全开源——基础模型+蒸馏模型+超分+推理代码,都会开源出来。
或出自阿里淘天
关于Happy Horse-1.0背后是哪家公司,目前猜测主要集中在国内。
而在众多选项中,呼声最高的是阿里淘天未来生活实验室,由前快手Kling一号位张迪领导。
张迪,上海交通大学本硕毕业,职级P11,直接向淘天集团首席科学家兼阿里妈妈CTO郑波汇报。
他于2010年毕业后便加入阿里,担任资深技术专家,负责阿里妈妈大数据与机器学习工程架构。
2020年,他曾转战快手,历任技术副总裁、大模型与多媒体技术团队负责人。在快手,他牵头了可灵大模型的底层架构研发与应用落地,成功推出了可灵1.0/2.0视频生成模型。
2025年9月初,张迪加入哔哩哔哩,出任技术条线负责人。
2025年11月,张迪离开哔哩哔哩,重返阿里,担任淘天集团未来生活实验室负责人。
目前,Happy Horse-1.0还处于无官网(目前出现的几个官网都被打假了)、无技术报告、无代码库的状态。
有消息称团队现在每晚都在加班加点,10号会正式发布,也是可以期待一下了。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”