科技 > 人工智能 > 正文

字节跳动OmniHuman多模态视频生成模型即将上线，图片+音频便可生成视频

IT之家

下载客户端
独家抢先看

2025年02月07日 17:17:49 来自山东

IT之家 2 月 7 日消息，据第一财经报道，字节跳动旗下一站式 AI 创作平台即梦 AI 将上线多模态视频生成模型 OmniHuman，仅需一张图片与一段音频便可生成一条 AI 视频，该模型为字节自研闭源模型。

即梦 AI 相关负责人透露，该模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。

IT之家注意到，字节跳动的研究人员近日展示了一款 AI 模型，可以通过一张图片和一段音频生成半身、全身视频。字节跳动表示，和一些只能生成面部或上半身动画的深度伪造技术不同，OmniHuman-1 能够生成逼真的全身动画，且能将手势和面部表情与语音或音乐精准同步。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

字节跳动OmniHuman多模态视频生成模型即将上线，图片+音频便可生成视频

亲爱的凤凰网用户:

第三方浏览器推荐: