科技 > 人工智能 > 正文

腾讯混元技术负责人刘威离职创业，又一巨头暂缓Sora的故事

36氪

下载客户端
独家抢先看

2024年11月19日 15:35:18 来自北京

文｜ 周鑫雨

编辑｜ 苏建勋

《智能涌现》从多名独立信源处获悉，原腾讯混元大模型技术负责人之一、前 AI Lab计算机视觉中心负责人刘威于近日离职。

此外，AI Lab计算机视觉中心暂时由AI Lab副主任俞栋管理。

对上述信息，截至发稿前，腾讯官方暂无回应。

多名从业者对《智能涌现》表示，刘威已经在新加坡创业，瞄准的还是视频生成领域。

△原腾讯AI Lab计算机视觉中心负责人、混元大模型技术负责人之一刘威。图源：腾讯AI实验室微信公众号

在腾讯，具有“杰出科学家头衔”的刘威，最为人所知的身份是腾讯混元大模型的技术负责人之一。

此前，他曾任腾讯广告多媒体AI中心总监，带领团队基于混元大模型，研发了广告多媒体AI技术矩阵，提高了腾讯的广告转化效果和广告制作效率。

种种迹象表明，在验证落地场景和商业模式前，腾讯对视频生成的投入还十分谨慎。

一名从业者表示，图像、音频是目前腾讯多模态研究的重点：“技术成熟，成本可控，而且比较容易找场景。”比如，2024年11月，微信公众号最新版本上线了“朗读音色”功能，用AI实现了音色克隆。

“在腾讯，目前CV研究的主力在混元团队。但总体而言，腾讯对视频生成的人力和资源投入还不是很大。”上述从业者表示。

另有相关人士表示，腾讯AI Lab计算机视觉中心所配备的人力向来很少，刘威创业后又带走了多名成员，“总体而言，AI Lab对视频生成很佛”。

有关是否大力投入视频生成模型，如今中国互联网公司已经分成了泾渭分明的两派：

大举投入派，以字节跳动和快手为代表。2024年6月，快手发布了效果轰动一时的“可灵AI”；同年9月，不甘人后的字节一口气发了两款视频生成模型：Seaweed和PixelDance。

这些公司的特点在于，具有丰富的视频数据资源，以及能立刻与视频生成技术相结合业务场景。

而另一暂缓投入派，如百度，则对目前视频模型的商业回报，持有较为消极的态度。

此前《智能涌现》曾独家报道，在2024年Q3总监会上，百度董事长兼CEO李彦宏明确表示，Sora这种视频生成的投入周期太长了，10年、20年都可能拿不到业务收益，那么无论多么火爆，百度都不去做。

而腾讯对视频生成模型的态度天平，也正在向保守和观望倾斜。在明确落地场景和商业化回报之前，“类Sora”的视频生成模型还不会成为腾讯挺进的领域。

封面来源 ｜ 视觉中国

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

腾讯混元技术负责人刘威离职创业，又一巨头暂缓Sora的故事

亲爱的凤凰网用户:

第三方浏览器推荐: