腾讯混元世界模型1.5发布 可生成实时交互的3D场景
科技
科技 > 人工智能 > 正文

腾讯混元世界模型1.5发布 可生成实时交互的3D场景

凤凰网科技讯 12月17日,腾讯混元团队正式发布混元世界模型1.5(WorldPlay)。该模型支持通过文本描述或单张图片生成可实时交互的3D场景,用户可通过键盘、鼠标或手柄在生成的世界中自由探索。

据悉,此次发布版本强调空间记忆能力,当用户在场景中移动并返回先前区域时,模型能保持三维结构的前后一致性。模型支持以24帧/秒的速率生成720P视频流,并可将交互场景导出为3D点云复用。

腾讯宣布,此次同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架。技术报告公开了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节。该模型主要面向AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景。目前用户可通过官网申请体验。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载