科技 > 滚动 > 正文

生数科技发布Vidu S1实时交互模型，支持实时视频通话

IT之家

下载客户端
独家抢先看

2026年07月03日 21:01:34 来自山东

IT之家 7 月 3 日消息，生数科技今日发布面向实时交互场景的新一代模型 ——Vidu S1 实时交互模型。

官方表示，Vidu S1 模型支持实时视频通话和语音控制视频走向，用户不仅能通过语音控制数字人的行为，还能实现无限时长连续互动。

Vidu S1 支持 540P（960x540）高清分辨率、25FPS帧率（最高支持 42FPS），可基于真人、动漫、萌宠等任意初始形象及个性化音色，快速创建专属交互角色。

据介绍，Vidu S1 采用自回归扩散模型(AR + Diffusion) 路线，不再一次性生成完整视频，而是基于已经生成的历史画面，结合当前语音指令和对话上下文，持续预测并生成后续内容。

当用户发出新的语音指令时，模型可以实时理解并调整角色的表情、动作及后续视频走向，使视频从预先确定的固定内容，转变为一个持续生成、实时响应、动态演化的交互过程。

Vidu S1 已开启内测，IT之家附相关链接如下：

线上体验地址：https://www.vidu.cn/vidu-stream

API 体验地址：https://platform.vidu.cn/live/landing

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

生数科技发布Vidu S1实时交互模型，支持实时视频通话

亲爱的凤凰网用户:

第三方浏览器推荐: