科技 > 互联网 > 正文

京东即将开源视觉语言实时交互模型

财联社

下载客户端
独家抢先看

2026年06月17日 08:42:15 来自北京

《科创板日报》17日讯，《科创板日报》记者独家获悉，京东团队即将开源视觉语言实时交互模型JoyAI-VL-Interaction。记者从一份在开源社区和海外AI技术圈受到关注的技术报告获悉，JoyAI-VL-Interaction把多模态大模型从"一问一答"，推进到"实时流式交互"，适合需要AI持续在场的场景。报告将JoyAI-VL-Interaction与豆包、Gemini 的App内视频通话助手进行了人工评测，覆盖监控预警、实时计数、实时翻译、时间感知、直播解说和引导、长程记忆六类场景。在58个案例中，JoyAI-VL-Interaction对豆包的总体胜率为77.6%，对Gemini的总体胜率为87.9%。其中，在监控预警场景中，对两个基线均取得100%胜率。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

关闭

亲爱的凤凰网用户:

您当前使用的浏览器版本过低，导致网站不能正常访问，建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器下载

360安全浏览器下载