原标题:DeepSeek罗福莉将加入小米,或领导小米大模型团队|新皮层独家
记者:吴一凡
编辑:吴洋洋
第一财经「新皮层」独家获悉,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。
小米AI实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括视觉、声学、语音、自然语言处理(NLP)、知识图谱、机器学习和大模型。
根据公开信息,罗福莉硕士毕业于北京大学计算语言学研究所,研二时在自然语言处理领域顶级会议ACL 2019上发表8篇论文,其中两篇为一作。毕业后,罗福莉加入阿里达摩院机器智能实验室。期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。
2022年,罗福莉离开阿里,在DeepSeek担任深度学习研究员,参与了DeepSeek的MoE大模型DeepSeek-V2的开发。
罗福莉的加入可能加速小米在大模型领域的研发进度。2023年4月,小米AI实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。公开资料显示,栾剑曾任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。
2023年年度演讲中,雷军宣布小米将全面拥抱AI大模型,大模型技术的主力突破方向为「轻量化」和「本地部署」。基于该原则,小米的大模型团队研发了MiLM系列模型,并于今年11月升级至第二代——MiLM2,其中,模型参数最小为0.3B,最大为30B,多数在端侧部署,MiLM2-30B专为云端场景设计。目前,MiLM2已经在澎湃OS、小爱同学、智能座舱、智能客服中应用落地。