科技 > 互联网 > 正文

今年的天才少女“有点多”

三言财经

下载客户端
独家抢先看

2024年12月31日 06:28:49 来自湖北

最近几天，Deepseek在AI圈子里太火了。

12月26日，Deepseek宣布全新系列模型DeepSeek-V3首个版本上线并同步开源。

官方称，DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

此外，官方技术论文还披露，v3模型的总训练成本为557.6万美元，GPT-4o等模型的训练成本约为1亿美元。

随后，Deepseek开始刷屏。

12月27日，有媒体报道了罗福莉将加入小米一事，并将罗福莉称为95后“天才少女”。而这个“天才少女”，也来自Deepseek。

之后，雷军千万年薪挖角天才少女的报道也刷屏了。

事实上，早在12月20日就有媒体报道过DeepSeek罗福莉将加入小米一事，但当时的报道中并没有将罗福莉称为天才少女。该消息也没有刷屏。

而最近几天，两个刷屏的事都很突然，而且几乎是同时，到底啥情况？

DeepSeek-V3好评众多

但给自己挖了个坑

媒体文章再现“震惊体”

DeepSeek-V3一经发布，便收获无数好评。

一方面，是有多项数据显示，其在多个评测中取得高分。另一方面，则是其低廉的训练成本。

很多大佬也对DeepSeek-V3给出了高度评价。

比如，Meta科学家田渊栋称，DeepSeek-V3的训练看上去是“黑科技”，这是非常伟大的工作。

Menlo Venture的投资人表示：“53页的技术论文是黄金。”

不过，DeepSeek-V3也给自己挖了一个坑。

很快就有人发现，当用英文“what model are you”向DeepSeek-V3提问它是哪家大模型时，它却给出了“ChatGPT”的答案。

而用中文或给“what model are you”加上问号，DeepSeek-V3则能够正确回答。

不过，DeepSeek官方还未对此做出回应。

有分析认为，之所以会出现这一幕，或许是因为DeepSeek-V3的训练数据中可能包含了大量ChatGPT生成的文本，导致它“记住了”ChatGPT的某些输出，并错误地将自己识别为ChatGPT。

今日，三言测试发现，该BUG已修复。

三言还测试了几个此前曾让众多大模型翻车的问题。

1、1个笼子里装着免子和鸡，一共有20个头，45只脚，请问免子和鸡各有多少只?

这个问题其实是无解的。日前，三言在测试另一款大模型时，对方给出了错误的答案。

DeepSeek-V3则是先通过设方程，解出兔子的数量为2.5只，鸡的数量为17.5只。

然后又指出，动物的数量应该是整数，这表明题目中给出的数据可能有误，或者问题本身存在矛盾。

2、9.11和9.9哪个数字大？

这个问题曾让一众大模型打脸。

DeepSeek-V3给出了正确的答案。

3、蒸一个包子需要5分钟，蒸10个包子需要几分钟？

这个问题也曾让某大模型出糗，该大模型不知道包子可以同时蒸，得出了需要50分钟的错误答案。

DeepSeek-V3也给出了正确答案。

4、为什么爸妈结婚没叫我参加婚礼？

这个问题DeepSeek-V3分析给出了四种原因。

5、麻辣螺丝钉怎么做？

日前，三言测试另一款大模型时，这个问题也让它翻车了。该大模型一本正经的给出了做法。

而DeepSeek-V3指出了螺丝钉不能食用，并给出了“麻辣螺蛳”的做法。

从回答这些问题来看，DeepSeek-V3的能力确实还不错。

据悉，DeepSeek还被称为“AI界拼多多”。

这源于今年5月，DeepSeek V2开源模型发布，将推理成本被降到每百万token仅 1块钱，约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

当时，DeepSeek就被冠以“AI界拼多多”之称。

据悉，这背后是DeepSeek提出了一种崭新的MLA架构，把显存占用降到了过去最常用的MHA架构的5%-13%，同时，DeepSeek独创的DeepSeekMoESparse结构，也把计算量大幅降低。

这也是DeepSeek的过人之处。

不过，从这次刷屏的媒体文章来看，标题中充斥着“震惊全球”、“AI界拼多多”等标签。不知道是媒体的一贯做法，还是有意这么标签化定位。

并且，“震惊体”在AI界实在是太常见了。好多大模型发布时，都“震惊”过。但是“震惊”过后，很快就褪去热度。

罗福莉能力到底如何？

从电子专业转到计算机专业

第一年对编程没有任何认知

从连python都不会，4个月就投了论文

8篇ACL论文有2篇是一作

公开信息显示，罗福莉本科就读于北京师范大学计算机专业，硕士（保研）毕业于北京大学计算语言学研究所，研二时在自然语言处理领域顶级会议ACL 2019上发表8篇论文，其中两篇为一作。毕业后，罗福莉加入阿里达摩院机器智能实验室。期间，她主导开发的多语言预训练模型VECO，被纳入阿里达摩院深度语言模型体系AliceMind。此外，她还主导了AliceMind的开源工作。

2022年，罗福莉离开阿里，在DeepSeek担任深度学习研究员，参与了DeepSeek的MoE大模型DeepSeek-V2的开发。

罗福莉的百度百科已经更新为小米AI实验室负责人，尽管上了两天热搜和刷屏，小米方面却迟迟未回应天才少女加盟的事。

从“罗福莉”词条的编辑历史来看，12月28日才有了该词条，并且是由多位不同的网友编辑而来。

据悉，罗福莉在ACL 2019上发表8篇论文一事曾登上知乎热搜。

当时，罗福莉在知乎发文回应称，当年ACL她投了一长一短，然后都中了，其他paper都只是部分参与了实验室同学的research。

罗福莉还表示，其朋友圈不乏ACL中了两篇一作长文的人。其次，这次投稿ACL paper是其近一年的产出，所以她为自己是付出了足够的努力的，当然也可能也有运气成分加持。

2021年6月，罗福莉曾在其公众号的一篇文章中写道：“这一年我收获了人生中大多数人认识我的标签——8篇顶会文章(并非全一作)，并因此被网友‘挂’上了知乎，‘荣获’(被黑)什么天才AI美少女萝莉的称号。”

之后，罗福莉还曾在其公众号的文章中透露过自己的保研经历。

罗福莉称，自己的保研经历跟一般保研完全不同，她是在三月份就积极联系各个学校的导师，发邮件给他们，附加简历，介绍我自己（包括绩点和个人做过的项目经历以及科研成果），然后询问老师是否有保研名额，并且表示自己可以去实习。

此外，罗福莉还曾在访谈视频中透露，她并非本来就是计算机专业的，而是电子专业。一次偶然的机会，她转到了计算机专业。

罗福莉称，她在计算机专业第一年对编程没有任何认知，别人三分钟解出来的课题，她要花三个小时。

但她的进步也是相当快的。

罗福莉称，她大三的时候就开始联系北大各个方向的老师，去他们组内实习，她从连python都不会的一个人，4个月以后就投了自然语言处理顶会论文。

她还曾表示，论聪明程度来说，她应该是中下水平的。自己平时做事很傻，丢三落四，经常出门忘带钥匙、走迷路、坐过电梯等等。

值得一提的是，罗福莉的访谈视频，都是达某院拍的。

从以上内容来看，罗福莉可能并没有那么神乎其神。

她自己也证实，所谓的8篇ACL论文，有6篇是部分参与。

虽然网络上有一些罗福莉往日的相关信息，但在小米挖角之前，罗福莉确实没什么名气。

三言以“罗福莉”为关键词搜索百度资讯，相关内容只有两页，发布最早的是10天前。

如今突然刷屏，不知道算不算是营销行为。从其转专业第一年不熟悉编程，后来就成绩名列前茅，不会python，4个月就投了论文来看，确实是天才。

今年的天才少女“有点多”

今年6月，还有一位数学天才少女，引发赞叹，后来的结果大家都知道了。

这次的天才少女罗福莉也有不同寻常的经历，相信她有相应的实力。小米也应该尽快回应，到底加入没加入。

在此之前，文生视频大模型Pika发布时，其开发团队创始人之一的郭文景也被称为“天才少女”。

但也是很快，Pika和郭文景就没了声音。

这次的“天才少女”，还叠加了“Deepseek”和“雷军”两个buff，至于这两个buff有没有额外的属性加成，还需要让子弹飞一会儿。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

今年的天才少女“有点多”

亲爱的凤凰网用户:

第三方浏览器推荐: