新智元报道
编辑:好困 KingHZ
【新智元导读】近日,小扎在采访中透露,Meta等一众大厂或许将在今年拥有能够媲美中级软件工程师的AI;而在未来,AI将能够完成几乎所有的编码工作,甚至是AI系统本身的开发。面对即将到来的智能浪潮,人类该如何未雨绸缪?个人又该如何适应变革?
今年,编程可能从就业市场上最受追捧的技能之一,变成一种可以完全自动化的技能。
从小扎最近「信心满满」的发言来看,这并不是空穴来风:
到2025年,我们Meta以及其他正在研究这一领域的公司,很可能会开发出一种AI,它能够发挥相当于中级工程师的作用,具备编写代码的能力。
甚至,他还提出了一个「终极设想」——Meta大部分代码的编写,以及AI系统的开发,都将由「人·工智能」工程师来完成,不是「人·类」工程师!
按小扎的话说,未来的人类将从重复性工作中解放出来,去探索更多的可能性,并拥有更强的创造力。
Meta软件工程师的薪酬从E3级别每年18.4万美元,到E9级别每年325.1万美元不等。其中,中级软件工程师的年薪约为50万美元
其实,自2024年末,科技圈便开始充斥着这类雄心勃勃的「预言」。
各个大厂的研究人员和高管们,开始急切地讨论超级智能系统的降临,仿佛一场智能革命即将席卷而来。
Salesforce的老板Marc Bernioff更是放出豪言称,公司今年将停招软件工程师
马斯克:超级AI将于2030年问世
在去年12月的一条推文中,马斯克表示:「到2025年底,AI会超越所有人类个体的智能水平,而到2027-2028年期间,将会超越全体人类的个体智能。」
「到2030年,AI几乎必然会超越全人类的智能总和(概率接近100%)。」
奥特曼:AI将在2025年全面进入就业市场
类似的,OpenAI CEO奥特曼也在今年1月的博客中表示,OpenAI已经掌握构建传统意义上的AGI的方法。
并且他相信,在2025年,可能会看到AI智能体首次「加入劳动力市场」,并实质性地改变公司的产出。
Dario Amodei:2025-2027年有望实现AGI
去年6月,Anthropic CEO Dario Amodei表示,他认为在未来1-3年内实现AGI的「可能性很大」。
如何解读AI圈的「未来宣言」?
正如宾大教授Ethan Mollick指出,这些来自业内人士的大胆预测有着明显的目的——他们在筹集资金,抬高股票估值,或许还在说服自己正在创造历史。
而大模型本身,也在稳定性方面存在本质上的缺陷:在某些任务上表现卓越,却在看似更简单的任务上显得力不从心。这种「能力参差不齐」是当前AI系统的核心特征,短期内难以得到根本改善。
但是,将这些预测简单地归类为炒作,是非常不明智的。
无论出于什么目的,AI实验室里的研究人员和工程师,似乎确实真诚地相信他们正在见证一个前所未有的突破。
仅凭他们的这种确信或许不足以令人信服——但越来越多的公开基准测试和演示,开始揭示他们为何会有如此想法。
就像潮水正在以超乎想象的速度上涨。
潮水渐涨
12月下旬,OpenAI发布了全球最强「推理模型」——o3。它在一系列测试中所表现出的令人震惊的进步,可以说完全超出了我们对AI技术水平的预期。
在这之中,有三个基准特别值得关注:
1. GPQA:即便用谷歌也无法解答的博士级测试。
测试中,可以利用互联网的博士在其专业领域内的得分为81%,而在领域之外则跌到了34%。相比之下,o3在整体上实现了高达87%的正确率,首次超越了人类专家。
2. Frontier Math:由数学家创建的非公开数学问题。
这项测试难度极高,此前没有任何AI能够获得超过2%的得分,而o3却取得了25%的正确率。
3. ARC-AGI,题目对于人类相对容易但对AI来说很难的智能体测试。
在这里,o3再次击败了所有之前的AI以及人类基准水平,得分达到了87.5%。
虽然这些测试都有局限性,但它们表明,我们之前认为AI无法逾越的门槛实际上可能会很快被突破。
AI智能体
随着AI变得越来越智能,它们成为了更高效的AI智能体。
智能体又是一个定义模糊的术语,通常指的是能自主实现一系列目标能力的AI。
之前的文章中已经展示了一些早期的智能体系统,而过去几周的发展也向我们证明,至少在一些细分但具有重要经济价值的领域中,实用性的AI智能体已经变得可行。
一个典型例子是谷歌的Gemini及其Deep Research功能——一个定制的研究型AI智能体。
比如,我们问它「从创始人的角度研究,比较高增长创业公司的各种融资方式」。智能体就会立刻制定计划,并阅读了多达173个网站。
几分钟后,一份完整的分析报告就出炉了!其中,包含118个参考文献,篇幅长达17页。
那么,质量如何呢?
作为在沃顿商学院教授创业入门课程超过十年的教师,Ethan Mollick不仅在这个领域发表过文章,自己创办过公司,还写过创业方面的书。
他认为,这份报告相当扎实,也没有发现任何明显的错误,感兴趣的读者可以查看原文进行验证。
此外,教授还指出,AI智能体目前最大的局限不在于准确性,而是只能访问公开的非付费网站,无法获取学术或付费出版物的内容。并且,它的分析也略显肤浅,在面对相互矛盾的证据时缺乏有力的论证。
总结来说,它虽然还比不上最优秀的人类专家,但已经超过了他所见过的许多报告的水平。
Deep Research项目的负责人透露,这仅仅是一个小团队的试点项目。因此可以推测,意愿更强、规模更大团队和公司,也能够实现类似成果。
如今,特定领域的AI智能体已经是实际的产品,而不再是遥不可及的设想。
这就引发了一个问题:是否很快就会出现通用型AI智能体?用户只需提问,这些通用型AI智能体就能通过计算机和互联网来完成任务。
随着时间推移,谜底迟早揭晓。
一旦通用型智能体系统能够可靠且安全地运作,将会带来巨变,因为AI智能体能将在现实世界中,真正发挥作用。
「小进步」不断
智能体和超级智能是实现革命性AI所需的核心要素,但还有许多其他领域也在快速发展。包括AI记忆容量(上下文窗口)的提升,以及赋予它们视觉和语音能力的多模态技术。
回顾一下过往的发展历程,我们就能清晰地看到这种进步。
举个例子,从ChatGPT发布之前,Ethan Mollick就一直用「坐飞机使用wifi的水獭」这个提示词来测试图像和视频模型。
在2023年10月,这个提示词只能生成一个令人毛骨悚然的怪物形象。而仅仅18个月后,多个图像创作工具就能完美驾驭这个提示词了。
根据教授的测试,最新的谷歌Veo 2只需不到15分钟的操作,就可以完成一段30秒的视频生成。(当然还需要一些时间等待视频渲染完成)
可以看到,画面中阴影和光线的质量,以及水獭打开笔记本电脑这个细节的处理,都非常精彩。
随后,教授再次提升难度,将这个水獭的奇妙故事改编成了80年代风格的科幻动画,让水獭遨游太空。并且,还利用Suno配上了复古风格的主题曲。
同样,创作过程几乎不需要人工干预。
「洪水」将至,未雨绸缪
纵观这些发展,我们该如何看待各AI实验室关于智能浪潮即将来临的预测?
如今,我们已经看到了AI足以改变诸多脑力工作的能力:o3基准测试突破了之前的壁垒;特定领域的AI智能体能够进行复杂研究;多模态系统可以创造越来越精妙的内容。
而这还仅仅是个开始,更强大的系统和通用型AI智能体即将问世。
面对这些预测,令人担忧的不是这个时间表准确与否,而是我们连应对当前AI能力的准备都不充分,更遑论面对预测成真的可能性了。
当AI研究人员专注于对齐问题时,却很少有人试图勾勒和阐述AI深度渗透的世界会是什么模样——这不仅仅是一个技术问题,更关乎如何选择和部署AI。
生命未来研究所、基础问题研究所和Metaculus的联合创始人,Anthony Aguirre曾写道:
科技公司之所以构建价值万亿美元的AI基础设施,并不是因为指望你每月支付20美元,使用AI工具提高生产力。而是因为他们知道,如果有可能的话,你的老板愿意花数百甚至数千美元,用AI来取代你。
正如开篇Marc Bernioff的「证言」:Salesforce不会在2025年招聘软件工程师,因为AI已经带来了显著的生产力提升。
这波浪潮中,打工人的命运可能被改变,企业可能要转型……它可能与每个人都息息相关。
即将到来的智能浪潮本身并无善恶之分,关键在于我们如何未雨绸缪,如何适应变革。
最重要的是,我们选择如何驾驭它:这些将决定它是成为推动进步的动力,还是引发动荡的源头。
此时此刻就是展开这些讨论的最佳时机,等到浪潮汹涌而至之时,为时晚矣!
参考资料:
https://www.businessinsider.com/mark-zuckerberg-meta-ai-replace-engineers-coders-joe-rogan-podcast-2025-1
https://www.oneusefulthing.org/p/prophecies-of-the-flood
https://controlai.news/p/the-unknown-future-predicting-ai