8月21日,2024年世界机器人大会在北京正式开幕,与以往最大的不同在于,今年是人形机器人参展企业最多的一届,共有27家人形机器人整机企业、30多家产业链上下游企业亮相。
随着AI突飞猛进,具身智能成为了今年资本市场上最热的领域之一,那些曾经仅存在于科幻电影中的机器人,正离现实生活越来越近,变得“看得见、摸得着”。
在开幕前后,也有多家机器人公司发布了新产品,比如经纬创投投资的宇树科技发布了G1量产版本,起售价为9.9万元,这款产品在世界机器人大会上首次展出,更强性能、终极外观,最关键的是可以大批量生产了。
宇树G1机器人身手敏捷,不仅可以空中劈腿,还可以自由地上下楼梯,轻巧敏捷
英伟达科学家Erwin Coumans迫不及待想搞一台来做实验
智元机器人则是一口气发布了五款商用人形机器人产品,包括3款适用于不同场景的远征系列(A2、A2-W、A2-Max),2款模块化机器人系列产品(灵犀X1和X1-W,后者面向专业数据采集)。
星尘智能则发布了新一代AI机器人助理Astribot S1,这款产品也在2024世界机器人大会上正式亮相。
星尘智能的机器人助理Astribot S1,正在烘烤华夫饼
今天随着人形机器人越来越走进现实,也迎来了群雄逐鹿的时刻,但技术路线仍不确定、应用场景皆有可能。经纬创投在几年前就系统性地关注通用智能机器人赛道,在机器人软硬件一体化领域,投资了宇树科技、智元机器人、银河通用、星尘智能,它们都是优秀的全技术栈型创业公司,但各自的技术切入方向并不相同,切入的应用场景也不尽相同,有工业、仓储物流、零售、生物制药等等场景。短期目标都是快速占领各自的应用场景,谁先把一个细分场景做好,积累出足够多的数据,就有可能继续拓展新的延展领域,最终走向通用化。
除了机器人软硬件一体化外,在产业链上游的两个重要方向(数据、一体化关节),经纬创投也投资了AI仿真数据领域的光轮智能,正在为行业提供海量的高真实性、高效用性的训练数据;而在一体化关节/执行器领域,经纬则投资了钛虎机器人,钛虎有非常高效和全面的产品系列,覆盖了从灵巧手到全身上下的所有关节……
相比于AI大模型,人形机器人更需要工程层面的实践与突破。比如1990 年出生的王兴兴,并不是履历亮眼的学霸型创业者,他是一个典型的理科偏才。“大家可能觉得很多顶尖院校的人很厉害,但实际上大家都是普通人,在机器人这个行业里,很多人只做软件,完全没碰过硬件,而硬件是实践出来的,你知道就是知道,不知道就是不知道。” 宇树科技创始人兼CEO王兴兴说,在大学时代他就发现,只要集合最好的零部件,并且用上最先进的软件,就可以做出一个更好产品,组合式创新。
与王兴兴有着类似的经历,钛虎创始人易港是一位95后,早在大学宿舍就搞起了3D打印机和焊台,大一就做出了假肢原型机,还在中美创客大赛中获奖;大二又做出了一套主从式外骨骼,手部拥有17个自由度。他总结自己为什么能在大学时期的很多奖项中,打败名校的参赛项目,最核心的就是自己的产品“看得到、摸得着、能体验,对社会有直接价值,而不是漂亮的PPT。”
随着AI大模型的突破,今天的人形机器人,正越来越逼近临界点。有越来越多之前不敢想的任务,如今都可以实现了。特别是随着“世界模型”的提出,机器人的真机数据越来越具备实用价值。
“下一个十年,最值得做的就是人形机器人。”星尘智能创始人来杰说,他曾是腾讯RoboticsX机器人实验室的一号员工、百度“小度机器人”团队负责人,在去年底离职创业。
“人工智能的黎明已经迅速临近,我预计在明年年底之前,全球至少会有一家公司能够推出相对通用的机器人AI模型,发展速度之快令人瞩目。” 王兴兴说,“我在年初提出了这一观点,至今仍然坚信,明年年底实现这一目标是非常有可能的。”
一、“软与硬”的结合
不同技术路线、不同应用场景,逐鹿方始
今天的机器人与以往最大的区别在于,随着AI的爆发,智能泛化能力大幅加强,这让通用机器人成为可能。传统机器人并不需要对外界自主响应,所以这是一个自动化设备,不断地重复之前预设的程序。而现在有了智能泛化能力的突破,甚至只需要语音控制,机器人就能实现新功能,这是从自动化到智能化的底层转变。
而AI大模型的能力,不仅体现在规划层面,也开始进入感知和控制环节,机器人发展了50多年,第一次出现这样由学习算法驱动、以及一个非常大的预训练模型来推动控制环节的变化,这也是过去一年里,我们看到技术层面最大的突破。
“最终我们会有大脑大模型、小脑大模型,一起把本体串起来,构成一个通用机器人系统。” 北大-银河通用具身智能联合实验室主任王鹤说。他认为,通用机器人应该由基石层和能力层支撑,在基石层最关键的是去打造一个通用的本体,数据依赖于本体,本体也决定了它能产生什么样的数据,两者相互绑定。基于本体和数据,进而发展出机器人能力,主要是“大脑”和“小脑”,前者主要解决感知和决策问题,后者把大脑的感知和决策转换成动作。
比如智元机器人也遵循了这样的思考逻辑。“稚晖君”彭志辉从华为离职创业后,与上海交通大学博士生导师闫维新,组建了创始团队,其中闫维新负责人形机器人的“身体”,彭志辉负责人形机器人的“大脑”。“过去,他们在工作中有一些交集,创始人(彭志辉)提出这个想法之后,大家一拍即合。”
远征A1,是智元机器人的第一代产品,已于去年8月亮相。其步行速度为7公里/小时,依靠视觉传感器和多线激光雷达可自主避障。它的灵巧手有5根手指,能像人类一样抓取物品。应用场景专注于工厂、生物实验室、家庭护理与陪伴等。
而一年之后,8月18日上午,智元机器人一口气发布了“远征”与“灵犀”两大家族共计五款商用人形机器人新品:交互服务机器人远征A2、柔性智造机器人远征A2-W、重载特种机器人远征A2-Max、智元X-Lab孵化的首个全栈开源机器人灵犀X1、专业数采机器人灵犀X1-W。
智元在发布会现场,搭建了一个摄影棚,机器人当场秀了一次在语音指令下,动手调饮料的操作
对于机器人这样,离不开硬件做最终执行的赛道,“软硬一体”的能力尤其重要,像宇树科技、智元、银河通用、星尘等等公司都非常重视这一思路。如果我们看电动车与自动驾驶行业的历史,2015年第一批电动车创业公司创立至今,在这个过程中,自动驾驶创业公司的数量,并不少于电动车创业公司。但在今天,单纯做自动驾驶的创业公司基本上都处于挣扎状态,鲜有获得业务突破,哪怕曾经获得过巨额融资。
但从电动车企的角度,不仅“蔚小理”等一众新兴电动车企崛起,先有了“硬件”、产生数据闭环,再切入自动驾驶,反而有很大的业务进展,各家的城市NOA越来越智能。如果一个行业离不开硬件支撑,并且这个硬件仍处于快速迭代期,单纯做这行业的软件是要冒极大风险的。
类似于新能源汽车核心的三电系统,彭志辉将机器人的核心系统分为:动力域(电机关节、伺服控制、电源管理)、感知域(传感器模块、感知算法)、通信域(网络接口、数据传输协议、中间件框架)、控制域(通用算力、AI算力单元、运控算法、具身算法)。
“整个机器人其实是一个软硬件极其复杂的系统,既涉及到内部各个硬件模块的协同和部署,同时也需要软件跟算法高效配合。” 彭志辉说。
“我们在过去一年里,同时在G2落地和G3预研两个方向,都取得了一些阶段性突破。在G2阶段实现了一系列zero-shot和few-shot的一些通用原子能力,比如通用的位姿估计模型UniPose。目前也正在与多家制造业和服务业领军企业,进行联合的场景POC,今年晚些时候有望全流程跑通,让机器人能够正式在客户场景中部署干活。” 彭志辉说。
二、“大部分人对社会的成本结构一无所知”
硬件与中国供应链
低成本是人形机器人大规模运用的前提。今年5月,宇树在发布G1人形机器人时,把最低售价打到了9.9万元。但这款机器人的参数一个不差,身高约127厘米,体重约35公斤,具有超越常人的灵活性,小跑速度大于2m/s,拥有广阔的关节运动空间,23至43个关节,最大关节扭矩达到120N.m,可进行高难度的动态动作。比行业整体便宜80%的售价,再一次成为人形机器人领域的焦点。
“大部分人对社会的成本结构一无所知。”王兴兴说,“低成本的原因其实很简单,以前很多学术或公司主要靠去买工业电机,但它们很大、很贵、很重,所以做出来的效果也不太好。但我后来发现,其实可以对航模电机加以改造,所以后来的电机驱动器全是我自己做的,可以做到很小很便宜,再结合最新的运动控制技术,就可以把整体性能做得非常好。其实整个社会大部分创新,是组合式创新,我们需要把各个行业的一些想法、技术组合做新的实践,保证它是最前沿的,其实你就可以实现很多目标。”
G1采用3指力控灵巧手,通过力位混合控制,能模拟人手的各种精准操作
在2013年-2015年读研究生期间,王兴兴没什么资源和资金,却做出了一款当时特别火爆的产品XDog,拿到上海机器人设计大赛二等奖,这几乎是他一个人从头设计硬件、控制算法,自制驱动电机做出来的。相比之下波士顿动力的四足机器人,还是纯液压方案,虽然性能不错,但是很大、很贵、很重,那时候纯电机驱动方案还是比较领先的。
“在制造成本方面,我甚至认为机器人其实与家里的电风扇本质是一样的,都可以通过各种方法将成本做到极致。”王兴兴说,他认为大部分产品都可以分为“材料成本+加工成本”,如果能优化整个流程,找到合适的加工方法,其实可以省很多钱。
与王兴兴读研期间做了XDog类似,钛虎创始人易港也在大学时期,东拼西凑了4-5万元,在大学宿舍里买了3D打印机和焊台,自学3D建模和编程,模仿德国骨科隐形冠军企业奥托博克的产品,制作出了一款假肢原型机,并在中美创客大赛中获奖。
“做机器人,充满了工程方面的问题,很多时候不是凭智商,而是看你对这个东西是不是真的感兴趣,能不能去一点点钻研,尝试各种各样的方法去解决技术难题,而且还要在一定的量产与成本可控的条件下。”易港说。如今,钛虎主攻高性能一体化关节/执行器,延展到轻量级协作机械臂、人形机器人/外骨骼、灵巧手等,其产品主打高扭矩密度、体积小、重量轻,具备无框电机、减速器、驱动器、编码器自研设计能力,拥有机器人所需要的所有关节,可以说是最为全面的产品线。
如果从更全局的角度来看,人形机器人最核心的是软件+执行器,软件负责感知和决策,本质上与自动驾驶类似,都需要先感知环境,然后做路径规划和决策。而在硬件层面,也就是机械设计层面,最关键的就是执行器,它相当于机器人的“关节和肌肉”,让机器人可以做出各种动作,尤其是人形机器人,它的执行器数量要远远高于传统工业机器人,也是人形机器人的设计难点和重要成本项。
如果我们按功能拆解特斯拉Optimus Gen2的BoM成本,按Morgan Stanley的分析
“按分部”与“按功能”划分BoM成本
如果只看机器人的硬件成本,其中占比最大的就是一体化关节,它集成了伺服电机、驱动器、减速器和一些控制模块等。在传统工业机器人中,这些伺服电机、驱动器、减速器等部件并不需要太集成,它们可以在空间上各自分立,通过各种线缆和连接件进行连接,体积重量大。但人形机器人不可能这么做,而一体化关节/执行器的定位,就是在设计层面,将它们集成为一体化,实现更小体积、更轻重量、更强扭矩性能。
钛虎的关节产品
人形机器人还有一个特殊的核心零部件——灵巧手。它高度仿人手,是人形机器人执行动作的最终零件,十分重要且复杂,面临的最大难题是要在极小的空间内,驱动自由度极多、配备功率密度高、控制精度高的电机,对其性能要求极高。
比如特斯拉Optimus机器人,和人手一样同样使用5个手指,拥有11个自由度,拇指采用双电机驱动弯曲和侧摆,其它四指各用一个电机带动。电机采用蜗杆传动机构的目的,与腿部直线伺服如出一辙,采用机构自锁降低能耗。为追求形态美观及自适应性,手指采用拉线的传动机构,拥有负重20磅(9KG),和自适应抓取(能够抓取不同形状、尺寸的物体)的能力,可完成搬运、浇花等动作。这基本上就复制了人类手掌的功能设计。
4年前,易港还自主研发了一款灵巧手,“我也没想到这款产品在今天那么受欢迎,如今回头看,其实这是现在三大主流结构中的一个,我们当时为了做假肢,结果相当于开创了一个结构派系。”
在灵巧手的传动结构中,有奥托博克式的直线推杆方案,这个方案在2008年就实现了量产。另一种主流结构是拉绳式,类似于模仿人体的筋腱,拖一根绳子来传动。还有一种钛虎的专利,基于平行齿轮、锥齿,再加上三连杆的结构。“如果从美观度、抗冲击性、装配难易程度、成本等各个方面来看,第三种方案有其优势。”易港认为。
钛虎的灵巧手产品
机器人上半身的发展,直接决定了它现在能做什么。当然灵巧手的设计和应用并不容易,在这项技术成熟之前,采取夹爪(“两爪”、“三爪”)的方案也未尝不可,需要有选择性。比如银河通用在便利店场景的实际应用中,给机器人装上了吸盘和夹爪两种末端执行器,机器人可以自主决策需要用哪个,例如在需要拿矿泉水瓶时,夹爪就可以完成任务,但在抓取零食时,吸盘会更合适。
同时,银河通用还在针对灵巧手展开研究,因为面对过宽(夹爪的夹距有限)或光滑的物体,以及柔性物体(比如晾晒衣服,需要用衣架把衣服插起来)、复杂场景(拧瓶盖)时,灵巧手或许才是终极解决方案。
相比于AI大模型,在人形机器人领域,硬件的快速迭代也有很重要的影响。拿电动车产业举例子,传统燃油车至少需要三年时间的研发、七年时间的全球销售,才能收回成本开始盈利。但现在中国的智能电动车企业,已经能做到两年就迭代一个平台,因为如果不能在两年之内迭代一个平台的话,这个车型无论是在智能化方面,还是在续航里程方面就都跟不上。在光伏产业也类似,每隔几年就会有一个重要的技术迭代。一个新产线如果不能在两年之内实现产能交付,基本上也会被淘汰。
而机器人硬件水平每迭代一次,很多核心性能都会跃升一个台阶,而这恰恰是中国供应链的优势。比如减速器、电机的升级,对精度、力控都有决定性影响,这能极大升级机器人的可操作性。一旦研发成熟,到达制造环节,根据大多数制造业的规律,每当产量翻倍,成本将会降低10-30%,这在光伏和锂电池行业中,均有所体现。
“展望未来,整个机器人产业链,很可能比现在的汽车产业链更高一个量级。”易港说。
三、“人形机器人比自动驾驶更缺数据”
真机数据、仿真数据与机器人的数据饥渴症
“数据是AI下一个发展阶段的最大助推力,但真实世界的数据是远远不够的,这需要仿真数据来弥补。”光轮智能联合创始人兼COO杨海波说,“我们认为很快就能找到Scaling Law,那么机器人也将很快变成数据驱动,这也是我们做仿真合成数据的初衷。”
GPT-3.5之所以能产生划时代的突破,核心在于Scaling law,而这离不开数以百亿的训练数据。训练AI大模型的数据在互联网上容易获取,但对于机器人来说,直接可用的数据几乎为零。
能否获得高质量且足够便宜的数据,是当下制约机器人发展的瓶颈,也是拉开公司之间竞争的重要手段。前车之鉴是Everyday Robots,它曾是谷歌的明星独立项目,但在今年2月被谷歌因成本控制而解散,并入谷歌其他部门。
造成Everyday Robots成本高昂的一个重要原因,就是数据采集成本过于昂贵。OpenAI曾经也有一个机器人部门,但后来放弃了,问题也出在数据收集上。
为什么采集成本这么高?主要是因为Everyday Robots基于真实环境来收集数据。谷歌为了训练PaLM-E,用了13台机器人,收集了17个月,才拿到足够的数据量,如果是在更复杂的工业场景,数据采集成本会更高。
机器人的遥操作
“目前对于人形机器人来说,主流的数据获取手段分为两种:一种是真实数据,另一种是仿真数据。” 杨海波认为。
真实数据就是构建一个采集数据的基地,在里边搭建相关设备,比如遥操作、动作捕捉等等,比如家庭场景里的做饭,捕捉方方面面的动作数据,然后再对合并数据进行一些泛化,以及清洗,最终给到模型。
仿真数据则是完全在模拟器中进行的。首先用虚拟建模的方式,把环境场景搭建起来,然后再把机器人虚拟化放进去,形成一个动态的场景。这里面的一切物体,建模都要尽量接近真实,比如需要做一个苹果,那就要制作出大量不同的具体形态,比如不同的光照条件、不同的位置条件、不同的摩擦力情况等等。
从这样动态场景提取出来的数据,其实是一张张类似于“图片”的数据集,在这些“图片”上也需要补充针对性的标注,再给到机器人公司做算法训练。这个训练过程,就有点像特斯拉在训练FSD时,拿人类司机的真实驾驶视频训练。
仿真数据最核心的要求,就是尽可能的接近真实,真实度、泛化度都是重要指标。如何符合物理规律,是目前的一个难点,比如一个物体是软还是硬,这就需要更复杂的参数设计。
由于仿真数据多数是通过视觉,训练过程往往是,首先需要判断出来这个物体是什么材质,比如是个杯子,然后再去设计多大的力量,这个过程也可以加入大语言模型的能力。但这与在机器人的传动结构中,加一个力触觉是不同的技术方向。
所以,仿真数据与遥操作各有优劣。遥操作的优势在于,在将采集到的数据用于训练机器人后,这一项任务的成功率会很高。但劣势也很明显,机器人的能力缺乏泛化性。
比如在特斯拉训练机器人分拣电池的例子中,就是通过人类带着VR眼镜,去遥控操作机器人采集而来的。通过这种方法训练出来的机器人,几乎只会重复遥操作时的动作,比如把一个电池放到三乘三的盒子里,但当你把电池换成矿泉水瓶,同时将盒子换成更大的四乘六时,机器人就不知道怎么办了,这时候就又需要重新进行遥操作再去训练。在没有形成海量数据的时候,每做一个新动作都非常吃力,数据采集成本很高,并且难以在短时间获取大量数据。
与遥操作对比,仿真数据的优劣势几乎相反。首先可以用低成本生产海量数据,同时机器人在经过训练以后,能力是泛化的,因为可以仿真制造一系列所需要的场景和交互,以使机器人可以解决各种问题。
当然,仿真数据的劣势也很明显,问题主要出在仿真还不够接近真实,当把通过仿真数据训练的机器人用在真实场景中时,存在一定的失败率,比如在抓取任务中,因为光照、环境等各种因素的改变,机器人可能以为抓到了,但其实没抓到。
提高数据规模,尝试将大模型训练中的Scaling Law,应用在机器人仿真训练数据中,可能是准确率不足的解决之道。
在王鹤看来,他在一开始尝试用仿真数据时,也遭遇了准确率不足的问题。不过他很快意识到,当时只用了一个百万级的数据集,如果把规模扩大会怎样?
“我们自己的实验发现,比如在抓取这个任务上,在用灵巧手抓取没有见过的、随机乱放的物体时,在有十亿次抓取数据的情况下,机器人的成功率能到 86%,如果数据量缩到万分之一,也就是 10 万次抓取时,成功率就只有 58%。这说明具身智能也有清晰的 scaling law,它对数据有更大渴求。”王鹤说。
“传统的仿真是以测试为中心的,而为具身智能服务的仿真,则是需要以训练为中心。”光轮智能CEO谢晨说,他认为好的仿真数据首先要有自我真实性、效用性评测能力,如果没有这些,仿真数据也很难让客户的算法有所提升。谢晨曾在英伟达负责自动驾驶仿真,国际首创将生成式AI融入仿真,从0-1开发落地仿真数据,后选择回国创立光轮智能。
“仿真数据不会取代真实数据,而是放大它。” 他认为终极的Data for AI,会是真实的人的示范数据,与仿真数据能力的乘积。
==========================
过去10年,AI给太多行业带来过希望和失望。而今天的人形机器人,正越来越逼近临界点。虽然机器人至今没有清晰的产品形态,但经纬创投看到每一家机器人创业公司都在尝试各自的应用场景,像已经投资的四家机器人软硬件一体化公司(宇树科技、智元机器人、银河通用、星尘智能),再配合着产业链上游的核心一体化关节(钛虎机器人)、仿真数据(光轮智能),都在不同场景下有非常好的应用。
这一波人形机器人公司的短期目标,都是快速占领各自的应用场景,谁先把一个细分场景做好,积累出足够多的数据,就能建立护城河,再去拓展新领域,最终走向通用化。
而机器人的发展离不开硬件。与欧美市场对比,经纬创投看到国内很多初创公司的硬件迭代能力,比海外要快很多,成本控制能力更好,在某些硬件细节方面超越了海外同行。
全球化几乎是中国通用机器人公司的必选战略,且与电动车行业不同,其在全球化中遇到的障碍会更小。其中一个原因是,几乎没有一个国家具备有规模的机器人产业,此时出海不会冲击当地的产业结构,只要产品质量和应用体验足够好,出海溢价可能达到国内的5倍以上,这将为中国通用机器人企业提供广阔的国际市场。
人形机器人能发展到今天的位置,来之不易。“我记得在2016年的时候,那时我还在百度,有一次参加完一个NLP的会议,结束之后充满了挫败感,感觉好像这辈子都看不到真正的应用,你也不知道那时的投入到底是不是对的。”星尘创始人来杰回忆,“但我也经常反思,从我过去十几年对未来的预判里,我发现AI和机器人整体的发展速度,又是大大超出我的预期了。短期内你永远会看到很多困难,但这么多聪明的头脑,其实在解决一个又一个问题,产生了一个又一个技术突破,就像有一只巨大的手在促使这个行业往上升,这给我带来很大的能量,让我一直坚守在这个行业里。”
“技术是一个日新月异的事儿,你无论是在做你的老本行,还是做一件新事,你都有可能明天就被更新的技术给‘卷’了,AI和机器人行业尤其如此。与其说按兵不动,还不如主动的去创造变化。” 光轮智能创始人兼CEO谢晨说,“所以在我看来,现在的创业成本其实比之前要低太多了,因为现在不变的成本太高了。”
另一方面,虽然最终的目标是通用化,但在当下早期的发展阶段,机器人的产品定义并不明确。由于劳动力和任务需求是多元的,人形机器人公司短期内也不会只有唯一的巨头,将会有很多公司围绕不同细分市场,走不同的技术方向,积累该场景下的数据护城河,这种“条条大路通罗马”的局面会维持一段时间。
一些公司选择把主要精力放在机器人的“上半身”。比如银河通用选择的落地场景是无人值守药店(特别是夜班),其首代产品盖博特机器人,“下半身”就采取了轮式底盘+折叠本体的设计。之所以采取这样的设计,首先因为轮式底盘在零售场景里,已经完全可以覆盖绝大部分应用。而折叠的设计,往上可以摸到2.4米,可以覆盖最高的货架,机器人可以拿到所有货物。
往下也可以摸到地面,比如当有产品不小心掉到地面上时,机器人也可以自己捡起来。这些都是目前机器人的双腿结构,比较难解决的问题,而在当下集中精力先研发“手”,可能能够率先实现应用价值。
星尘智能创始人来杰则将自己的机器人产品定义为“助理”,辅助人,而非替代人。首要的场景就是那些脑力劳动更多,但却经常陷入一些重复操作的事情上。最典型的例子就是生物医疗和化学实验,这些都是需要高智力劳动,但却绕不开重复操作的领域。此时一个合格的机器人助理,可以解放这些教授、博士们双手,他们只需要设计实验,而所有操作都可以让机器人准确无误、不分昼夜的去完成。如果给一位生物教授配10个机器人助理,他用于创造的时间甚至可以翻几倍。
来杰也非常重视“软硬一体”的能力。得益于在腾讯RoboticsX机器人实验室的经历,他非常重视架构,“我们与腾讯RoboticsX机器人实验室的架构就很相似,一半主攻机器人软硬件一体化,另一半强调用AI算法去做感知和运动控制,以此来探索AI和机器人的强耦合。”
星尘融合了触觉感知进行力控抓取,并结合规模化数据综合训练,包括人体动作视频演示、动捕、遥操作采集等方案。来杰非常重视传动结构中的刚、柔结合,也装入了一些传感器以在传动过程中,能一直监测力的传输。比如机器人在削黄瓜时,星尘的机器人并不是去估算轨迹,而是与人类一样,通过感知削皮刀在压到黄瓜上时,力量的大小,来控制力量的输出,这种特殊的传动结构,能使精度更上一层楼。
“当下,离我们想要的具身智能之间,还有两个重要的Gap(差距)没有解决。”星尘智能创始人来杰说。
第一个Gap是AI大模型和机器人之间,有时候一些问题的产生,并不是单纯靠扩大数据规模,或是算法就可以解决,而是需要在机器人层面去进行提升,这是硬件带来的。
第二个Gap是在硬件本身的表达能力足够的前提下,AI如何更好地结合硬件的能力。比如说AI是否可能完全自主地进行学习和尝试?假设有一个机器人在办公环境下,它本来什么都不知道,只知道一些基础动作,然后让它自己去建语义地图,自己去理解环境,自己去观察其他人的操作,然后把所有动作学会,这就跟我们人类很像。当然,这也是Yann LeCun所提出的“世界模型”。
彭志辉在最近的发布会上,对整个具身技术成熟度等级,做了从G1-G5的划分,这类似于自动驾驶的L1-L5:
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”