你是什么垃圾?人工智能面对干垃圾和湿垃圾“有点蒙”
科技
科技 > 科技创新 > 正文

你是什么垃圾?人工智能面对干垃圾和湿垃圾“有点蒙”

当你工作累了一天回家休息,你说“放一首歌吧”,然后智能音箱就自动放出你最喜欢的歌曲。当你在超市里堆满购物车后,只需对着摄像头进行人脸识别从而完成支付,甚至可以不用掏出手机。

这就是人工智能在生活中的应用。随着人工智能在语音识别与合成、图像识别、自然语义理解等方向取得突破,越来越多的生活场景开始出现人工智能的应用。

当复杂的垃圾需要分类处理时,人们也想到了人工智能,并期望它能够帮助他们做出判断。2019年7月,上海率先开始实行区域性的生活垃圾管理条例,随后北京传出也将出台相关制度。

互联网巨头如阿里巴巴、腾讯开始推出垃圾识别的应用程序,其背后通过物品的视觉识别做出垃圾分类的判断。一些此前并不涉及垃圾行业的企业如平安、中国电信也开始利用人工智能的技术推出不同的解决方案。打开应用商店,更是出现了近百个垃圾分类的应用,记者通过下载测试发现,其大多数为个人开发者制作,由于技术能力的限制,他们更多选择语音对话的形式完成,也有部分具备了图片识别的能力。

然而,当人们使用这些应用后会有这样的疑问,这些应用真的提高效率了吗?有人工智能公司的技术专家告诉记者,这些匆忙发布的产品,很多数据训练的样本并不足以支持其满足日常使用的准确率,“他们的识别率只有20%~30%”。

让机器理解干垃圾和湿垃圾是个难题

微软亚洲研究院主管研究员傅建龙告诉记者,目前来看,视觉识别技术落地在垃圾分类领域主要有三个难题,分别是核心技术算法,产品的设计以及使用习惯难以被改变。在这背后,当商品成为垃圾后,其发生的变化使其定义复杂化,也就是“非标准化”。

然而,计算机的优势就是处理定义好的问题,并且问题中有大量数据可以学习。通常情况,无论是语音,还是图像,机器想要认识它,就必须经过两个过程,也就是人工智能技术成为产品的两个阶段,分别被称之为“训练”算法和利用算法“推理”结论。

无论是在训练阶段,还是在推理阶段,投入大量的样本数据是提高识别率的必要条件。傅建龙表示,在此前的尝试中,他们也曾投入过小样本数据进行模拟训练,也就是让计算机对一个类别通过对几百个样本学习,达到可以做出判断的程度。但在这个过程中,他们发现了一个问题,就是垃圾本身不仅类别广,而且总有新的类别产生,影响判断。

在推理阶段,如何让机器理解干垃圾和湿垃圾本身也是一个难题。这就像计算机很容易识别出一把雨伞,但很难理解人将使用雨伞去遮阳,还是去挡雨。在学会这个问题的阶段,计算机需要专业知识的输入来学习和理解真正的意图,或者说是为垃圾引入“上下文”。

因此,对于前端用户用手机拍摄识别的过程,多数受访人工智能专家并不认为技术目前可以取代人眼的效率。

金融壹账通智能风控总经理、人工智能研究院首席科学家施奕明表示,针对部分用户来说,拍照识别是一个比较高效的辅助方式。因为其看到在已经实施垃圾分类的上海,需要大批志愿者帮助用户进行垃圾分类和检查是否正确,这需要大量的人工,而且工作也非常艰巨。作为平安旗下的业务部门,其在2-3周的时间内发布了一款垃圾分类的小程序。

混合垃圾识别困难,机器需要更多样本学习

从垃圾箱到处理厂后,垃圾的数量急剧上升,这为人工智能提供了大量的样本可以学习。旷视研究院研发总监、检测组组长俞刚告诉记者,在垃圾回收站做批量分拣,这时AI视觉应用将极大利于效率的提升。

在这个环节,目前视觉识别技术也只是萌芽。拍摄图像分类的问题解决后,更重要的是还需要解决识别物体是什么,以及从混合在一起的垃圾中识别更加的困难,因为要避免遮挡以及物体变形对识别的影响。一位人工智能独角兽公司的专家告诉记者,“人可以推理,但机器需要更多的样本学习,目前算法和人的肉眼识别还有一定的差距。”

不过,傅建龙告诉记者,目前计算机视觉识别新的研究方法就是计算机对物体抽取一个部分进行识别,从而确定物体本身。如果被遮挡的物体露出了相应的识别点,就可以被机器捕捉。此外,将视角从2D转向3D,也可以克服多目标和遮挡的问题。

在实际应用中,上述人工智能专家表示,海外企业使用了多个传感器和机械臂结合,垃圾在传送过程中就被自动分类抓取。这种商业模式的产生,是人力成本的增长。但随着人工智能技术成熟,会给工厂带来更大的成本节省。

在这种模式下,视觉识别的算法需要与机械臂联动,而这其中需要一整套的系统解决方案。目前比较大的问题是,需要针对需求进行定制,不同区域不同的分类标准都需要做精准的调整,因为必须要达到人工的水平,甚至要超过人工,这样的投入才有意义。

新京报记者 梁辰 编辑 徐超 校对 范锦春

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载