除了看和听之外,AI能拥有触觉吗?
作者:CQITer小编 时间:2018-06-30 09:13

AI近几年的快速发展离不开深度学习方法的深入研究,而深度学习提升AI能力的最显著表现,目前来看主要集中在两个方面:图像识别和语音识别。
通过对图像的语义分割,图像识别技术已经应用得特别广泛。在手机摄影、拍照购物、刷脸支付等各种领域,图像识别给我们带来了极大的便利。同时,基于语音识别的各种语音助手比如智能音箱等,也在悄然描画智能家居的未来。可以说,单单是在视觉和听觉这两个方面的技术突破,AI就已经给世界带来了巨大改变。
但是,人有五感,除了视觉和听觉之外,还有非常重要的触觉。曾经有个人做实验,看看蒙上眼睛堵上耳朵再绑手脚这人会怎样,结果差点儿整出精神病。
那么具体到AI这件事上,仅仅发展其视觉和听觉技术已经逐步呈现了“瘸腿走路”的特征。如今,或许是时候讨论一下给它加上触觉这件事了。
视觉和听觉长板下的触觉短板
视觉和听觉技术发展的优点是显而易见的,其最重要的作用也集中在两个字上:识别。
为什么视觉的识别和听觉的识别技术这么重要,而且被首先开发出来呢?笔者认为主要有以下几个方面的原因。
第一,视觉和听觉是判断某一个物体特性的基本方法。
如何确定一个人是张三而不是李四?首先我们要看他的脸,千人一面这件事儿基本不可能,脸也就成为了一个人区别于他人最显而易见的特征。其次,每个人的声音可以说也是藏在身体里的一道独特密码。所以,要让AI认出人,视觉和听觉的技术研发就首当其冲了。
第二,识别在现实生活中蕴藏着人类的巨大需求。
无论是工作还是学习,亦或是企业的生产,几乎离不开视听尤其是视觉技术。比如摄像头监控到了工业生产流程、镜头下的人们的动态,但是如何识别这些海量内容就成为了人们的难题。又如各种场景下物联网生态的构建,如果没有视听,万物互联也就成为了无本之源。
第三,视听技术的突破得益于技术的长期积累。
计算机视觉分析早在上个世纪六十年代就已经走进了科学家们的研究视线,而以鸡尾酒会为代表的语音识别则是在更早的一九五三年。经过半个多世纪的发展,关于机器视觉和语音识别问题的研究成果已经非常丰富,近年来兴起的深度学习方法则助推其进入了一个发展的高潮。
事实上,两种技术的大规模应用也确实为无论是B端还是C端的用户都带来了巨大的便利之处。但是随着人们对AI应用能力的要求的提高,视觉和听觉这两块长板显然已经弥补不了触觉短板带来的问题。
比如倒水这件事。倒水和接水是有很大区别的。接水只需要给机器定一个出水的量,量满即止,就不会出现洒溢的问题。而要想机器实现像人一样倒水,就不是这么简单了,它不仅要涉及到视觉观察水杯在哪儿、是否对准了杯口、水杯是否已经倒满,还必须要保证拿到的被子不会滑落。那么,这个时候只依靠视觉识别就不够了,毕竟机感受杯子会掉这件事触觉肯定比视觉来得快,不然现实中也就不会有那么多人会被烫伤了。
由此可见,虽然AI不再是瞎子、聋子,但随着其不断长大,触觉障碍带来的麻烦恐怕也就会越来越多。
从皮肤到虚拟现实:身处闺中的触觉模拟
人的皮肤上遍布着触觉感受器,其将来自外界的温度、湿度、压力、疼痛等刺激通过神经传递给大脑,然后作出分析和应对,这就是人的触觉活动的一个基本逻辑。
如果一个人的触觉失灵,最大的危害就是其将无法感受到来自外界的危险,进而无法做出反应。现实中有很多这样的例子,有人天生痛觉缺失,受伤就成了家常便饭。那么用到机器人的身上,触觉的缺失就意味着必须要从其他方面迂回地为其设计自我保护系统。
那么,有没有什么办法让虚拟触觉成为现实呢?
事实上,研究者们在实验室里探索虚拟触觉的脚步一直以来并没有停止。只是由于触觉系统的复杂性,比如如何模拟皮肤触觉感受器对不同刺激的感知等,导致触觉研究基本上仍然停留在实验室和论文当中,其在市场上的应用还不够成熟。关于触觉的研究,目前来看主要还是通过开发模拟触觉感受器的传感器,表现在以下几个方面。
模拟电子皮肤。由于触觉最直接的是由皮肤感受到的,所以电子皮肤也就成为了触觉研究者们最青睐的课题。针对复杂的触觉系统,研究者们同样是采取了针对不同的刺激类别而研发不同的皮肤传感器,80年代以来,分别研发了专门感应温度、湿度、力度等各个方面的传感器。





