打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
未来机器人入门系列

机器人2025本期导读

第一版:

未来机器人入门系列——预测未来20年的发展

第二版:

麻省理工脑控机器人:通过 EEG 信号实时纠正机器人所犯的错

继谷歌亚马逊之后Line推出AI语音助手

Facebook用人工智能技术预防用户自杀

第三版:

智能工厂缔造者——科捷机器人介绍

第四版:

漫画:编程其实是文科


作者:Top Liu

著作权归作者所有,本文由作者授权转载


本系列将未来机器人的突破点分为6个创新领域:机械结构、硬件、电子、软件、连通性、控制。将依次介绍这6个类别,并以此预测未来20年的发展。


未来机器人入门——1:机械结构


机器人的机械结构(底盘、几何结构、关节)没有得到足够的重视,但对机器人设计而言,这是非常重要的一个方面。机器人如何运动、有多重、以及重量是如何分布在整个机械结构上的,解决这些物理学上的问题对与一个机器人设计是否成功至关重要。毕竟,机器人的活动还是有局限的。我们常常会让马达超负荷达到其断裂点。机械手的重量也直接影响了臂轴处可采用的马达技术。而这反过来也显著影响了机器人的最终成本。


几何结构和重量也非常重要,并有一些针对这些问题的专项研究。其中有一项研究称为被动行走,在我们的祖父母辈那个时代,有一种木头玩具,不需要电池甚至不需要弹簧作为临时储能装置,就能够从小斜坡上面往下行走。今天的研究人员已经开发出了一种真人尺寸的机器人机械结构,能够在没有任何净能量消耗的情况下沿着小斜坡往下走。这些先驱们探索重量和力学的边界,来创造高效节能的机器人。这些机器人爬坡时只需要消耗传统行走机器人所需的一小部分的能量([McGeer 1990; Omer et al. 2009]_)。


进行机器人机械结构的研究,曾经是一项非常具有挑战性的工作,因为要实现一个新的设计则需要实验室配备高端的机械加工和制造设备,包括车床、铣床和焊接设备。但是在过去的5年间,在低成本、快速原型的制造方面发生了一场小小的革命,这得归功于3D打印技术和激光切割技术的发展。3D打印机通过加热并沉淀可塑材料的方式,每次循环沉淀一层,可以创造出任何立体形状。激光切割机能够将塑料、木制品、甚至是金属切割成复杂的零件模块,再将这些模块组装成新的机器人框架。现在,每个机器人实验室在发明出新的形状后,都有能力在数小时或者数天内制作出原型并进行测试,而且耗费不多、所以在短短一周内就可以做出几十、甚至几百个实验用机器人机体。


过去机器人研究的一个特点是,每个实验室都塞满了看起来差不多的机器人,因为研究者们都是从三四家制造商那儿购买机器人,而这些制造商都大批量地生产一模一样的圆形垃圾桶大小尺寸的机器人。现在,机器人实验室有了众多可选择的机器人方案,甚至是自定制机器人。这种创造性的大爆发类似于寒武纪时代出现的哺乳动物大分化:每个实验室都有着各式各样大小不一、重量不等、形状各异的机器人——而且每个实验室的机器人“围栏”看起来都跟邻近的实验室完全不同。


在未来十年间,机器人的机械结构,尤其是它在两个特定领域:高自由度(DOF)机器人和飞行机器人将会受益于这种机器人寒武纪的多样性大爆发。高自由度机器人有着大量的关节和马达,这意味着,相比与那些只能简单地前进后退和转向的传统机器人小车,这种机器人能够以更为精细的方式与物理环境互动。自由度实现了腿和髋关节的自由运动,使得机器人能够使用楼梯,从而将其活动范围扩展到我们大部分的生活居所;有了手臂和肩关节,机器人可以操作所有那些我们人类每天都会使用的设备,从电灯开关、冰箱,到洗衣机。更高的自由度意味着会有更多的机械手、尾巴,以及更高的像蛇一样的灵活度。十年前,机器人能够像6岁孩子一样玩单杠。现在,为军事侦察而设计的蛇形机器人能够爬进4英寸的缝隙。类人型家庭服务机器人能够打开冰箱的门,看到里面的瓶子,挪开周围的物品,将手伸进去,把啤酒取出来。我们可以很容易地去设想运用机器人去做那些我们人类做不到的事情——从爬树穿过林冠,到蛇形穿过下水道系统,攀爬任何排雨水管,以及爬行穿过乱石堆对救灾现场进行搜索。


在蛇形机器人和其他一些高自由度机器人领域内,重量和马达强度是最主要的问题,而对于飞行机器人来说,这些问题则更为关键。快速的结构仿真、原型制造以及测试对于飞行机器人来说将会是具有颠覆性影响的。只要去逛一下本地的电子市场,你就能看到一些这样的进展。十年前,一个小型远程控制直升机就得花上数百美元,并且一次只能飞两分钟。而现在,人人都能花上14美元买到并操纵飞行一架手掌大小的直升机。


机器人控制在飞行器上的应用,已经将这种新一代廉价直升机推向了一个全新的高度。视觉系统能够实时地检测直升机所在的确切的方位,自动控制系统能够精确地控制直升机飞行,如控制直升机旋转上升、急转弯、穿过两边都只留有一英寸间隙的狭窄的垂直缺口。它们可以在壁架上着陆以节省电力,稍后再起飞(Mellinger, Michael, and Kumar 2010)。研究实验室曾公开过一些视频,20架机器人直升机在空中盘旋并以紧凑的队形飞行,甚至动态地改变队形成对地同步穿过窗户框(A Swarm of Nano Quadrotors 2012)。现在,这些演示效果还要依赖于天花板上安装的摄像头和外部计算机控制,但在不久的将来,这些限制将会不复存在。空气动力学和控制——机器人的外形、重量分布、机械配置、自动控制——是飞行机器人飞行的关键技术,它们会使飞行机器人变得很便宜、机动性更强,并且只依靠很少的电力就能保持滞空。现在我们梦想中的飞行机器人,将随着先进的3D制造技术,特别是新型塑料和弹性材料的应用而成为现实。我相信机器人的“寒武纪大爆发”现在只是一个开始,其创造性的发展轨迹在规模和形式上都将呈现出急剧上升趋势。



未来机器人入门——2:硬件


在机器人技术发展的分类中,硬件是最难以作出预测的。硬件方面绝对需要重大革新,但我们不能简单地依据最近的历史来预测未来硬件革新的速度。在计算机设计中,摩尔定律曾准确地预测出处理器升级的速度——每18个月处理器速率翻一倍。但在硬件技术,比如电池和电机领域却没有这种摩尔定律。事实上电池和电机的研究已经枯竭多年,来之不易的研究成果也没有取得商业应用上的成功。


然而,新的进展已经出现了,而且它们的最终出现也产生了颠覆性的影响。尽管颇具争议,但本田公司的ASIMO机器人曾被认为是激起公众对机器人想象力的最上镜且最具魅力的大型机器人之一,关于它,在机器人研究圈子里流传着一个有趣的故事。ASIMO项目中一位领军的日本人工程师曾做过一次巡回旅行,在美国的大学展示自己的机器人并含糊其辞地回答一些问题。一次他在毫无准备的情况下坦诚地说道,他们必须克服的一个杀手级问题就是马达。换句话说,只要他们能够解决如何制作机器人每个关节的马达这个问题,相比之下,其余的人形机器人的开发工作就简单多了。


马达技术确实限制了机器人的发展。一部分原因与马达和生物系统里的关节和肌肉的工作机制截然不同有关。我们人类的关节既轻又极具弹性。每个关节的柔韧度和肌肉的硬度是可以控制的,因此在击剑运动中,你能够在招架的同时保持肌肉的放松,轻易地将手中的花剑移至侧面;或者是在扳腕较量中使胳膊上的肌肉变硬,保持牢固不被扳倒。我们的关节的活动速度也非常快,更不用说蜂鸟和蝴蝶了。


相比之下,以前的电机是笨重、高能耗、僵硬的。如果你给电机增加齿轮箱,便能够增大输出扭矩,但同时也降低了转动速率,而且使输出轴难以被转动——不花点力气你就无法用手扭动机械臂,无法用手转动齿轮箱的输出轴。如果你制作小型机械臂时内置轻型电机,即使机械臂和人的胳膊一样轻,机械臂也完全不可能举起一个咖啡杯。并且这个任务对于要求能够在家里扶老人下床,协助他们去卫生间的机器人就太过简单了,机器人要完成这些动作必须同时具备柔韧性、弹性以及相当大的力度。


有一段时间,很多人认为机器人马达的未来应该是像人的肌肉那样工作的系统,镍钛合金金属肌肉纤维技术被誉为下一个革命性的进步。这种金属纤维能够随着电流变化而伸展收缩,人们设计了巧妙的装置来使多簇同类的纤维平行工作用来负重,以及将其活动范围从几毫米扩展至几厘米以及更长距离。然而,整体能源效率和疲劳度方面的挑战将这种金属肌肉纤维的应用缩小局限在某些领域,譬如医疗机器人领域。在这个领域,严格受控的环境可令其工作地非常理想。


尽管如此,最近新型马达的设计工作在高动态、可控马达方面已经有所成就。研究者们正在开发一种将电机和可调节弹簧整合起来的关节,这一整套的系统能够能精巧地应对外来冲击力。更为精巧的马达已经具备了内置的压力感知,而且它能够实现极为快速的控制,马达的电子器件能感知作用在马达上的外部压力并对这些压力做出实时反应以输出任意期望的刚度和韧度。总有一天,这将使机器手能够与人进行有力而又安全的握手、折纸、甚至是在保持蛋黄完整的前提下打破鸡蛋。马达之所以得以进步,其中一个原因是虽然它们本身并不遵循摩尔定律,但却得益于不断进步的嵌入式控制电路和软件,这样摩尔定律可以通过另一条途径影响未来马达技术。


可能会对机器人的发展产生巨大影响的另一类硬件是电池。发明一款革命性的电池已证明是难以做到的,因为它不像计算机芯片设计的那种增量式进步,可以预测其未来数年、数十年的发展,电池的发展依赖于化学和材料合成领域中基础的、颠覆性的发现。何时会出现这些发现?无人确知。在计算领域,摩尔定律暗示,每18个月处理器的处理速率将翻一倍。相比之下,我们来看电池技术的发展。1860年,我们发明了第一块铅酸蓄电池,这款电池的能量密度大约是每千克30瓦时(W?h/kg),即电池内每1千克的物质能够以30瓦的电力放电1个小时。直到1988年镍氢电池(NiMH)的出现,能量密度值才翻倍,达到了60W?h/kg。同一台机器,只需要0.5千克的镍氢电池,就能提供早些年1千克铅酸蓄电池提供的电力。到了1997年,锂聚合物电池达到了一个新的能量密度级别,180W?h/kg,但是时至今日,生产锂聚合物电池的成本仍然比30年前镍氢电池的生产成本高。现在让我们小小地震撼一下,用这些数字与汽油相比:13000W?h/kg,几滴汽油,总重2.5克,就能提供一千克铅酸蓄电池所能释放的能量。


简而言之,这就是电动汽车和小型机器人需要克服的挑战。再具体一点,假设有一个体重50千克,大小与人相当的可行走机器人,它需要平均350瓦的能源供应。让这样一个机器人连续工作6个小时,需要使用70千克的铅酸蓄电池,镍氢电池则需35千克,高端锂电池仅需12千克,而如果是汽油则仅仅需要10大汤勺的量而已。


市场上存在着众多需要对电池进行改进,同时降低移动产品的能量消耗的商业压力。得益于平板电脑和智能手机产业的发展,这些领域的商业投资将使得未来的机器人在运算上会消耗更少的能量,并且终将会推出更轻、更便宜的电池。但是请记住,电池生产成本的方程往往由其材料所主导——因此对于价格便宜的小型飞行机器人而言,规模经济不会必然性地将先进的锂电池的价格降低到能使其显著受益的程度。


跟马达一样,电池的研究也需要工程师们做出实实在在的创新,从而创造出全新一代的替代品。另一方面,燃料电池和光伏电池也需要有类似的革命性突破。所有的这些技术挑战主要是阻碍了小型机器人的发展,因为这类机器人需要重量轻但又高能的电力供应。与之形成对比,在未来十年内即使电池技术只是渐进式发展,也足以满足那些重达数十磅数百磅的大型机器人的需求了。下一代的燃料电池、大容量电池,甚至是汽油引擎,都足够让这些大型机器人奔跑、跳跃、游走于大街小巷。



未来机器人入门——3:电子


机器人电子技术的发展沿着一条迂回的路径前进,只是现在才有了稳定的进展,这些进展指明了未来的趋势。机器人沙基(Shakey)属于第一代研究型机器人,由加利福尼亚州门洛帕克市的斯坦福研究院(现在称为SRI国际)的人工智能中心建造(Wilber 1972; Nilsson 1984)。在1971年,这个机器人所用的技术已经远远超越了它所处的时代:它能够在实验室的各个隔间之间导航,用视觉确定自己的位置,以及识别障碍物。想象一下,在计算机的人机接口仍然是电传打字机、还没有文字显示的计算机显示器的时代,机器人沙基就已经能够使用视频摄像头进行视觉导航了!机器人沙基并不仅仅局限于它六英尺高的身躯,他的组件还包括了一个房间大小的PDP-10和PDP-15计算机,这些计算机不停地与他的硬件通讯。换句话说,这个机器人并不是自足的,它还依赖于自己身体以外的各种计算资源。


20世纪80和90年代出现了一种趋势,研究者们试图去实现他们梦寐以求的目标:独立自足的移动机器人。在研究者们眼里,这种挑战就是让机器人不依赖于任何外部资源,也就是说将所有需要的资源全部塞进机器人身体里。在能源和重量的限制下,要求大量的电子工程设计以实现尽可能多的感知处理,得益于前人在这方面的努力,在二十世纪末,机器人才开始真正成为一个自足的系统。


后来便是软件即服务的时代,以及在机器人上的应用,这种应用在架构上希望机器人能够利用尽可能多的互联网资源。例如,调用外部资源做人脸识别,这样机器人就能搭载更少的电子器件,且能够识别出机器人实验室里的每个人,并对他们说“早安”。随着网络数据传输速率不断增长,互联网被认为是将机器人小型化同时又保持其拥有高智能行为的绝佳方案。


随着回归沙基机器人理念的接受,视频游戏实体化也随之而来。Wii远程控制器,使得任天堂游戏机的玩家在显示屏前面通过肢体动作就能玩游戏,这意味着视频游戏电子设备的开发者们已经开始生产手持电子设备了,机器人研究者可以直接利用这些设备。低成本高精度的加速度计和陀螺仪改变了游戏规则,首先得益于视频游戏,现在又得益于由智能手机所创造的规模经济效应,现在只需要几美元,就能购买大量的本体传感器密集地集成在小型机器人里面。


这种趋势随着微软的Kinect的推出而进入高速发展阶段。Kinect是一个电子摄像头系统,有了它,人们的手势、肢体动作能够通过Xbox游戏机与视频游戏关联起来。大量机器人方面的研究文章指出了一些方式,移动机器人利用这些方式现在能够通过可编程的Kinect传感器来检测墙壁和障碍物,以及实现以前很难实现的人机接口(HRI)——例如,人类对机器人的手势控制,或者用Kinect与人类跳舞的机器人。这样看来,我们正再次回到复杂的机载电子技术的时代,但现在与以往不同的是,大批量、低利润的交互式消费电子产品的时代已经到来了。随着这种交互性的复兴,任何新型电子设备的发明都将可以直接应用于机器人,并且通过必要的改装使机器人更智能更先进。


设想一下手机和游戏的未来:从检测你是否正在开会,到感知你的位置、温度和湿度等环境数据,以及你是否昏昏入睡或者处于兴奋状态——所有这些物理感知电子设备都将以零部件的形式安装在机器人体内。任何让手机融入我们的日常活动的新方式,同样也能让机器人更全面地检测环境并对环境做出反应。


当然,视频游戏、在线娱乐、真实世界中的娱乐活动、以及移动通信技术的界线将变得模糊。在我们的活动范围内所有的设备将变得更加具有交互能力,而且这些交互将由更多的自然交互行为所驱动,包括语音、眼神、手势。越来越多的个人用品将具有自主能力,就像是一个好管家一样,按照我们的意愿或者高级指令做出行动:正确地找到并预定餐厅,重新安排我们的日程,甚至是根据观察我们正在做什么而过滤我们的电话。


也许“机器人”这个词的含义将变得模糊,因为手机将会越来越像一个机器人,并且机器人也将大量当作成熟的视频通讯设备使用,使我们在出门在外的时候也能哄孩子睡觉或者是造访同事。无论如何,得益于电子相关行业的不断发展,我们今天所设想到的机器人技术将会变得更加成熟、更加智能。



未来机器人入门——4:软件


机器人软件的发展围绕着一段试图为程序设计创造出一个标准框架的有趣的历史而展开,理论上,这种框架能以开放共享的方式逐步提高所有机器人的能力。标准框架方面的努力通常是从计算标准化的成功中寻找启示,而且这些努力已经在软件开发中获得了最好的实践,并试图将这些成果应用在机器人研究上。


但是,机器人远比计算机更为多样化,受制于此,在机器人研究上的这种尝试只取得了部分成功。计算机之间有相似的结构,并使用类似的处理器和零部件。然而机器人们虽在外表上看起来很像,但内部结构却完全不同:例如,一个机器人使用无线电收发器和低成本的处理器,而另一个则使用成熟的计算机和定制的传感器。标准化在这些差异性面前几乎就是矛盾的。但是,这并没有妨碍那些大公司做出最大的努力。


作为基于社区的互联网工程任务组(Internet Engineering Task Force:IETF)早期的重要参与者,2002年,英特尔公司和其他一些公司率先开发社区和程序以实现机器人技术的标准化(no virtual host specified)。他们的想法是在这个成功模式基础上规范机器人技术。基于它所具备的兼容性、开放性和一致性,IETF成功地协助完成了互联网的规范化。通过提议建立机器人工程任务组(Robotics Engineering Task Force:RETF)从而将这些概念引入机器人技术,这似乎是合理尝试的第一步,但是,这种尝试在把基于一致性的方法应用于最简单的问题时,就已经困难重重了:例如为机器人零部件编写一系列标准化的规范。机器人技术可不是那么轻易就能对传感器、马达、处理器进行定义的——不是因为努力不够,而是因为一个研究者的马达,按照字面定义却可能是另一个人的传感知器。即便是机器人这个词也太难定义了,标准化似乎也只是一个目标,但还没到实现这个目标的时候。


避开硬件上追求一致的目标,微软从2005年开始借助Microsoft Robotics Studio独自进行机器人技术编程的标准化尝试(Jackson 2007)。微软的目标是为机器人开发一个统一的编程接口,这种接口对爱好者、教育工作者、甚至从业人员都是很有价值的。应用目标的多样性迫使微软要同时解决多方面的需求,例如爱好者和教育工作者要求容易上手,研究工作者们要求具备如实时控制之类的高性能,还有工业装配线机器人之类的商业应用的需求。同时,微软希望支持一种基于服务的架构,以便机器人和机器人进程能够发布和订阅如同人脸追踪、导航、远程控制之类的服务。最后,为了满足消费者如此多样化的需求,它们生产出了一个产品,而且这个产品已经被一部分人所使用,但是还没能成为广泛的社区性标准。对于一个标准的诞生来说,2005年似乎还是太早了。


2008年,一个叫Willow Garage的新公司依靠其机器人操作系统(Robot Operating System,ROS)加入了竞争行列。英特尔的OpenCV库由一系列开源的计算机视觉程序组成,它对爱好者、教育工作者和研究者们在计算机视觉方面的工作影响很大。ROS就是从英特尔公司先前十年间OpenCV上所取得的成功中获取了灵感(Bradski and Kaehler 2008)。选择重要的计算机视觉功能,然后在英特尔的计算机芯片上优化软件使这些功能更好地运行,公司通过这种方式为希望创建终端用户应用的人提供了高质量的视觉产品(Quigley et al. 2009)。从可以打乒乓球的机器人到能够为人脸拍照然后用线条构画出来的草图绘制机械臂,OpenCV库促成了迷人的演示程序在计算机实验室和科技博物馆里的蓬勃发展。Willow Garage希望通过ROS将移动机器人所要用到的关键技术成功地打包给用户,这样用户就能在Willow Garage自己的机器人上或者是其他的运行ROS的机器人上使用这些技术了。这些技术包括基本的导航、操控、跟踪移动的物体、人脸识别、以及手势识别。它们已经催生了一个由ROS研究者组成的子社区,这些人共同使用、修改ROS资源库,以及向库内添加功能包。


ROS对于搭载了高性能处理器的高端机器人尤为有效,然而智能手机方面的发展也显示出小型低功率机器人领域也将会有同样巨大进步。谷歌公司的安卓操作系统提出了一种架构,这种架构允许智能手机直接与机器人通讯,并允许智能手机像小型机器人的决策处理器或者大脑一样运作。在不久的将来,你也许能够建造一个这样的机器人,它可以与你口袋中的手机通讯,甚至通过手机与互联网通讯。你的手机甚至可能成为一个控制中心,像蜂后那样,控制你周围的一群低成本机器人。


过去十年的经验告诉我们,将不会有对所有机器人都适用的大一统的软件架构出现。这个领域的差异性实在是太大,以至于这种大一统的尝试没有任何意义。然而,在所有机器人都能使用的软件服务里已经出现了重要的进展,并且这种进展的发展速度只增不减。室内导航曾是机器人技术里主要的研究难题,甚至整个会议议题都是致力于解决如何让机器人不会迷路。现在,大学生常常不需要学习机器人导航理论,只是使用整套的室内导航工具包作为软件服务,就能搭建出能够进行室内陆图构建与导航的机器人。按照OpenCV和ROS的惯例,越来越多的软件服务将会面向大众,尤其是机器人将会走的更远并与我们的现实世界做更多的交互——和人一样在人行道上行走、乘坐电梯并协调出入、做简单的煎蛋。在现在,这些对机器人来说都还是很困难的,但是只要出现合适的硬件设备,软件上的解决方案很快就能以共享的方式开放出来,从而所有的机器人都能从中受益。


最重要的是要对这个构建的世界进行操控。处理家务事的能力,如拿起并移动罐头、水杯、报纸、或是要洗的衣物,对于机器人在居家生活中扮演卓有成效的角色来说是非常重要的。现在,操控方面的研究水平仅相当于20世纪90年代室内导航的水平。研究先驱们开始展示他们的机器人,这些机器人有轻量级的机械臂和高级的感知能力,能识别桌子、分析桌子上的物品,然后在不碰到桌子上任何其他物品的情况下,用机械手抓起目标物品(Srinivasa et al. 2010)。推测物体的形状,判断用什么样的方式抓取,如何感知目标物体的重量,以及如果目标物体装满了液体,该如何在不让液体洒出的前提下移动它,这些问题解决起来都会出乎意料地困难。


从早期的导航系统过渡到完整的室内导航解决方案只用了不到十年。现在,软件技术的发展越来越快,我们也不会再遇到一年前所出现的计算方面的限制问题。如果在5到8年内对机器人的基本操控能成为坚实的公共服务,那么在20年内我们有可能完全开发出来的机器人技能的数量将十分惊人。在现实世界中,很多事情需要我们人类机械地去做,将来这些都可以很好地流程化并由机器人模仿完成。



未来机器人入门——5:连通性


在加利福尼亚州,由观光客们不经意引入的一个入侵物种,阿根廷蚂蚁,已经成为了一个单独的、数量庞大的超级群落,沿着加利福尼亚海岸延绵了将近600英里(Walker 2009)。与已知的“加州大蚁群” 群落相比,加州的其他蚁群都显得十分渺小,这个蚁群展现出了它独一无二的力量,没有任何其他蚁群能与之抗衡。当你的敌人拥有无限的后援和无处不在的食物资源信息的时候,任何普通攻击都会失败。所有的阿根廷蚂蚁都混杂在一起,而不会遭到攻击——它们呼吸同样的信息素,甚至有冗余的蚁后,每一千只工蚁就有八只蚁后。


不管这些群落是否真的像“加州大蚁群”或者星际迷航里面的博格人那样,它们都是既有趣而又令人不安的,因为它们所拥有的力量和知识的基础远远超出了你和这种群落中的一员交流时所体验到的一切。构成我们所讲的机器人雾霾的那群机器人,是否将成为一个大型群落中的成员,还尚无定论。但可以肯定的是,我们机器人雾霾将会与它自身以及数字世界里的信息上层建筑有大量的互连互通。无论从哪点来看,都将会有一个新的超级机器人群落出现,并且这个群落将给我们这些具有独立思想的人类带来有点棘手的交互方式。


对机器人的基本连通性的争论将源于这样一个事实:在对物理环境的感知和交互能力上,最开始它们将会表现得很一般。为了尽可能好地去看到世界并且理解感知信号,机器人必须利用在线资源,这当然包括视觉识别服务,以及物体与信息的特定数据库。请将这当做一个为机器人而不是人服务的庞大的谷歌搜索引擎:Robo-Google(译者注:意思是将类似谷歌的搜索引擎用在机器人身上,让机器人能够通过它搜索信息),将全世界的信息组织起来供移动机器人使用。机器人将会希望知道如何识别交通信号灯,如何去拧他们从未遇到过的门上的门把手,以及如何去折叠或是打开一台婴儿推车。机器人将会需要具备识别人脸的能力,以及记住所识别人的身份以备以后能想起他的名字。


一旦机器人使用Robo-Google收集并存储现实世界的信息,那么在机器人之间广泛地共享这些信息方面自然就会有所进步。这样一来,有趣的是,基于互联网的非物质的信息将会非常容易地与有形世界关联起来。一个机器人在飞机场看见你吃力地拖着一堆行李,会询问你是否需要联系一些新型的助力行李箱。如果你回答需要,你不必提供联系方式,因为机器人知道你智能手机的详细信息——你的手机和机器人都在同一个网络内,并且,任何为享有这种特权而付过费的机器人或者服务都可获得你对新型行李箱有兴趣这一信息。但共享将不会仅此而已:你愿意接受关于新产品的有礼貌的提议,这一信息将会在机器人网络里被买卖,只要它仍具备商业价值。


因为在线社区具有无限大的特质,当在街看见一个机器人的时候,你很难推断它到底拥有多少关于你的背景信息。这就相当于影视明星或者是政客遇到他们的粉丝。粉丝们很清楚地知道与明星有关的大量信息,而明星对每个粉丝的信息却一无所知。这种关系中没有平等性和相互性,恰恰相反,只有双方都不会满意的奇怪的单边社交。


关于连通性,最后需要提到的是,机器人,即便是社交机器人,都不会和人一样。因此,认为我们与智能社交机器人交互将会如同与人交互一般,这种想法是非常天真的。如何做到这一点,在这方面没有任何真正的先例,我唯一有信心预测的是,2035年你在大街上遇到的机器人,他们了解你的信息将会比你了解它的信息要多得多。如果你是一名不折不扣的乐观主义者,你可以将这种现象解释为,机器人把你当作影视明星一样对待。



未来机器人入门——6:控制


一种传统的看法认为机器人控制可以分为两种截然不同的模式:人工控制,或称为遥控机器人(teleoperated robots);以及自主控制,或称自主机器人(autonomous robots),后者使用自身的传感器来决定如何移动及动作,它们自我控制。我们目前不倾向于追求这两种极端方式,而是寻求一种能将自主决策和人工遥控流畅融合的方法。一些机器人将主要依赖于自动驾驶仪工作,当不确定要做什么任务时,则会询问人类。一些机器人将是自主的,但需要人类的帮助。它们会去寻求路人的帮助,如方向、门和电梯的位置。一些机器人将设计成遥控的,虽然受人类的高度控制,但仍可利用自身的传感器和反应机制进行避障。然而,其他的机器人根据任务不同可实现从精细的远程控制到完全自主行为的全范围运行。


自2004年NASA/Ames智能机器人小组启动一个称为人-机器人对等互动( Peer-to-Peer Human–Robot Interaction)的项目。


研究人员研究了机器人和人类如何在月球上共同工作建设项目,着眼于让人类在安全的登月舱内帮助机器人在月球表面建设一个栖息地(Fong et al. 2005)。有时候身穿宇航服的人类会与机器人肩并肩一起工作,来抬起沉重的零件或检查一个焊接接头。其他时候,机器人也可能会遇到困难,例如螺接两个预制框架部分,此时它将请求远程帮助。在这种情况下,人类操作员则将需要从机器人的监督者转换到遥控者,从远方接管指挥机器人的摄像头和机械手臂,直接扭紧遇到麻烦的螺栓。研究人员称这种机器人控制水平无缝转变的能力为可调自主(adjustable autonomy),这将是未来机器人的一个重要设计考虑。


可调自主表明:类似于商用飞机的自动驾驶仪,接口设计得非常好,人类可以获得态势感知并在必要时接管控制。相反,当任务足够简单,机器人足以处理时,可调自主则意味着人类操作者赋予机器人自主权而无需直接控制。


在NASA的例子里,这意味着要保证人类和机器人之间有共同的语言。比如“稍向左”和“在我上面”,机器人和人类都需要用正确的方式做出理解,这样他们之间才可以就一项任务以及某种情况下可能的解决方案进行交流。远程操作控制也需要相应的设计,当操作员不小心造成损害时,例如,当移动机器人时由于未能注意到突出障碍而造成机体的损坏,传感器能够及时中止远程操作。

大量的可调自主研究集中于安全的远程操作控制,包括力反馈以及三维可视化,为人类操作员提供尽可能多的的情境感知。


可调自主将成为未来机器人系统的一个事实,这将意味着在家里或是在街上遇到的机器人将会有不同程度的人类的控制。从完全自主到监督再到直接远程遥控。随着自主机器人控制和对话系统的进步,将会越来越难以推断一个特定的机器人是人类控制的、还是受人类监督的、或是在外跑丢的,在不久的将来,控制方面的进步将会在我们与机器人互动时,为其蒙上一层面纱,隐藏了这是一台自动机器人还是人工遥控的真实身份,也同样遮掩了我们构建一个与我们进行交互的对象的具体模型的能力。 


综合


鉴于在结构、硬件、电子、软件、连通性和控制方面所有可预见的进步,我们可以重新想象在2035年由众多机器人创新合奏出的新景象。今天任何一个可以从一箱零部件中组装出一辆自行车或组合出一个瑞典式卧室梳妆台的人,将来也可以利用众多的工具包构建出一个机器人。机器人将飞越我们的头顶,跟着我们一起跳跃、快速跑动、上下楼梯、能跑到家里的任何角落。当你在人行道上看到一个机器人时,并不清楚这是由旁边的人、还是数英里之外的人所遥控的,或是由一个完全是数字化决策的人工智能程序所引导。机器人可以识别出我们,检测我们的视线方向,能听懂大部分我们所说的话。


它们可以随意拍照,并立即发布到全世界;它们可以录制我们的话音和声音;它们可以从低IQ的人工遥控机器人无缝地切换成一个高IQ的自动机器人。


今天可拍摄视频的手机已经正在改变公民和政府之间的关系。当一个警察朝着一排示威者脸上发射胡椒喷雾时,所有人都会在线看到这个暴行。没有什么是转瞬即逝的,因为一切都可以记录并分享。对于隐私的期望必须转变,因为在公共场所所做的任何事情都会被抓拍,然后公之于众。由于机器人自动决定记录和发布的内容,所以我们将不得不转变我们对于互联网身份的认识。我们人类将不再是唯一一个记录并在线发布事件的物种。事实上,机器人将不仅是新内容的创作者,它们也会像我们一样忙于消化吸收发布在网上的内容。当你碰到一个有着强大资源库的机器人,从第一印象你很难确定是否这个机器人知道你每天所做的每一件事情包括你所去过的地方以及你与其他机器人互动的方式,或者是否你和它对于对方都一无所知。 


这些机器人会是庸俗的,像一只过度热情的狗一样友好;或是完全不知所措,像一只暹罗猫一样疏远。它们或是跟人的手掌大小一般,以每小时5英里的速度飞行然后停落在树枝上,或是像一根几厘米宽,3米高的杆子一样瘦长且高挑。机器人会爬树、玩杂耍、擦干净三楼以上楼层的窗户。它们会在公园里到处跑,跟孩子们天真地玩接球的游戏,但是看上去,听起来却像是一个5英尺高,有着6厘米长的橡胶牙齿和发光的红色眼睛的暴龙。在郊外演唱会上听到手机响,你会感到很烦躁,但是这跟各式各样的机器人以各种方式分散你的注意力,中断和打乱你的计划相比,就会显得渺小的不值一提了。 


如果在自制的公共机器人的蛮荒西部尚有一线希望的话,那就是在二十一世纪早期的混乱的、动画密集的网站大量爆发时我们所做的应对。与设计低劣的网站相对的是设计和人机互动领域充满了活力,这些学科招收并训练不同的个人,教给他们设计方法,使得高效、互动的网站走向了成熟。我希望人机互动以及机器人设计理论能够适应这一情况,引入原理和实践,这将会消除掉因我们发明创造所产生的机器人的雾霾。但充其量这些举动也将是被动而非主动的,就像政府监管、市政分区和法律判例。它可能在好起来之前会变得更糟。


本文摘录之我们翻译的《机器人与未来》(第一财经2015年度特别推荐图书)
《机器人与未来/机器人探索与实践系列》([美]I.R.诺巴克什)【摘要 书评 试读】- 京东图书


作者知乎专栏:https://zhuanlan.zhihu.com/learn-robotics


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
世界上最有个性的机器人
旺仔机器人火了,真的不要抱一只回家吗?
超感人短片《更换电池》:机器人能替代人类吗?
FANUC机器人在生产中《安全模式分析》
如何成为一名机器人工程师(三)
如何学习ros
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服