当前位置 : 中国机器人峰会 >> 大会新闻
发布时间:2023-10-08发布人:中国机器人峰会
1950年,英国数学家艾伦·图灵提出,当一个测试者与一个计算机程序进行对话,如果测试者无法区分程序的回答是由人类还是计算机生成的,那么该计算机程序被认为具备与人类智能相当的能力。
这便是AI领域赫赫有名的图灵测试。在通用足式机器人领域,也有类似的测试:如果机器人能够在任意情况下抓取任意的杯子,那么该机器人便具备了真正的运动智能。
要通过这个测试非常困难,其中,机器人必须具备极强的感知能力,与环境进行实时交互,不断调整运动控制,才有可能完成任务,整个“感知到控制”的闭环是完全实时、动态、无法预先设定的。通用足式机器人公司逐际动力创始人张巍直言,机器人要通过类似测试,“比自动驾驶还难”。
原因在于,自动驾驶仅解决移动(mobility)的问题,即从A点到B点,只需要位置关系的感知;足式机器人在此基础上,还增加了接触关系感知,比如地形感知、触觉感知。机器人必须要通过这两种感知做实时交互,实现移动,然后执行操作(manipulation),才能被称之为运动智能。
现阶段四足机器人的窘境在于,多数机器人处于「弱感知」阶段,只有微弱的感知或者用了少量数据,甚至是没有感知,行动能力十分受限,效率不高且通过复杂场景的鲁棒性较低。张巍表示,机器人的核心是运动,包括“腿”的移动和“手”的操作。而运动智能化的核心来源于感知,这类感知指的是基于复杂场景的实时感知。机器人基于实时感知进行决策、控制,完成整个运动的闭环。
01移动机器人按照移动结构可大致分为两类:以底盘为重心的轮式,与动物和人类相似的足式(四足、双足)。轮式机器人主要在结构化道路上进行运动,典型的如酒店配送机器人。这类机器人技术已经非常成熟,各大细分赛道已经出现了许多明星公司。
但轮式机器人的不足之处在于,地形的适应能力较差,很难克服楼梯、凹凸不平的路面、野外等非结构化的场景;并且,轮式机器人有一个比较重的底盘,来支撑机身保持稳定,但这个底盘除了承重和搭载传感器以外,能够执行的任务比较有限。张巍告诉雷峰网,如果机器人要像“人”一样提供各种服务,腿的结构至关重要,因为“有腿的机器人末端自由度更高”。
而且机器人必须具备实时调整重心的能力,保持平衡,提高负载自重比,才具备复杂场景运动的基本能力,这是轮式机器人没办法做到的。
基于此,张巍认为,未来的机器人会往两个方向发展。一个是「专用机器人」,即单一或者简单场景下,机器人能够根据人设定的流程代替人高效地执行任务,比如工厂的AGV/AMR、配送机器人等等。
另一个则是「通(多)用机器人」,即机器人要满足复杂地形、场景,执行多种任务。现阶段,「专用机器人」已经杀成一片红海,不论是送餐、酒店,还是工厂,都已经出现了许多机器人公司,从拼技术到卷价格,最终到渠道和服务,已经渐渐跑通商业闭环。而足式机器人才刚刚起步,即便四足、双足机器人已不是新鲜事物,但市面上还没有一款真正具备智能的足式机器人产品。
这一现象的本质原因,在于当前的足式机器人缺少「感知」。“机器人本质上是理解用户指令,然后根据机器人收集的环境信息,让电机转起来,实现运动控制。”张巍表示,要实现精准高效的控制,这与环境感知密不可分。举个例子,足式机器人要上下楼梯,需要知道楼梯与自身的相对位置(实时)、什么地形、踩哪儿、用多少力...在这些感知信息的基础上,自主规划路线、姿态等等,整个过程都是动态的,而非预先设定的运动控制。机器人实际上是通过感知来理解环境,再通过关节来产生作用力,实现控制运动,所有的运动都会有环境反馈。这里面既有位置关系的感知,也有接触式感知,将二者完美融合起来的难度非常之大。并且,机器人与环境交互需求越大,根据实时感知环境来重新规划动作(而不是按照事先预设流程)就越难,本身的控制和稳定性问题会更难。
简单而言,足式机器人必然要与环境产生感知交互,对应的任务不是提前设置好的动作流程,直接进行replay,而是根据现场情况进行动态感知,并实时规划动作。张巍表示,机器人要“类人”,一定要跟环境交互,否则就没有智能而只是一个机器,很难产生真正的价值,实现商业闭环。但是,从环境感知到运动控制,这又是一件非常难的事情。
02相当一段时间里,足式机器人都默默无闻。直到来自MIT的 Patrick Wensing 和Benjamin Katz 分别开源了两套影响深远的方案之后,越来越多的玩家躬身入局,越来越多的机器狗从实验室走向公众视野,这个行业才渐渐被看到,接着有了资本助力,产品开始落地到具体场景。虽然现在不少机器狗可以行走、爬楼梯甚至跳舞、翻跟斗,但从做一个demo展示到实际量产甚至落地到具体、复杂的业务场景,仍然会遇到两个问题:效率低,以及稳定性弱。比如,机器狗在通过非结构化地面时,速度不高,而且缺乏稳定性,容易“趴窝”。
张巍认为,这一问题的本质,甚至是足式机器人还没有很好的商业化落地的原因之一就在于,这些机器人缺少 Perceptive Locomotion(基于感知的运动控制)。没有感知,意味着机器人的运动失去了“眼睛“,只能靠盲走,就像闭上眼睛的人直立行走,一定会走得歪歪斜斜,因为缺少感知来实时调整路线。当前,机器人的控制主要有两种方法,一种是基于模型(Model)的控制,一种是基于学习(Learning)的控制。这两种方法都是为了解决同一个「最优控制」的问题,控制机器人的本体以最好的姿态高效、高质量地完成动作,却也有不同之处。“Model是用解析模型做推演、设计控制;Learning是减少使用Model的显性表达,用仿真器来预测控制的效果。实际上,Learning本质上也是基于模型的,仿真器都是基于模型设计,但是更侧重于强化学习,需要机器人反复迭代、试错来改进其控制器。”打个比方,在高空飞行的飞机,从A点到B点,可以用一个固定的模型来解决;但如果机器在低空环境中飞行,会遇到建筑物、动植物、飞行物等复杂场景,机器人需要自己辨别障碍物是什么、怎么避开、怎么实现控制等,就需要Learning。
换句话说,复杂场景的感知交互,一定要用到Learning。机器人需要把各种传感器(摄像头、IMU、雷达)的数据融合起来,先构建一个高精度地形图,然后定位、规划行走,行走过程中不断进行感知,实时调整运动控制。现阶段,机器人行业专注于基于感知的运动控制的有Boston Dynamics、Anybotics、逐际动力LimX Dynamics等。Boston Dynamics 是业内最领先的足式机器人公司,而逐际动力也正在进行追赶,并走了一条差异化路线。
张巍告诉雷峰网,逐际动力既有Model-based的控制,也有Learning-based的控制,这两种方法有各自适合的任务,通过模型数据混合的方式来做迭代。在足式机器人的功能方面,逐际动力的路线是,首先完成腿部的基本功能,例如高效稳定地上下楼梯、穿越复杂地形;然后攻克全身运动的问题,即运动+操作;最后将产品打磨足够稳定之后,针对细分场景进行作业。目前,逐际动力已经可以实现带感知的运动控制,虽然成熟度上相对于Boston Dynamics还有待提高,但能力已经接近。在陡峭的、真实的镂空的工业场景下,逐际动力的机器人已经可以实现稳定的上下楼梯,以及克服草地石板路、斜坡等各类场景。
03