四足机器人「技术跃变」：如何成为「地面的大疆」？-中国机器人峰会官网

四足机器人「技术跃变」：如何成为「地面的大疆」？

发布时间：2023-10-08发布人：中国机器人峰会

1950年，英国数学家艾伦·图灵提出，当一个测试者与一个计算机程序进行对话，如果测试者无法区分程序的回答是由人类还是计算机生成的，那么该计算机程序被认为具备与人类智能相当的能力。

这便是AI领域赫赫有名的图灵测试。在通用足式机器人领域，也有类似的测试：如果机器人能够在任意情况下抓取任意的杯子，那么该机器人便具备了真正的运动智能。

要通过这个测试非常困难，其中，机器人必须具备极强的感知能力，与环境进行实时交互，不断调整运动控制，才有可能完成任务，整个“感知到控制”的闭环是完全实时、动态、无法预先设定的。通用足式机器人公司逐际动力创始人张巍直言，机器人要通过类似测试，“比自动驾驶还难”。

原因在于，自动驾驶仅解决移动（mobility）的问题，即从A点到B点，只需要位置关系的感知；足式机器人在此基础上，还增加了接触关系感知，比如地形感知、触觉感知。机器人必须要通过这两种感知做实时交互，实现移动，然后执行操作（manipulation），才能被称之为运动智能。

现阶段四足机器人的窘境在于，多数机器人处于「弱感知」阶段，只有微弱的感知或者用了少量数据，甚至是没有感知，行动能力十分受限，效率不高且通过复杂场景的鲁棒性较低。张巍表示，机器人的核心是运动，包括“腿”的移动和“手”的操作。而运动智能化的核心来源于感知，这类感知指的是基于复杂场景的实时感知。机器人基于实时感知进行决策、控制，完成整个运动的闭环。

技术「跃变」：从被动输入数据到主动感知交互

移动机器人按照移动结构可大致分为两类：以底盘为重心的轮式，与动物和人类相似的足式（四足、双足）。轮式机器人主要在结构化道路上进行运动，典型的如酒店配送机器人。这类机器人技术已经非常成熟，各大细分赛道已经出现了许多明星公司。

但轮式机器人的不足之处在于，地形的适应能力较差，很难克服楼梯、凹凸不平的路面、野外等非结构化的场景；并且，轮式机器人有一个比较重的底盘，来支撑机身保持稳定，但这个底盘除了承重和搭载传感器以外，能够执行的任务比较有限。张巍告诉雷峰网，如果机器人要像“人”一样提供各种服务，腿的结构至关重要，因为“有腿的机器人末端自由度更高”。

而且机器人必须具备实时调整重心的能力，保持平衡，提高负载自重比，才具备复杂场景运动的基本能力，这是轮式机器人没办法做到的。

基于此，张巍认为，未来的机器人会往两个方向发展。一个是「专用机器人」，即单一或者简单场景下，机器人能够根据人设定的流程代替人高效地执行任务，比如工厂的AGV/AMR、配送机器人等等。

另一个则是「通（多）用机器人」，即机器人要满足复杂地形、场景，执行多种任务。现阶段，「专用机器人」已经杀成一片红海，不论是送餐、酒店，还是工厂，都已经出现了许多机器人公司，从拼技术到卷价格，最终到渠道和服务，已经渐渐跑通商业闭环。而足式机器人才刚刚起步，即便四足、双足机器人已不是新鲜事物，但市面上还没有一款真正具备智能的足式机器人产品。

这一现象的本质原因，在于当前的足式机器人缺少「感知」。“机器人本质上是理解用户指令，然后根据机器人收集的环境信息，让电机转起来，实现运动控制。”张巍表示，要实现精准高效的控制，这与环境感知密不可分。举个例子，足式机器人要上下楼梯，需要知道楼梯与自身的相对位置（实时）、什么地形、踩哪儿、用多少力...在这些感知信息的基础上，自主规划路线、姿态等等，整个过程都是动态的，而非预先设定的运动控制。机器人实际上是通过感知来理解环境，再通过关节来产生作用力，实现控制运动，所有的运动都会有环境反馈。这里面既有位置关系的感知，也有接触式感知，将二者完美融合起来的难度非常之大。并且，机器人与环境交互需求越大，根据实时感知环境来重新规划动作（而不是按照事先预设流程）就越难，本身的控制和稳定性问题会更难。

简单而言，足式机器人必然要与环境产生感知交互，对应的任务不是提前设置好的动作流程，直接进行replay，而是根据现场情况进行动态感知，并实时规划动作。张巍表示，机器人要“类人”，一定要跟环境交互，否则就没有智能而只是一个机器，很难产生真正的价值，实现商业闭环。但是，从环境感知到运动控制，这又是一件非常难的事情。

当前四足机器人的两个瓶颈：效率、稳定性

相当一段时间里，足式机器人都默默无闻。直到来自MIT的 Patrick Wensing 和Benjamin Katz 分别开源了两套影响深远的方案之后，越来越多的玩家躬身入局，越来越多的机器狗从实验室走向公众视野，这个行业才渐渐被看到，接着有了资本助力，产品开始落地到具体场景。虽然现在不少机器狗可以行走、爬楼梯甚至跳舞、翻跟斗，但从做一个demo展示到实际量产甚至落地到具体、复杂的业务场景，仍然会遇到两个问题：效率低，以及稳定性弱。比如，机器狗在通过非结构化地面时，速度不高，而且缺乏稳定性，容易“趴窝”。

张巍认为，这一问题的本质，甚至是足式机器人还没有很好的商业化落地的原因之一就在于，这些机器人缺少 Perceptive Locomotion（基于感知的运动控制）。没有感知，意味着机器人的运动失去了“眼睛“，只能靠盲走，就像闭上眼睛的人直立行走，一定会走得歪歪斜斜，因为缺少感知来实时调整路线。当前，机器人的控制主要有两种方法，一种是基于模型（Model）的控制，一种是基于学习（Learning）的控制。这两种方法都是为了解决同一个「最优控制」的问题，控制机器人的本体以最好的姿态高效、高质量地完成动作，却也有不同之处。“Model是用解析模型做推演、设计控制；Learning是减少使用Model的显性表达，用仿真器来预测控制的效果。实际上，Learning本质上也是基于模型的，仿真器都是基于模型设计，但是更侧重于强化学习，需要机器人反复迭代、试错来改进其控制器。”打个比方，在高空飞行的飞机，从A点到B点，可以用一个固定的模型来解决；但如果机器在低空环境中飞行，会遇到建筑物、动植物、飞行物等复杂场景，机器人需要自己辨别障碍物是什么、怎么避开、怎么实现控制等，就需要Learning。

换句话说，复杂场景的感知交互，一定要用到Learning。机器人需要把各种传感器（摄像头、IMU、雷达）的数据融合起来，先构建一个高精度地形图，然后定位、规划行走，行走过程中不断进行感知，实时调整运动控制。现阶段，机器人行业专注于基于感知的运动控制的有Boston Dynamics、Anybotics、逐际动力LimX Dynamics等。Boston Dynamics 是业内最领先的足式机器人公司，而逐际动力也正在进行追赶，并走了一条差异化路线。

张巍告诉雷峰网，逐际动力既有Model-based的控制，也有Learning-based的控制，这两种方法有各自适合的任务，通过模型数据混合的方式来做迭代。在足式机器人的功能方面，逐际动力的路线是，首先完成腿部的基本功能，例如高效稳定地上下楼梯、穿越复杂地形；然后攻克全身运动的问题，即运动+操作；最后将产品打磨足够稳定之后，针对细分场景进行作业。目前，逐际动力已经可以实现带感知的运动控制，虽然成熟度上相对于Boston Dynamics还有待提高，但能力已经接近。在陡峭的、真实的镂空的工业场景下，逐际动力的机器人已经可以实现稳定的上下楼梯，以及克服草地石板路、斜坡等各类场景。

逐际动力：先打造全地形移动底盘，做“地面的大疆”

张巍本科毕业于中国科技大学自动化系， 2005年开始在美国普渡大学攻读博士学位，研究基于模型的混杂动态系统的控制（Hybrid Dynamical System）。博士后期间，张巍加入了加州伯克利分校的Hybrid System 实验室，导师为美国工程院院士Claire Tomlin和Shanker Sastry ，该实验室的著名人物还包括李泽湘、马毅等。2011年9月，张巍加入俄亥俄州立大学，在电气与计算机工程系先后担任助理教授和长聘教授，继续从事混杂动态系统控制的研究和教学。值得一提的是，MIT开源方案核心人物之一的Patrick Wensing，彼时也还在俄亥俄州立大学学习机器人与控制理论。直到2014年，Patrick Wensing才前往MIT仿生机器人实验室，负责足式机器人的控制算法。张巍认为，机器人的足在踩踏地面时，是一个离散事件，并且速度和系统状态会发生跳变，本质上就是Hybrid Dynamical System。如何系统地控制这类运动，是张巍一直在研究的课题。2019年5月，张巍回国加入南方科技大学，担任机械与能源工程系教授，创办了机器人控制与学习实验室（CLEAR LAB），并指导学生开始以强化学习的方式训练足式机器人，并于三年后下场创业，成立了逐际动力。张巍告诉雷峰网，逐际动力是通用足式机器人公司，先要解决机器人的核心痛点：全地形移动能力，即像人一样移动，人能去的地方，机器人都能去。鉴于当前四足机器人欠缺复杂场景移动能力、效率低能耗高的等问题，逐际动力对机器人进行了「系统升级」，包含两方面，一是以感知为核心的运动控制，二是将足式和轮式的优点结合，形成轮足式。“逐际动力要解决的是复杂场景下，四足机器人从A点稳定快速地到B点。至于机器人的使用场景，是巡检、配送，还是装了机械臂做更复杂的工作，将结合客户本身的业务去做落地。”就像大疆的无人机，在天空上飞来飞去，客户可以用来拍照、撒农药，也可以用来巡检、表演，而逐际动力打造的是“地面的大疆”——全地形移动底盘，并推出了首款四轮足产品W1。W1 基于逐际动力「运动智能Motion Intelligence」研发，将腿式和轮式结构相结合，具备实时地形感知与全地形移动能力，在效率上比单纯的足式机器人更高效，适用场景也更加丰富、复杂，可以实现上下楼梯、斜坡、伏地穿越、过草地石板路等功能。
张巍表示，四足机器人已经有足够的技术积累，基础研究与商业化的交集业已出现。现阶段能落地并产生价值的，首先是封闭场景，例如危险、复杂的工业环境，代替人的工作，这类环境比较可控，机器人能很快适应；开放场景存在的不可控因素太多，比如人为干扰、突发事件等，不太容易落地。因此，逐际动力计划首先将W1在固定路线上落地，如工业巡检、物流配送、特种作业等场景，并持续打磨产品；在固定路线跑通后，再逐步尝试开放场景，循序渐进，最终打通四足机器人的广泛应用。
04

机器人，大时代

从世界第一台机器人诞生至今，机器人的发展已接近百年历史。每一次技术革命都将给机器人的发展带来强大的助推力：能源、信息、大数据、芯片、人工智能...都推动了机器人持续进化，从简单的模仿到惟妙惟肖，从实验室走向生产生活，从不能行动到稳定行走，从轮式到四足再到双足。如今，机器人已经以各种形态融入人们的生产生活，比如扫地机器人、工业机器人。虽然现阶段的机器人还比较“笨”，距离通过“图灵测试”还有很长一段距离。不过，技术本身是「涌现」出的，谁也无法预测这个「奇点」。但无可争议的是，正如人的进化史一样，机器人也在慢慢进化，且终将迎来一个新的时代。