当前位置 : 中国机器人峰会 >> 大会新闻
发布时间:2023-12-12发布人:中国机器人峰会
如果说ChatGPT为代表的大模型开启了通用AI新时代,那么多模态具身智能、主动交互式的人形机器人,则为存活在电脑中的人工智能送来了物理躯体,开启了通用AI在物理上一个人形实体落地的新时代,也是机器人行业从专用到通用,从单一智能到通用智能的一次革命性升级。
如今,在“具身智能”的浪潮下,国内人形机器人产业化加速。业内专家指出,技术研发是人形机器人产业发展的关键环节。那么,人形机器人产业化,需要突破哪些关键技术?
对于这个问题,工信部印发的《人形机器人创新发展指导意见》曾给出答案。《意见》强调“大脑”、“小脑”、“肢体”等一批关键技术取得突破,有助于建立人形机器人创新体系。
原文:人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品。到2025年,我国将初步建立人形机器人创新体系,“大脑、小脑、肢体”等一批关键技术取得突破,整机产品达到国际先进水平,并实现批量生产。到2027年,人形机器人技术创新能力显著提升,形成安全可靠的产业链供应链体系,构建具有国际竞争力的产业生态,综合实力达到世界先进水平。
仔细来看,“大脑”与大模型、自主决策、行为控制相关,“小脑”则主要指运动控制系统。
“肢体”关键技术具体可分为“上肢”“下肢”“躯干”关键技术,“上肢”技术是指与机械臂、灵巧手、双手控制、手眼控制等相关的技术;“下肢”技术是指与仿生关节、仿生腿足、行走控制、足眼控制等相关的技术;“躯干”技术涉及机构系统、材料系统、动力系统、感知系统的控制与运行。
其中,大模型技术在人形机器人“大脑”中具有举足轻重的作用。
大模型需具备自主可靠决策/多模态感知/实时精准运控+泛化/涌现能力。对于限定的应用场景和任务,从决策层、感知层和执行层三个角度出发,大模型需要具备自主可靠决策能力、多模态感知能力和实时精准运控能力;为了拓展到多样复杂的应用场景和任务,大模型还需要具备泛化能力和涌现能力。
目前大模型不断迭代,已出现包含多种能力的“全能选手”,但仍存在感知模态不足、实时性差和泛化能力弱等问题。未来需要不断优化训练模型结构、训练方法和数据集,将多模态感知信息纳入模型,同时提高控制指令的生成速度和大模型的泛化和涌现能力。
《意见》提到,打造人形机器人“大脑”和“小脑”,需要开发基于人工智能大模型的人形机器人“大脑”,增强环境感知、行为控制、人机交互能力,推动云端和边缘端智能协同部署。建设大模型训练数据库,创新数据自动化标注、清洗、使用等方法,扩充高质量的多模态数据;科学布局人形机器人算力,加速大模型训练迭代和产品应用。开发控制人形机器人运动的“小脑”,搭建运动控制算法库,建立网络控制系统架构。面向特定应用场景,构建仿真系统和训练环境,加快技术迭代速度,降低创新成本。
而突破“肢体”关键技术,需要用好现有机器人技术基础,系统部署“机器肢”关键技术群,创新人体运动力学基础理论,打造仿人机械臂、灵巧手和腿足,突破轻量化与刚柔耦合设计、全身协调运动控制、手臂动态抓取灵巧作业等技术;攻关“机器体”关键技术群,突破轻量化骨骼、高强度本体结构、高精度传感等技术,研发高集成、长续航的人形机器人动力单元与能源管理技术。
据人民网研究院发布的《人形机器人技术专利分析报告》显示,人形机器人的发展已有超半世纪的历史。
迄今为止,人形机器人经历了四个发展阶段:
第一个阶段:1969-1995年,此时机器人运动是一个缓慢静态行走的过程,以早稻田大学的人形机器人WABOT为代表。
第二个阶段:1996-2015年,此时是连续动态行走,这时候更多考虑到了机器人的质心惯量以及质心的加速度等因素,代表是日本本田的人形机器人ASIMO。
第三个阶段:2016年至2020年,追求的是高动态的运动性能,以波士顿动力的Atlas机器人做出的令人惊叹的运动动作为标志。
第四个阶段:2021年至今,随着相关技术的发展与成熟,人形机器人开始进入商业化落地的初级阶段,以亚马逊的Digit和优必选科技Walker为代表,未来可能还会包括特斯拉的Optimus。
最近一年人形机器人的革命性崛起,使业界有头有脸的科技巨头都在积极布局。目前来看,发展足够智能的人形机器人把人类社会的重复性体力劳动接管过去将会是一个造福全人类的科技大方向,也是大国博弈时代背景下,在军事和经济领域,一个弯道超车的潜在机遇。