「峰咖」李德毅院士 : 新一代人工智能十问十答-中国机器人峰会官网

「峰咖」李德毅院士 : 新一代人工智能十问十答

发布时间：2021-09-03发布人：中国机器人峰会

作者简介

李德毅

中国工程院院士、欧亚科学院院士

军事科学院系统工程研究院研究员，中国人工智能学会名誉理事长，中国指挥控制学会名誉理事长。他是中国改革开放以来第一位人工智能专业博士学位获得者，指挥自动化和人工智能专家，长期致力于军队信息化和作战智能化工作，是不确定性人工智能领域的主要开拓者，中国无人驾驶的积极引领者，人工智能产学研发展的重要推动者，吴文俊人工智能最高成就奖获得者。

摘要

新一代人工智能是我国在全球第一个面向2030年提出的国家重大发展战略。如何认识新一代人工智能和传统人工智能的不同，了解其内涵、外延、技术特征以及发展目标，从而更好地凝聚研发队伍，是实现这一战略的重要保证。文章围绕新一代人工智能的技术内核，提出十个主要问题，自问自答，大问小答，指出新一代人工智能将从传统的计算机智能跃升为无意识的类脑智能，是人类智能的体外延伸，不涉及生命和意识，由人赋予意图，通过有指导的传承学习和自主学习，能够与时俱进地解释、解决新的智力问题，形成有感知、有认知、有行为、可交互、会学习、自成长的新一代人工智能——智能机器。

智能是学习的能力，以及解释、解决智力问题的能力；人工智能是脱离生命体的智能，是人类智能的体外延伸；人工智能可面向不同的情境，通过不断学习，积累本领，与时俱进地成长。

在智能、人工智能等概念达成上述基本共识的基础上，我们研究新一代人工智能的技术内核，提出十个问题[1]，并给出自己简要的回答。

一问：意识、智慧和智能是什么关系？新一代人工智能触不触及意识？

答：意识不是物质，意识不过是一种感觉，是寄生在物质上的一种精神活动。通常认为，意识是对自身存在的感知，包括对自己行为和驱动行为原因的感知[2]。每个人都能客观地感受到意识的存在，而这其中，对自身存在的感知和表达——也就是自我意识——是最起码的自知，也是最初始的意识。原始的自我意识是低级意识，只有自己本人才能体验到这种意识的存在，正所谓“我思故我在”，在此之上，才谈得上高级意识或更高级的群体意识。而要想感知到“我”这个本体的存在，首先需要具备知觉意识，要能够从边界上区分出“我”和“非我”（如图1所示）。对于生物来说，这种边界就是皮肤。

生物的皮肤除了提供物理的边界，还具有呼吸、体温调节、感应、新陈代谢、吸收、分泌排泄、保护等7种边界交互作用[3]。这种从个体大脑神经元到末梢的知觉神经使得生物有了明确的边界感知能力，构成了意识的生物学基础。对于机器人来说，为了形成这种边界，需要具备包裹自己全身的，类似于人类皮肤的感知边界，我们称之为感知膜。感知膜要具备跨模态（如疼痛、温度、湿度、压力、张力、弹力、光滑度、透气性、材质等中的一种或多种）的综合感知能力和准确的感知精度，当感知膜受损时，还需要自修复能力，以维持边界的完整性。只有这样，机器人才能区分“我”和“非我”,也只有这样,才能够萌发出原始的自我意识。而要制造出类似人类皮肤这样敏感的人工感知膜、电子皮肤甚至量子皮肤，还来日方长，也许要一百年。

对于高等生物而言，意识和智能是智慧的基础。意识和智慧难以分离，智慧还强调生机活力和灵感气质。高等生物的智慧会涉及到意识、情感，生物的情绪反过来也影响其智能。大凡意识、情感都是内省的、自知的、排他的，不可以人造。只有诞生人工生命之后，也许才谈得上人工意识。

意识和智能是可以分离的。在计算机上表现出的计算智能就是一个极好的例子，计算机没有意识。人类智能的发展史就是动力工具的发明史，动力工具是人的体力的体外延伸，如发明发动机、轮子、汽车、飞机可延伸人的出行范围。而人工智能是人类智能的体外延伸，如发明油灯、电灯、望远镜可提升人的视力，发明算盘、计算尺、计算机可延伸人的计算力，发明驾驶脑可代替驾驶员的驾驶认知。人工智能的发展史表明人工智能可以脱离意识而存在。

新一代人工智能不触及意识。至于高等生物的生理本能，如生存和繁衍，也不在当前人工智能的研究范畴。

虽然非生命体的人工智能没有意识，但是可以人为地赋予人工智能以情感，那是第三人称的“外显”而已，情感机器人只是外显的情感。

二问：如何理解通用智能？通用智能一定是强智能吗？新一代人工智能既要通用又要强智能，通用和强是什么关系？

答：通用和专用、强和弱、可解释和不可解释，都是相对的。可解释也是有限的，总是可以追问到不可解释的边界，如公理。通用智能是跨领域的一般性智能，能够不局限于最初设置的任务和目标，通过交互和学习实现智力的增长，具有触类旁通、举一反三、融会贯通能力。人类进化过程中很早就表现出模仿能力，模仿中的抽象和类比尤其重要，这就是一种跨领域的一般性智能。当前的人工智能都是专设智能，他们只能按照程序员的设定，完成特定的任务目标。尽管今天的计算机已经可以解决很多复杂的、专门领域的智力问题（如特定围棋规则的智能），但我们仍常常觉得它们缺乏人类思维的某些本质特征。这里的差别主要不是在算法、算力、数据量方面，不是在机器的速度和容量方面，而是在人工智能的一般性（通识性、普遍性、常识性）、不确定性（灵活性、适应性、可习得性、容错性）、创造性（自主性）、开放性等方面。

遗憾的是，发展60多年的人工智能没有能够更靠近人的一般性智能。如果说强人工智能追求的是智能纵向的深度，新一代人工智能追求的恰恰是智能横向的宽度，是可交互、会学习、自成长的类脑智能。纵向智能、横向智能都没有尽头，一台机器人永远不可能全知全能。

三问：目前几乎所有人工智能都是在计算机上表现出来的计算机应用，即“计算机智能”。如何在物理装置上实现超出计算机智能的、受脑科学和认知科学启发的新一代人工智能？

答：人类起源可追溯到10万年前的“智人”崛起，经过绵延不绝的人类进化，从原本也没有什么特别的动物，进化到地球生物链的最高端，人脑的组织结构的持续进化和后天学习，先天基因和后天教育的双突破，成就了人类的认知革命。

可以说，人类共经历了3次认知革命。第一次认知革命，是5千年来的语言、文字和符号的发明，创造了文化和文明，发明了教育，使得人类智能可以脱离生命体而以文字等形式独立存在，并反过来进一步发展和丰富了人类的想象力，智能植根于教育，是人类文明造就了人类智能的生态。第二次认知革命是5百年来的物质科学和技术革命，人类逐渐掌握了如何利用物质和能量，创造动力工具延伸人的体能，极大地解放了人的体力；最近这一百多年来，人类进入第三次认知革命，开始研究生命，研究脑科学和人工智能，千方百计创造智力工具，来延伸人的智能。

但是，要从生物学意义通过脑的微观组织结构解释人的意识和智能，要从认知科学意义通过脑的宏观功能结构机理解释人的智慧的成因和发展，至今还相差甚远。

人类没有类鸟，却发明了飞机，反过来用空气动力学解释了鸟的滑翔；人类没有类脑，却发明了计算机，反过来用计算智能解释了人的部分智能。目前的人工智能都是基于图灵机模型和冯诺依曼架构的计算机智能，或者计算智能，它不能执行任何未预先编程的活动，不能自编程，人工智能仅仅是算法工程师的智能表现出的编码的一次又一次的重复执行而已。传统计算机智能的硬核是算力、算法和数据。可以说人们当初把计算机比作电脑，就是研制类脑智能的初心，“缸中之脑”[4]的说法也由来已久。在人类对自身脑的工作机理远远没有搞清楚之前，是很难做出类似人脑微观结构的物理装置的。但是，我们可以从不同的尺度，采用不同的方法研发受脑科学和认知科学启发的“类脑”装置。

在脑科学和认知科学研究成果的启发下，我们认识到，没有感知不会有认知，脑和外界环境不停地交互，和外部客体之间一直存在着认知对应关系，尤其是空间位置关系，形成各式各样的、有概念内涵的认知地图；大脑和小脑、大脑的不同区域，既有分工又有协同，要实现脑认知的逐层抽象；脑区大规模神经元(1011)组成记忆网络，对认知起决定性作用，记忆的提取依赖神经网络动力学，是人类的已有的记忆导致了注意力的选择；人脑总是处在学习状态，等等。这些启发都是极其宝贵的。因此，如同我们不在分子水平讨论一栋房子的架构和功能，我们也不必先在基因、蛋白质水平上探究智能，这里我们强调介观类脑，即在大规模神经元群组和网络水平上模拟脑认知网络，尤其是模拟人类特有的、占人脑 70% 的大脑皮层那一大片神经组织，其厚度约为2.5mm，表面积约为1500cm2，它将大脑的其余部分包裹起来，主要表现为智能。

四问：机器人不会有七情六欲，学习的原动力来自何处？如果没有接受教育的自觉性，新一代人工智能如何具有学习的动机？

答：所有机器和机器人，都不是人工创造出的生命。非生命体没有求知、好奇的欲望，没有接受教育的自觉性和学习的原动力，但也没有不学习和反对学习的负面情绪，它是人类智能的体外延伸。

但是没有欲望不代表没有学习的目标，学习的目标取决于任务的目标。如同一枚导弹可以自动寻的，无人驾驶拖拉机可以自己耕地，我们在新一代人工智能基础架构中，可人工赋予机器企图和任务目标，让机器在交互的过程中，提出自己的问题，依据任务目标，分解并确定具体的学习目标，也就有了学习的驱动力，学习欲望强，主动性就强。

五问：人的偏好和注意力选择是如何产生的？新一代人工智能如何体现这一点？

答：人的注意力选择源于记忆，源于记忆的偏好依附性。例如，当你看一张大的集体照时，常常首先认出的是你熟悉的那个人。偏好依附受基因影响，有一定的遗传特性，但后天的培养也很重要。偏好通常与交互的频度和时间的远近相关，频度高、时间近的记忆优先，但也不尽然。人的恐惧性以及满足感会让一些发生频度很低、时间久远的事记忆特别深刻，也形成选择性注意，这是记忆印迹太深造成的。因此，记忆网络以及记忆的多索引并行机制很重要，注意的选择性法则是：先检索典型情境提取记忆，后才走规则推理计算求解。如果存在很多的情境，之间也会有不同的权重，通过多索引机制来体现偏好。

六问：人类思维的载体是自然语言，自然语言开放性很强，通用计算机是基于图灵机模型，属于封闭的有限状态空间，根据哥德尔不完备定理，数学自身难以完全自洽。因此，人工智能怎么可以反过来要用计算机语言或者数学语言去形式化人类的自然语言呢？

答：无论数学本身如何严密，如何通用，用自然语言表述数学仍然是不可或缺的，这和哥德尔的不完备定理思想是一致的。科学家，尤其是数学家，之所以能够用自然语言思考，还因为他们的思考过程有很重要的一部分并不是在他们的脑子里，而是在外部数据处理系统的协助下进行的，人脑中的通用智能是指那些一般的、普遍的、开放的、不确定性的智能，能够触类旁通，举一反三，融会贯通。

人工智能经历了从最初的问题求解程序，到人工神经网络和人工生命的研究，经历了从符号计算到神经计算和进化计算的倡导和实施，从最初的符号主义到联结主义，再到行为主义工作范式及其相互转换。这3个范式的竞争和转换的根源，都是由于“智能的本质就是计算”这一基石受到了不同程度的挑战。人类思维活动常常用语言表达，自然语言是思维的外壳或载体。语言和文字可以脱离生命体独立存在，才有了人类文明，在人类认知中起重大作用。目前人工智能已经能够用受限的自然语言进行沟通交互，虽然还不那么好。语言涉及语境、语用、语义和语法，机器自然语言的实现，不可能要求一部机器对全世界的各种语言、各种方言全知全能，不要求应对无限，只要能够自如应答周边的语境、语用、语义和语法，应对有限，就很好了，数学可以多局部帮忙，但不能一次性全局替代。机器是否有语言智能，还要看它有没有接受语言和文字的交互、学习和进化能力。新一代人工智能是用人类的自然语言表述的，因此是开放的，不完全的，允许精确性和复杂性相容，允许不同思想兼容并包。人脑常常被比作一个内在的小宇宙，人的认知是想象的现实而已。其中的智能是多情境、多公理兼容并包的，非单调的、与时俱进的，是多边智能，智智与共的智能，在不同时刻、不同情境会有不同应对，不完全收敛，不完全自洽，不整体统一，当然也不必一定要脑裂，如同我们的微信里有很多不同价值观的朋友圈一样。因此，很难存在智能的单一的公理系统，很难存在非公理的统一体系的数学推理，“智能的统一体系”也许做不到，但可寻求“智能的弱统一体系”，或者用多个高阶智能来分段支撑。也就是说，自然语言的形式化不可能毕其功于一役。

七问：如何体现新一代人工智能与时俱进的学习能力？

答：人脑始终具有可塑性，或学得新知，或遗忘旧知，认知的螺旋与时俱进，一直不停地在做微重构。学习是神经系统不断地接受刺激，获得新知和积累经验的过程，学习的本质是理解和记忆，记忆则是将习得的知识和经验进行巩固和再现。新一代人工智能不仅在于某一个时刻它能解决什么实际的智力问题，而在于它有没有与时俱进的学习能力，其最基本特征是能够在与环境的交互过程中学习和成长。

人类最早存在的肢体语言和模仿学习都是形象思维，常常以视听觉交互认知方式表现出来，对儿童最原始的母教就是模仿。模仿学习可进一步衍生出类比学习和迁移学习。新一代人工智能也许偶尔会犯错，从错误中同样可以进行学习，如同人开车向事故学习一样。人类创造了各种各样的文字和符号就是形象思维的结果，在人类有了语言和文字之后，有了累积的文化和文明之后，随着模仿学习的延伸和升华，人类又把交互认知提高到了一个所有其他生物不具备的崭新高度——教育，并与时俱进改革着教育。教育作为专门的职业得到全社会的认可和回报，构建了人类社会特有的生态位——传承学习，这在其他动物世界组织里很难见到。智能后天的习得靠教育，教育带有强制性，是有指导的学习，不仅仅是有监督的学习。人类文明以文字、文学、法律、艺术和知识的形态积累起来大量的群体智能——人文和常识、科学和技术、知识和技巧，它们可以脱离生命体而独立存在，通过教育传承给后代，人类利用教育实现群体智能的有效传播，实现个体智能和知识的累积和迭代发展。举个例子，关于轮子的典型知识，这个让“物体绕轴滚动”的看似简单的发明和持续发明，倘若没有它，今天我们很难想象任何一种机械化工具还可以工作，这种知识累积覆盖了从齿轮到自行车、汽车、喷气发动机、精密仪表和计算机驱动的所有范围，由于人类群体延绵的智能，才能改变世界。文字是思维活动的载体，知识是群体智能的结晶，教育是传承学习（有指导的学习）的手段，个体智能通过教育获得群体智能，通过传承学习和自主学习反复迭代个体和群体智能，积累下来，形成认知的螺旋，使得人类进入了高速发展的智能时代。教学过程原本就是提高教师和学生之间交互认知能力的行为，诸如教师和学生的眼睛接触、互鉴和教师对学生的口头提示等，有助于培养学生的注意力。教育在人一生中占了四分之一的时间长度，这是其他生物无可比拟的。传承学习，加上自主学习，有指导学习加上无指导学习，这才培育出一个个单体的智能，包括通用智能，具备思考、分析、解释、解决一般问题的方法和能力。因此，新一代人工智能也必须具有这样的学习和交互认知的环境才能习得知识，而不是传统人工智能那样一次性设计而成，也不是带着特殊预设目的，向机器强制地集中性注入一个或者多个专门领域的计算智能。

八问：在新一代人工智能架构的机器人中，基本组成最少可能有哪几种？各部分中的信息产生机制与存在形式是什么？他们之间的信息传递是什么样的？

答：研究新一代人工智能架构，我们从介观(mesoscopic)尺度切入。介观是从介观物理学借用而来，指介于宏观与微观之间的一种体系。这里，我们不从基因或蛋白质水平的微观角度，也不从脑组织功能分区的宏观角度，而是在神经细胞环路与网络水平的尺度上研究脑认知，在介观上，新一代人工智能机器中，由记忆、交互和计算3个部件组成（如图2所示），其中的感知、认知与行为都是双向互动的。交互系统里有定时定位定姿、语音文字、图形图像等多种传感器部件，它们承担与外界环境的交互，而行为交互常常是一个反馈自调节的过程。记忆是新一代人工智能的核心，记忆不同于计算机中的存储，记忆系统里有瞬时记忆、工作记忆和长期记忆3类子部件，记忆是在神经细胞连接的动态变化中得到的，是多神经元相互连接、相互作用的结果。我们创新提出“智痕细胞”的概念，记忆是智痕神经元网络的一种整体状态，不是哪一个神经元单独决定的。要有用于检索记忆的多索引并行机制，从记忆网络中可挖掘出相互关联的诸多概念、认知地图、概念树、知识点和知识图，还有这些知识图随着时间变化的知识谱。新一代人工智能架构充分利用学习形成并巩固记忆智能的时候，需要计算智能来帮忙，提高可解释性。

记忆、交互和计算三部分之间的信息传递机制和螺旋发展比较复杂，但三位一体很重要。例如，在每个记忆系统的里面，依然嵌有交互与计算的子系统，但整体表现为记忆。新架构可在结构上体现人脑的不同记忆区不同记忆留存的认知网络，体现已有记忆中的印迹、概念、概念树、知识图谱中的不确定性和多索引机制，体现情境驱动的记忆智能，而不是每次都依靠知识（规则）驱动的计算智能求解才能获得问题解决方案。新架构要确保情境数据和知识模型的双驱动。

其实这和冯架构为基础的计算机智能并不排斥，计算智能可看作是新一代人工智能中的一个重要组成，无论是数值计算、符号计算，还是图计算，都是在公理、常识、原则、规律、规约、模型、方法等前提下的推理或思考，这些前提就是认知的模型，多种模型可以分别是已有的记忆对当前计算的多元约束和监督。

图2 新一代人工智能时空架构

九问：记忆、计算和存储的区别是什么？能不能说，记忆智能和计算智能都不可或缺？利用自己记忆中的经验解决当前的一个智力问题也好，利用知识去分析推理解决也好，如何建立整体的工作机制？

答：对人的智能而言，记忆是通过学习而习得的结果，记忆力体现智力，强记忆常常强智能。幼儿脑的发育，先有记忆，后有计算，进化中的人脑组织中有很大部分都是用来记忆的。人脑始终具有可塑性，或学得新知，或遗忘旧知，与时俱进，一直不停地在做微重构。记忆是后天通过学习而习得的结果，当然不理解也可死记硬背。深度学习中的人工标注相当于典型案例的强制记忆。记忆不是简单存储，记忆是重组，回忆是提取或者涌现，智能是基于记忆的预测。尤其是自动联想记忆，可以联想出模式序列或时间序列。当感知到序列的一部分时，就可以记忆起其余的部分。例如从小段歌词可勾出整首歌曲。所以，记忆的提取非常复杂。在脑科学中，它至今没有完全搞清楚思维即计算，是探究、解释、理解智能的过程，要形成当前操控载体的一个智能行为，除了直觉之外，可先根据一个实际问题的认知模型，转变为算法，再变为程序让机器执行，即计算。例如，基于知识的演绎学习，可利用归结原理、谓词演算和启发式搜索，进行由上而下的推理，完成符号问题求解、定理证明和数值计算。又例如，基于案例的归纳学习，带有不确定性，可利用人工神经网络模型，进行深度学习或强化学习，通过算法、大量的人工标注数据和算力，由下向上地完成分类和识别，或者完成数据挖掘和知识发现。

记忆是新一代人工智能的核心，记忆比计算重要得多，记忆是对计算的监督和约束，认知网络具有多索引并行机制，可通过检索引擎直接提取记忆，因为有注意力选择机理，它要比临场的思维、推理、计算快得多。实际生活中，依靠情境驱动的记忆解决问题，比知识驱动的计算解决问题更为多见。记忆早于计算，记忆优于计算，记忆约束计算,记忆随学习与时俱进。

十问：新一代人工智能机器人，存不存在停机问题？如何理解机器人在发育成长过程中软硬件的维修管理和扩充升级？

答：因为我们把人工智能定义为人类智能的体外延伸，是智力工具，新一代人工智能是有感知、有认知、有行为、可交互、会学习、自成长的机器智能，有解释、解决智力问题的能力，但没有意识，也没有免疫和自愈能力，是特定人的智能代理机器。硬件的故障自修复和停机问题，本质是高阶逻辑的不自洽性和不完备性，在这里是不存在的，只能是特定人赋予机器意向性，检测或者授权停机，特定人是机器人的高阶，并在机器人发育成长过程中扩充升级机器人的软件及其物理载体。机器人自身会学习，也会编程，会形成新的软件，更会通过与主人的交互交流提出自身“发育”需要补充的软硬件需求。设想如果人人都有个机器人代理，那将是什么景象啊！