原载《华中科技大学学报(社会科学版)》2026年第1期
(李珍.身体何为:论具身智能的“具身悖论”[J].华中科技大学学报(社会科学版),2026(1):8-16.)
摘要:根据奇偶性原理,认知过程可“卸载”至环境,同理,具身过程亦可“内化”于大脑。具身智能由此面临一个根本悖论:身体是否为其必要条件?这一悖论源自具身与计算两种认知路径之间的内在张力。通过比较彻底拒斥计算主义的“革命派”(身体生成主义)与主张融合计算传统的“改革派”(身体功能主义),力图为改革派立场辩护,提出核心主张:具身性在本质上是一种模拟计算,即系统借助自身连续物理动力学对目标系统进行模拟的过程。在这一重构下,身体的必要性体现为模拟计算的具身化实现,其哲学困境也随之转化为对实现方式的探索。
关键词:具身智能;具身悖论;生成主义;功能主义;模拟计算
引言
近年来,人工智能的研究范式经历了从计算主义向具身主义的转变。传统人工智能将智能视为一种抽象的信息处理过程,侧重于符号推理、知识表征和算法优化,其核心假设是智能可以脱离身体在纯粹的计算系统中实现。然而,随着研究的深入,这一范式在解释和构建真正意义上的智能系统时逐渐显露其局限性。具身智能(embodied AI)的兴起,正是对传统人工智能困境的一种回应,它强调智能体的身体形态、感官运动系统及其与环境的实时交互在认知涌现中的根本作用。其核心观点包括:第一,身体不仅是感知和行动的媒介,更是塑造认知结构的根本因素;第二,智能体的行为必须置于真实的物理和社会环境中去理解,而非仅通过内部符号操作模拟;第三,智能的发展是一个动态、历史性的过程,依赖于个体与环境的持续交互。这一范式不仅得到认知科学中4E认知(具身的、嵌入的、延展的、生成的认知)理论的支持,也在机器人学、神经科学和发展心理学中获得了实证依据。
然而,尽管具身智能在理论上颇具吸引力,当前的实际应用仍远未实现其理想形态,大多数所谓的“具身”系统仍依赖于硬编码的控制策略、预定义的行为模块或有限的环境模型,其行为缺乏真正的适应性和涌现性。例如,尽管ICub等人形机器人拥有复杂的身体结构,其行为仍依赖于手写代码和传统视觉算法,并未体现出身体与环境的共演化关系。Roomba等商用机器人虽具物理形态,但其行为模式化僵化固定,缺乏真正的智能互动。这些系统往往只是在形态上具身,而非认知上具身;它们的身体并未在与环境的持续互动中共同演化出智能,而更多的是被设计为执行特定功能的工具。这种将身体作为外设的观点,实质上未能真正体现具身认知所倡导的“身体作为必要条件”的本体论主张。
在此背景下,本文旨在探讨具身智能的一个核心悖论:若智能的确依赖于身体,那么是否意味着无物理实体的纯计算系统必然无法实现智能?反之,若能通过高精度仿真模拟出身体-环境交互的全部功能,是否意味着具身性可被完全虚拟化?“身体是否必要”这一问题陷入哲学上的两难。具身悖论不仅关乎技术路径的选择,更触及智能、身体与认知边界等哲学根本问题。
本文将从这一根本冲突出发,揭示具身悖论形成的理论背景和根源,旨在通过将具身认知重新界定为一种模拟计算的过程,来消解具身智能所面临的身体必要性悖论。这一理论重构试图阐明,身体的必要性并非源于其物理实体的不可替代性,而是体现在其为模拟计算提供的动力学实现基础之中。为论证此观点,文章首先从奇偶性原理(parity principle)出发,揭示该悖论源于具身与计算两种视角的根本张力;继而剖析彻底拒斥计算主义的“革命派”(身体生成主义)与主张融合计算传统的“改革派”(身体功能主义)两条对立路径;最后,通过引入模拟计算理论,为改革派立场辩护,在这一重构下,身体的必要性体现为模拟计算的具身化实现,其哲学困境也随之转化为对实现方式的探索。
一、奇偶性原理与“具身悖论”
人工智能研究的原始驱动力,源于对人类智能本质的模仿与复现,因此,如何理解“智能”,从根本上塑造了AI研究的路径与形态。回溯近代哲学传统,自笛卡尔提出身心二元论伊始,主流观点长期将心智禁锢于大脑之中。“我思故我在”不仅确立了一种怀疑方法,更暗示存在的根本是思维性的“我”,而非物质性的“身”。在这幅图景中,我们的身体仅被视为一种传导工具——它接收感官信息并执行运动指令,却不参与认知本身,由此衍生的第一代认知科学,将人类复杂的心智活动简化为抽象符号的形式化操作,仿佛智能只是发生在颅内的一场无声计算。早期AI研究深深浸染于此种离身性思想。无论是明斯基(Marvin Minsky)的框架理论,还是纽厄尔(Allen Newel)与西蒙(Herbert Simon)的物理符号系统假设,都致力于在计算机中复现这种“纯粹”的推理过程。研究者们认为,智能的关键在于对符号的操纵,身体只是可有可无的附属。甚至以联结主义为基础的类脑计算,虽然转向模拟人脑神经结构,其目标仍是在机器中重建一个可进行信息处理的“内在大脑”,并未跳出身心二元的桎梏。这一阶段的AI可称之为“离身智能”(disembodied intelligence)。
离身AI虽然在棋类游戏、专家系统、自然语言处理等封闭领域取得了显著成就,但在处理开放、动态、不确定的真实世界任务时却举步维艰。研究者们发现,那些对人类而言轻而易举的能力——如运动控制、物体操纵、常识推理、情感理解——对机器而言却难如登天。这些困境暴露出一个根本问题:智能并非仅源于抽象计算,而是深深植根于智能体与世界的互动。
正是在这一背景下,具身认知(embodied cognition)自20世纪90年代起逐渐兴起,成为一种重要的研究范式。该范式主张,认知并非局限于大脑内部的抽象符号运算,而是源于身体与环境之间的实时互动,认知系统应被理解为由“大脑—身体—环境”共同构成的动态耦合体系。这一范式涵盖多个理论流派,彼此呼应又各有侧重。例如,瓦雷拉(Francisco Varela)、罗施(Eleanor Rosch)和汤普森(Evan Thompson)提出的生成主义(enactivism)强调,认知并非对外部世界的被动表征,而是有机体通过自身行动生成世界和意义的过程。社会文化取向的具身认知则进一步指出,身体不仅是生物物理实体,也是社会与文化实践的产物,身体姿态、手势乃至情感表达,都内嵌了社会规范与文化脚本,这些反过来也塑造了认知的结构与内容。此外,克拉克(Andy Clark)与查尔莫斯(David Chalmers)提出的延展认知(extended cognition)也常被置于具身认知的广义框架中讨论。尽管侧重点有所不同,这些流派都共同反对传统认知主义中的离身观,强调认知是嵌入环境、依赖身体、并通过具体行动实现的。
具身性主张不仅重塑了认知科学的基本框架,也为人工智能研究带来了方法论上的革新。研究者不再局限于算法设计与符号推理,转而投入机器人的设计,强调在真实的物理交互中涌现的智能。这一路径在运动控制、适应性行为、实时感知等方面取得显著进展并揭示出身体结构及其物理属性——如弹性、形态与质量分布——本身就能承担部分控制功能,从而大幅降低对中枢计算的需求。
尽管具身认知在哲学上和局部模型中颇具说服力,然而其理论承诺与实际成效之间仍存在明显差距。批评者指出,具身观点常停留于修辞层面,其核心前提要么是“不可接受的模糊”,要么是“没有什么新东西”。更严峻的挑战来自实践:许多所谓的“具身系统”仍严重依赖传统算法,它们不过是在机器人躯壳中运行离线训练好的模型,其“身体”并未在认知过程中扮演构成性角色。与此同时,无实体身体的深度学习模型(如GPT系列)却在语言、绘画、推理等高级认知任务中表现出接近人类的能力,进一步动摇了身体必不可少的论断。
在这一争论中,克拉克与查尔莫斯提出的奇偶性原理,其逆向逻辑为揭示“具身悖论”提供了关键理路。该原理主张:“如果当我们面对某项任务时,世界的一部分作为一个过程发挥作用,如果它是在头脑中完成的,我们会毫不犹豫地承认它是认知过程的一部分。那么世界的这个部分就是(所以我们声称)认知过程的组成部分。认知过程不是(全部)在头脑中!”换言之,如果某个外部工具或设备在功能上等同于大脑内部的某个认知过程,那么该外部对象同样应被视为认知的一部分。例如笔记本或智能手机可作为外部记忆载体。奇偶性原理也可以被理解为对多重可实现性原则的一种解读:同一功能过程可由多种物理结构实现,无论其位于头脑之内还是之外。然而较少被讨论的是,奇偶性原理在逻辑上具有双向性,它不仅意味着内部认知可向外延展,同时也意味着任何在功能上等价的外部过程均可被内化为认知的一部分。也就是说,认知过程可以“卸载”到环境中,同理,具身过程可以“内化”到大脑中。认知的位置变得无关紧要,真正重要的是其功能结构是否得以实现。
奇偶性原理对具身智能的理论基础构成了严峻挑战。如果以功能等价作为判断认知发生与否的标准,那么:一个虽无实体身体却能在精确模拟环境中与虚拟身体进行实时交互的计算系统,是否也应被视为具身智能?倘若接受奇偶性原理,答案似乎是肯定的。具身性所带来的诸多优势在原则上均可通过高保真度的仿真环境复现。依据这一逻辑,身体的必要性似乎完全取决于其功能结构是否可以被模拟。
为阐明这一悖论,可思考一个“全仿真模拟假说”思想实验:假设存在一个构建于高性能计算平台上的精细虚拟环境,其中物理规则高度逼真,并包含一个模拟机器人和一个虚拟世界。该机器人具备与真实机器人完全等效的传感器与驱动器模型,它的控制架构严格遵循具身认知原则,包括低层反射、感觉-运动协调、动态身体耦合等机制。进一步假设该仿真系统在输入-输出行为层面与真实机器人系统无法区别,且在内部信息处理与动力学过程的功能上也完全一致。根据奇偶性原理,该模拟系统中发生的所有过程,如虚拟身体与环境的交互、传感器的信号生成、运动引起的反馈,在功能上与真实世界中的对应过程等价。因此,即使该系统没有物理实体,我们仍应承认它实现了具身认知。它拥有具身性带来的所有功能优势,却不真正拥有一个身体。这意味着,“身体”在认知中可能并不具有不可替代的本体论地位,它只是实现某种功能关系的介质之一。一旦该关系可经由仿真复现,具身性即被“内化”至计算过程之中,从而消解了其原本依赖物理存在的必要性。
此思想实验并非纯理论虚构,当前已有诸多基于物理引擎的训练方法通过仿真来为实体机器人提供控制策略,如MuJoCo、PyBullet等,虚拟现实与数字孪生技术也逐步逼近真实体验。倘若未来模拟技术足以乱真,具身智能是否仍必须依赖物理实体化?抑或,一个足够精确的仿真系统本身就已经是具身智能的一种形式?这一悖论迫使我们对“具身”的内涵进行重新审视:它究竟是指认知过程依赖于一个物理的、存于真实世界中的身体,还是仅指认知在功能上依赖于某种具有形态、感知与行动耦合的动力学结构,而无论该结构是物理实现还是虚拟仿真。若依后者,则具身智能并未真正脱离计算主义的框架,它只是将计算范围从大脑扩大至身体-环境系统,而这一系统在原则上仍可被模拟。这一悖论从根本上引出了如下问题:强调物理身体与真实世界嵌入的具身主义,与主张功能可仿真、结构可计算的计算主义,二者之间是何种关系? 这一问题直指具身智能的理论基础与发展路径。
二、具身主义和计算主义的关系
关于具身智能的讨论虽然热烈,但其定义在当前仍未确定,正如齐姆克(Tom Ziemke)所敏锐指出的:“具身人工智能——乃至整个具身认知科学——似乎更多是由其所反对的东西来定义的,而非由其所积极主张的东西来界定……许多研究者拒绝以纯粹计算术语来解释智能与认知,然而至今仍缺乏清晰的替代方案。”这种理论上的模糊性,使得我们必须在方法论层面认真对待具身主义与计算主义之间的关系。对此,学术立场可大致划分为两种代表性进路:一种是“革命派”,认为认知不需要计算和表征,具身认知应彻底取代计算主义,如瓦雷拉等人的生成主义;另一种是以克拉克为代表的功能主义,主张在继承计算传统的基础上进行修正与扩展,可称为“改革派”。两派不仅在“身体”和“具身”的理解上存在根本差异,也对认知是否必须依赖计算与表征提出了截然不同的回答。
1. 革命派立场:生成主义及其对计算主义的彻底拒绝
生成主义源于1991年瓦雷拉等人《具身心智:认知科学与人类经验》一书的出版,这本书试图带来一场认知科学的范式革命。他们提出,认知并非发生在大脑内部、对世界进行抽象表征和符号操作的静态过程,而是一个具身化、情境化且自主生成的动态活动。认知不是对预先存在的客观世界的被动反应,而是通过生命体与环境的实时感官运动互动,共同生成和塑造其所体验的意义世界。因此,生成主义提倡一种强形式的具身认知观念:认知应从颅骨之内解放出来,被视为生命体为维持生存、在与环境的互动中主动生成世界感的一种具身实践。早期生成主义主要受新兴的复杂系统科学、认知语言学、佛教冥想传统以及现象学的影响。近年来,生成主义更侧重于用最佳解释推理为具身认知提供科学论证,如切梅罗(Anthony Chemero)的《激进的具身认知科学》一书。尽管有所差异,生成主义始终共享一个根本目标:推动认知科学彻底放弃计算与表征的传统路径,转向以具身、嵌入和动力耦合为核心的新范式。
首先,计算主义认为,认知系统通过内部表征来应对外部世界,这些表征就像一个描述世界的模型。生成主义则认为,恰恰相反,世界的意义和结构是通过我们特定的身体结构和活动方式揭示出来的。心灵、身体和世界是一个不可分割的耦合系统,认知主体通过自身的具身行动与世界持续互动,共同生成我们所感知到的有意义的世界。因此,对于一只蜜蜂、一个人或一个机器人,世界对他们的意义是完全不同的,因为它们具有不同的身体和行动能力。
其次,计算主义认为,心灵可以独立于身体而存在,身体仅仅是心灵的工具或载体,负责输入和输出,而真正的思考发生在大脑之中。生成主义则认为,身体在认知中扮演着构成性的角色,身体的形态、感觉运动系统乃至生理过程,都深刻地塑造着我们的思维方式和概念的形成。例如,我们的很多抽象概念(如“上下”“前后”)都源于我们身体的物理体验(如直立行走、有前后方向),没有这样的身体体验,这些概念将是不可想象的。
最后,计算主义将抽象的、无意义的符号作为计算的基本单位。而生成主义认为,认知是情境化的,它发生在具体的环境中。思考并不仅仅是大脑中的符号操作,而是涉及整个身体的体验。我们是通过“做”来“知道”的,认知与行动不可分割。下棋时,棋手并非在头脑中计算所有可能的步骤,而是通过识别棋盘上的态势来作出决策;走路时,我们不会先计算腿的运动轨迹,而是通过视觉和本体感觉来反馈实时调整。
2. 改革派立场:功能主义及其对计算主义的兼容
与生成主义的革命姿态不同,以克拉克为代表的功能主义改革派,主张在肯定具身重要性的同时,并不完全抛弃计算和表征主义的传统。克拉克认同认知深深依赖于身体与环境的实时互动,但他认为这并不必然导致对计算主义的全盘否定;相反,我们应扩大计算的范围,使其包含身体、环境乃至技术工具在认知过程中的功能角色。
对于克拉克来说,他并不是全盘否定表征和计算主义,而是拒绝在感知、行动和认知之间不作区分的观点。例如,福多(Jerry A. Fodor)将思维划分为模块化的、特定区域的感知和运动过程。克拉克反对这种认知架构的观点,他认为思维是大脑与非神经体和环境结构协同工作的结果。克拉克利用后连接主义计算建模、情境机器人、人机交互、发展心理学、视觉科学甚至管理研究的资源证明:人类大脑并不是在与身体和世界隔绝的情况下执行其功能,而是应被视为我们在世界上具身活动的控制器。思维可能本质上是具身的,但它们仍然“关键地依赖于计算和表征的大脑”。在克拉克看来,认知科学的意义不是放弃计算主义,而是进行一些调整和完善,为身体、工具和技术,甚至认知计算腾出空间。大脑并不太关心它在哪里进行计算处理,有时计算可以通过外部人工制品和身体操纵来完成,有时完全可以在头脑中完成。认知系统是一个高度灵活的分布式系统,大脑并不独占认知的所有权,而是作为一个调控中心,通过动态组合神经结构、身体动作与外部资源以完成认知任务。
克拉克尤其强调,身体会通过三种方式影响认知。第一种方式即机器人学中的形态计算,它展示了身体形态和生物力学如何在解决问题时被利用来完成原本必须由大脑完成的计算工作。第二种方式是构建信息流,从而创造出解决问题所需的数据。例如,通过移动头部或身体,视觉系统可获得不同视角的信息,从而减少内部推理的负担。第三种方式是认知延展,身体能够将外部工具和技术无缝整合进认知循环,形成延展认知系统。感觉替代装置(如用触觉传递视觉信息的设备)就是一个例证。熟练使用者不会注意到皮肤的振动,而是直接透过设备感知外界对象,该设备在功能上已成为感知器官的一部分。
可见,身体的作用被理解为功能性的或因果性的:它是实现某一计算过程的手段,其贡献可在抽象的功能描述中被识别和说明。身体因此被视为一种“桥梁”或“工具”,用于连接大脑与外部世界,从而构建更高效的问题解决架构。克拉克明确指出:“身体是智能利用环境结构的主要工具……它使我们能够以转化和简化内部计算的方式与外界互动。”这隐含了一种更为基本的认知原则:认知任务的功能组织是可多重实现的——既可以通过神经活动实现,也可借助身体或外部资源实现。
因此,克拉克所主张的具身认知并不要求放弃计算和表征,而是对传统认知科学进行修正与扩展。他接受“计算心智”的基本框架,但主张大脑不在乎计算在何处发生,只要某些过程在功能上扮演了计算与表征的角色。这种立场也被称为“有限具身”或“功能具身”,它试图在承认身体重要作用的同时,保留认知科学中功能分析与计算解释的有效性。
生成主义与功能主义虽然都强调具身的重要性,但它们在哲学基础、理论目标与方法论上存在深刻分歧。具体可总结为如下几点:一是对表征的态度。生成主义完全拒绝内部表征的概念,认为认知可以直接通过身体与环境的互动实现,无须中介性的符号操作。而功能主义则认为,即使是在具身和嵌入的情境中,某些外部结构或身体行动仍在功能上扮演了表征的角色,它们承载信息、指导行为,并在认知系统中发挥计算作用。二是身体的作用。生成主义视身体为认知的构成性基础,即没有特定类型的身体,就没有特定类型的认知;身体不是工具,而是认知本身得以可能的条件。相反,功能主义将身体视为认知的扩展工具,其作用是在功能上辅助或替代大脑的计算过程,身体是实现认知功能的多种可能载体之一。三是计算与认知的关系。生成主义主张彻底告别“认知即计算”的范式,认为具身认知应建立全新的概念体系。而功能主义则认为,具身认知并未推翻计算解释,而是扩展了“计算”的发生场域,即从孤立的大脑走向了“大脑—身体—环境”共同构成的分布式系统。四是对具身的理解。生成主义强调具身的存在论含义,即认知依赖于生命体具体的、历史的和现象的身体经验;而功能主义则采取更抽象的功能等价立场,即只要某一过程能实现与身体类似的计算功能,它就可以在认知中扮演相同角色。这也正是奇偶性原理所暗示的结论。
生成主义与功能主义的分歧,本质上反映了具身悖论中更深层的理论张力:一方面,若坚持生成主义的强具身立场,则身体被视为认知不可还原的构成基础,但这可能阻碍了对智能形式普适性的探索,甚至陷入某种身体神秘主义和二元论;另一方面,若接受功能主义的调和立场,虽可保持计算理论的解释力,但却可能淡化具身的特殊性,甚至被奇偶性原理瓦解——如果功能等价,虚拟身体亦可替代物理身体。这一两难不仅关乎技术路径的选择,更触及我们如何理解认知、身体与世界的根本关系。
三、作为模拟计算的具身性
笔者并不赞同生成主义的强具身立场。首先,根据强具身观点,真正的具身性根植于生命有机体的生物学和现象学特性,身体不仅是功能载体,更是自我持存的本体论基础,智能是活的身体在与环境互动中涌现出来的。倘若将此观点应用于AI,将带来严峻挑战:当前的AI和机器人,无论多么复杂,尚不具备生命有机体的基本特征。强行将基于生命的“身体”概念套用于非生命的机器,存在范畴错误的风险。并且,如果接受这种观点,就必须采纳一整套关于生命如何从物质中创生的复杂理论,从而大大增加了理论负担和验证难度。其次,生成主义会面临身体神秘主义与新二元论的隐忧。具身智能理论在批判脑中心主义时,将身体推向了舞台中央,却可能不经意地滑向另一种形式的中心主义——身体中心主义。传统认知科学常被批判将大脑视为“笛卡尔剧院”,内在的“小人”(homunculus)在脑中观看表征并决策。具身认知理论破除了脑的内部表征中心地位,转而强调身体的作用。然而,这可能导致身体成为新的“笛卡尔剧场”,成为感知的源头、行动的发起者、意义的生成地。这仅仅是用“身体小人”替代了“脑中小人”。这种对身体的过分强调,可能只是掩盖了对某种内在主体性或心智内核的预设,未能真正克服心物二元论。
笔者认为,具身悖论的根源在于对“计算”这一核心概念的狭隘理解。革命派(生成主义)所挑战的,实质上是基于离散符号操作和规则演算的经典数字计算主义。然而,如果我们超越这一传统范式,将“计算”的概念拓展至模拟计算,那么,改革派(功能主义)不仅能够有效吸纳具身认知的核心洞见,更能为破解此悖论提供一套严密而富有解释力的理论框架。笔者旨在论证:具身认知在本质上可被理解为一种模拟计算,这一重构不仅挽救了计算主义的核心地位,而且更精确地刻画了身体在认知中的功能角色,从而在哲学上消解了“身体是否必要”的两难困境,并为具身智能的开发路径提供参考。
1.从数字计算到模拟计算
经典计算主义将认知类比数字计算机,处理的是离散的、静态的符号,其过程是序列化的、规则驱动的逻辑演算。然而,计算概念本身远比数字计算更为丰富。一种更具包容性的视角是模拟计算:计算系统不是一个处理抽象符号的句法引擎,而是一个利用其自身的连续物理动力学来模拟目标系统动力学的物理过程 。“计算”体现系统内部连续变化的物理量被精巧地构型,使得它们之间的动态关系与另一个系统的动态关系形成同构或同态。例如,我们伸手拿起水杯时,手臂的肌肉、肌腱和关节中的张力与角度变化,本身就构成了一套模拟计算系统:这些物理量的动态变化,实时计算并模拟了水杯的位置、质量以及我们身体与它的空间关系,从而导引出流畅精准的动作,而无须大脑先将其编码为离散符号再进行演算。
这一理解的转换意味着,认知的计算理论不必与身体的物理性、情境性和动态性相冲突;相反,身体的物理动力学本身,就可以视为一个天然的、高度复杂的模拟计算机。神经系统、感觉器官、运动系统以及它们与环境持续地相互作用,共同构成一个通过物理过程(而非符号操作)来计算生存相关问题的模拟系统。因此,与克拉克的功能主义立场不同的是,解决具身主义和计算主义之间张力的途径,不是在计算框架内为身体寻找一个位置,而是将身体重新定义为执行认知计算的物理系统。
值得注意的是,模拟计算的具体实现形态,在物理实体机器人、虚拟智能体等不同技术载体上存在差异。对于物理实体机器人,其模拟计算直接由机械身体的连续物理动力学(如力、形变、热传导)在真实物理环境中实现,身体是计算不可分割的物理基础,其必要性体现为它与真实世界因果律的关联。而对于虚拟环境中的智能体,其“身体”及环境均由数字仿真引擎模拟,模拟计算实则是底层数字计算机对连续动力学的近似计算。此时,“身体”的必要性不根植于物理实在,而转化为交互界面的设计必要性:一个具有形态、动作并能与模拟环境进行连贯交互的虚拟化身,为智能体提供了一个稳定、可操作且富含语义的动力学交互界面。
2.复杂系统中表征的必要性
将具身认知视为模拟计算,一个亟须回答的核心问题是:在此框架下,表征是否依然必要?以瓦雷拉为代表的革命派对此持否定态度,主张认知是身体与环境互动中直接生成的,无须内部表征。然而,笔者认为,尽管革命派正确地批判了静态符号表征的局限,但在处理复杂认知时,一种动态的、行动导向的表征不仅存在,而且是解释系统功能所必需的。
首先,我们需要重新审视革命派对表征的拒斥。瓦雷拉等人强调,认知并非对世界的内部镜像,而是通过具身行动“生成”意义。他们反对的是那种脱离行动、去语境化的强符号表征。然而,细察其理论,一种弱意义上的功能性表征依然潜藏其中。当有机体为了生存而行动时,其神经系统与身体状态必须与环境特征保持一种系统的、具有关涉性的协变关系。例如,青蛙视觉系统对飞虫的检测并触发捕捉动作,这一感觉运动模式虽非抽象符号,却实实在在地承载了关于环境特定状态的信息,并据此引导行动。这种为行动服务的表征,其内容由它在感觉运动循环中的功能角色所决定。因此,革命派所挑战的,更多是表征的某种特定形式,而非所有形式的关涉性。在复杂的目标导向行为中,这种行动导向的表征对于协调跨时空、跨模态的信息至关重要。
其次,可以借助艾萨克(Alistair M. C. Isaac)对反表征主义的动力学论证的反驳来强化这一立场。反表征主义者常以瓦特调速器等简单动力学系统为例,声称其行为仅凭微分方程即可完美解释,引入表征是多余的。艾萨克对此的回应极具启发性:对于低维、功能单一的系统,此论或可成立;但面对复杂系统,纯动力学解释则力有不逮。他以MONIAC装置为例,得出此结论。MONIAC是一个通过水流模拟开放市场经济循环的装置,允许用户通过观察彩色水流在一系列透明管道和水箱中流动和汇集的变化来判断政策对货币供应量的动态影响。其水流动力学固然可由方程描述,但仅凭此无法解释它为何能代表经济活动。为何结构相似的两个水罐,一个代表“储蓄”,另一个代表“外汇储备”?为何特定罐壁的曲率至关重要?答案必须诉诸表征赋值:该曲率并非任意,它被设计来代表凯恩斯理论中流动性偏好与利率的特定函数关系。若无此表征性解释,我们既无法理解其设计,也无法区分功能相关的动力学模式与无关的物理噪声。具身认知的情境与此类似,一个人在复杂情境中,大脑-身体-环境系统的动力学庞杂无比,即便能记录所有物理参数的时间序列,也远非完整的认知解释。我们必然能识别出:哪些神经模式、身体姿态或环境结构承载了功能角色,它们关涉了什么?正是这种表征层面的辨识,使得系统能够理解情境意义并灵活应变。
因此,在复杂的模拟计算系统中,表征并非多余。恰恰相反,识别表征是我们从纯物理动力学描述迈向认知解释的关键桥梁,它划定了其功能边界,阐明了结构设计的目的,并最终解释了行为何以具有适应性智能。将具身认知视为模拟计算,非但不排斥表征,反而以运动学的、具身的新形式重新确立了表征在解释复杂认知中的不可或缺性。
3. 具身性的计算重构
将具身认知视为模拟计算,不仅调和了计算主义和具身主义之间的张力,更催生了对具身性本身更为精细的理解。这一视角蕴含了三个理论支柱,它们共同定义了何为“作为模拟计算的智能”。
一是表征的具身形态。模拟计算催生了对表征形态的重新构想。首先,表征是动态化的。这意味着,认知系统并非通过存储静态的数据来表征世界,而是通过其状态的变化模式来度量世界。例如,在运动中,关节角速度的连续变化本身即构成了对自身运动状态和外部物体相对运动的动态表征。这类似于MONIAC中水流速率的变化表征经济活动的涨落。表征的载体是过程本身,而非过程中的某个快照。其次,表征是结构化的。认知系统的物理结构(无论是神经连接模式、身体形态,还是感觉运动耦合的固有属性)本身可以固化某种计算关系。在生物体中,身体的形态、四肢的动力学特性,都可视作一种结构化表征,它们先天性地编码了对于特定生态环境的适应性假设,简化了在线计算的需求。动态化和结构化表征形态体现了具身性:它们与主体的物理构造和运动能力密不可分,是行动中的知识。
二是解释的仿真依赖性。数字计算主义认为,一旦掌握了算法,便完全理解了系统。然而,模拟计算和复杂动力学系统的非线性和整体性特征,使得纯粹的分析性理解常常变得不可能。系统的宏观行为是其多组件非线性耦合后涌现的结果,无法通过单独分析各部分来预测,因此,对这类系统的完整解释,必然包含构建模型并进行仿真的环节。只有通过运行这个模拟过程,观察其动态轨迹,我们才能理解各种复杂的认知现象。这赋予了认知科学一种建构性的方法论:理解心智,要求我们构建与身体和环境实时交互的认知模型,并在仿真中观察其涌现的动态过程。这并非解释的失败,而是在面对复杂具身系统时,解释本身所必须采取的形式。
三是稳健性(robustness)作为认知的判据。并非所有的身体动态都是认知,一个有效的理论必须能够区分真正的认知过程与物理上的偶然波动。模拟计算理论提供了一个关键约束——稳健性。任何现实的物理模拟计算都受制于底层噪声。一个真正的认知过程,必须是一个有效程序,即在面对一定程度的内部噪声和外部扰动时,仍能稳定地产生适应性结果的过程。这一稳健性判据将认知与单纯的物理反应区分开来,它意味着,只有那些在进化或学习中被选择、巩固下来的,能够可靠执行的感知-行动循环,才能构成认知。这一观点巧妙地融合了改革派与革命派的洞见:它承认认知根植于身体动力学,但同时强调,只有那些满足计算可靠性标准的动力学过程,才配称为认知。
将具身性理解为模拟计算,不仅是一种哲学上的重构,也为具身智能的发展指明了一种可能的路径。我们应超越将身体视为被动执行器或信息采集端的传统思路,转而将智能体的整体架构视为一个专为模拟特定任务的动力学而设计的专用计算机。具体而言,具身智能的研发应聚焦于三个方面:第一,协同设计物理形态与计算过程,即让机械结构、材料特性、传感器布局等硬件本身成为计算资源的一部分,使其动力学天然适配目标任务的物理约束;第二,开发新型仿真工具与编程方式,能够直接对连续物理动力学进行建模、编译与优化,而非仅离散地规划动作序列;第三,确立以任务的动力学匹配度为标准,评估智能体是否“足够具身”,即其整体系统是否能够通过自身的动态过程,稳健且高效地模拟出解决特定问题所需的关键交互动力学。这实质上是将“身体必要性”问题,从形而上学的争论转化为一个工程上的优化问题:何种物理或虚拟形态,能以最低的成本实现对特定环境交互功能最稳健的模拟计算?
结语
通过将具身性重构为模拟计算,我们尝试为具身悖论提供了一种解答。回到开篇的两个问题。问题一:无身体的纯计算系统是否无法实现智能?答案是:一个没有实现模拟计算所必须的物理动力学的纯数字符号系统,确实难以实现完整的具身智能。但是,一个在强大硬件上运行的、高保真的物理仿真环境,其本身就可以视为一个虚拟的模拟计算机。当一个人工智能体在这个环境中通过连续的、感性的交互进行学习时,它正在经历一种虚拟的具身模拟计算。其关键在于实现功能的等价,而非基质的同一。问题二:高精度仿真是否意味着具身性可被完全虚拟化?答案是:在功能等价的意义上,是的,但这绝非易事。虚拟化并非简单的图形渲染或逻辑推理,而是要求构建一个能够支持连续、多模态、具有物理真实性的交互动力学的模拟计算环境。身体的必要性,在此被转化为实现特定模拟计算功能的物理结构的必要性,而一个足够强大的虚拟物理引擎,正是一种新型的物理结构。
功能主义的智慧在于其功能的普适性与实现的灵活性。生成主义明确地指出了身体在认知中的构成性角色,但彻底拒斥计算与表征的立场,使其无法为虚拟具身性提供任何理论空间。而经由模拟计算理论重构后的功能主义,则展示了一条中间道路:它深刻地尊重身体的根本地位,同时以计算的功能主义视角,为理解乃至最终在机器中重构智能开辟了一条既符合哲学严谨性又充满技术潜力的道路。具身悖论,由此在一种更宏大、更精确的计算观念中得以消解。
参考文献
[1]Rolf Pfeifer, Christian Scheier. Understanding intelligence[M]. Cambridge, MA: MIT Press, 1999:25.
[2]Nick Chater, Jennifer Misyak, et al. Negotiating the Traffic: Can cognitive science help make autonomous vehicles a reality?[J].Trends in cognitive sciences. 2018, 22(2): 93-95.
[3]Rodney A. Brooks. Elephants don’t play chess [J]. Robotics and autonomous systems,1990, 6(1-2): 3-15.
[4]Francisco J. Varela, Evan Thompson, Eleanor Rosch. The Embodied mind: Cognitive science and human experience[M]. Cambridge, MA: MIT Press, 1991:147.
[5][美]雷蒙德·W.吉布斯. 具身性与认知科学[M]. 魏屹东, 孔佳仪,译. 北京 : 科学出版社, 2024:31.
[6]James Carney. Thinking avant la lettre: A review of 4E cognition [J]. Evol stud imaginative cult, 2020,4(1): 77-90.
[7]Stephen D. Goldinger, Megan H. Papesh, et al. The poverty of embodied cognition [J]. Psychonomic bulletin & review, 2016, 23: 959-978.
[8]陈晓平,翟文静. 智能时代与社会道德——从ChatGPT引起的问题谈起[J]. 广西大学学报(哲学社会科学版),2024(4): 50-58.
[9]Andy Clark, David Chalmers. The extended mind[J]. Analysis,1998, 58(1): 7-19.
[10]Tom Ziemke. Embodied AI as science: Models of embodied cognition, embodied models of cognition,or both? [C]∥Embodied Artificial Intelligence; Fumiya L, Pfeifer R, Steels L, Kuniyoshy Y. Eds. Springer: Berlin/Heidelberg, Germany, 2004: 29.
[11]Anthony Chemero. Radical embodied cognitive science[M]. Cambridge, MA: MIT Press, 2009.
[12]郁振华. 知行哲学与认知科学的实践转向[J]. 社会科学,2025(4): 15-26.
[13]Andy Clark. Being there: Putting brain, body and world together again[M]. Cambridge, MA: MIT Press, 1997:143.
[14]Andy Clark. Supersizing the mind: Embodiment, action and cognitive extension[M]. Oxford, England: Oxford University Press, 2008.
[15]Tim van Gelder. What might cognition be, if not computation?[J]. Journal of philosophy 1995, 92(7): 345-381.
[16]Alistair M.C. Isaac. Embodied cognition as analog computation[J]. Reti, saperi, linguaggi. 2018, 7(14): 239-262.
[17]Ming Li , Paul Vitányi. An introduction to kolmogorov complexity and its applications[M]. New York: Springer-Verlag, 2019:101.