陈保亚：语言对认识活动的建构——从AI大语言模型说起

陈保亚，北京大学中国语言学研究中心研究员，北京大学中文系教授

摘要：长期以来，语言相对论关于语言深刻影响思维的命题一直得不到实证和证伪，主要是缺少一种“语言人”和“非语言人”的比较。AI大语言模型让AI获得了自然语言理解和生成能力，AI的能力也产生飞跃，甚至出现涌现能力，这证明自然语言符号系统对AI的认识活动有强烈的建构作用。这引导我们去观察人类大脑在具备某种特殊符号系统的情况下认识能力有什么变化。通过比较证明，数学符号系统对数学认识活动有建构作用，音乐符号系统对音乐认识活动有建构作用。总之，无论是人工智能AI还是人脑，都受到了语言符号系统的深刻建构。语言不仅仅是记录思维和交际的工具，更重要的是认识活动得以建立的建筑材料。由于语言符号系统的差异，这种建构也存在差异，在一定程度上支持语言相对论，即不同的语言符号系统对认识活动有不同的建构作用。至于这种建构是否深刻影响思维，有待进一步研究。

关键词：大语言模型；认识活动；语言建构；相对论

引言

语言和认识活动、思维的关系，从近代开始引起了人们的深度关注。分析哲学和语言哲学对语言和哲学的关系有很多重要认识。分析哲学和语言哲学的语言观主要是一种语言表达论，即认为哲学问题的产生是语言表达的误用，并进一步提出意义即用法的观点以消解哲学问题。自洪堡特以来的语言相对论关注的是另一个角度，即认为语言对经验具有主动划分的作用。语言相对论在萨丕尔、沃尔夫时期得到了很大的推进，一个重要的结论就是：不同语言的民族具有不同的世界图式。不过，这一假说的证实和证伪都有很大的难度，其中一个很重要的原因在于，人们很难找到能和语言人相比较的非语言人。

近几十年来，很多脑电科学研究都试图解决语言相对论这一难题，努力通过实验的手段来论证语言和思维的关系，取得了诸多成果。脑电实验目前主要关注的是语言活动的大脑部位，以及简单语言现象的脑电变化。语言作为一个高度复杂的符号系统，和大脑的关系还远远不清楚。

近年来，AI大语言模型在自然语言处理上取得重大突破，为我们认识语言和思维的关系提供了重要的窗口。大语言模型能够生成符合语法规则和语义规则的崭新句子，一定还原出了自然语言的单位和规则，解决了长期以来人工智能中自然语言处理的难题，这是一个重要的转折。从语言和思维的关系看，这个转折更重要的意义在于，大语言模型从自然语言入手，得到快速发展，从一个侧面证明了语言符号系统对机器大脑具有重要的建构作用。这也让我们从一个崭新的角度来看待各种符号系统对人脑认识活动的建构。下面我们从人工智能(AI)和真人智能两个方面来讨论语言符号系统对认识活动的建构作用。

一、大语言模型：AI的涌现能力

蒸汽机的发明是工业革命的标志，随之而起的是火车、纺织机、汽车机器的出现，人类的劳动得到充分的解放。当时的机器和语言没有关系，工作效率受到极大的限制。受莱布尼茨二进制思想的启发，1936年，图灵提出了逻辑机通用模型。这是一种功能很强大的机器可计算理论模型，被称为图灵机，由此开启了计算机时代。从语言学和认识论的角度看，图灵的工作要重要得多，因为他首次开启了让机器计算的理论，而这种计算能力所赖以实现的逻辑机通用模型（图灵机）本质上就是一种语言模型。图灵的核心思想是，只要让0和1两个符号不断组合变换，就可以模拟任何机器推理行为。这显然是一种由0和1构成的文法形式。后来乔姆斯基(Chomsky)把形式语法分成0型、1型、2型、3型四种。20世纪60年代已经大量讨论证明，图灵机和乔姆斯基的0型文法是等价的。可以说，正是语言对机器的建构，开启了计算机时代。

1950年，图灵又进一步提出了判定机器能否思维的模仿游戏(imitation game),后人称为“图灵测试(Turing test)”,由此形成了区别一般机器计算的人工智能(AI)标准，也确定了AI的核心目标。随着编程语言Fortran的出现，机器的工作效率得以大幅度提高。其实编程语言的出现还有更重要的认识论价值没有被注意到。由于编程语言的出现，机器从某种意义上说就有了大脑，而这个大脑正是语言建构的。没有语言，就不会有机器的自动化运行，也就无所谓机器大脑。

编程语言有专门为科学计算用的Fortran语言，为数据库用的Lisp、Foxpro语言，为商业数据处理用的COBOL语言，等等。每种语言都是一种符号系统，都在建构机器的大脑。没有各种先进的程序语言，就不会有各种先进的机器大脑，也无法完成大规模计算、数据库处理、商业数据处理等复杂工作。借助先进的程序语言，Alphago出现了，竟然能够战胜国际象棋世界冠军。

当然，和人们日常所使用的自然语言相比，所有这些程序语言都是对象语言，是通过自然语言定义的，因此这些程序语言都只能处理特定领域的工作。自然语言是所有这些程序语言的元语言。自然语言作为元语言，最重要的特点就是直接和经验打交道，人类不断通过对经验活动的编码，进行创造活动。程序语言处理的是符号和符号的分布关系，自然语言不仅要处理符号和符号的分布关系，还要处理符号和经验的关系。要让机器像人一样处理各种复杂的工作，包括人文社会活动和科学活动，并具有创造性，就得用自然语言去建构机器的大脑，而不仅仅是用人工程序语言处理有限的科学活动。

自然语言中必要的符号是建立在基于直接经验（亲知）基础上的，这些必要的符号可以称为亲知符号，理解这些符号主要是通过这些符号在经验活动中的使用而不是定义。词典通过对词的定义来理解另一些词，但这种定义的方法无法定义亲知符号。比如“一”是一个很基础很重要的数，根据《现代汉语词典》（1996）：

一：最小的整数

整数：正整数（1、2、3、4、5……）、负整数（－1、－2、－3、－4、－5……）和零的统称。

这里定义“一”时用到了整数的概念，定义“整数”时用到了“一”的概念。这也说明我们关于“一”的概念是不可能通过定义获得的。人们关于“一”的概念，是在单个物体和多个物体的使用差别中获得的，比如儿童面前有两个盘子，一个放了一个苹果，另一个放了两个苹果，父母说第一个盘子中有一个苹果，第二个盘子中有两个苹果。类似的经验活动不断重复，儿童就理解了“一”的概念。“一”就是一个亲知符号。亲知符号可以定义非亲知符号，比如“一”可以通过加法原则定义“二”及大于“二”的数，等等。亲知符号可以是相对的，比如用“一”可以定义“整数”，也可以用“整数”定义“一”，但必须有一些符号是亲知符号，否则对数的理解就会陷入循环定义。

正是通过亲知符号，自然语言能够和亲知活动打交道，语言人不断产生领悟，并在自然语言的基础上创建人工语言符号系统。基于人工语言的机器由于没有自然语言的基础，就无法真正进入对经验的领悟，无法在领悟的基础上创建新的符号系统。机器理解自然语言，成了人工智能的关键。语言学家和计算语言学家开始寻找自然语言的规则输入电脑，但是寻找规则依靠的是手工归纳，不同的人归纳的规则并不完全相同，所归纳的规则合理性也存在问题。很多人认为，人们开始花大力气关注自然语言处理，只是为了通过机器翻译或理解语言来解放劳动力，其实机器理解自然语言更重要的理论意义，在于解释语言和认识的关系或语言和思维的关系。

一个重要的突破是AI科学家开始反省人脑的认识机制，开始关注人的大脑和经验打交道的神经原理。大脑的根本运行机制就是神经元的关联，人工神经网络开始启动。这是一个重要转向，涉及自然语言和经验关联的问题。关键技术是变换器模型(Transformer)的出现，这是一种基于自注意力(self-attention)的人工神经网络模型，自注意力的基本工作原理就是充分获取句子中每个单位（比如词）的上下文关系，然后转换成数字向量，通过数字向量的相似度来生成合法的句子。从语言学的角度看，机器所得到的词的上下文关系就是词的位置关系、词与词的分布关系，所以变换器模型关键的工作方法就是布隆菲尔德(Bloomfield)、哈里斯(Harris)等曾经提到的分布理论。更早的时候索绪尔在他的《普通语言学教程》（1916）中就始终贯彻这样一种基本思想：单位的价值在于和其他单位的关系。布隆菲尔德的分布理论把这种关系明确化了，他认为句法规则可以通过词类来确定，为了解决词类问题，布隆菲尔德又提出了词的功能的概念，而词的功能又是由词的位置决定的。布隆菲尔德是这样谈论总体分布和词类的关系的(Bloomfield 1926，32，33）：

32 语法形式出现的位置就是该语法形式的功能(The positions in which a form occurs are its functions)。

33 具有相同功能的所有形式构成一个形式类(All forms having the same functons constitute a form-class)。

哈里斯更进一步认为，语言规则就是由单位的分布组成的分布系统，只要掌握了每个语言单位分布的总和，语言的规则就被掌握。前面提到，人类学习自然语言需要亲知这种经验活动，哈里斯的分布理论绕开了亲知，在自然语言处理上有重要的方法论意义。哈里斯分布理论的方法在AI大语言模型中首先得到了实现。大语言模型正是绕开亲知这样的经验，直接从单位的分布入手，充分掌握每个单位的分布，每个单位的分布总和就是一组数字化的多维向量。单位的意义变成了数字向量符号的集合。两个单位的分布越相似，其语义及其规则就越相似，数字向量就越相似。比如“猫”和“狗”有很多相似分布，和“电脑”的分布很不相似（*表示不成立的语言片段）：

我们可以列出大量言语片段，“猫”和“兔子”有很多相同的分布，和“电脑”的相同分布很少。现在的大语言模型，一个词的向量维度可以到4096，甚至更大。也就是说，可以用4096数字来刻画一个词的分布特性，这种刻画比过去自然语言处理靠手工进行十几个特征标注要丰富深入得多。“猫”和“兔子”由于有很多共同分布，他们的向量数字就会很相似。于是单位的意义、语法规则和语义规则都隐藏在单位的数字向量中，可以纳入计算。自然语言的分布规则转换成了由巨大的数字化多维向量构成的符号系统。

其实在变换器和AI大语言模型出现之前，语言学家和计算语言学家就在大量做词的语法特征标注和语义特征标注的工作，这些特征标注都和词的分布有关系。只是由于这种标注实际上需要浩瀚的数据才能完成，所以语言学家和计算语言学家的早期标注工作并未充分获得一个语言全部单位的全部分布特征，因此也没有提出一个向量化的符号系统。有一个共同点是清楚的，从布隆菲尔德和哈里斯的分布理论，到语言学家和计算语言学的特征标注，再到变换器和大语言模型的向量获取，都是在用一种分布特征系统描述语言规则系统，都是在通过建立一种新的语言符号系统来完成语言规则的理解和生成工作。

AI大语言模型通过把分布特征向量化取得了成功，自然语言理解和生成取得了根本性突破。此前的自然语言理解，生成的句子在语法规则和语义规则上总是有一定的错误率，说明并未充分获取自然语言的单位和规则。让机器像人一样说出正确的句子，一直是计算语言学或自然语言处理科学的难点问题，也是检验机器是否真正获得了单位和规则的根本问题。大语言模型基本上不会出现语法和语义的错误，说明基于变换器的大语言模型真正掌握了自然语言的生成规则。尽管大语言模型还存在很多问题，但它在自然语言处理上取得的突破具有重要的方法论价值。由于机器掌握了自然语言，能够通过自然语言和人类交流，能够获取由自然语言书写的大规模网络信息，尤其是能够间接获取人类通过亲知活动所获得的知识，在此基础上涌现出很多惊人的智力活动。涌现能力是一种创新。比如4位数的乘法，人类一般无法通过心算完成，而需要有基于文字的符号系统来完成。大语言模型在不借助其他计算程序的情况下，通过对自然语言单位分布的向量处理，可以在数据或参数足够大时涌现出4位数的乘法运算能力，这种涌现能力是此前基于人工语言的AI完全无法相比的。涌现能力不是人类给AI预先制定的程序，是AI自己的创新。从严格意义上说，这种涌现能力在大语言模型之前的各种AI模型中是不存在的。AI进入大语言模型后形成的涌现能力有力地证明了自然语言符号系统对机器大脑AI的巨大建构作用，在AI认识论上是一个转折。

二、AI启示：数学与音乐的符号建构

正是AI从自然语言入手建构机器大脑所获得的成功，让我们开始反思人类语言符号系统对人类认识活动的建构作用，这一点常常在语言和思维关系的研究中被忽视了。和机器不同，人类首先习得自然语言，因此得以在自然语言的基础上创建各种人工符号系统。但是，这些人工符号系统在认识活动中的重要性并未被充分认识到，语言对思维的重要性也没有被充分认识到。

认识活动可以在诸多层面展开。欣赏音乐、画画，下棋、搭积木等等，都可以看成一种认识活动，可以称为直观认识活动，但通过语言符号编码展开的认识活动是人类认识活动中最重要的。在人类认识活动发展过程中，第一个飞跃是语言的出现。语言的出现使得人类能够在离开经验现场的条件下谈论经验和制定未来计划。交际是语言的重要功能，但语言更重要的功能是组织复杂思维活动和制定未来计划，以实现更复杂的交际。组织复杂思维活动和制定未来计划，实际上是用符号系统建构知识。

人类认识活动发展的第二个飞跃是文字的出现。通常认为文字是记录口语的符号，其实文字的作用远远不止于此。文字对认识活动的建构作用还未被充分认识到。在文字基础上出现的数学，最能够说明文字建构认识活动的作用。数学是人类思维高度符号化的认识活动，但人们在解释语言和思维、认知关系时，还多局限于低层次的脑电数据解释，数学符号在认识活动中的重要性被忽略了。一种常见的误解是，人的认识活动是独立于符号的，符号只是为了把这种认识活动表达出来，记录下来，数学符号系统被看成是为了准确地把已经完成的数学活动表达出来的工具。其实符号系统不仅仅在表达认识活动，更是在构建认识活动。不借助数学符号语言，一般人很难对4位数的乘法进行心算。数的开方运算更难以抛开数学符号仅仅靠心算来完成。更高层次的微积分运算等活动更难以心算。这些都是符号系统建构认识活动的非常直接的证据：不借助复杂的符号系统，无法完成复杂的数学和逻辑思维活动。心算是建立在口语基础上的。由于口语要满足大众的日常思维活动，无法完成很多需要基于文字符号系统的复杂思维活动。

数学符号的演化过程更进一步证实了数学符号对认识活动的重要建构作用。以欧几里得几何到非欧几何的发展为例，在欧几里得几何证明过程中，除了用自然语言展开推理和证明，直观的图形起到了很大的作用。直观的图形当然有利于理解各种图形和线条的直观关系，但其对空间关系的认识很有限度，因为三维以上的空间就很难直观。笛卡尔（1637）建立了解析几何，角度、空间等概念可以用符号公式来表示，比如大家所熟悉的直线方程和圆的方程：

Ax+by+c=0（直线方程）

(x-a)²+(y-b)²=R²（圆的方程）

欧几里得空间中的点被笛卡尔转换成一对数(x,y),直线和圆被转换成以x和y为变量的方程，于是几何思维变成了代数思维。这本质上就是用新的语言符号来建构几何，其意义是深远的。过去直观的空间几何变成了非直观的代数解析几何，也正因为从直观图形到代数语言的转换，为后来微积分的出现创造了符号条件。这不仅是数学上的一次重要进展，也是语言建构认识活动的重要证据，从这里我们看到符号对认识的重要性。希尔伯特《几何基础》（1899）中所讨论的几何理论，正是把欧几里得几何公理转换成代数公理来证明欧几里得公理系统的一致性(consistency)，即如果转换出来的代数公理没有矛盾，欧几里得几何公理就没有矛盾。在数学上，把一种系统一致性的证明转换成另一种系统一致性的证明，被称为模型转换证明，希尔伯特把欧几里得几何系统转换到代数系统，就是一种模型转换。通过模型转换证明一致性也可以看成是相对一致性证明。从语言学的角度看，模型转换本质上就是语言符号系统之间的转换。

随着解析几何的不断完善，欧氏几何空间、非欧几何空间等各种复杂的空间关系得到了充分的描述。可以说，如果没有解析几何这种语言符号系统，仅靠直观的几何图形是不可能发展出三维以上几何理论的，也不可能有代数几何，非欧几何也无法建构起来。解析几何语言的出现，是数学认识活动的一次重要进展，也是符号建构认识活动的有效性证明。

解析几何是对几何的一种符号化。如果说符号化是认识活动的一种语言飞跃，符号形式化则是认识活动更进一步的语言飞跃。符号化和形式化不同，两者都属于语言认识活动。符号化是通过编码形成符号，形式化是通过精确编码形成符号。平时我们说“2加2等于4”，这是一种自然语言表述，也是符号化表述。如果表述如下：

彐x（4=x+x)

这是数理逻辑中用到的表述，是形式化表述。

传统的形式逻辑或亚里士多德逻辑学主要借助自然语言来研究思维规律，无论在严密程度还是概括力度上，都受到限制。亚里士多德《前分析篇》中的三段论(syllogism)主要是用自然语言表述的，严密程度会受到限制。比如：

大前提：人都是要死的

小前提：苏格拉底是人

结论：所以苏格拉底是要死的

亚里士多德已经开始在某些方面用字母代替变项，基本命题形式是：

A是B

这是早期不完全形式化的体现，但对于很多的复杂推理活动，很难在自然语言中展开。数学中有大量的命题，很难用“A是B”的命题形式写出来，比如：

相对论公式：E=mc²

费马大定理：Xⁿ+Yⁿ=Zⁿ

在物理学和数学中，这些公式实际上都是命题，都需要作为大前提参与推理活动。如何将这些复杂的命题也纳入推理中来？

又比如大家熟悉的“大于”具有可传递关系，根据这种关系可做如下推理：

A>B且B>C，于是A>C

显然，三段论是无法概括这种推理的。后来的形式化系统的出现，使各种复杂的推理活动得到有效的研究。莱布尼茨（1704）比较早地认识到符号系统的重要性。他认为数学之所以得到迅速发展，是因为有一套自己的符号语言，于是他首先提出把逻辑推理像数学一样进一步符号化的思想，这样就可将复杂命题的推理纳入计算，这是靠自然语言无法完成的。布尔(Boole)1947年发表了The Mathematical Analysis of Logic（《逻辑的数学分析》），1954年又发表了The Law of Thought（《思维规律研究》）。布尔率先全面从符号的角度首次系统地展开了逻辑研究，形成了布尔代数理论。布尔代数是逻辑推理的符号化和数学化，又被称为逻辑代数(algebra of logic)或符号逻辑(symbolic logic)。布尔代数的实际工作就是逻辑推理的语言形式化，传统逻辑由于很多隐含的推理原则没有符号化，就不可能精准检验复杂推理过程中存在的问题，也不能实现逻辑代数的推理计算工作。布尔还认识到数学从根本上看并不是数量的科学，而是符号的组合，数量只是一种解释。符号代数理论的有效性不在于对符号的解释，而在于符号组合的规律。当然，莱布尼茨、布尔等的思想主要是认为符号有利于表达思维活动，其实这不仅仅是表达问题，如果没有符号系统，布尔代数理论就无法得到建构。

在数学形式化以前，数学家推理过程中常常隐含了一些没有得到解释的原则。比如欧几里得在证明没有最大素数时，使用了一条推理规则：

A：一个数不是素数就是合数

通俗地说素数就是指只能被自身和1整除的整数，比如1、2、3、5、7等等，合数是除了素数的整数。上面这条推理实际上并没有形式化，因为背后依赖了一个更一般的原则：

不是p，就是非p

如果这条原则不首先提出来并形式化，推理就是不严格的。欧几里得给出A命题因为包含了“素数”“合数”两个概念，就不是纯形式化的推理规则。只有当人们知道合数是非素数，这个推理才是有效的，这样就必须知道合数是什么，由此可见，严密的符号系统正在建构严密的思维活动。

胡塞尔在《逻辑研究》（1901）中也提到了符号在数学中的作用，他认为算术之所以成为可科学，就在于符号的使用。遗憾的是胡塞尔在他基于悬搁理论的现象学方法中，竟然超越符号来讨论悬搁和直观。胡塞尔所关注的其实就是一个符号建构认识活动的过程：乘法是加法的一种符号化建构，乘方是乘法的一种符号化建构。正是因为符号化建构，算术得到了充分的发展。比如我们通过中学学过的加法规则很容易算出2345＋2345的结果，但是如果没有乘法演算规则，要计算2345×3456，就需要把2345加上3456次，这是很费力的。考虑开方这样一个符号化过程：X的乘方Y是X自乘的符号化，Y开方是X乘方的逆过程的符号化。如果没有乘方、开方这些符号及其规则，靠加法运算基本上不可能求出2的平方根。求对数、极限、积分等，都必须借助数学的多种符号系统。可以说，没有符号系统的建构就没有数学。当然，数学符号系统是以文字的出现为基础的。

人工语言的符号化和形式化有力地建构了复杂的认识活动，但这并不等于自然语言表述就失去了价值，关键问题还是认识活动和语言的关系，无论日常的认识活动还是逻辑认识活动，都以一种符号化的方式体现出来。

符号化不仅对建构数学知识很重要，任何科学认识活动，如果没有自己独立的语言符号系统，就只有停留在领悟的基础上，或停留在自然语言的基础上，只能自然发展，不能得到充分发展，不能进入独立的科学平台。和数学的符号化类似，音乐的发展也体现了符号系统对认识的重要建构作用，这一点在中西方音乐发展上尤其凸显。湖北随县战国曾侯乙墓中编钟的发现，可以证明中国音乐很早就处在世界领先的地位。在文字记谱的基础上，中国从唐代开始还发展出了工尺谱，宋代开始流行，这是用“上、尺、工、凡、六、五、乙”等基本谱字和一些笔画来标记音高，相当于西方数字谱（简谱）的1、2、3、4、5、6、7，但由于中国传统音乐强调临场发挥，因此工尺谱并不是一种能精确记录和还原音乐旋律及节奏、力度的符号系统，而是一种宽式乐谱。今天我们拿到古人的工尺谱稿子，基本上无法准确地还原当时的旋律和节奏。中国音乐的传承主要还是通过口耳传承。中国古代音乐由于未得到严式乐谱符号系统的充分建构，中国音乐的复调、和声等没有得到有效的发展。西方的五线谱尽管起源较晚，到16—17世纪才定型，简谱18世纪才开始定型，但由于五线谱和简谱都能够比较精准地记录和还原旋律、节奏和力度，属于严式符号系统。西方音乐从17世纪开始得到严式乐谱符号系统充分建构，复调、和声得到了高度发展，出现了西方古典音乐的辉煌。

世界上复调的演化过程尤其能够显示音乐符号系统的建构作用。中国的有些少数民族音乐有复调，比如壮族、侗族和毛南族等，但由于没有严式乐谱符号系统，并未得到充分的发展。著名的联合国非物质文化遗产格鲁吉亚民歌，也是复调系统，靠口传。由于缺少严式乐谱符号系统，也未得到充分发展。大约在9世纪到13世纪，欧洲出现了复调雏形奥尔加农，当时使用一种“纽姆谱”记录复调。这是一种指示旋律大致走向的符号，记在歌词上方。纽姆谱并不能准确还原旋律和节奏，所以这种复调主要还是靠口传，但由于有简单乐谱建构，复调音乐发展更成熟。随着五线谱和简谱等严式乐谱在欧洲的出现，不仅复调得到充分发展，交响乐、协奏曲等高度复杂的音乐形式也得到了充分发展。严式乐谱由于能够分析多层音高的复杂关系，进而建构多层音高的关联，这是对位、和声能够复杂化的基础，更是复杂的复调、交响曲、协奏曲等形成的基础。没有严式音乐符号系统，不可能出现复杂的音乐形式。

五线谱体系的成熟，使西方记谱系统能够独立于表演语境。从巴洛克时期通奏低音的结构需求，到古典与浪漫时期器乐体裁的发展，五线谱不断向“总谱”(Full score)方向演进，通过高低音谱表的并联、声部模块的分区，实现了音乐时间（横向时值）与音乐空间（纵向和声）的同步可视化。其核心优势在于：将听觉经验几何化、书写矢量化，使音乐成为可分解、可重复、可分析的符号文本。在此基础上，西方音乐的总谱化进程构建了一种高度自律的符号系统。它不仅能记录音高、节奏、力度等表层信息，更通过和声功能、配器逻辑与曲式架构，将复杂的音响现象转化为可操作的符号系统，作曲家可以在这种符号系统上建构总谱，建构更复杂的交响曲。中西记谱动机突显出来的一个问题是，记谱之于表演的“在场”与“离场”。“在场”(Presence),指的是记谱与表演难以分开，记谱需要依附于表演，符号自身的意义才能确定下来。“离场”(Absence),指的是记谱与表演可以分开，记谱不需要依赖于表演，符号自身的意义是独立存在的。中西音乐的发展差距正是在这种“在场”与“离场”中拉开的。在16、17世纪之前，中西音乐不太好比较哪一方更有优势。但从这个时期起，西方音乐在完成基本的符号化进程后，作曲家就进入“离场”的符号化创作，音乐的发展也就突飞猛进了；而此时的中国音乐仍是简单记谱和表演的“在场”行为，音乐符号停留在了自然语言阶段，音乐的发展也就滞后了。记谱虽然有习惯性、文化性的选择，但却不是固定不变的，符号的发展在很大程度上影响着记谱；记谱从表演中“分娩”出来，是人类音乐的重要进步。交响乐、协奏曲等作曲家总是在音乐符号的建构中完成交响曲的，不可能在“在场”的交响乐队中来作曲。指挥家也不可能在阅读总谱之前进行。贝多芬（1770—1827）的晚期作曲尤其显示严式音乐符号系统的建构作用。他在1796年后耳朵渐渐失聪，到1819年时听力几乎完全丧失；但这并没有中断贝多芬的创作之路，他在完全失聪的状态下仍然坚持写作，《庄严弥撒曲》《第九交响曲》《降B大调弦乐四重奏》，包括歌剧《费德里奥》的定版发行，都是他晚年留给人类宝贵的音乐遗产。失聪后的贝多芬为何能继续创作？一个重要原因就是“离场”的符号化创作。假设记谱无法与表演分开，而耳朵又是记谱的必要条件，那贝多芬就不可能坚持下来了。

从20世纪开始，西方严式五线谱、简谱等符号系统开始传入中国，推动了20世纪中国民族管弦乐合奏的结构性飞越。通过吸收西方配器理念与总谱编排逻辑，民族管弦乐队由早期“同曲同奏”式合奏逐步发展为多声部分工明确、织体复杂、节奏协调的现代合奏体制。严式的五线谱、简谱在其中不仅是技术工具，更是一种结构意识的嵌入模式，使传统乐器在声部、力度、音区与时间轴上得以精密组织，突破了传统谱式的协调瓶颈，为中国音乐现代创作提供了关键支撑。

三、从算术到代数：符号化的关键作用

人类很多复杂的认识活动都依赖了语言的建构。前面提到的从欧几里得几何到笛卡尔的解析几何，一个关键环节是从算术到代数转变，这种转变为符号建构认识活动提供了更进一步的可能。

代数符号系统更是代数形成的关键。从语言建构论的角度看，代数出现必须以变量的符号化为先决条件。考虑下面问题：

一个数再加上它的1／7等于16

这个数是多少？类似问题要在算术符号层面解决有一定的困难，这只是一个简单的例子，实际情况可以更复杂，比如这里的数字可以是小数、分数、无理数等等。但是引入符号X充当未知数，X就可以像数字一样参加运算，于是得到以下一元一次方程：

X+（1／7）X=16

利用中学学习过的解方程方法，很容易算出X是14。这里X就是对未知数的符号化。在算术中引入符号代替未知数，就形成了代数。代数本质上是对数字符号的进一步符号化，而数字是对外部世界的符号化。数字符号化可举例如下：

1：一个苹果，一个香蕉

2：两个苹果，两个香蕉

3：三个苹果，三个香蕉

……

我们可以在数字符号的基础上考虑加法的交换律：

1＋2＝2＋1

1＋3＝3＋1

2＋3＝3＋2

……

这显然不具有普遍性。如果我们把数字“1、2、3……”进一步符号化为n或m,并可作为未知数纳入计算，于是有：

n+m=m+n

这就具有普遍性，这也是从算术到符号代数的关键。符号代数的引入，是解析几何以及后来数学发展的关键环节。

符号代数中的未知数符号的发明是推动代数发展的重要环节，其作用犹如自然语言中的疑问代词。古希腊的丢番图(Diophantus)已经使用了未知数符号。法国数学家韦达(F.Vieta 1591）在《分析方法入门》中首次系统使用未知数字母，进行未知数字母的运算。一般认为韦达的工作是算术和代数区分的开始。不过韦达还用不同的字母表示同一个未知数，比如一元三次方程中x、x²、x³用不同的符号，这一点不符合一形一义的形式化要求。而笛卡尔的《笛卡尔几何学》（1637）则是同一个未知数用同一个字母，达到了形式化要求。可以说，代数符号化的原则是在笛卡尔手中完成的。笛卡尔的一元多次方程用x作未知量，已基本和现在的书写方式一致。也正是在自变量x（自变符号）的基础上，笛卡尔考虑到了因变量y（因变符号），开启了函数符号化，笛卡尔的解析几何也是在函数符号化基础上发展起来的，他的工作从符号系统上为微积分的出现创造了条件。从语言建构的角度看，数学发展的一个关键转折点就是对变量的符号化，未知数、函数、无穷大等都是变量，正是有了变量的符号化，才有了代数、函数和微积分等。

中国古代的算术很发达。从钱宝琮（1963）校点的《算经十书》可以看出，中国公元1世纪的《九章算术》已经有了多元方程组的解法。但是中国古代主要用算筹进行数字计数和演算。算筹代表的是已知数，是对数字的符号化，通过位置来表示十进位，这在同时代已经达到世界很高水平。但算筹不代表未知数，当时的未知数是靠位置通过上下文确定，也就是说现代数学中类似x、y、z等未知数在算筹运算中没有符号，即中国古代没有进一步对未知数进行符号化，也就无法进一步展开符号代数研究，这是非常遗憾的。明代的珠算和算筹的方法相似，珠子代替了算筹，更为方便，但关心的仍然是计算，没有未知数符号。正是因为缺乏未知数表达，影响了中国数学的发展，由此可见符号在建构认识活动中的重要性。

中国南宋著名数学家秦九韶《数书九章》中有高次方程解法，在世界上也很领先。但该书用的也是数字解法，不是代数解法，这是很遗憾的。可以说，系统地对数字符号进一步符号化的工作是韦达开始的，他的工作对后来的数学认识活动极为重要。中国古代《周易》中的卦爻讨论，明显和数学中的排列组合有关系，但是这些思想后来没有得到充分发展，前面提到中国数学没有充分符号化，未形成符号代数，也使得排列组合的研究无法得到符号代数的建构。

前面提到的从欧氏几何到非欧几何，尤其是到黎曼几何，一个根本的认识观念就是从代数语言入手，不把几何研究限制在可以感知的二维、三维空间，而是扩展到多维空间，结果是几何研究得到了惊人的发展。另一个相似的例子是从结构语言学到乔姆斯基的转换生成语法。乔姆斯基并不把语言研究限制在可观察到的自然语言研究，而是扩展到一般的语言符号研究，其结果是极大地推动了自然语言研究和形式语言研究，证明了四型文法的关系，证明了在符号序列生成过程中转换的重要性。

代数学发展的重要成果之一就是虚数的出现。从符号建构的角度看，虚数本质上是一种虚指，即没有指称或指称不确定的符号，但虚数对认识活动的重要性尤其能证明符号对认识活动的建构作用。

弗雷格(Frege)、罗素(Russell)等认为没有确定指称或空指会引起很多哲学上的伪问题。他们的研究极大地推动了数理逻辑和分析哲学的发展。不过，没有指称的符号是人们谈论未知和引进假说词语的必要条件，没有这个条件，人们就不可能谈论崭新的事件，不能提出假说和猜想。当我们要探索火星上是否有人的时候，我们自然会构造“火星人”这样一些指称暂时不确定的符号组合来组织下一步的认识活动。

在数学这样的高精度认识活动中，没有指称的符号广泛存在。如果我们把1米长的竹竿分成10等份，每一等份是一个自然数1，可以在数轴上找到明确的点。可是我们习以为常的有理数1／3，在主干上却找不到明确的数字点，因为这是一个无限循环小数0.333……。更为奇怪的是无理数。直角边长为1的等腰直角三角形，斜边是2的平方根，这是一个无限不循环的无理数，在数轴上也没有确定的指称位置，这也是震惊古希腊数学家的发现。不过，无理数的提出对建构数学大厦有重要意义。有理数1／3和无理数2的平方根，还可以通过几何作图确定下来，比如等腰直角三角形的两条直角边为1米，斜边的长度就确定下来了，我们可以说根号2在三角形上有确定的经验指称但在数轴上没有确定的指称。但虚数的指称就完全不能实现了。虚数是根本没有经验指称的符号，却解决了代数方程求解的难题。没有虚数就没有复数，也就没有复变函数，也没有基于虚数的各种数学理论。尽管很多有理数、全部无理数和虚数的指称在数轴上不确定，但有理数、无理数和虚数这样一些符号能够有效地建构数学认识活动。

无穷小符号对数学认识的建构尤其值得注意。比如牛顿的微积分，为了求得x²的导数，设定了不为0的增量Δx,由(x+Δx)²-x²，得到2xΔx+(Δx)²，然后再除以Δx,得到2x+Δx,最后令Δx=0，求得导数为2x。牛顿遇到的问题是，他一方面设定了不为0的增量Δx,最后又令Δx=0。这里出现矛盾的关键就在于Δx的指称并不确定。后来随着极限理论、实数理论和集合理论的进一步完善，“连续、导数、微分、积分、无穷”等符号有了明确的语义限制，微积分的基础才牢固地建立起来。但是，如果当时没有不确定指称符号Δx的使用，微积分就不可能出现，也不可能解决物理学中的一系列重要问题，牛顿力学也不会出现。认识活动首先是要符号化，才能建构更高层次的认识活动。

余论：大语言模型的启示

AI的发展历程是先获得人工语言，再获得自然语言，形成大语言模型支持下的AI,出现涌现能力。人脑先学会自然语言，再学会人工语言，数学符号、音乐符号等人工语言使得人类能够完成自然语言无法完成的复杂认识活动。这两种方向的学习，都证明语言符号系统在建构认识活动，而不仅仅是在记录认识活动。

语言深刻影响思维这一相对论命题长期以来得不到实证，关键原因在于，人们所研究的对象都是会语言的人，无法和不会语言的人展开比较。语言人和动物确实存在明显的思维能力的差异，或许可以作为语言激活人类思维能力的证据，但这些差异也可以归结为人类智商更高。著名的野孩实验显示脱离语言环境的野孩，智力发展受到限制，但这种限制也可归结为野孩缺少教育。

AI的发展历程，证明了语言对AI的认识活动有根本的建构作用。在ChatGPT这样的大语言模型出现以前，AI所依靠的符号系统只是一些人工符号系统，其能力是有限的。Alphago战胜了国际象棋大师，是AI的一次重大飞跃，但是这种能力是局部的智力表现，不存在严格意义上的涌现能力。大语言模型ChatGPT让AI完成了自然语言的学习和生成，这不仅是自然语言处理上的重大突破，更是语言在建构AI“思维”上的重大突破。大语言模型使AI的能力剧增，AI甚至出现涌现能力。大语言模型对AI的认识活动有重大建构作用，这是在AI层面语言对“思维”产生深刻影响的重要证据。

大语言模型的AI认识活动的建构也给我们回答人类语言和思维的关系提供了研究思路，这就是看特定符号系统对认识活动的影响。具备某种符号系统的人如果在认识上和不具备某种符号系统的人有差异，就可以证明符号系统对认识活动有重要作用。自从人类出现文字以后，人们可以在文字的基础上构造更多的人工语言或特殊符号系统，其中最成熟的是数学符号系统和音乐符号系统。不是所有的民族都有成熟的数学符号系统和音乐符号系统，因此这两种语言符号系统为我们观察语言建构认识活动提供了重要视角。前面的讨论证明，数学符号系统对数学认识活动有强烈的建构作用，音乐符号系统对音乐认识活动有强烈的建构作用。

下棋活动、绘画活动以及禅宗倡导的超越语言符号系统的领悟活动，是否得到过语言符号系统的建构，需要进一步研究。柏拉图的理念、笛卡尔的“我思故我在”、康德的先验自我等领悟，都有一定的道理，但要在这些领悟上建立知识，没有更复杂的语言符号系统是不可能的。比如，没有数学符号，再深刻的无穷小领悟也无法建立微积分理论。庄子的“一尺之棰，日取其半，万世不竭”，就是关于微积分思想的深刻领悟，但只有当数学符号系统的出现，才能建立真正的微积分。

说语言是思维的工具有一定的道理，但是语言和人们所理解的工具并不完全相同。搭建木屋需要榔头、斧子、锯子等工具，木屋搭建好以后，这些工具也就拿走了。语言更像搭建木屋的木板和钉子，木板和钉子本身就是木屋的成分。当语言建构知识，语言本身就是知识的一部分。数学中的虚数本来就是数学的成分，音乐中的音乐符号也是音乐的成分。

我们可以把AI分成前语言AI和语言AI。现代出现的基于大语言模型的AI是语言AI。相比前语言AI,语言AI的成功显然证明了语言对AI认识活动的建构作用。当然，语言是如何建构AI的，由于大语言模型的黑箱效应，我们目前还不清楚。其实语言学家对自然语言如何建构认识活动的很多机制也并不是很清楚，也需要深入研究。乔姆斯基等语言学家所倡导的人脑语言机制研究，就是在做这方面的工作。辛顿(Hinton)等数学家、人工智能专家在大语言模型上取得成功，为我们提供了大语言模型建构AI认识活动的证据。但建构的机制仍然有待语言学家、数学家和人工智能专家携手展开研究。近年来辛顿和乔姆斯基之争论实际上未能切入要点。辛顿等人的工作提供了大语言模型建构AI的证据，乔姆斯基等人的工作是在证明语言如何建构认识活动，两种工作都在揭示语言对认识活动的建构。

基于语言的认识活动可以称为符号认识活动，这样我们可以把认识活动分成三个传统，最早是以亚里士多德为代表追问世界本原的本体论传统，后来有以笛卡尔“我思故我在”这类追问知识如何获得的认识论传统。这两个传统都不重视语言对认识的作用。从语言建构认识活动的重要性看，还存在语言建构论。分析哲学、语言哲学以及语言相对论都涉及语言对思维的作用，但语言建构论更应该关注语言符号系统是如何建构认识活动的，无论是语言符号系统对人类大脑的建构，还是对AI的建构，都需要深入展开研究，语言和思维、认识活动的关系才可能得到最后的解释。

本文载于《北京大学学报（哲学社会科学版）》2026年第1期，引用 / 转发等请据原文并注明出处。参考注释请参见原文。

陈保亚：语言对认识活动的建构——从AI大语言模型说起

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏