赵毅衡：人工智能文本生成的双轴互动与转向——兼评辛顿与乔姆斯基的争论核心

本文刊于《福建师范大学学报(哲学社会科学版)》2026年第 1 期

摘要：任何符号意义活动都产生文本，不论文字文本或其他媒介的文本，都必须在符号的组合与聚合两个轴向生成。组合轴与聚合轴构成了任何意义文本的基本展开面向，但不同体裁、不同风格的文本，其双轴关系会有所偏向。既然人工智能是一种意义活动，双轴关系依然是人工智能的基本意义生产方式之一。在从符号主义到连接主义、从聚合优先转向组合优先的演化中，人工智能各系统基本设计“基于概率”的选择倾向越来越明显。双轴倾向的明显不同，可以部分地解释近年来发生的辛顿与乔姆斯基之间关于人类智能与人工智能根本性质的争论：乔姆斯基的理论偏向于句法关系，即组合关系;辛顿注重的是词元的选择，即聚合关系。前者的选择是“偏组合的聚合”，后者主张的是“偏选择的聚合”。从当前看，可能辛顿的观点更切合目前的运用实际。但是效率并非结论，或许未来的人工智能发展，可以充分结合符号主义的逻辑推理能力和连接主义的概率处理能力优点，形成一种“混合式神经-符号人工智能”。

关键词：人工智能；人类智能；辛顿；乔姆斯基；组合；聚合；符号主义；连接主义

基金项目：国家社会科学基金重大项目“当代艺术提出的重要美学问题研究”（20&ZD049）；国家社会科学基金重大项目 “中华文化经典符号谱系整理与数字人文传播研究”（23&ZD212）

一、双轴概念

任何符号文本，小至一个梦，大至整个文化，必然在组合轴与聚合轴两个向度上展开。人工智能的诸种活动，也是在生产携带意义的文本，它是否也在双轴关系中展开？各种人工智能系统，是否也受双轴关系的制约？它本身的发展演进路线，是否也可以从双轴关系理论看出一些端倪？这是“人工智能文化符号学”必须研究的课题，因为这问题深深嵌入人工智能的工作机制及其文化影响。

双轴观念首先是索绪尔提出来的，在索绪尔理论的四个二元对立中，有三对（能指/所指，语言/言语，历时/共时）已经成为常识，不再是学界关注的焦点。而索绪尔一个多世纪前提出的这个双轴（组合/聚合）观念却是弥久历新，在今日的文化研究中仍然有强大的生命力。

组合关系比较好懂，就是一些符号连接起来，组合成一个有意义的“文本”。聚合关系比较复杂，索绪尔把这个轴向称为符号的“联想关系”(associative relations)，他对这个关系向度的解释是：“凭记忆而组合的潜藏的系列” 。他的解释心理色彩太重，似乎是文本形成过程或解释过程中的思想发散。双轴关系是文本的品质，是符号文本的组成原则，不完全是理解文本时的“联想”方式。

索绪尔之后的符号学家把索绪尔的术语改称为组合轴(syntagmatic)与聚合轴（paradigmatic）。这两个术语源自希腊文，意义比较晦涩。罗曼·雅柯布森（Roman Jakobson）在20世纪50年代提出，聚合轴可称为“选择轴”（axis of selection），其功能是比较与选择；组合轴可称为“结合轴”（axis of combination），其功能是邻接粘合成文本。因此，双轴关系就是“比较选择轴”与“连接组合轴”二者的配合，这是人的意义方式的两个最基本维度，也是任何文化得以维持并延续的二元。雅柯布森的提议（选择轴/结合轴）非常清晰易懂，可惜聚合轴/组合轴的称呼，20世纪上半时期已经通用，现在学界只能沿用。

聚合轴，是符号文本的每个成分背后所有可能被选择的、也就是“在结构上有可能代替”（structurally replaceable）该成分的各种元素的相互关系。这个理解，对我们接下来的讨论非常重要。聚合轴上的各元素作为文本的隐藏部分，是作为被选择的可能性而存在。它们是否真的在文本组成过程中进入挑选，或在解释过程中进入解释者的联想，无法辨明，也无需辨明，因为这是一个“可能集”（set of possibilities）。戴维·西尔弗曼（David Silverman）等学者指出：“聚合关系中的符号，选择某一个，就是排除了其他。”

因此，聚合操作并不是接收者的猜测，而是文本组成的方法，而不一定是真实的过程。这个问题说起来有点抽象，其实这是任何文本建构的必要，而且对符号文本意义的形成起了至关重要的作用。《战国策》里有个“千金买马骨”的故事：

古之君人，有以千金求千里马者，三年不能得。涓人言于君曰：“请求之。”君遣之。三月得千里马，马已死，买其首五百金，反以报君。君大怒曰：“所求者生马，安事死马而捐五百金？”涓人对曰：“死马且买之五百金，况生马乎？天下必以王为能市马，马今至矣。”于是不能期年，千里之马至者三。

死马当然不能当活马用，但当它加入了这个“可能集”，君王买马骨的举动就极大地扩大了获得良马的选择。可选的元素增多，加强了聚合轴，就能促进意义的产生。

既然聚合是文本建构的过程，一旦文本形成并呈现出来，它就退居幕后，它是隐藏的；而组合是文本构成的方式，它是显示的。因此选择是结合的根据，结合是选择的投影。除了被选中进入文本的成分，其它元素哪怕不可能在文本组合形成后出现，依然对文本投下影子，此种投影转化成文本风格因素，成为影响解释的压力。这就是双轴关系的基本原理。

雅柯布森又提出：聚合偏向于隐喻（metaphor），组合偏向于转喻（metonymy），把本来属于符号文本建构的双轴关系，转化成二种可对比的文本修辞风格。不同的体裁、流派、风格，在双轴关系上可以看出不同的偏向。偏向聚合的表意方式，与偏向组合的表意方式，可以形成巨大差异，而且这两个风格分类与修辞手法有联系。这是雅柯布森对当代符号学的杰出贡献之一：双轴关系依然在文本建构中起作用，但当某一轴的操作成为主导，另一轴成为次要方向，就会显现成不同风格的文本。按照雅柯布森的看法，浪漫主义注重隐喻与象征，意义方式向聚合轴倾斜；现实主义注重转喻，意义方式向组合轴倾斜。

大部分情况下，双轴的操作可以在文本中感觉出来。罗兰·巴尔特（Roland Barthes)为此举例说：餐馆的菜单，有汤、主菜、酒、饭后甜点等各项，每项选一，就组成了想点的晚餐，因此菜单既提供了聚合轴的挑选可能，又提供了组合轴的连接可能。“菜单”这个文本显示了整个文化的多层次双轴运作，而菜单与端上来的一桌饭菜是两个不同的组合文本。一桌饭菜端上后，其聚合轴退隐，我们只能在“菜系的多选择性”上看到某些风格特征。

但是我们认为菜单是另一种组合文本，菜单产生时已经作了选择，经理和大厨提供的食料与手艺的可能性，构成了菜单文本的选择可能性集合。菜单上列出了每个范畴“经过选择的”选择可能。因此菜单是经过一道道选择后产生的聚合与组合“双轴共现”的文本。“双轴共现”背后的道理好像有点纠缠，但深入思考便能明白，且这一现象在现实中较为普遍。

实际上我们必须在表达意义的文本中看到双轴操作才能真正理解这个文本。一位足球教练如果看不明白对方出场时教练排兵布阵组合的背后选择，就不可能排出有针对性的阵容，也不可能临场做出调度。可以说，世界上表达意义的文本不计其数，每一个文本都由具体聚合选择与组合构造联手形成，但是每一个文本的偏重点可以很不相同。

以上似乎抽象实际上很具体的讨论，只是本文的方法论引子。我们要讨论的是：人工智能各种系统既然是在做意义活动，它们的各种产品也是一个个的文本，那么它们的构成以及结果呈现是不是也有双轴的配合？是不是也有主导轴的偏重？人工智能产生的，不管是文字、图像、声音、视频，还是动作步骤，都可以说是广义的意义文本。仅仅说所有的文本都应当有双轴关系，是不能让人信服的。我们细心考察与人工智能系统有关的三个问题，或许能看出人工智能产品中也必然具有的双轴关系：其一，人工智能文本构筑方式中的共同特点；其二，人工智能设计原理经历了以符号主义为主导到符号主义与连接主义并行的发展阶段；其三，最近两年杰弗里·辛顿（Geoffrey Everest Hinton）与诺姆·乔姆斯基（Noam Chomsky）的激烈争辩。这三个都是人工智能技术的关键问题。仅仅说人工智能的工作原理与人类头脑的意义生成方式一样，都需要选择与组合的双轴操作，并不有助于理解人工智能的意义生成方式。但是对于希望明白人工智能的大众来说，双轴关系的分解，不失为一种比较方便且可行的理解，甚至对人工智能发展的趋势，或许也可以从中窥见一二。

二、从人工智能文本生成过程中的符号双轴互动

人工智能模拟人类智能，是让电脑系统能够在大数据库中寻找连接，以完成指定工作。生成式人工智能是人工智能的一种，可使用深度学习等技术生成新的内容。例如，可以使用生成式人工智能创建图像、文本或音频，即是利用大量预先训练的知识来生成特定内容。

生成式人工智能平台从使用者提供的提示词（prompts）出发，寻找数据库的相关语料，例如，用图像生成器（如Midjourney）检索图像素材、视频生成器（如Sora）调取声画整合素材、音乐生成器（如Suno）匹配音频素材，然后把它们连接成文稿、视频、歌曲。这个过程既需要挑选，也需要连接。数据库巨大，如何找出各种有关材料？从连接的材料中选取比较起来更为合适的元素，再进一步寻找连接的语料，最后形成所需要的“文本”，这是一个令人眼花缭乱、连人的智慧都无法很好处理的复杂过程。

莱因哈德·拉普(Reinhard Rapp)认为，这个“筛选—连接”过程分两个层次进行。第一层次是在同义词中寻找共生数据，决定选择哪一个词最适合上下文，例如是选“吃”还是“喝”；第二层次是通过词的共生概率找出经常在一起出现的词，例如从“喝”连接到“咖啡”或连接到“快慢”。一篇生成式文本不得不考虑选择上的需要与文本连接上的需要，考虑二者如何迅速协同生成为预定的文本。

也就是说，经过预训练的系统，在大数据库里进行两层筛选性操作：第一层是在有关语料中寻找，显然是在寻找最有可能的共生组合关系，即所谓“偏置”；第二层是在寻找同位可替代的聚合元素，即在各种共生频率语料上根据其权重（weight）进行“调优”（optimization）。这两种筛选实际上是同时进行的，没有先后之分，而且因为数据库巨大、可选的元素极多，所以两个方向上都可以延伸到一定规模，形成长度适合需要、有一定深度探索的文本。拉普认为：“这两种筛选都是人脑功能中所固有的，与索绪尔提议的组合与聚合双轴概念相通。”

也有学者如瓦莱里奥·塔贡（Valerio Targon）提出，输入的语料经组合算法（syntagmatic algorithm）与聚合算法（paradigmatic algorithm）的反复调适与迭代，最终形成“迭代讲述”（iteration）的生成文本。材料的筛选与组织过程，本质是在这两类算法体系之间交织互动、彼此择取的动态过程，由此构建出融合双轴逻辑的“符号认知自动机”（Semiotic Cognitive Automaton，简称SCA）。聚合与组合没有何者是领先的，而是来回旋转互相试探其可用性。

双轴逻辑的“符号认知自动机”（图自学者Valerio Targon论文）

所谓人工智能工作系统的“深度学习”（deep learning），就是找到在可供选择与组合的数据，在双轴之间不断回旋组织文本，通过构建深层的、类似神经网络的模型，来自动学习和提取数据中的特征模式；通过不断调整连接中的参数，使得网络能够从数据库中选取合适的再现方式。即深度学习就是找到控制此种来回推算生成的概率，使计算机能够以仿神经网络的方式推演出一个适合需要的文本。学习过程之所以是深度性的，是因为人工神经网络的结构由多个输入、输出和隐藏层次构成，文本生成也不得不依靠多层操作，包括搜索技术、数据挖掘、自然语言处理、多媒体学习以及推荐系统等。因此深度学习所得的神经网络结构包括多种类型，如卷积神经网络（convolutional neural network,简称CNN））以及循环神经网络（recurrent neural network,简称RNN），在筛选过程中一再往复测试，在选择中不断进行选择，才能处理输入数据之间的时间与序列依赖性，才能从数据库中存储的元素中选择合适的连接与权重，从而获得可供呈现的文本。

人工智能在选择时，常采用一种反向传播（backpropagation）、即来回推试的优化算法，通过计算梯度来更新网络中的参数，以最小化预测误差或损失函数，使得网络的选择结果更加准确。如此的大数据与深度学习结合，当然需要极强大的计算机与高强度的能量消耗。人工智能的进步，是数字技术总体进步的结果，但它最基本的运行逻辑，依然是在大数据库中寻找选择与组合相匹配的方式。

三、从符号主义到连接主义、从聚合优先转向组合优先：人工智能文本生成的双轴偏重转向

从符号主义到连接主义的变化，是人工智能发展历程中的重要转折。那么，这两种设计元语言，是否在双轴关系的偏重上有不同倾向？

符号主义（symbolism）是一种基于逻辑推理的智能模拟方法，在人工智能开发历史中占据重要地位。符号主义认为人工智能可以通过模拟人类的逻辑推理和符号操作来实现，所以又被称为逻辑主义（logicism）或心理主义（psychlogism），意思是人工智能模仿人脑的思维能力。这种进路认为，人类认知和思维的基本单元是符号，而认知过程就是表现在符号上的一种运算。人是一个物理符号系统，计算机也是一个物理符号系统，二者可以相比拟，因此可以用计算机来模拟人的智能行为，即用计算机的符号操作来模拟人的认知过程。正因为符号是电脑与人类思维共同的基本单元，人工智能系统可以用逻辑体系搭建出来。符号主义的智能推理过程，被看作是在有限的时间和资源条件下，用人的思维方式寻找最优或近似最优解的过程。

1936年，艾伦·麦席森·图灵（Alan Mathison Turing）提出了“可计算理论”，认为电脑应当是一个能够处理符号输入与输出的机器，通过规则进行计算而呈现为另一套符号，这就是图灵机概念。在此种理论助力下，20世纪60年代产生了第一批现代意义上的计算机。而“图灵机”作为一种抽象计算模型，在人工智能的产生中扮演了重要角色。随着计算机技术的不断发展，图灵机的计算模型也在不断优化和完善。符号主义与图灵机之间存在紧密的关系，共同推动了人工智能领域的发展。但是符号主义的起源可以追溯到19世纪末数理逻辑的迅速发展以及20世纪30年代数理逻辑对智能行为的成功描述。

符号主义注重知识标识和推理，让机器像人类一样理解和运用符号，在知识工程和专家系统等方面取得了显著的成果。它通过构建符号化的机制，实现了人工智能的模拟和应用。这种思维把问题的组织与解释看作是一种符号关系，解答问题就是从一种结合转换到另一种结合，因此符号主义以组合轴操作为文本构成的主要方式。

二十世纪八九十年代，计算机在处理复杂问题时，就已经面临数据过大的挑战。随着人工智能应用需求的不断变化，新的方式从另一个方向突破，即寻找数据库中元素之间的概率上的连接延伸方式，明显着重于其中的聚合方式，这就是连接主义（connectionism），又称为仿生主义（bionicsism）或生理主义（physiologism）。该主义主张让计算机模仿人类的神经元，模仿神经网及其连接机制，用概率预测下一个词元（next token prediction），而不是依靠逻辑来类推。例如“饮下”可以推到“水”“酒”等高权重词连接，然后反推到语境中看哪个连接适合上下文。只要通得过反推检查，那么下一词元甚至可以与“仇恨”这样的低权重词连接。

人工智能学习此种连接算法，主要灵感来自人类的神经系统工作方式，即把认知看成是神经元网络的整体活动，通过模拟生物神经系统来实现学习和适应。简明地说，不通过逻辑意义进行选择，而借助数据库中找到的链接概率来模仿分布在众多神经元中的信息是如何整合的。

早在1943年，神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)合作，对大脑的神经元进行类比和建模，提出了模仿人类神经元连接的数学模型。20世纪80年代以来，由于互联网技术的发展，计算机服务器联网到神经网络，更精细地实现了仿生模拟神经网络，推动了连接主义的崛起。

深度学习技术的发明，是连接主义崛起的关键技术突破。随着计算能力的提升和大数据的出现，推动了连接主义。此后数十年，借助此种模仿神经网络连接的办法，人工智能取得了巨大进展。反向传播算法等方法，使连接训练变得更加高效和准确。连接主义在语音识别、图像识别等领域取得了巨大的成功，扩展到自然语言处理系统等领域。

以上讨论，可以粗略地说，符号主义侧重于用逻辑推理来模拟人类智能，而连接主义则更注重直接模仿神经网络连接机制。连接主义注意的重点是：在大数据中，如何在这些元素的连接中进行挑选。尽管符号主义与连接主义都需要选择与组合的双轴配合，但符号主义更注意元素之间的逻辑意义组成，因此更倾向于组合关系；而连接主义更注重各元素之间是如何互相生发出来的，如何对连接出来的元素进行评价并且选择，此种工作更倾向于聚合轴操作。

连接主义通过模拟神经网络处理信息的方式，能够处理复杂的数据和模式识别任务，看来是很有效的路径，不需要在每个连接上理解其意义逻辑，因而能实现快速选择。其缺点是缺乏可解释性，因为它跳过了人类智能的理智思考过程而直接模仿神经系统工作。人类思想史、文明史的伟大成果，都简化为大数据中的概率而已。说的人多、连接概率大的，就多采用，思维的质量不在其主要考虑之列。这个过程说起来复杂，但是在计算机每秒几亿次的推算中，几乎是一瞬间完成的。

赵汀阳说：“人工智能大胆地显示了以经验方法去预测未来的粗鲁能力。相对于神秘复杂的人脑来说，人工智能的经验论方法很笨却又很管用，而且没有使用人类引以为豪的先验理性能力，这使人好奇人工智能是否大智若愚。”话说得很委婉，实际上是说人工智能可用、管用，但其只是“经验论”地模仿神经系统的连接方法，并没有采用从理性上可以解释的推演过程，因此显得“很笨”。表面上，人工智能似乎什么都知道，但其实是在很“粗鲁”地对待人类文明的文本累积。即看似都在“选择”行为，但人工智能的概率选择与人类的思维逻辑选择遵循着完全不同的判定标准。当然从目前的实践效果来看，此种基于概率的选择，的确比思维逻辑选择迅疾而有效。

四、“偏组合的聚合”与“偏选择的聚合”：辛顿与乔姆斯基的争论核心

语言学权威乔姆斯基是学术界泰斗级的存在，对当代语言学做出了巨大贡献，其影响超出语言学界，常被认为是欧美尚在世的“最著名的知识分子”。乔姆斯基在ChatGPT出现之后，曾批评当今人工智能的路线只是“高科技抄袭”，本质上是剪刀加浆糊。而有“人工智能教父”之称的杰弗里·辛顿，则指责乔姆斯基的语言学理论有根本性错误。他们唇枪舌战，用词非常激烈，争论已经延续了两年时间。辛顿2025年获得诺贝尔物理学奖，使他最近的言论更受重视。

他们对语言构成意义方式的观点完全不同，处理语言的方法可以说是针锋相对。实际上，人工智能研究界反对乔姆斯基理论的声音已经持续好多年，许多著名学者都加入其中，只是辛顿的观点比较系统而有代表性而已。这也不是无事生非的意气之争，人工智能在开发大语言模型时，发现不能使用乔姆斯基的语言学模式。因而这是一场我们不得不仔细分析的争论。可惜的是乔姆斯基本人年事已高（2026年已98岁），或许他已经不可能再次做出回应。

乔姆斯基的理论，往往被笼而统之地称为语言“深层结构”的“普遍语法”（Universal Grammar）。他发表此理论在1957年、尚不到30岁的时候，历经多年一系列著作推进，1997年，他在《语言学理论最简方案》(Minimalist Program for Linguistic Theory)一文提供了最成熟的理论形态。简化地讲，乔姆斯基认为人类理解并运用语言的能力是与生俱来的。语言能力是人类区别于动物的最重要特征，如同人类会行走一般，它由遗传获得，且将在教育过程中被唤醒。表面千差万别的不同语言，都是在这个类似的“深层结构”中发展出来的。

乔姆斯基认为，人脑通过内存的符号规则系统（普遍语法）来生成语言能力。这一系统具有功能模块化的特点，虽然运算速度受限，但为语言的生成和理解提供了坚实的基础。如果承认这个理论对人工智能也适用，那么人工智能的意义活动，尤其是其文本显示，也会遵循这深层语法的规律。只不过人工智能就像一个学习能力极强、记忆力超级的神童，让“普遍语法”发挥作用，用极快速度就能表达意义，而文本只是对认识内容的表述，无需特别设计。应当说，乔姆斯基认为人脑通过符号规则系统来处理语言的理论，有点类似于基于逻辑推理的人工智能符号主义。符号主义认为人类思维的基本方式是符号间的逻辑联系，乔姆斯基的语言理论为符号主义提供了语言学上的支持，符号主义的发展也为乔姆斯基的理论提供了计算模型和实现手段，使得语言学的研究更加具体。

简单地说，乔姆斯基的理论应用于人工智能，就是偏向于在聚合选择中引入组合关系。普遍语法决定的是语句各部分的结合方式，例如主语必有动词与宾语连接，不是聚合选择的元素强迫形成表述的组合关系，而是某种组合先天地控制聚合，对聚合选择有某种前定的要求。

当连接主义在人工智能的设计中出现，设计者们认为乔姆斯基的理论非但不能适用于机器，甚至人脑神经系统的语言生成方式也与此不同，因此必须要破除此种深层语法控制理论，才能用概率方式（而不是逻辑方式）处理数据库。深度学习领域的开创者们认为词汇之间的连接关系在大数据中已经现成，依赖于关键词连接中的概率与权重调整就能生成文本。而且他们认为人工智能此种学习方式，就是人类在经验材料中生成意义文本的方式：是神经元的持续连接与挑选，而不是乔姆斯基说的先天语言能力在起作用。因此，辛顿直率地提出：乔姆斯基的人类先天语言能力说是说不通的。人工智能连接主义的方式，就是人类语言能力固有的方法，就是人类理解语言的模型。偏选择的神经网络模型，是人工/人类智能共同具有的基本方式。

不过，这场争论是乔姆斯基首先挑起的。2022年11月，OpenAI公司发布了ChatGPT-3.5，震动了全世界。2023年3月8日，乔姆斯基与语言学家伊恩·罗伯茨（Ian Roberts）、人工智能专家杰弗里·沃特穆尔（Jeffrey Watumull）合作，在《纽约时报》（The New York Times）刊出一篇特稿《ChatGPT的虚假承诺》（The False Promise of ChatGPT）。在此文中，他们指责人工智能系统“只是在大数据中寻找惯例用法，输出统计学上正确的答案”，是一种“高科技剽窃”（high-tech plagiarism），而且只是“总结文献中的标准答案，拒绝对任何事表明立场”，实在是“为无知辩护”的“平庸之恶”。他们认为人工智能只是在进行模式匹配，生成了看似合理的文本，但并没有真正的理解和思考。

在这之前，辛顿对人工智能的未来持有一定程度的谨慎态度，称人工智能可能成为人类的一个“生存威胁”（existential threat）。但是乔姆斯基的挑战是原则性的，认为这不仅关涉人工智能的评价问题，而且是根本的方法论问题，对此他不得不回应。2024年4月8日，辛顿在爱尔兰都柏林大学（University College Dublin）接受“尤利西斯奖”（Ulysses Medal）时的感言，给了乔姆斯基一个口气尖利的回复：

语言学家被一个叫乔姆斯基的人误导了好几代……他有一个偏执古怪的理论，即语言不是学会的。他成功地说服很多人相信这一点。这个说法显然是一派胡言。语言显然是学会的。大型神经网络学习语言，不需要任何先天结构，只是从随机权重和大量数据中开始学习。乔姆斯基却仍然在说：这并非真正的语言，不能算数。这是不对的。许多统计学家和认知科学家也说，永远不可能在这样一个大网络里学习语言。

这话实际上是说，他们争论的不是人工智能的设计问题，而是人类智能的根本原理问题。接着辛顿详细地解释了我们上文解释过的“反向传播”，即通过概率连接与反复试探，就可以找出最合适的连接。他认为大多数语言学家也相信这种理论，即一个词的意思来自于它与其他词的关系。

不过他承认，两人可能是注意到语言文本的两个不同方面：“乔姆斯基从来没有提出任何一种有关语义（semantics）的理论，他的理论全是关于句法（syntax）的。”这就是两位大师最主要的分歧点：乔姆斯基的理论偏向于句法关系，即组合关系，而辛顿注重的是词元的选择，即聚合关系。但他们都是在讨论人工智能产生文本的聚合选择，实际上当前人工智能从数据库中找出的是已有的聚合，因此是从聚合中找聚合，有点像全国运动会的参赛成员从省级运动会的参赛成员选择中进一步做选择，或是从菜单可能的选项中作进一步选择。乔姆斯基主张的是“偏组合的聚合”，而辛顿主张的是“偏选择的聚合”。两人的看法是在双轴关系中作了有选择的偏重，结果就大不相同。

从聚合中找聚合的文本生成示意图

当然可以问：乔姆斯基完全错了吗？在辛顿获得诺贝尔物理奖之后，结论似乎已经明朗：辛顿对，乔姆斯基错。人工智能的高速发展，尤其是人工智能在图像、视频、音乐方面的强有力推进，的确证明了神经元连接能解决意义生成问题。乍看来，让人类智能跳过逻辑推理环节直接模仿神经元联系，似乎的确具有超高速的文本生产能力，但若细究其实质，却可能涉及更深层次的认知机制和哲学考量。

可见，科学界尚在努力理解人类智能与人工智能之间的同和异。辛顿和乔姆斯基的观点可谓是从不同角度探讨语言的本质，乔姆斯基强调人类先天的语言结构，辛顿更侧重神经网络式的数据连接能力。就目前的大型语言模型生成文本而言，可能辛顿的观点更切合运用实际。但是效率并非结论，或许引入更多的先验框架与结构信息，有助于在将来进一步提高人工智能的理解和生成能力。

本论文探讨的几个方面的双轴关系，只是说明了双轴偏向的变化造成的一系列特点，却无法指出哪一种偏向比其它偏向更出色。可以看到，哪怕是在最“神秘”的人工智能领域，只要是意义活动，就必然在双轴关系中展开，仅仅这两个关系中的偏向，就造成人工智能发展过程中的巨大变异。未来的人工智能发展，或许可以充分利用符号主义的逻辑推理能力和连接主义的概率处理能力，将符号主义和连接主义的优点结合起来，形成一种“混合式神经-符号人工智能”。符号主义和连接主义之间的界限很可能会逐渐模糊，转而相互借鉴和融合。目前，一些研究者已经开始尝试双轴并重的研究路径，即将符号主义推理组合方法与连接主义聚合选择中高效的神经网络模型相结合，试图构建更加“智慧”的人工智能。

赵毅衡：人工智能文本生成的双轴互动与转向——兼评辛顿与乔姆斯基的争论核心

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏