徐英瑾:语境建模三大进路之哲学预设探微

选择字号:   本文共阅读 749 次 更新时间:2016-03-25 09:41:11

进入专题: 语境建模   人工智能   外在主义  

徐英瑾  
在此战役中战士之所以要佩戴钢盔,乃是因为其头部随时都有被敌弹击中的风险。如果“对于战士的头部的威胁”这个方面并非反常(即这个威胁没有被解除)的话,那么即使在“第二次世界大战”这个更大的语境中,战士依然需要佩戴钢盔。

      

      (读作:对于任何两个语境来说,只要其中一者包含于另一者,且任一事件在较大的语境中成立,且在“方面2”这两个语境和该事件都不是反常的,那么该事件也在较小的语境中成立。)

      示例:设“诺曼底战役”这个语境是“第二次世界大战”这个语境的一部分,而“战士需要和家人别离”这一点则在“第二次世界大战”这个语境中为真。而之所以战士需要在战争中和家人别离,乃是因为一般而言,一个家庭的所有成员不会都参军。如果“一个家庭的所有成员不会都参军”这个方面并非反常的话(即任何一个家庭的确只有一部分成员在部队里),那么即使在“诺曼底战役”这个更小的语境中,战士依然需要和家人别离。

      从哲学角度看,这两个公式有三点值得注意:

      第一,前文所提到的“制限方法”,显然在这两个公式中得到了保留。我们已经知道,该方法的核心哲学预设就是假定世界自身的“惯性”,也就是在反常条件未发生的情形下诸自然规律和社会规律的持续有效性。秉承着这一典型的麦卡锡式思路,古哈在“提升公式一”中也设定了较小语境的“惯性”也能在较大语境中持存,并在“提升公式二”中设定较大语境的“惯性”也能在较小语境中持存。换言之,诸语境之间共享的“惯性重叠区”,也就成为一个事件得以完成“跨语境漫游”的“绿色通道”。但需要留心的是,要寻找不同语境之间的“惯性重叠区”,就首先要对打破惯性的反常特性进行提取,并由此将“惯性”定义为对于这种反常特性的否定——这就牵涉到了如何提取这种反常特性的问题。在讨论“制限方法”时敏锐的读者或许已经发现,对于反常特性的信息提取会牵涉到作为人类的程序员对于相关语境的判断,而未必体现了程序自身的智能——而这个问题现在也已经被古哈的语境建模方式所继承。

      第二,从知识辩护(epistemic justification)的角度看,在这两个公式中,对于原语境(在“提升公式一”中,这指的是 ,在“提升公式二”中,这指的是 )的反常特性的否定,就意味着我们已经将被提升判断在原语境中得以成立的理由加以了明述——而这些理由本来只是隐含于原语境之中的。换言之,这些隐含条件一旦被剥离出来成为独立条件,对于它们的满足就能够保证我们能够合理地将相关判断移植入新语境之中(也就是说,对于这些条件的满足构成了对于这种移植之合法性的辩护)。

      第三,正如前文所提到的,要运用这两个公式,系统就必须预先知道相关语境彼此之间的包含关系。很显然,这样的宏观信息并不总是可被获取的,而这又反过来为上述两个公式的运用构成了限制。

      上述几点哲学分析,或许已足以向我们展现麦卡锡等人的语境刻画方案的先天缺陷。概而言之,此方案对于大量提升公式的依赖,实际上已经包含了对大量常识见解进行公理化的意图,但——很显然,这个做法同样会使得系统在面对崭新的问题求解语境时变得手足无措。但从哲学角度看,这种方法论只能够面对过去,而无法面向未来——因为既然有的常识见解往往并不包含关于“应当如何应付一个新问题求解语境”的有效指导。在这里我们无疑看到了按照麦卡锡和古哈的精神设计出来的人工系统和真实人类之间的重大区别:对于前者来说,当其因为某种需要而试图将某条知识从语境甲“提升”到语境乙中之时,它必须先得在自己的公理库中找到一条对应的“提升公式”才能够完成这步推理。一旦它找不到这类公式,其跨语境推理活动就会陷入瘫痪;而对于我们人类来说,即使我们在既有的经验中没有找到完全符合当下问题需求的跨语境推理的先例,我们也可以使用一些更为灵活的方法来进行跨语境推理,比如:罗列我们面对的新语境和我们熟悉的旧语境之间的类似点和不类似点,并在此基础上,构造出一些和我们熟悉的跨语境推理路径类似的新推理路径,等等。但正如我们所看到的那样,麦卡锡和古哈的工作方法论是无法容忍这种灵活性的。

      从更深的层次上看,他们的工作方案之所以无法容忍这种灵活性,又是得缘于如下两点:

      首先,麦卡锡和古哈对于弗雷格以降的数理逻辑传统的高度忠诚,使得他们不假思索地在自己的语境建模工作中采纳了“公理化方法”,即将大量的提升公式作为公理预存在系统的知识库之中。但众所周知的是,作为演绎系统之初始命题的“公理”所构成的集合,一经确定后便不可能在系统的运行历史中被修改,因此,任何一个采用公理化方法构建出来的跨语境推理系统,都无法在根本上规避这样一个难题:如何面对程序员未曾料想到的新问题?从这个意义上说,麦卡锡和古哈的工作方案的技术缺陷,其实是有着非常深刻的理论根源的。

      其次,麦卡锡对于常识见解的表征和整编工作,虽然已经触及了卡普兰-刘易斯方案所不重视的语境的主观面相,却依然并不太重视对于心理词汇的表征,更不重视对于心理活动过程的再现。这当然也使得他们的常识表征工作陷入了某种“弃本逐末”的窘境:他们只关心心智活动所产生的结果——即关于跨语境推理的法则式概括——却不关心心智机器是如何产生这样的结果的。这就使得他们所设计出来的系统,难以像真正的人类心智那样,在面对新问题时展现出足够的灵活性。(11)

      三、酶性计算模型对于语境敏感性的展示

      上面的讨论似乎在暗示我们,语境建模工作应当离数理逻辑更远一点,靠人类主体的心理实在更近一点,以便从人类心智的真实语境处理机制中找到启发。不过,这个方法论原则虽貌似有理,却已然预设了我们已经知道了人类的心智的信息处理活动是如何具有语境灵活性的——但不幸的是,在这个问题上,认知心理学家所能够提供的,至多也只是这样或那样的猜测而已。

      那么,我们能不能以一种退而求其次的姿态来追问:在这样的一些心理学猜测之中,究竟哪些或许会对人工智能中的语境建模工作具有更大的参考价值呢?

      在这里比较值得一提的假设性模型乃是巴瑞特(Clark Barrett)提出的“关于心智模块的酶性计算模型”(12)。顾名思义,这个心智模型的提出,肯定是受到了化学家所提到的“酶促反应”的启发。有初等化学知识的人都知道,要让不同的底物彼此之间发生更为高效的化学反应,就必须要有不同的酶分子分别参与其中,这就体现了所谓的“一把钥匙配一把锁”(a lock matching a key)原理。这也就是说,对于不同的酶促化学反应过程来说,底物和酶分子之间的具体匹配关系其实是“多姿多彩”的:不同的酶分子需要不同的底物作为其输入,而且不同的酶分子对于底物的加工程序也是彼此不同的。巴瑞特便沿用这种观点来看待人类认知架构中的诸模块处理信息的过程。请设想这样一个例子。一只狮子正在朝一个智能体走来,此时,其认知架构下属的各个模块开始运作,识别并标记这个狮子在各个方面的特征,如大小、颜色、尺寸、距离、速度,等等。这些表征被知觉系统捆绑为一个单一的对象表征,成为“狮子识别机制”的一个“底物”。而一个叫“LION”(狮子)的标签(tag)则成为该机制的另外一个“底物”。在该机制的“催化作用下”,这个标签和这个对象表征被处理为某种“化合物”,作为输出被递送出该机制,并由此进入了一块被所有模块“看到”的“展示板”(bulletin)。这样一来,这样的输出就会成为别的模块的潜在输入或者底物,有待别的模块来检验其与自身之间的匹配度。请参看图1的直观性展示:

      

      图1 认知模块的酶性反应机制示例图

      现在再假设“LION”这个标签和一个叫“捕猎者查找表”的新模块机制发生了关系——这个机制根据这个标签的形式特征,就像查对数表一样,找到这个输入可能具有的进一步的语义标签,并将该标签附加到原来的表征上去(这个过程也可以被视为另一个酶催化过程)。现在,假设这个被新加上去的标签乃是“PREDATOR”(捕猎者),这样一来,原来的表征现在就具有了两个标签:“LION”和“PREDATOR”。这个更为复杂的表征则重新进入“展示板”,以便和其他的模块发生进一步的“化学反应”。若其中的某些模块连接着“欲望”以及“行动”机制,我们就可以期待有机体会因为识别出了某些标签而给出某种行动(譬如,在意识到狮子是捕猎者的情况下,立即转身逃命)。

      以上说的这些,和本文所关心的语境建模问题之间的联系点又在何处?回答此问的关键乃在于上文所提到的“展示板”——在化学酶的催化作用的语境中,这指的就是大量的底物和大量的酶进行匹配尝试的“公共场所”;而在这里,它指的则是大量的语义标签和大量的认知模块进行匹配尝试的“公共场所”。由于在上一轮的标签匹配游戏中得到标注的标签,可以重新进入这个展示板成为下一轮游戏的潜在输入,因此,模块之间的信息交流也便得以完成。同样不难设想的是,由于在这一公共展示板中,没有任何一种高端的“顶层设计”可以预报哪些模块必须和哪些标签发生关系,因此,具体哪些“标签”被生产出来,则取决于很多当下的偶然性因素。这一点也就最终体现了所谓的“语境灵活性”。

      不过,巴瑞特模型对于自然认知系统的“语境灵活性”的这种处理方式是否令人满意呢?笔者的意见是比较消极的。相关理由如下:

      第一,依据卡鲁瑟斯(13))的大规模模块性假设,模块乃是一种由演化压力而演变出来的先天结构,不是有机体通过在个体层面上的后天学习而获取的。由此不难推出,模块所为之服务的可能的标签的数量,应当是一个固定的值,因为没有一种先天的机制能够处理在种类上具有无限丰富性的各种输入(这就好比说,你无法设想在物理世界中存在着一台输入键数量为无穷大的键盘)。但我们又都知道,人类的概念标签具有极大的可拓展性(请大家想想英语的词汇总量),而且,很多智力正常的成年人都可以在后天习得大量的新词汇。这就构成了一对矛盾:功能有限的先天模块组合,是怎么可能应对这些数量不断扩大,且种类也层出不穷的新语义标签的呢?

   第二,在巴瑞特的模型中,我们没有看到关于诸多模块之间层级结构的清晰描述,因此,我们也就不是很清楚他们所处理的不同语义标签之间的概念层次结构是如何产生的(顺便说一句,这样的概念层次结构是必须存在的,否则智能体将很难从关于某个表征的知识中得到一些有用的推论)。而他用以解决这个问题的唯一希望,似乎就放在不同模块对于不同标签的识别能力之上——比如,一些负责更为复杂的语义表征识别任务的模块,在识别机制上会安置更多的机关,以便保证自己不会首先处理那些过于简单的语义标签。但笔者非常怀疑这个架构的可行性。从某种角度看,这个架构实际上是把语言的句法结构转化为了各种模块的识别机制的构造,就像一个政府将自己的法律转化了大量的执法人员自身的行为倾向一样。然而,如果缺乏某种高端的“顶层设计”的指导,对于这种低层次上的语义标签识别机制的设计会变得非常繁琐和困难——而且,我们也很难相信带有很大盲目性和随机性的自然选择过程能够在这个问题上具有比人类设计员更为深邃的眼光。(点击此处阅读下一页)

    进入专题: 语境建模   人工智能   外在主义  

本文责编:gouwanying
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 哲学 > 科学哲学
本文链接:http://www.aisixiang.com/data/98079.html
文章来源:《上海交通大学学报:哲学社会科学版》2015年2期第17~26,34页

1 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2021 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统