梅剑华:人工智能与因果推断——兼论奇点问题

选择字号:   本文共阅读 205 次 更新时间:2021-11-06 21:12:29

进入专题: 人工智能   因果推断   奇点  

梅剑华 (进入专栏)  

  

   摘要:自“图灵测试”提出以来,关于机器能否真正具有人类智能的争论就一直没有间断。批评者多认为机器可以具有工具意义上的弱人工智能,但不具有主体意义上的强人工智能。以珀尔为代表的因果推断学派主张因果推断能力是机器具有强人工智能的关键。一旦机器获得因果推断能力实现强人工智能,机器就可能在后续发展中远远超过人类智能,并达到其发展之奇点。我们认为:如果能让机器人具备因果推断能力,那么强人工智能就是可以实现的,奇点的存在在逻辑上是可能的。但是可能性不等于实际性,要想在实际上获得这种高于人类的智能,人类还需要进一步整合传统生物智能和机器智能。

   关键词:强人工智能  反事实  因果推断  奇点问题

  

   一、“图灵测试”与强人工智能

   要探讨人工智能问题,不可避免地要回溯到图灵(A.M.Turing)及其所提出的“图灵测试”。1950年,图灵在哲学杂志《心灵》上发表了《计算机与智能》一文,该文成为了人工智能领域的开创性文献。在该文中,图灵提出了一个基本的测试标准,以检验计算机是否具有人工智能。图灵提出,我们可以设计一个模拟游戏,让不同的测试者轮流向某个人和一台计算机提出问题,这个人和计算机都借助打字机回答测试者提出的问题。如果在一段时间内,测试者无法识别两个回答者中哪一个是人哪一个是机器,计算机就可以算作通过了测试,具有了和人类一样的思考能力。这就是著名的“图灵测试”。(cf.Turing)

   “图灵测试”的反对者们则提出,通过了这种测试的机器并非具有真正的人类智能,因为人类智能具有其生物基础,拥有意识(自我意识、现象意识),具有承担责任的能力(伦理责任、法律责任),具有理解和感受世界的能力及实践能力等等,这些都是机器不能通过算法来完成的。人类的心灵不能通过算法模拟而获得。我们因而可在弱人工智能与强人工智能之间做出区分。弱人工智能建立在算法基础上,但算法本身不能建立强人工智能。诸如默会知识、现象意识、自由意志、责任、主体性等都不能从算法中产生出来,从算法到主体性之间有一道深深的鸿沟不可逾越。

   不但如此,在从专家智能到通用智能的跨越过程中,传统研究也长期忽略了这样一个关键性因素。那就是机器人需要具有一种独特的能力:因果推断能力。因为专家系统对人类智能的模拟是针对某个特定的任务制定的算法程序,例如下棋、语音识别等等。而要达到通用智能,就需要机器能够根据周边的复杂环境进行反应作出推理。人类就是在复杂的环境中根据有限的数据进行推理。早期的专家推理系统取得了巨大成就,却不能像小孩一样进行常识判断和因果推断。它可以做出超越专家的事情,但无法做出小孩很容易做到的事情。小孩对外界环境的刺激进行回应,通过因果学习,建立因果推断模式。与计算机相比较,小孩获得的数据是少的,但解决的任务是复杂的。加州大学计算机视觉研究专家朱松纯将其总结为:人工智能不是大数据、小任务;而是小数据、大任务。环境中的智能体通过观察、操控甚至设想环境中的有限信息(小数据),建立信息和行为之间的因果关联,从而做出复杂的行为,完成大任务。(参见朱松纯)

   与这一思考趋势相关联,2011年图灵奖得主、计算机科学家珀尔(J.Pearl)及其同事提出,人的根本能力是因果推断能力,强人工智能就是让机器人具有因果推断能力。他们据此提出了一个因果版的“图灵测试”:我们需要测试机器能否回答人类可以回答的因果问题。(cf.Pearl&Mackenzie,pp.36-39)塞尔可能会认为,即使机器能够回答因果问题,仍然不理解因果关系。但珀尔则认为,机器要通过成功回答因果问题来欺骗对话者非常困难。如何让机器具备因果知识是对人工智能领域的一个巨大挑战,在《因果性》一书中珀尔提出了因果推断的形式化模型,推动了人工智能领域中的因果革命。(cf.Pearl,2009)

   如果说因果推断是人工智能的一次范式革命,那么这种范式革命会不会加速人工智能研究领域人们所普遍关心的奇点的到来呢?这也将是本文讨论所关心的另一个核心话题。人工智能学家用奇点表示人工智能远远超越人类智能的那一刻。古德提出:“第一台超智能机器将是人类最后一个发明。”(转引自库兹韦尔,第10页)从此之后,超能机器自身就会制造出比自己更具有智能的机器。跨越奇点就意味人工智能的终结。既然设计机器是一种智能活动,那么超智能机器就可以设计出更具智能的机器人。智力爆炸和速度爆炸相关。根据墨菲定律,计算机的速度是倍增的,加速会导致智能迅速达到临界点。因此可以预期“智力爆炸”的临界点可能会到来。

   在人工智能问题上,是否承认人工智能拥有一个临界奇点,这将反映出不同的人对于人工智能理解的不同信念,不同态度,因此将原则性地决定人们对于人工智能发展的性质及未来之判定的立场差异。机器如果具备因果推断能力,这将使得机器人智能具有实质性提升,因此因果推断在判定奇点是否会到来的问题上将发挥实质性的作用。

   二、因果推断、反事实推理与强人工智能

   因果性在人类实践生活中具有头等重要的地位。因果是“联结人类意识与物理世界的通道桥梁,它们也是人类作为认知、道德等方面的能动的行为者(agent)的不可或缺的基础。”(蒉益民,第113页)人工智能关注的正是人们如何运用因果推断能力与世界打交道。

   强人工智能应该是一个心灵(mind)而不是单纯的人类工具。给机器配备因果推断能力,是让机器成为心灵的关键一步。我们如何行为依赖于我们对于世界的认识,依赖于我们通过有限的观察所获得世界的图景。人类似乎有一种因果直觉,能够很快发现事物之间的关联。如果机器在不需要大量数据的情况之下,也能很快发现事物之间的关联,那么它在行动上的表现就和人非常类似。因此一方面,如果我们接受神经科学对大脑的研究,认为人的行动不是仅仅由“意志”发动的,而是和外部的因果事件有联系,我们对人类自由意志的理解就会弱化一些,这种自由至少有部分是可以客观可获得的。另一方面,如果我们对机器输入因果推理模式,它就会根据因果关联去行动,例如事件甲和乙之间具有因果联系,事件甲和丙之间具有相关性。机器选择了从甲到乙的路径而不是从甲到乙的路径,它就展示了像人一样的思维能力。机器在面对多个事件的时候,选择了具有因果相关的事件而不是仅仅相关的事件。这也进一步表明,它具有一定的自由选择能力。因果推断能力是强人工智能的重要的标准,这一论断将具有双向后果:一方面我们可以看到人的机械性,另一方面我们可以看到机器的主动性。传统哲学对于主体性、自由意志的理解是一种全有或全无的逻辑。某一个体要么具有要么不具有自由意志。但是从当代神经、认知科学的视角来看,我们可能要说主体性和自由意志应该是有程度之别的。某一个体具有更多一些的主体性,而另一个体具有较少一些的主体性,这样的说法是合法的。因此对于因果推断与强人工智能的关系,我们可以从理解和理论两个角度来说。从理解方面来说,放弃人类中心主义会让人们倾向于认同机器具有一定程度自由意志;从理论方面来说,建构一套因果推断的形式系统为机器具有一定程度的自由意志提供了基础。

   强调因果推断,这是珀尔和其他主流人工智能研究的关键分界。早期的人工智能算法基于符号逻辑的演绎推理,1980年以来的人工智能算法则基于概率(贝叶斯网络)的归纳推理。而因果推理则是结合了演绎推理和归纳推理两个维度的算法。作为20世纪80年代兴起的贝叶斯网络推理的教父,从20世纪90年代起,珀尔放弃了概率推理,转而支持因果推断理论。在他看来,目前的机器学习、深度学习不能发展出真正的人工智能,其根本缺陷就是忽视了因果推断。当前的人工智能不过是爬树登月,要登月必须建造宇宙飞船而不是种大树,建造宇宙飞船就是为因果推断构造出一套数学模型。

   规则性因果说和关于因果的反事实理论是因果推断理论中两种最主要的理论。规则性因果说源于休谟:“我们把原因定义为有另一个对象跟随的对象,那么所有和前一个对象相似的对象都有和后一个对象相似的对象跟随。”(休谟,第70页,译文有改动)刘易斯对休谟的规则性因果说做了形式化定义:令C表示命题c存在(或发生),E表示e存在(或发生)。c是e的原因当且仅当:(1)C和E为真。(2)自然律命题集L和特定的事实集合J联合蕴涵了C→E,尽管L和J并不联合蕴含E,J单独不蕴含C→E。(cf.Lewis,p.556)

   这里的问题在于,相关并不蕴含因果。事件a和事件b规则性相关,但二者之间并非因果关系。公鸡打鸣天就亮了,但公鸡打鸣并不因果地导致天亮;夏天来临,冰淇淋销量大增同时犯罪率也上升,但冰淇淋销量大增并不因果地导致犯罪率上升。刘易斯意识到了规则性因果说的局限,因而另辟蹊径提出了关于因果的反事实理论。(cf.Lewis)

   按照刘易斯的读解,休谟自己其实也已经提出了关于因果的反事实定义。在给出了因果的规则性定义之后休谟说:“或者换句话说,如果前一个对象没有存在,后一个对象永远也不会存在。”(休谟,第70页,译文有改动)这里已经给出了一个与因果的规则性定义截然不同的反事实定义:如果a,那么b;并且如果非a,那么非b。(cf.Lewis)人类能够想象反事实状况,这是认知能力的一大提升,是从已知到未知的一跃。

   不难发现,很多物理学定律都可以用反事实条件句来刻画。例如胡克定律:弹簧在发生弹性形变时,弹簧的弹力F和弹簧的伸长量(或压缩量)x成正比,即F=-k·x。它的反事实形式就是这样的:如果对弹簧施以双倍的力量,那么弹簧也相应伸长为双倍。

   珀尔关于因果推断的模型受到了刘易斯反事实因果理论的启发。休谟的规则性因果说是一种归纳推理,人工智能早期基于逻辑的推理是一种演绎推理,20世纪80年代开始人工智能逐渐转向了基于概率的归纳推理。而刘易斯的反事实模型更接近于演绎推理。珀尔在因果推断领域把演绎推理和归纳推理相结合构造了因果的数学模型。反事实推理对于人类生存实践至关重要,因为人类不可能实际上穷尽所有的可能性,只能基于有限的数据去进行推断。规则因果建立在对实际发生事件彼此关联的归纳之上,反事实因果则是建立在非实际发生事件的关系上。反事实推理要比规则推理更抽象、更普遍也更符合人类实际推理情况。我们可以发现,规则推理是基于实际发生事物的推理,反事实推理则是一种基于不存在事物的推理。因此理解因果推断能力的关键,就是理解反事实思维方式。让机器具有因果推断能力,就是让机器具有反事实思维能力。

   基于刘易斯的反事实推理思想,珀尔认为人类获得因果推断能力可分为三个渐进的层面。第一是观察层面,人类和动物都可以对周边环境的规律进行观测。第二是操作干预层面,通过预测后果作出相应的行为,例如早期人类使用工具。第三是想象反事实情形的层面,通过想象来获得对世界的理解。(cf.Pearl&Mackenzie,pp.23-51)

在观察层面上,我们观察到规则和相关性。我们可以提这样的问题:假如我处于某个特定场景,我会观察到什么?事件或变元之间如何关联?当我观察到新证据x,这如何改变我关于既有事件y的信念?例如我们可以问:什么样的症状可以让我判断某人得了肌肉萎缩症?什么样的统计数据可以告诉我某一次选举的结果?这种相关性由条件概率刻画P(y│x)=p,在我们观察到事件X=x的条件下,事件Y=y的概率就是p。P(y│x)=p表达的是x和y的统计关系。当前在人工智能研究领域被人们广为关注的机器学习问题就是处在这样一个一层面上的问题。相关并不蕴含因果,这也就意味着机器学习并不蕴含强人工智能。(点击此处阅读下一页)

进入 梅剑华 的专栏     进入专题: 人工智能   因果推断   奇点  

本文责编:admin
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 哲学 > 科学哲学
本文链接:http://www.aisixiang.com/data/129498.html
文章来源:哲学研究

1 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2022 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统