杨学山:走向通用人工智能

选择字号:   本文共阅读 178 次 更新时间:2019-08-21 00:38:56

进入专题: 人工智能  

杨学山  

  

   2019年8月16日至17日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,CIO时代APP承办的"第五届中国行业互联网大会暨CIO班14周年年会"在北京隆重举办。北京大学兼职教授、工业和信息化部原副部长杨学山发表了题为《走向通用人工智能》的演讲。以下为演讲实录:

  

   尊敬的各位来宾、各位CIO的同仁,各位朋友,大家上午好!很高兴参加第五届中国行业互联网大会暨CIO班14周年年会!CIO班14年的学员们像一颗颗种子在全国各个地方和各个行业开花结果,所以我在此表示祝贺!

  

   根据会议安排,今天讲讲通用人工智能。我本人是不太喜欢通用人工智能(AGI)这个词,所以在我的书里面,没有用到这个词。但是大家对这个话题感兴趣,而且这个概念大家也都熟悉,所以还是用这个概念来讲。讲三个部分:一是讲历史,我们对通用人工智能的追求;二是讲一下人类智能,因为通用人工智能必须理解人的智能,不理解的话做不出来;三是讲一下通向AGI的一种路径,这个路径就是我从《论信息》到《智能原理》到现在正在写的第三本书《智能工程》,一直想描述的一个理论和一种实现方式。

  

   维基百科关于AGI这一段英文大概是三个意思。第一,通用人工智能是什么?通用人工智能就是能够完成一个人所有智能行为或者是智能任务的一个机器系统;第二,它既是人工智能研究者,也是我们写科幻小说的人和未来学研究的人共同使用的一个概念,这句话很有意思;第三,通用人工智能和其他相关的几个智能概念的关系。

  

   确实,我们人类对通用人工智能的追求有着漫长的历史。莱布尼茨应该说是我们走向机器智能的一个奠基者,他是二进制创造者,是符号思维符号逻辑的创立者,也是机器思维的创立者。所以应该说从他开始往后,我们在持续追求一种机器,这种机器能够像人的思维,有人一样的智能。

  

   在这个过程中有很多的努力,但是很多都失败了。其实前面两个我们都熟悉,通用问题求解器,五代机谁也知道,当然美国国防部的DARPA项目我们了解的不多,但是它也是想追求通用人工智能,但是他也失败了。

  

   尽管莱布尼茨1640年前后到现在350多年了,我们依然没有找到解。这里面有说人工智能不可能在近期有重大突破的这样一些观念,这是左边。右边讲的是为什么通用人工智能不行,主要的反对意见,所以说我们到今天为止没有找到解。

  

   尽管没有找到解,但是努力依然没有放弃。到现在,大概全世界还有40多个项目在做着通用人工智能,都在进行中。美国2019年的人工智能战略里面,六项任务中的第四项依然是要找通用人工智能究竟怎么实现。所以还有40多个项目在今天依然活跃在通用人工智能领域,但是十分遗憾的是,所有的这些项目到今天为止,连他们自己在内都不可能认为他已经找到了走向通用人工智能的路。只是说他们在努力,没有放弃。

  

   原因就在于我们所有的通用人工智能的努力,都没有真正把人的智能究竟是怎么回事儿弄清楚。维基百科的定义很清楚,通用人工智能就是一个机器系统,能够完成一个人所有的智能行为,能够成功地完成所有的智能行为。这个定义告诉我们要追求的目标本身就应该是如何理解人的智能,然后才说通用人工智能怎么做。人的智能是怎么回事儿?我们确实自己不了解自己。我始终说,我们最不了解的是自己,知己知彼百战不殆,其实最难的不是知彼而是知己。几乎所有的失败,找找原因几乎都是自己是主要原因。

  

   怎么理解人类智能呢?要有很多维度。第一个是多样性,这是教育学和心理学的研究成果。人的智能是有多种类型的,代表人物是加德纳,《多元智力理论》,有中译本,你们可以看一看。他根据智力与大脑的关系及在人类知识和实践体系中的不同部分将智力分为9类:语言、音乐、逻辑和数学、空间、体能、人际、内省、自然、存在。这本书第一版提出来了七个,到第二版再版时在前言里面加了第八个。他在20年后的一篇论文中加了0.5个,存在。他自己都没有确定这个存在究竟算不算,所以这是多样性。智力和智能是同一个英文字,只是在不同的语境下翻译成智能或者智力,但英文词是统一的,所以我们说人的智力是不同类型。为什么心理学和教育学要研究它呢?说明我们人的不同类型的智能或者智力它是有不同方式的。所以今天始终以为智能就是逻辑和数学,这确实是我们认识人工智能到今天最大的困难。以为数学和逻辑是智能,其他的都是在数学和逻辑之上建立起来的,其实不是。

  

   想想我这一辈子走过来,数学什么时候用的最多?小学、中学、大学。大学之后走向工作单位,数学用的越来越少,几乎不用。到超市去买东西,你不算帐,你现在可以自己结账,扫一下就OK了,所以不计算。即使在人的智能任务中,数学计算的任务是很少很少的,而且人的计算能力是极其弱的。我们很多人两位数的加减法都想用笔算,都想用计算器,所以说明我们的计算能力有多弱,更不用说算法了。想什么呢?你怎么可能做得到?

  

   第二个发展性,人的智能是逐步发展起来的,不是一开始就十分完善。所以这是我们的心理学,特别是发展心理学研究的成果。皮亚杰是著名代表人物,所以从胎儿开始,受精卵第三周开始就开始智力发育,一直到成为社会的独立主体,我们才开始行使我们的能力、责任。

  

   第三个结构性,这个结构有时空两个概念。发展心理学就是一个人在你的一生中,不同的时期对不同的智能敏感,这是发展心理学的主要成果。其实还得看时间,我们的智能是一代一代传下来的,而不是一个时间平面。就是你的一辈子不是你的一辈子,而是说一代一代传下来的,同时它的空间结构是所有的智力,它在人的所有的认知功能体系的结构中是稳定的,从感知到传输到脑的记忆和使用,它都是固定的结构。这个固定的结构是生下来就有的,结构之间的关系,结构之间哪个先启动哪个后启动都是生下来就已经定了。

  

   再就是遗传和生命。正因为它有时空结构,所以遗传和生命是人的智能的重要构成部分,没有遗传、没有生命、没有智能。遗传是从什么时候开始的?不是你父母的过程遗传了你,而是你遗传了从人类生命的第一个生命开始,所有的基因都在这个遗传过程中。所以我们才说人的基因原来和一条小虫子、一个细菌、一头猪、一个猴子的有如此多的基因相象性。当然这还不够,为什么还不够?因为我们今天所谓的人类的基因组的研究只是解释了在一个人生命过程中使用的2%的基因,还有98%所谓的暗基因或者不活动基因还没有研究。如果再把这98%没研究的基因放进去,就知道几乎40亿年来进化的都在基因中成长。所以遗传和生命是理解人类智能的重要内容。

  

   这一点是我们计算机界最大的错误。计算机界以为信息是符号,所以机器学习、深度神经网络努力想尽一切办法把符号变成含义。其实这是跟人的智能相比,这是错得离谱。因为人从一开始感知信息开始就是含义的,不是符号的。所以不管是很多听到、眼睛看到、鼻子闻到这些感觉到,所有的从一开始都是通过特定的细胞结构来确定是什么东西,然后经过一个结构化的整合和传输过程到大脑里面,所以你感觉到痛就是痛、冷就是冷、热就是热,看到的这个光就是这个光,这个东西就是这个东西,没有计算过程,没有任何计算过程。这是我们的神经系统。所以人所有的信息都是含义的,绝不是符号的。符号是在人生活和发展过程当中为了交流所以才有了语言有了符号,有了符号大家相互之间都是知道的,大家知道这个东西是什么含义,但是这中间进行记录以后,但是别人不知道,所以就有了重新认知的过程,然后我们的计算机学家以为信息是符号,其实错了,信息它的根本是含义而不是符号。

  

   我们把一代一代的知识通过学习过程来积累到今天的大脑里面。所以往前推一千年、三千年,你得到的知识和能力是不一样的。同时他是从胎教开始,一直到我们工作过程都是持续的交互过程。

  

   同时我们再把这样的东西合起来看到,人的智能一个重要的特征就是主体性(意识、自我、存在、生命),没有存在、没有生存,哪有智能。没有自我保护,智能就玩完了。生物进化的第一要义是生存、自我保护。在这样的过程中,我们才有了意识、自我。自我和意识不是人独有的,是生物在长期进化过程中逐渐逐渐进化过来的。同时是整体的,人的行为要实现从感知到传导过程到记忆到使用到行为,动用了人的生物体各种功能系统,缺任何一个功能系统都是不行的,所以独立的通用人工智能要从里面切出一块那是不可能的。正是因为是通用人工智能,你能够承担人的智能任务,所以承担着社会的角色和责任。

  

   把这些东西合在一起,不同的智力和他的形成和发展的特征放在一起,才是人的智能的整体的视图。这样的整体视图我们怎么样来实现它?我们要实现它首先得回答四个问题:第一个问题,定义清楚你要做的是什么?所以AlphaGo不是通用人工智能,因为它从来没有说我要做通用人工智能。沃森也不是通用人工智能,他从来没有说过他要做通用人工智能。所以首先要定义清楚你究竟要做什么;第二个问题,定义完以后能实现吗?第三个问题,能使实现的话,给出一条路径来;最后一个问题特别重要,真能做到了,你做不做?该不该做?这就是今天我们人工智能威胁论的主要需要回答的问题。

  

   为什么我的第三本书原计划这个月要封稿的,但是到今天没有完成。是我写的过程中越来越忐忑。这本书到底该不该写,该不该出?这是我今天最主要的纠结。我定义的是非生物智能体,在《智能原理》这本书里明确定义了,这个东西就是非生物智能体。有自我和意识,能够拥有、调用、控制、维系其生存和发展的所有逻辑、物理资源。所以计算资源不是别人的,这个动力不属于别人的,是自己管理和控制的,所以才能成为社会主体。能够完成社会交给他的任务,履行社会职责,同时跟人一样,从一开始处理的是含义而不处理符号。符号只是他处理不了的时候临时放在那的,但是只要进到智能体内部一定是含义,不是符号。

  

怎么做呢?这个路径就来回答怎么做。这个“做”大体上要满足一个独立的社会的跟人一样的智能体得有相应的功能和约束。所以首先一个原则,他和人一样,有相应的功能。而这个功能是由一个一个功能体系来实现的,同时他要担当社会角色,承担社会责任。在这里面一个重要的事情是人的智能40多亿年,不要以为我们可以把最早的原始生命体的基因去掉,去掉以后对不起,人就是残缺的。所以从40多亿年第一个生命体开始,他所有的故事都是我们今天智能的重要的构成部分。这几百年构成了我们今天在人类社会行为的主要的知识体系,但是不要忘了,没有前面的就没有后面的。但是怎么办呢?我们这个智能体不能有多少年,不可能的,必须要比较短的实现它,所以我们用空间换时间。我们用多少亿的并发来实现时间的年代的迭代,所以这是一个最基本的原则。我们用大规模并行自我生长,一个一个独立的很小的,既有独立的智能功能的小的东西在一个总的架构下持续的生长,(点击此处阅读下一页)

    进入专题: 人工智能  

本文责编:limei
发信站:爱思想(http://www.aisixiang.com),栏目:天益笔会 > 科学精神 > 科学演讲
本文链接:http://www.aisixiang.com/data/117788.html
文章来源:CIO时代学院

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2019 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号 京公网安备11010602120014号.
易康网