张耀铭:数字人文的价值与悖论

选择字号:   本文共阅读 421 次 更新时间:2019-10-18 20:55:43

进入专题:   数字人文   人文学科   学术期刊    

张耀铭  

  

   [提  要]数字人文的概念和诠释林林总总,并未形成统一的共识。在数字技术与传统人文学科跨界、融合研究的过程中,学术团体、学术会议和学术期刊构成了组合性的学术共同体,并推动了数字人文的兴起与发展。数字人文应用于传统人文学科研究的价值,主要体现在四个方面:一是从文献检索数据库到量化分析数据库的飞跃;二是从地图到地理信息系统和空间分析的飞跃;三是从数据化到文本挖掘研究的飞跃;四是从文本到图形图像可视化的飞跃。但数字人文应用于人文学科研究,也存在一些悖论:一是数字人文研究的大多数项目还没有产生全新的叙述,更没有出现震动学界的成果;二是某些数字人文倡导者推崇数据中心论,从而使人文研究失去人文意义,削弱甚至消解了研究者的主体性;三是在“一切皆可量化”的理想与数据获取现实之间存在较大差距。我们在享受数字人文带来的各种便利时,也要避免成为“计算”和“数字”的附庸。

  

   [关键词] 数字人文  人文学科  学术期刊  价值  悖论

  

   近年来,数字人文已经成为学界、业界的热点,俨然有显学之势。2011年武汉大学数字人文研究中心成立,是中国大陆首个数字人文研究中心。此后,中国人民大学信息资源管理学院成立数字人文技术实验室,北京大学成立数字人文建设与发展研究课题组,曲阜师范大学成立数字人文研究中心;南京大学更是双管齐下,历史学院成立数字人文研究中心,人文社会科学高级研究院成立数字人文创研中心。随着研究机构的成立,各种学术会议相继召开,如北京大学主办的三届数字人文论坛,主题分别是“跨界与融合:全球视野下的数字人文”、“互动与共生:数字人文与史学研究”、“孵化与实践:需求驱动下的数字人文项目”;南京大学主办的“数字人文:大数据时代学术前沿与探索”、“比较视野中的数字人文反思”;全国高等学校文科学报研究会主办、《河南大学学报》编辑部与河南大学文学院承办的“数字人文时代的文学研究”学术研讨会等等,畅抒己见,热烈争鸣,令人目不暇接。本文将围绕数字人文的发展源流、学术期刊在数字人文兴起中发挥的重要作用、数字人文应用于传统人文学科研究的价值与悖论,谈点不成熟的意见,求教于方家。


一、“数字人文”概念及其发展源流


   我们正进入一个由数字技术和互联网造就的万物皆媒的全新时代,各种新兴突破性技术集中出现,正以日新月异的惊人速度和不可限量的变革潜能在不断推出其最新形态。各行各业都在发生重大转变:旧的商业模式被颠覆,新的商业模式在出现;教育、金融和交通体系被重塑,生产方式与生活方式被刷新;技术革命与知识更迭的周期不断缩短,新的学术方法和理论取代旧的学术方法和理论也将成为常态。

  

   (一)“数字人文”的概念形成

  

   数字人文(Digital Humanities,简称DH)这一术语,20世纪末美国弗吉尼亚大学人文科学高级研究所等机构就已经开始使用。2000年,斯坦福大学英文系教授弗兰克·莫雷蒂(Franco Moretti)在后来成为经典的《世界文学的猜想》中提出一项研究“世界文学”的方法,就是远离“细读”传统,发展出一种新的“远读”模式,通过量化的方法,对庞大的文本体系中的类别因素和形式元素作出解释。“远读”概念的提出,预言了以计算机和“文本”结合来考察文学体系的做法。这被认为是“数字人文”文学研究在21世纪发生发展的一个转折点。莫雷蒂也由此被认为是数字人文的代表性人物。大约在2001年,英国布莱克威尔出版社编辑安德鲁·麦克内利约请弗吉尼亚大学英文系教授兼大学图书馆主任约翰·安斯沃思与苏珊·施赖布曼和雷蒙德·西门斯三位领域巨擘讨论出版物《人文计算年鉴》的更名问题。雷蒙德·西门斯主张用当时比较流行的术语《人文学计算指南》作为书名;布莱克威尔出版社的编辑与销售人员从市场营销角度出发,提出一个更吸引读者眼球的书名《数字化的人文研究指南》;约翰·安斯沃思反对书名出现“简单的数字化”,建议使用《数字人文指南》。各方坚持己见,难以统一,更名的事情因此被搁置。不过“数字人文”这个新生事物,却得到众多学术会议、学术期刊和社会人士的支持。2001年,美国加州大学洛杉矶分校信息研究学院教授约翰娜·德鲁克在ACH/ALLC会议上做主题发言,标题即为《现状核实:数字人文项目与前景》。从2002年开始,“数字人文”概念的使用得到了大幅度的提升。

  

   关于“数字人文”的概念和诠释林林总总,并未形成统一的共识。梳理目前的文献资料,大体上有四种不同的代表性观点。第一,把“数字人文”理解为一种实践。约翰·安斯沃思教授定义为“一种代表性的实践,一种模拟方式,一种推理,一种实践本体核心的思路。这种代表性的实践可分为两个方面,一方面是高效的计算,另一方面是人文与科技的沟通”。第二,把“数字人文”看作一种研究方法。“它是人文学科研究方法的补充,这一方法基于对计算机和互联网的运用,是一种更广阔意义上的‘计算’。对提出的问题采用不同的研究方法并研究一些目前尚未解决的问题,这构成了‘数字人文’。”第三,把“数字人文”视为一个研究领域。数字人文不仅发展迅捷,而且更具扩张性。它除了历史学、文学、社会学、语言学、考古与艺术学之外,有时也包括“平台研究”、“软件研究”、“媒介研究”,以及像文本编码、数据挖掘和数据分析等新领域。第四,把“数字人文”看成为一门学科。英国剑桥大学教授凯特·巴雷特在《从小册子到像素:转变中的人文学科》一文中提出了“数字人文学科”概念,是指用电子技术来处理和分析传统人文学科研究资料,并结合人文研究方法论和电子工具创建电子历史文本的人文研究。特别有趣的是巴雷特还定义了“数字人文学者”的形象:他们不仅能在计算机实验室中操作数据库和编程软件,而且能够跨越狭义人文学科定义、进入与电子技术结合的广阔人文学科研究平台。欧美许多大学已经将“数字人文学科”纳入正式教育体系,涉及语言学与语言研究、计算机科学、文学和语言研究、历史、图书馆学与信息科学、人类语言技术等学科,开设“数字文化”、“数字人文”、“大数据与社会化、文化”、“数字内容管理”、“数字人文研究”、“数字资产媒介管理”等系列课程,包括了本科、硕士、博士的整个阶段。

  

   (二)“数字人文”的发展源流

  

   “数字人文”概念的提出,其实才有十几年的时间。但要追根溯源到“人文计算”,已经有70年的历史。人文计算是通过引进计算机、统计学等技术与方法对传统人文学科(例如历史学、哲学、语言学、文学、艺术、考古学、音乐等)的问题进行辅助性研究的一种实践。英国伦敦艺术大学教授苏珊·霍基在《人文计算的历史》一文中,对“人文计算”的历史进行了整体性梳理,将其分为“起始”、“联合”、“新发展”和“成熟”四个阶段。

  

   1. “人文计算”的起始阶段(1949~1970年代)

  

   “人文计算”(Humanities Computing),可以追溯到意大利耶稣会罗伯托·布萨(Roberto Busa)神父与IBM合作,用穿孔卡和磁带存储的计算机,辅助编制意大利著名神学家、哲学家托马斯·阿奎那及相关作者作品中1,100万中世纪拉丁文词汇的索引。工作从1949年开始,先后在意大利米兰、皮萨、威尼斯和美国的科罗拉多州博尔德等地进行,团队最多时达66人。经过近30年的不懈工作,至1980年编成了56卷百科全书式的《托马斯著作索引:圣托马斯·阿奎那全集索引和语词索引》,由德国斯图加特市弗罗曼—霍尔兹柏格出版社印行。2005年,已经92岁高龄的布萨与意大利“托马斯·阿奎那基金会”合作,把托马斯著作索引数据库推上万维网,使其内容更翔实,检索更方便。布萨的贡献主要体现在三个方面:一是运用计算机将文本转化为数据的方法,具有革命性的开拓作用;二是把索引条目词目化,从而推动了词目化软件的开发,使词典编纂从中受益;三是对托马斯著作的文献数据处理程序,经过必要的技术改进,“也会适用于法律、化学、医学、工程技术等方面的文献分析和信息检索”。布萨由此成为把计算机应用于人文科学的先驱者和“人文计算”的奠基人。

  

   2. “人文计算”的联合阶段(1970年代~1980年代中期)

  

   这个阶段,学者思想开放,学术会议增多,学术交流活跃。英国开启的“双年系列会议”成为人文学科计算的重要焦点,北美启动的“人文学科计算国际研讨会”系列会议影响提升。在此基础上,“文学与语言学计算学会”(ALLC)在英国成立,“计算机与人文学科学会”(ACH)在北美成立。这个阶段的“联合”,主要体现在两个方面:一是学术会议促进了学术共同体的建构,学术共同体反过来又推动了学者群体的聚合、学术期刊的创办和学术论文的生产。二是人文学者和计算机技术人员之间有了联合,从而开发出了牛津语汇索引程序(OCP)和希腊语库(TLG)为代表的一系列软件程序,大大减少了人文项目在程序设计方面的费用,并促进了学科之间的交叉融合。

  

   3. “人文计算”的新发展阶段(1980年代中期~1990年代早期)

  

   这个阶段发生的三个事件与人文计算的发展有着密切的关系,值得一提。(1)个人计算机的出现。计算机最早应用在二次世界大战中的军事领域,1950年代计算机应用在大学里快速增长,1960年代计算机支撑的研究方法在社会科学领域得到应用,1970年代随着数据库管理系统、网络管理系统的出现,应用领域从科学计算、事务管理逐步走向人文研究领域。1981年8月12日,IBM公司正式推出了全球第一台个人计算机——IBM PC,它首创了“个人计算机”的概念,并为PC制订了全球通用的工业标准。这一具有划时代意义的发明,从此掀开了个人计算机普及的序幕。随着越来越多的纸本图书与期刊被数字化,并从图像扫描转换为文本字符,也促使更多学者依靠快速进步的计算机语义识别技术处理更大量的文本数据。(2)电子邮件的流行。虽然电子邮件是在1970年代发明的,但却是在1980年代才得以流行。随着个人计算机的兴起,电子邮件开始在学者以及大学生中广泛传播开来。当时的大多数网络运营商提供了跨国收发电子邮件的服务设施,并创建了邮件自动回应程序软件。特别是1987年邮寄清单Humanist的创建,为人文计算领域学术共同体提供了一个定期保持联系和学术交流的社区平台,其意义非同小可。(3)文本编码倡议(TEI)的贡献。TEI起源于“文本编码创始项目”,用大约400个编码标记了一个结构,可以轻而易举地向新的应用领域进行扩展。该结构由两部分构成:一是各种类型文献的标识,二是此文献的书目信息(元数据部分)。1994年5月,TEI以纸媒形式和电子版形式发布《电子文本编码和交换指南》。这被认为是“历史上第一次系统化地对所有人文学科文本进行分类和定义”。

  

4. “人文计算”的成熟阶段(1990年代早期~2003年) (点击此处阅读下一页)

    进入专题:   数字人文   人文学科   学术期刊    

本文责编:limei
发信站:爱思想(http://www.aisixiang.com),栏目:天益综合 > 学界动态
本文链接:http://www.aisixiang.com/data/118616.html
文章来源:《澳门理工学报》(人文社会科学版)2019年第4期

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2019 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号 京公网安备11010602120014号.
易康网