王兆鹏:谈文学排行榜的评价指标与权重设置

——以唐诗宋词为中心
选择字号:   本文共阅读 198 次 更新时间:2016-05-31 22:53:51

进入专题: 文学排行榜   文学定量研究  

王兆鹏 (进入专栏)  

   【内容提要】 文学排行榜,是以计量分析方法为手段来观察和分析作家作品影响力的一种特殊研究方法。排行榜是以数据为基础,数据指标的完备与否就成为排行榜的结果是否科学和有公信力的前提条件。指标设置越多,越趋向科学、合理。文学作品影响力的评价指标,可从作品的典范性、美誉度和传阅度等层面来选择确定。所选数据既要考虑其量差,也要考虑其质差。作家影响力的评价指标除典范性、美誉度和传阅度外,还要加上名篇贡献率。文学排行榜评价指标的权重设置,最理想的状态是客观赋权法和主观赋权法相结合。

   【关 键 词】文学排行榜/文学定量研究/评价指标/权重/唐诗/宋词

  

   一、排行榜是一种特殊的研究方法

   我们相继推出《唐诗排行榜》和《宋词排行榜》之后,引起了比较广泛的反响和争议。无论是肯定还是否定,是鼓励还是指责,是学理性的批评还是情绪性的意见,都表明读者对唐诗宋词的热烈关注,也表明文学排行榜这种形式,自有其学术意义和方法论价值。我们在这里要讨论的,不是排行榜有没有必要做的问题,而是如何改进,如何做得更科学、更完善的问题。通过讨论,我们希望把文学的定量研究提升到规范化、标准化、科学化的学术层级。

   文学排行榜,是以计量分析方法为手段来观察和分析作家作品影响力的一种特殊研究方法。对于学者来说,做文学排行榜,不是一种娱乐方式,而是探求一种科学的研究方法。因为研究文学的影响力,是文学研究的一个重要组成部分,文学研究必须对不同作家作品的影响力作出定位和评价。过去我们习惯用定性分析的方法,凭主观的印象去描述和区分哪些作家影响力“很大”,哪些作家影响力“较大”,哪些作家“有一定的”影响。当文学研究发展到成熟阶段时,我们已不能满足于那种标签式的定性描述。面对文学史著作告诉我们的哪些作家作品影响力“很大”,哪些作家作品影响力“较大”,哪些作家作品的影响力“一般”或“较小”时,我们不禁要追问:这些比较和定位,究竟有多少数据作依据?没有数据的支撑,凭什么对作家作品影响力的大小高低进行定位和比较?怎样衡量作家作品的影响力是“很大”还是“较大”还是“较小”?“很大”与“较大”“较小”之间究竟是一种什么样的数量关系?一般读者,了解哪些作家作品影响较大,哪些作家作品影响较小,就可以了,但文学研究的学者和专家,必须在学理上弄清楚:究竟多大的影响力才算“很大”,多大的影响力才算“较大”或“较小”,作家作品的影响力怎样来计量衡量。

   单项量化数据的影响力排行,比较容易操作,如一本书或一个唱片的发行销售量排行等,不需要数理统计的转换分析,直观而简单,我们所要讨论的是综合影响力的排行榜。

   在电视市场研究中,目前全国各主要电视台对自己的各频道栏目的考核,采取的就是这种综合排行榜的方式,实行综合积分排队,排在最后的实行末位淘汰。各栏目由于节目类型不同、播出时段不同、所在频道不同、频道的覆盖率不同、观众的构成不同,相互之间不能直接比较。比如老年人喜欢的京剧节目在白天播出,不可能与晚上黄金时间播出的大众综艺节目的收视率相比。所以要进行权重修正,然后进行排队。观众看不看电视,看哪个频道的什么节目,是一种主观的选择和感受。读者读不读文学作品,读什么样的文学作品,读哪位作家的哪篇作品,也是主观的选择和感受。不同的电视节目之间可以进行量化的收视率综合排行,不同的作家作品之间当然也可以进行量化的传播影响综合排行。

   在社会学领域,综合排行榜方法也很常见。国家(城市)综合实力排行榜、大学排行榜就是人所熟知的例子。无论一个国家,还是一座城市,其综合实力都是由一大堆指数构成,如国内生产总值、人均GDP、非农业人口比重、人均工资、教育支出、每百万人医院和图书馆数量,等等,最后转换成统一可比的得分,变成排行榜数据。目前流行的城市幸福指数排行也是如此。

   我们认为,排行榜是一种优化处理,是将复杂的现象简单化的认识方式。传统学术是以主观感觉判断为基础,强调学者的心性颖悟、个人积累,常常缺乏规范统一的评价尺度。现代学术依托科学的发展,尤其是计算机和统计学的介入,不断走向理性、规范、科学、严谨。就像传统的中医正在不断走出主观感觉,不断走向科学严谨一样。如何将这种优化处理的研究做到科学化、标准化,是当代学者的责任。

  

   二、排行榜的指标选择

   排行榜是以数据为基础,数据指标的完备与否就成为排行榜的结果是否科学有公信力的前提。指标设置越多,越趋向科学、合理。问题是,文学作品的许多指标无法量化统计,有些能够量化统计的,又无法取得完整的数据。能够取得完整数据的指标,其价值和置信度也不同。比如我们要谈论一个诗人的影响力,我们就渴望知道:他有多少作品传世,作品有多少版本,历代刻印发行量多大,码洋多少,多少人学习、模仿、谈论过、选过他的作品,海外知名度如何,石刻作品多少次,多少地方有他的遗迹和纪念地,美誉度或恶评如何,画像有多少,有关他的文物拍卖价多高……总之,这些指标越多越详细越好。可惜,它们大部分无法取得准确的统计数据。

   我们在做《唐诗排行榜》时,考虑过要统计每一首诗对后世诗人创作的影响,但数据采集相当困难。比如,我们可以知道后世哪些人学过杜甫,但我们无法判断后世诗人哪首诗是学杜甫或学杜甫的哪首诗。举几个例子可以做到,但要作为数据源来统计,就很难进行。做《宋词排行榜》时,为了统计每首宋词对后世词人的影响,我们采集了后世词人追和宋词的情况,但这也只是后世词人学习仿效宋词的一个方面,创作方法和创作精神上的仿效暂时还没有好的办法采集数据来统计。作家作品对他人和后世的影响,有些是表层字句或用韵方式的模仿或化用,有些则是精神层面的借鉴与仿效①。前者的影响是显性的,后者的影响是隐性的。有时隐性的影响比显性的影响更重要。然而,显性的数据尚难采集,隐性的数据就更难集中采样了。随着数字化技术的发展,计算机的智能识别可在一定程度上解决这个问题。现在的数字化技术,可以进行语义分析和诗句的相似度分析。比如,只要数据库中有《全宋词》和《全唐诗》,计算机就可以自动分析任意一句宋词的遣词用字与唐诗的哪一句相似或相同。随着这种语义分析技术的进一步发展,文学创作中“互文性”(一部作品与其他作品之间的显性或隐性的关系)的分析与数据统计有望成为现实。但在现阶段,还没有多少现成的成果可以利用。早些年,我们对宋代词人的影响力进行排行,采用了存词名次、版本名次、品评名次、研究名次、历代词选名次、当代词选名次等六种指标;而《宋词排行榜》对词作的排行,采用了词选、互联网页、评点、研究论文和唱和等五种指标。这虽然是一种谨慎的做法,但绝对不是一种完善的做法。这些指标,都是显性的,而且是不完全的(有些可用的显性数据尚未采集),隐性的数据根本就没有顾及到。

   对比“国家综合实力排行榜”、“城市综合竞争实力排行榜”的数十个指标,我们的唐诗宋词排行榜只用三、五个指标,当然太少,难以让人信服。努力寻找新的排行指标,增加指标的丰富度,借以提高可信度,将是改进文学影响力评价指标体系的主要途径。理想的情况应该找到十种以上的排行数据源,然后进行数据处理。我们目前能考虑到的作品影响力的评价指标,大约可分三类:作品的典范性、美誉度和传阅度。

   一、典范性。典范性是就作品对他人创作的影响而言。一部作品的艺术性再高、开创性再大,如果没有人仿效,其典范性就无从确立。因此,典范性必须依存于他人的作品中。作品典范性的测度,有两个层面可以考虑:

   显性层面:如语句的借用(含集句)、化用、追和、模拟、改作(编)等。如五代翁宏《春残》诗的“落花人独立,微雨燕双飞”,被宋人晏几道一字不改地借用到他的《临江仙》词而成为名句。又如五代卢延让《松寺》的“两三条电欲为雨,七八个星犹在天”,被辛弃疾的《西江月•夜行黄沙道中》化用为“七八个星天外,两三点雨山前”。台湾王伟勇教授有《宋词与唐诗之对应研究》②一书,专门考察宋人词句化用唐人诗句的情况,可以取资作为数据源来统计。只是其书还不全,仅以几位词人为例,而不是全面考察宋词化用唐诗的情况。这种借用、化用、集句的情况,今后可以利用计算机来自动分析和统计。至于宋词化用唐五代词或宋词化用宋词之例,更是举不胜举。如李煜的“一江春水向东流”名句,被欧阳修《踏莎行》化用为“离愁渐远渐无穷,迢迢不断如春水”,被秦观的《满庭芳》化用为“便做春江都是泪,流不尽,许多愁”等。至于风格句式的模拟,如李白的《登金陵凤凰台》“凤凰台上凤凰游,凤去台空江自流。吴宫花草埋幽径,晋代衣冠成古丘。三山半落青天外,二水中分白鹭洲。总为浮云能蔽日,长安不见使人愁”以及《鹦鹉洲》“鹦鹉来过吴江水,江上洲传鹦鹉名。鹦鹉西飞陇山去,芳洲之树何青青。烟开兰叶香风暖,岸夹桃花锦浪生。迁客此时徒极目,长洲孤月向谁明”这两首诗,都有模仿崔颢《黄鹤楼》诗的痕迹,无论李白是有意比拼,还是一种无意识的效法模仿,后者对前者的影响是明显的,而且有本事记载可以证明。宋词中有不少作品在题序中直接交代是“效”某人或某作之“体”,如苏辙《调啸词•效韦苏州》,郭祥正《醉翁操•效东坡》,李吕《醉落魄•效山谷道人“陶陶兀兀”之句,法其体,作此以遣兴云》,辛弃疾《丑奴儿•博山道中效李易安体》、《蓦山溪•赵昌父赋一丘一壑,格律高古,因效其体》、《归朝欢•效介庵体为赋,且以菖蒲绿名之。丙辰岁三月三日也》、《玉楼春•效白乐天体》,吴儆《蓦山溪•效樵歌体》,侯寘《眼儿媚•效易安体》,刘学箕《贺新郎•用辛稼轩金缕词韵述怀。此词盖鹭鸶林寄陈同甫者,韵险甚。稼轩自和凡三篇,语意俱到。捧心效颦,辄不自揆,同志毋以其迂而废其言》,蒋捷《水龙吟•效稼轩体招落梅之魂》,仇远《合欢带•效柳体》,刘将孙《南乡子•重阳效东坡作》,吕南公《调笑令•效韦苏州作》等。这些都是可以观察、分析得出的显性数据,应该作为指标进入评价体系。我们可以考虑给每首作品建立借用与被借用、化用与被化用、追和与被追和、模拟与被模拟的档案库,作为数据源备用和统计。

   一首诗词作品的影响力或互文性,不仅体现在同类体裁的诗词作品中,也体现在其他体裁的文学作品中。文赋、小说、戏曲等作品,也会化用或引用诗词中的名句或成句。如元曲就经常化用宋词中的名句和语句。人们熟知的范仲淹《苏幕遮》的“碧云天,黄叶地。秋色连波,波上寒烟翠”,被王实甫的《西厢记》[正宫][端正好]点化为:“碧云天,黄花地,西风紧,北雁南飞。晓来谁染霜林醉?总是离人泪。”王维《送元二使安西》中的“劝君更尽一杯酒,西出阳关无故人”,常被明清时期的通俗小说所引用。凡写及友人送别,总是说“正是‘劝君更尽一杯酒,西出阳关无故人’”。“劝君更尽一杯酒,西出阳关无故人”,成为后世小说乃至日常生活中送别的流行话头。这类现象,也应该作为数据源来采集统计。

   除了文学作品的效仿和化用之外,还有日常生活语言和书面语言的引用。有些诗词名句,已进入到人们的日常生活语言之中,如“欲穷千里目,更上一层楼”、“每逢佳节倍思亲”、“谁言寸草心,报得三春晖”、“衣带渐宽终不悔”等诗词名句,已经成为熟语或引用语,常常为人所引用。诗词名句被非文学作品引用的情况,也可以作为一个指标纳入统计范围。这种被引用的情况,可以借助语言学的语料库来检索和抽样统计。

隐性层面:如创作方法的借鉴、审美范式的遵从、题材表现的启示等。上述“效某人某作之体”,有的就是属于创作方法的借鉴和效法,(点击此处阅读下一页)

进入 王兆鹏 的专栏     进入专题: 文学排行榜   文学定量研究  

本文责编:陈冬冬
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 语言学和文学 > 中国古代文学
本文链接:http://www.aisixiang.com/data/99920.html
文章来源:《社会科学》(沪)2013年2期第164~171页

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2018 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号 京公网安备11010602120014号.
易康网