朱剑：科研体制与学术评价之关系

在2014年11月7日《中国社会科学报》一篇题为《学术成果问题根源于“评价体系”》的报道中，记者以“调查结果让人吃惊——”为引语，披露了其“对北京、上海、广东、湖北、山东、陕西、青海、甘肃、江苏、吉林等地100余位学者展开‘学术成果问题反思大调查’”的结果：

71％的学者认为，目前我国哲学社会科学领域学术成果“存在多种不良现象”；

50.4％的学者认为，当前学术成果存在的主要问题是“数量与质量不成正比”；

48.7％的学者认为，“不合理的学术评价体系是当前学术成果问题存在的根源”。

而所回收的101份有效问卷显示，仅有3％的学者认为“不存在问题”。①

记者不禁设问：“哲学社会科学领域学术成果究竟怎么了?”其实，这个问题早已萦绕于管理者和学者的头脑中。虽然报道中记者没有详细介绍调查取样的经过，我们无从知道调查对象的选择与确定、调查结果的统计与分析是否符合学术调查的规范，但是，这个调查至少再一次印证了：学术成果之“病”的严重与普遍已是多数学者的判断。那么，“病源”何在?该报道根据调查结果进一步指出：“‘不合理的学术评价体系’、‘社会大环境’、‘学者自身的学术道德问题’等，被认为是学术成果问题的根源所在。”

笔者有幸被记者选中，成为这“100余位学者”中的一员，接受了问卷调查，与大多数接受问卷调查者一样，笔者也认为我国哲学社会科学领域在取得丰硕成果的同时，还存在着多种不良现象，但在什么是“病源”的问题上，与多数意见有些差异。笔者以为：“评价也好，道德也罢，或笼统地归结为社会大环境，都只看到了问题的表象或某一侧面。当前学术成果存在的种种问题(根源)在于学术(科研)体制的不合理。”感谢记者，将这句话写进了报道，但因为这只是一次问卷调查，无法申述持这样观点的理由，所以，本文将对这一观点展开论述，不当之处，敬请方家指正。

一、“评价”是如何被指为“学术乱象”根源的?

《中国社会科学报》的上述报道，既不是第一次大概也不会是最后一次对哲学社会科学研究及其成果乱象的报道，来自学界和传媒的对科研或学术乱象的批评和报道早已屡见不鲜，只不过此前更多的是针对某具体个案或几个案例的报道和批评，而像上述报道那样在作了较多问卷调查后以数据的方式所呈现出的对宏观局面的批评尚不多见，②因而让记者感到“吃惊”。

之所以有那么多的学者判定“目前我国哲学社会科学领域学术成果‘存在多种不良现象’”，是因为不良现象或曰“学术乱象”的存在是非常明显的，“数量与质量不成正比”是一种道出了实情而又不失温和的表述，说得更直白的那就是学术泡沫泛滥，学术垃圾成堆，少数优秀成果都被淹没在了平庸“成果”的汪洋之中了。问题虽然表现在“成果领域”，但成果只是科研的结果，结果有问题，说明整个科研过程很可能都存在问题。事实也正是如此。科研过程中所表现出来的突出问题可以用“学风问题”来概括。大概从本世纪初开始，从政府到学界，越来越多的人加入到了谈论学风问题的队伍中来。为人们所共同谈论且痛心疾首的学风问题，集中表现在学术不端行为。教育部曾明确开列出“必须进行严肃处理”的下列学术不端行为：“(一)抄袭、剽窃、侵吞他人学术成果；(二)篡改他人学术成果；(三)伪造或者篡改数据、文献，捏造事实；(四)伪造注释；(五)未参加创作，在他人学术成果上署名；(六)未经他人许可，不当使用他人署名；(七)其他学术不端行为。”③当学风问题比较普遍地存在于学术界时，乱象丛生也就不足为怪了。

如此“乱象”的原因是什么?“‘不合理的学术评价体系’，‘社会大环境’，‘学者自身的学术道德问题’等”，其实早已“被学界指为学术成果问题的根源所在”，而且得到了行政权力部门的认同并出手予以整治。

笔者在2011年初的一篇文章中就曾回顾和评论了作为高校科研主管部门的教育部一系列整治学风问题的举措，这里不妨再简单地回顾一下。教育部于2002年2月和2005年1月，曾连续下发了《关于加强学术道德建设的若干意见》和《关于进一步加强和改进师德建设的意见》，阐述了“端正学术风气，加强学术道德建设的必要性和紧迫性”，明确提出了“端正学术风气，加强学术道德建设”的“总体要求和主要任务”以及“主要措施”。④此可谓试图从道德的层面来解决问题。2004年6月，教育部制定了《高等学校哲学社会科学研究学术规范(试行)》，从学术研究的基本规范到学术引文、学术成果、学术评价、学术批评等诸多方面都制定了含义明确的原则条文，⑤此可谓从道德规范到学术规范，再到评价规范的全面规范化治理。2006年5月，教育部决定成立“社会科学委员会学风建设委员会”，作为“全国高等学校哲学社会科学学术规范、学术道德、学术风气建设的指导机构和咨询机构”，⑥此可谓建立和健全学风管治机构之举。2009年3月，教育部又发出《关于严肃处理高等学校学术不端行为的通知》，列举了从警告到开除等行政处分乃至“移送司法机关处理”等具体措施。⑦此可谓进一步明确了严厉的惩治措施。与此同时，教育部官员还高调宣布要对学术不端行为“零容忍”、“一票否决”、“一查到底”。⑧短短数年时间，多项措施并举，无论声势还是力度都可以说是空前的。

在此前后，中国科学院、中国社会科学院也都有相似的文件或举措出台。比如，中国科学院于2007年2月发布了《中国科学院关于加强科研行为规范建设的意见》，中国社会科学院于2010年7月发布了《中国社会科学院关于处理学术不端行为的办法》，皆明确界定了哪些行为属于“学术不端行为”，指定或建立了“学术不端行为的受理机构”，并公布了学术不端行为的处理措施和程序。⑨作为学术成果主要发布平台的学术期刊界也积极行动起来，如2008年10月，五十家著名学术期刊“联手亮剑”，发表了被称为“武汉宣言”的《关于坚决抵制学术不端行为的联合声明》。⑩

以上这一系列主要出自政府管理部门的举措不可谓不有的放矢，也不可谓不声色俱厉，连“移送司法机关处理”这样的极端和最后的措施都已提出，但结果又如何呢?不能说这些严厉的举措全然无效，但学风问题显然没有得到根治，或者说，学界并不认为在这些举措之下学风问题已有明显改观，不然，也不会出现本文开头所引用的报道。

在这一系列比较泛化的举措都不甚奏效的情况下，学者们逐渐将学风问题的根源聚焦于不合理的学术评价体系，许多人都认为是学术评价体系导致了今天学术研究的乱象。这样的看法似乎不无道理，因为评价在当下整个学术活动中的地位和作用都十分突出，举凡个人或集体项目申报、评审、结项，教师和科研人员职称、绩效的评定，学科、高校和科研机构的排名，都离不开评价，一切的好与坏、优与劣、成与败都由评价说了算，评价已成为左右所有学术活动名副其实的“指挥棒”。试想，在如此强势的评价之下，如果评价本身出了问题，那整个学术活动岂不是都会偏离正确的轨道?而在许多学者看来，今天的学术评价确实出现了十分严重的问题。这方面的言论和文章不胜枚举，比较有代表性的是余三定教授的观点：“目前，学风浮躁、学术垃圾、学术造假等现象甚嚣尘上，原因何在?我认为，学术评价体系的错乱是一个重要原因。之所以要用‘错乱’一词来描述目前的学术评价体系，是因为它已经大大超出了正常，呈现病态。”他列举了评价体系“错乱”而产生的三种“病态”：“其一，过分量化，太重数量”；“其二，级别崇拜，太重‘衣裳’”；“其三，本末倒置，违拗常理”。(11)可见，在学术研究呈现出乱象的同时，评价的乱象更加令人触目惊心。在如此“错乱”的评价体系之面前，那些试图纠正学风问题的道德建设、规范建设等措施都显得苍白无力，不是对手，于是，评价体系的不合理才是学术乱象的根本原因成为多数人的共识。

可见，关于学术乱象，很多人都认为是由许多复杂的因素共同作用而形成的，但在诸如道德建设、学者自律、健全规范等措施都不怎么起作用的情况下，才逐渐地将学术乱象的根源归结为评价体系，或者寄希望于通过对评价乱象的整治来达到终结学术乱象的目的。比如，余三定教授开出的“药方”就是：“面对学术评价标准的错乱，我们该怎么办?我认为，必须下重药、猛药。我建议：应该淡化、弱化学术评价，让那些靠搞学术评价活动捞钱、发横财的机构和人士转行去做实实在在的学术研究工作，以改良学术风气，恢复学术生态平衡。在学术评价方面，学术管理部门出台的政策越少越好，设的‘法’越少越好，‘折腾’得越少越好。”(12)在此之前，他还曾提出过更重、更猛的“药方”：“最好是暂停五到十年学术评价，以改良学术土壤、学术风气，恢复学术的生态平衡。”(13)似乎只要把评价问题解决了，或者干脆停止学术评价，一切问题也就迎刃而解，学术研究也就可从“乱”到“治”了。在这里，余三定教授矛头直指“那些靠搞学术评价活动捞钱、发横财的机构和人士”，无疑，他看到了评价活动中的利益冲突和纠葛。其他对评价提出批评的学者，虽然言辞不如余三定教授那么激烈，但也都异口同声地将乱象之源归结为不合理的评价体系。

笔者也认为，不合理的评价体系的确存在，改革不合理的评价机制十分必要，但是，我们必须看到，改革不合理的评价机制的呼声发出了已不下十年，重建学术评价机制的尝试十多年来也一直没有中断，但问题何以越来越严重?笔者以为，一些十分重要的问题被忽视了，那就是，“评价乱象”是如何形成的?或者说评价之乱的源头到底在哪里?评价是如何变得如此强势的?强势的评价又是如何作用于学术研究的?学界为何没有能力制约不合理的评价反而被它牵着鼻子走?不弄清这些问题，只是一味地试图通过改进评价方法来实现科学合理的评价，乃是治标而不治本的措施，是不可能正本清源，从根本上解决问题的。

二、“评价乱象”是如何形成的?

学术评价的历史可以追溯到学术研究的起源，有了学术研究就有了学术评价，只是“在学术发展史上，当学术研究仅限于个人的兴趣或爱好时，对其评价主要体现在同行间的交流(赞扬、批评、引用等)之中，故表现为一种比较纯粹的学术活动”。(14)我们更多的是用“学术批评”来指称这样的学术评价。这样的学术评价即学术批评在学术发展中的作用是十分重要和不可或缺的，学术的每一个微小或重大的进步，都是在对前人或同时代人学术成果的继承、扬弃基础上的创新；继承和扬弃的过程，主要体现在学术批评，有了学术批评才有了学术创新。从这个意义上来说，没有学术批评也就不可能有学术进步，学术批评本身就是一种重要的学术研究。

可见，在历史上，学术评价有着两个显著特点：其一是学术评价与学术研究是不可分割的，学术评价从来都不是外在于学术研究的。换言之，学术评价是学术研究的一个重要组成部分，缺失了学术评价的学术研究是不完整的。其二是学术评价和学术研究的主体是同一的而不是分裂的，学术研究的主体当然是学者，而学术评价的主体同样是学者，且多为同行学者，也就是我们今天常说的学术共同体成员。

然而，如果学术评价与学术研究的主体发生分裂，学术评价的主体不再是学术共同体成员，且学术评价脱离了学术研究而相对独立地外在于学术研究时，会发生什么样的情况?显而易见的是，由于学术共同体这一评价主体的缺位，评价的可靠性就不可避免地会大打折扣。如果这样外在于学术研究的学术评价获得了凌驾于学术研究之上并可对其发号施令的权力，又会发生什么样的情况?答案只能是，只要是有组织的学术研究，就不得不听命于权力者所发之号所施之令。如果以上两种情况同时发生了，会是什么样的结果?恐怕就会出现我们不愿看到但却不得不面对的评价乱象了。

我们也许很难为目前的评价乱象确定一个起点时间，因为这是一个渐变的过程，但有一点是明确的，那就是学术评价与学术研究的分离与学术资源发生变化是直接相关的。大致说来，哲学社会科学领域评价乱象的形成和蔓延与国家对社科研究投入的不断增加基本是同步的。国家的经济、社会、文化发展离不开学术研究的支撑，改革开放以来，随着我国综合国力的增强，国家对学术研究的投入也在逐年增加，特别是1990年代以来，国家对学术研究除了基础性的投入不断增加以外，对重大的或国家急需的科研任务以及与国家战略相关的科研建设的投入也在急剧增加，而在这方面的巨额投入更多的是以项目和工程的形式体现的。国家对学术研究定向定点的巨额投入导致了学术研究与国家战略从来没有像今天这样紧密地结合在一起。因此，对于学术资源(项目和工程)的分配和管理遂成为科研体制的中心。基础性投入是常态化、制度化的，与高校或科研院所的规模、建制等因素有关，故而是相对稳定和确定的资源；与基础性投入不同，项目和工程则是典型的排他性和竞争性资源，且数额巨大，比如著名的“211工程”、“985工程”、“2011计划”和国家自然科学基金、国家社会科学基金项目以及各部委、各省市的各种基金项目等。对于这些巨额投入的受方来说，这就是资源，就是机遇。因而，项目和工程遂成为必须争夺的最重要的学术资源和必须抓住的最重要的发展机遇。时至今日，一些重点高校和科研院所通过竞争所获得的来自国家财政的经费投入年均可以数十亿计，甚至远远超出了这些高校和科研院所得到的来自国家财政的基础性科研经费的投入。(15)因此，获取各种项目特别是国家重大项目和工程已成为高校和科研院所的头等大事，与此相比，其他都显得不那么重要了，一切都可以为这个头等大事让路。

所有来自国家(从中央到地方各级政府)财政的对学术研究的投入(项目和工程)的分配权几乎无一例外地掌握在各级政府手中，而且，行政权力部门不仅负责立项以分配学术资源，还要负责所投放项目的日常管理和最终结项。由于所要分配的是竞争性资源，只有将资源分配给最有能力或最适合做这些项目和工程的科研单位或团队，才可能让资源发挥最大的效益，这就涉及如何从众多的竞争者(申报者)中间挑选最终承担者，这实际上是一个评价问题；又由于项目和工程完成周期是一个相对较长的时间(3年至5年甚至更长)，必须对项目和工程的进展顺利与否有所跟进和判断，这仍是一个评价问题；还由于项目和工程结束时，对其是否达到预期效果，必须有明确的判断，这还是一个评价问题。可见，只要学术资源以项目或工程的形式呈现，就离不开评价。

但要命的是，一般说来，行政权力部门的官员并不懂学术，他们对如何投放和管理学术资源必须有所依凭才能作出判断和决定。这个依凭就是学术评价——对学术机构(高校和科研院所)、学者学术能力及其学术成果(项目和工程)质量的评价。让评价直接为行政权力部门服务，这是出于科研体制的需要，也是学术评价不同于其历史上作用的一个新的功能。对学术评价的这一新的功能要求，实则意味着学术研究与学术评价的同一性因为行政权力部门需求的强势介入而开始被打破，由此带来了一系列前所未有的变化。

其一，学术评价的裂变。由于身份和目的的不同，行政权力部门与学界对学术评价的要求是不同的。前者可以不看过程，要的只是评价结果，且结果越简单越直观越好，因为只有简单直观的结果才便于分配和管理的操作。最简单直观且最“实用”的莫过于学术期刊排行榜和排名表。学术论文是学术成果的主要呈现形式，学术期刊则是学术论文的主要载体。对数量巨大、学科分属不同、其价值常常见仁见智的学术论文进行全面的学术评价、统一的价值判断是件十分困难的事，而通过对学术期刊进行分等分级，再依论文所发表的刊物等级来确定论文的质量，则可以让复杂的论文评价变得简单、直观、易行，并可直接作为分配和管理资源的重要依据，由此可见期刊排行榜和排名表对行政权力部门之重要意义，此亦即所谓“以刊评文”盛行的原因。对于学界来说，学术研究需要的不仅是评价的结果(结论)，而且更看重评价的过程，而对学术研究内容层面的具体评价(评论)才是最重要的，这样的评价只有学术共同体的成员才可能完成，无论是过程还是结论都注定是复杂而专业的，决非排行榜和排名表所能替代，没有专业知识和眼光的人也许连理解都做不到。因此，同一个评价，很难同时满足行政权力部门和学术研究的需要。于是，评价发生了第一层蜕变，评价就此分裂为两端：一种是主要甚至专为行政权力部门服务的评价；另一种是传承了学术批评，主要为更深入的学术研究服务的评价。今天所有对评价体系的批评和对评价乱象的指责，其实都只是针对前者。

其二，学术评价的工具化。“20世纪以来，我国学术界经历了西方现代各种学术思潮的冲击和影响，这其中科学主义对我国学术思想界的影响不可低估。有学者指出，今天在中国影响最大、最能体现启蒙心态的是科学主义，而不是科学精神。科学精神是求真，力求拓展知识的新领域；而科学主义则是一种工具理性，认为科学高于一切，使得人们常常套用自然科学的标准来评价人文社科研究的过程及成果。这种做法会扼杀人文社会科学的创新性”。(16)正是在这样的科学主义管理理念下，裂变后的学术评价发生了第二层蜕变：评价在成了资源分配的主要依据后，又成了科研管理的重要工具。作为管理工具的评价所需要的并非学术批评的科学精神，而是工具应有的良好的“操作性”，于是，期刊排行榜和排名表在很多时候也就成了管理者的首选，其结果是学术评价进一步与学术研究相分离。

其三，定性评价的混乱。从学术评价的本质属性来看，只有学术共同体才是理想的学术评价主体。所谓“学术共同体的评价”主要指的是“同行评议”，由于对本学科领域“胸有成竹”，学术共同体所采用的评价方法往往是对评价对象进行直接分析和判断，故有“定性评价”之称。但是，定性评价是有条件的，那就是评价(学术批评)须在学术共同体的范围内进行，以保证评价的专业性；评价者与被评价者具有同等的地位，被评价者具有反批评的权利，而所有的学术共同体成员都有资格参与评价活动，评价呈现出一种透明开放、反复进行、绵延不绝的过程，以保证评价的自律性。离开了这些条件，定性评价的公平、公正就无法得到保证。在评价发生裂变后，作为行政权力部门分配和管理学术资源的评价已不再具备这些必不可少的条件，学术评价实际上就是一场场学术竞赛(评比)，参与评价的专家充当了学术竞赛的裁判。裁判需要简单、明确、可操作的规则，不能跟着感觉走；裁判需要与运动员划清界线，不能既当裁判又当运动员；裁判还需要价值中立，不能有个人偏好，不能代表本人所在单位。而定性评价与这一切正好完全相反。因此，当以定性评价来决定资源分配时，遂出现了诚如李剑鸣教授所指出的现象：“这些起源于欧美、并且长期行之有效的东西，却在中国发生了变异，甚至是‘异化’。其中‘异化’最明显、危害最严重的，莫过于‘同行评议’。”“权力支配，人情主导，标准缺失……三者只要居其一，都会使学术评价的意义受到严重损害”，“在我们当前的学术评价中，往往是三者一起发生作用，多路夹击，来自欧美的同行评议，怎么可能不水土不服以致彻底变质呢?”(17)这样的评价还反过来影响到正常的学术批评，批评难免得罪人，也就难免在资源分配的定性评价(学术竞赛)中遭遇报复，传统的以学术批评为特征的评价就这样日渐式微了。事实上，为行政权力部门服务的评价已逐渐遮蔽甚至取代了评价的原有功能而上升为主要功能甚至唯一功能。在这里，评价发生了第三层蜕变：作为学术评价核心内容的学术批评日渐没落，作为学术共同体最突出特点的专业性和自律性已消失殆尽，深陷于学术利益泥淖的定性评价声名狼藉，一度几乎被逐出了评价领域。

其四，定量评价的走红。自1990年代初开始，随着评价对资源分配和管理介入的不断深入，定性评价因其主观评价的公正性开始受到越来越多的质疑而逐渐陷入了困境，以“科学”和“客观”的定量评价见长的专业评价机构应运而生并迅速蹿红。评价于是发生了第四层蜕变：完全外在于学术研究的专业评价机构的出现使学术研究与学术评价的同一性彻底终结。不断问世的专业评价机构都有着一些共同的特征：其一是几乎均由从事文献情报工作的人员组成，除了其本专业以外，不是任何学术共同体的成员；其二是在明里或暗里都以为政府服务或被政府认可为主要目的；其三是通过采集各种形式数据，以量化评价的“客观”、“公正”、“公平”相标榜；其四是其主打产品即对学术期刊进行分等分级(如所谓“顶级期刊”、“权威期刊”、“核心期刊”等)的排行榜和排名表。尽管专业评价机构的第一个特征就决定了它不可能是学术评价适格的主体，直接采信这样的机构的评价结论已完全违背了只有同行专家才是最合适的评价主体这一学术评价的基本原则，但后三个特征正是行政权力部门最需要的，在同行评议痛遭诟病之后，专业评价机构终于得到了行政权力部门的青睐而上位。

其五，学术评价的权力化。评价原本是学术共同体成员的一种权利，推而言之，所有学术作品的读者、学术成果的应用者，都有评价的权利。但是，在学术评价裂变之后，为行政权力部门服务的学术评价日益从权利向权力过渡。虽说量化评价只是为行政权力部门提供了一种工具性的服务，但因其能提供行政权力部门需要的“客观”、“公正”、“公平”的排行榜和排名表，“母以子贵”，制作学术期刊排行榜的评价机构也因此而走红，由学术研究的服务者而摇身一变为学术舞台上的主角，排行榜和排名表则成为他们手中极具魔力的“指挥棒”，本意是服务于学术研究的评价成为了凌驾于学者之上的支配力量，评价终于完成了第五层也是迄今为止最后一层的蜕变：成为一种权力——评价权力。

在经历了五层蜕变之后，今日的学术评价早已不是昔日的学术批评，从评价主体、评价目的到评价方法、评价标准、评价环境都发生了全面的变异，不仅完全脱离了学术研究，甚至变得与学术研究毫无内在关联，这样的学术评价出现问题是必然的。但评价乱象只是一种表象，透过这一表象，我们应该看到，在乱象的背后，是资源分配和管理而产生的利益驱动。

三、“评价”真的是“学术乱象”的根源吗?

“学术乱象”在历史上并不鲜见，但目前的“乱”与历史上的“乱”相比，似乎有些不同于以往的特点：抄袭或剽窃历来为学人所不齿，加之极易被学术同行所识破，冒险而为者历来不多，所以，历史上很少像今天这样颇有些层出不穷的味道，甚至连校长剽窃、院士造假都已不再是稀罕事。但与如今庞大的科研队伍相比较，其实真正明目张胆进行抄袭和剽窃的人比例并不算高，随着科技进步，比如，“查重系统”的广泛使用，单纯的抄袭剽窃因逃不过用大数据进行比对的火眼金睛，将会日益减少。更值得忧虑的学术乱象是本文开篇所引述报道提及的科研成果“数量与质量不成正比”，大量的低水平重复的平庸之作充斥学界，因其普遍，才更为严重。

从表面上看，不合理的评价确实是造成学术乱象的原因，在每一起学风问题的典型事件背后，都可以找到学术评价的影子——为了在学术评价中胜出以维护或争取与学术相关的利益而主动或被动地不择手段，甚至铤而走险，冒着极易被发觉的危险去抄袭和剽窃；更普遍的平庸之作泛滥问题，也与学术评价直接相关，制造这些作品，既是为了应付科研管理，也是为获取项目、实现晋升准备条件，与抄袭和剽窃比起来，平庸之作安全多了，只要与纯量化评价不问内容和过程只问数量和级别的要求相符，就可获得与学术相关的利益，特别是在被量化指标压得透不过气来的时候，以平庸之作来应对评价(管理)，在许多人都是不得已之举。的确，这一切都是因为评价。

但是，当我们将学术乱象的根源归结为评价时，却不得不面对一系列问题，那就是：评价是如何变得如此强势的?强势的评价又是如何作用于学术研究的?学界为何没有能力制约不合理的评价反而被它牵着鼻子走?其实，在上文关于评价乱象是如何形成的分析中，笔者已大致回答了这些问题。我们可以看到，随着学术评价的层层蜕变，一方面，评价变得越来越强势，而与学术研究则渐行渐远。脱离了学术研究的学术评价，更体现出了对行政权力的依赖，评价的地位每上升一个层次，也就意味着它与行政权力的结合又加深一个层次，这在学界应该是尽人皆知的“秘密”。评价机构正是通过行政权力部门的授权，或者其评价结果为行政权力部门采信，才变得如此强势，才具备了对学界发号施令的权威，堪比狐假虎威。另一方面，评价变得越来越简单，以至于简单到就一个排行榜或排名表。某些评价机构虽然设计了十分复杂的指标体系，但姑且不论这些指标及其复杂的加权运算是否合理，仅就其最终产品而言，无非还是期刊排行榜或排名表，无非还是在用过去的文评现在的刊，再用现在的刊去评未来的文，仍难脱简单化、绝对化和以刊评文的窠臼。学术评价原本是一种复杂的学术活动，何以变得如此简单?正是评价机构出于对行政权力部门偏好的迎合。“不必告诉我为什么，只要告诉我是什么就可以”，排行榜和排名表恰恰符合这一要求。这样评价的荒谬，学界岂有不知?没有行政权力部门对它的青睐，学界何至于被它牵着鼻子走?

被评价牵着鼻子走除了出于对权力的屈服以外，还有利益的诱惑这一层原因。权力总是与利益相关，国家对于某些自然科学研究项目的投入动辄成百上千万甚至上亿元，对哲学社会科学研究项目的投入虽有所不如，但总量仍十分可观。国家对学术研究的巨大投入带来了我国学术、科研和文化事业的巨大发展，这是有目共睹的事实；毋庸讳言的是，同时也给高校和科研院所及其研究人员带来了收益，现实中的科研人员对名与利的追求当然是可以理解的，而正因为如此，名与利的杠杆在科研管理中也起着重要作用。在分析学术评价何以作用于学术研究时，我们可以看到一条清晰的权力和利益链(当然也是工作链)：

权力(资源)——评价(分配)——评价(管理)——科研(机构与人员)

链条的顶端是握有巨额学术资源分配权的行政权力部门，链条的底端是科研单位和学术界，串连起顶端和底端的是评价，而规约这一链条运转的则是科研体制。

行政权力部门因专业所限，并不能直接介入学术研究，要让这条链条运转起来，必须经过中介环节，这一环节就是评价。处于链条底端的高校和科研院所几乎无一不引入量化评价的指标，内部的利益分配越来越向科研项目、学术论文的级别和数量倾斜，学术研究已从随性的个人兴趣彻底转变成了硬性的“科研任务”。因为唯有这样，底端才能迎合顶端，才能从顶端获取更多的资源。可见，评价在这一链条中担当的是沟通顶端和底端双方的桥梁角色。桥梁的宽窄、高低其实是由处于链条顶端的行政权力部门设定的，评价机构只是根据这一设定，设计生产出了符合其要求的评价产品，且因其产品而跻身于学术权力场中，并实现自身的利益。与此同时，评价在这一链条中还担当着工具的角色，工具的型号、规格、尺寸当然是由行政权力部门设定的，评价机构只是通过对评价的打造，使其产品成为行政权力部门得心应手的工具。无论是桥梁的建造还是工具的打造，都是促使评价一层层蜕变的原因，原来的评价是担当不了桥梁或工具的，只有经过蜕变，桥梁才完成了建造，工具才完成了打造。

这样的桥梁和工具固然符合了行政权力部门的要求，但是否公平呢?诚如高翔研究员所指出的：“过分偏重量化指标，看似客观、公正，其实隐含着深刻的不公……学术界存在着比较严重的功利主义倾向，追名逐利、急功近利现象蔓延，而学术评价机制的不健全、评价标准的不透明、评审过程的不公开、学术监督机制的缺位，导致权力寻租、金钱交易现象时有发生。”(18)仅满足顶端的评价的不公平是不言而喻的，评价对行政权力部门的迎合固然是其异化的原因，但若没利益链的存在，就不会催生出这么多的评价机构；若没有规约利益链的科研体制的需要，评价也不至于如此走入歧途。

如前所述，以学术批评为特征的学术评价在历史上是学术研究的一个重要组成部分，曾为学术的发展起过非常重要的作用，在此不再重复，只想强调一点，那就是，即使在今天，学术进步仍然离不开学术批评，今天学术研究的低水平重复泛滥成灾，在很大程度上恰恰是因为学术批评的式微和学术评价的异化。学术评价发挥的作用无论是正面的还是负面的，都是有前提的，最重要的前提就是科研体制是否合理。学术评价在经历了五层蜕变后才使得那些以对期刊进行分等分级为最终产品的所谓评价机构脱颖而出，且自我标榜，欲号令天下，其背后的利益驱动是显而易见的。应该追问这一系列变化是如何发生的。上文的分析足以表明，促成学术评价蜕变的正是科研体制。我们可以说，有什么样的科研体制，就有什么样的学术评价；即使没有现成的，也会催生出服务于这一体制的评价体系。(19)

所以，只要利益链存在，单纯地改进评价方法是难以有效地遏制学术乱象的。最早的定量评价是始于1990年代初的“核心期刊”评选，依据的是包括引文数据、文摘数据在内的量化数据，但对“核心期刊”的批评在1990年代即已产生。继之是2000年的“CSSCI来源期刊”评选，这是一个纯粹以引文数据为依据的期刊评选，当其制作者声称其具有评价功能之初，对它的质疑之声也就产生了。客观地说，这些质疑和批评大多是有道理的，评价机构也有不同程度的响应，从评价指标到方法以及在功能表述上都有所改进，但总的来说，这些批评和改进都没有取得明显效果，学术之乱一如从前。可见单纯的评价改革并不能取得理想的效果。

因此，将学术乱象的根源归结为学术评价，以为只要淡化甚或取消了评价，就能中止学术乱象，未免太过简单。终止学术乱象的关键不在于淡化评价或改进评价，而在于消除造成评价乱象的因素。学术评价只是科研体制运行中的一个环节，量化评价更只是学术评价的一部分，而且量化评价的价值也不在排行榜和排名表，而在于采集了各种信息的数据库。在很多时候，为何评价、谁来评价、如何评价等这些直接涉及评价结果是否公平、公正和合理的问题，并不取决于所谓评价专家，不管是从事定量评价还是定性评价的专家，而是取决于评价的组织者。换言之，评价的结果如何，更多的是取决于评价组织者的意志。在涉及资源分配和管理的诸种评价中，评价的组织者几无例外的都是行政权力部门，包括从中央到地方各级政府以及高校和科研院所的行政管理部门。规约这些行政管理部门行为的，是科研体制。因此，与其说是评价导致了学术乱象丛生，不如说如今的科研体制必然会带来评价乱象和学术乱象。学术之乱和评价之乱，其实是同源的。将评价视为学术乱象的根源，实际上遮蔽了科研体制对学术乱象之所以产生所应承担的责任。

四、改革不合理的科研体制是终止乱象的根本途径

学术利益客观存在，并不会因“淡化、弱化学术评价”就能免于争夺。公平竞争也不会引起不当得利，只会有利于学术的发展。因此，笔者坚持认为，改革不合理的科研体制是终止乱象的根本途径。

“体制是管理机构和管理规范的结合体或统一体。不同的管理机构和不同的管理规范相结合就形成了不同的体制。总之体制是国家机关、企事业单位的机构设置、隶属关系和权利划分等方面的具体体系和组织制度的总称”。(20)今天的学术管理机构主要是行政权力部门，国家巨额投入的科研经费也无一不经行政权力部门之手而下拨，而管理规范无一例外也都出于这些部门。因此，行政权力部门对学术研究的进展和方向都起到了举足轻重的决定作用。一切的利益纠葛也都源出于此。

目前的科研体制基本属于“举国体制”，这种体制的好处是集中力量办大事，社科研究的重大成果的获取大多离不开这一体制，或者可以说应该归功于这一体制；但问题也由这一体制而产生，因为“举国体制”必然“加剧学术行政化”，(21)学术资源的分配权力必定集中于行政权力部门。可以想见的是，只要这样的科研体制存续下去，学术评价和学术研究的局面就不会有根本性的改观。

仲伟民教授曾以《缘于体制：社科期刊十个被颠倒的关系》为题，深刻分析了期刊体制是如何造成社科期刊种种“颠倒关系”的，其中之一就是“学术期刊与评价机构之关系的颠倒”而使怪现象丛生。“造成上述怪异现象的直接原因也在于科学合理的学术评价机制的缺失，原本不具备独立进行学术评价资格的评价机构如此走红，而其背后也是不合理的学术期刊体制在作怪……这进一步说明了重建学术评价机制和改革学术期刊体制的重要与必要”。(22)李频教授在《数字时代社科学术期刊改革路径的思考》一文中也指出：“实践证明，政府因‘有限理性’的刚性制约难以调整好社科学术期刊的结构，所以，管理体制改革是推进社科学术期刊改革的必由之路。”(23)学术期刊体制只是科研体制的一个缩影，目前科研体制的要害也在于行政权力部门垄断了所有的资源，并以学术评价为“指挥棒”来调动和管理学术研究。只要这样的科研体制不变，任何评价方法层面的改革都不会带来大家满意的结果。所以，笔者才认为：“评价也好，道德也罢，或笼统地归结为社会大环境，都只看到了问题的表象或某一侧面。当前学术成果存在的种种问题(根源)在于学术(科研)体制的不合理。”评价只不过是沟通行政权力部门与学术界的桥梁，或行政权力部门手中的工具，而桥梁和工具如何能成为乱象的源头?

在举国体制或科研体制不可能短时间内改变的情况下，要彻底终结评价之乱或学术之乱只能是不切实际的幻想，这是举国体制必须付出的代价。短时期内，这种代价是可以理解和承受的，但长此以往，必将从利大于弊逆转为弊大于利。随着国力的增强，投入的不断增加，这种逆转正在到来。因此，应该基于学术发展规律，改革和重建科研体制，其中的关键是管理体制和规范的改革和重建。

在科技界，科研体制改革早已不是一个新鲜的话题。2006年8月，中国科学院院士王志珍研究员就撰文指出：“我国现行的科研经费管理体制存在两大突出问题。一是条块分割、政出多门，科研经费使用效率低……造成科研项目设置重叠，科研人员不得不将很多时间花在‘跑’项目和应付评估上，极大程度地影响了科研成果的质量。二是政府既管经费，又管项目；既是出资人，又是‘经营者’，容易造成决策不当、资源浪费乃至滋生腐败……中国还是一个发展中国家，我们浪费不起；中国正处在发展的关键时期，我们也耽误不起。对此，国家应予高度重视，不合理的科研经费管理模式必须改变。”(24)在此前后，关于科研体制改革的呼吁和建议可谓层出不穷，如2010年10月，中国科学院院士郭雷研究员撰文呼吁：“科学技术的发展直接受科研环境的影响，而科研管理体制对科研环境起着决定性导向和制约作用。当前，应尽快从宏观和微观层面对我国科研管理体制进行深化改革。”为此，他提出三点建议：“设立国家科技宏观决策与协调机制，改革科技资源配置与管理办法”、“加快相关部门职能转变，既不能‘越位’也不能‘缺位’”、“遵循科技多样性客观发展规律，改革科技评价体系与科技奖励体制”。(25)

来自一线科研人员的呼吁终于得到了高层的响应，“如何让中央财政资金这一‘好钢’，真正用在体现国家意志的科技计划、项目、基金这些‘刀刃’上，如何从根本上解决项目管理‘九龙治水’、财政资金‘天女散花’、科研项目多头申报、科研人员‘跑部钱进’、项目经费缺乏监督等一系列问题，直接关系到国家科技资源的配置和使用效率，也关系到创新驱动发展战略能否顺利实施。对这些问题，近期出台的《关于深化中央财政科技计划(专项、基金等)管理改革的方案》将会提出解决之策，被认为是对中央财政支持的科技计划、项目、基金管理体系的‘重构’。”这个由科技部、财政部共同起草的《方案》宣布：“按照转变职能的要求，政府部门不再直接从事资金的具体分配和项目的日常管理，而是抓战略、抓规划、抓布局、抓监督，具体管理工作交由规范化的专业机构负责。”(26)这个方案实施的效果如何还有待观察，但这无疑昭示了科研体制改革的方向。科技界已先走一步，相信哲学社会科学科研体制的改革也会提上议事日程。

如果说来自高层的改革方案是一种“顶层设计”的话，那么，还需要有学术界的“底层响应”，而最好的响应莫过于通过重建学术民主，让学术评价回归正轨。科研体制的改革为学术评价的重建提供了某种可能。由于科研体制改革不可能一蹴而就，将是一个相对漫长的过程，而新的体制同样要面对资源的分配和管理问题，因此为分配和管理学术资源的评价也会长期存在。要使这样的评价回归正轨，首先，要明确不管是传统意义上的学术批评，还是为分配和管理资源服务的学术评价，其主体应该是同一的，即学术共同体，专业评价机构并不具备独立的评价主体的资格；其次，要摆正定性评价与定量评价的关系，定量评价不能与定性评价相提并论，专业评价机构更准确的定位应该是评价数据的提供者，而数据只能是评价的工具；再次，为了维护和保证学术共同体评价的公开、公平和公正，有效避免在资源分配的评价中学术共同体既是裁判又是运动员所带来的问题，除了实行必要的回避制以外，更有赖于学术民主的真正实现，学术共同体通过学术交流、学术批评、学术评论来表达“民意”，并对评价进行监督。关于重建学术评价机制的以上观点，笔者已有专文论述，在此不赘。

在本文即将定稿之时，笔者看到了国家新闻出版广电总局《第一批认定学术期刊名单公示》，公示文稿称：“为严格学术期刊出版资质，优化学术期刊出版环境，促进学术期刊健康发展，……总局组织开展了学术期刊认定工作。经过各省、区、市新闻出版广电局，中央期刊主管单位初审上报，总局组织有关专家严格审定，确定了第一批认定学术期刊名单，现予以公示。”(27)在以“跨界”为重要特征的互联网时代，在传统媒体力图与新媒体平台融合发展的今天，总局此举的“政策隐语”是颇耐人寻味的，值得专文予以分析。这里只想指出：在学术论文与非学术论文、学术期刊与非学术期刊之间，既无必要也不可能划出一条明晰的界线(比如，被许多高校和科研院所誉为或定为“顶级学术期刊”的英国《自然》杂志一直辟有刊发科幻小说的专栏)，这应该是常识，总局的官员不会不懂，但仍出台这样的政策，一定有自己不得已而为之的苦衷。排除“滥权”的可能，只有一个解释，那就是作为科研体制重要组成部分的学术期刊体制的制定者已被自己的设计拖入了“制度陷阱”。这为笔者所坚持认为的不合理的科研体制是学术乱象的根源提供了最新的例证。

(作者附记：本文初稿曾提交2014年11月7日在浙江金华举行的“第三届全国人文社会科学期刊高层论坛”并作大会发言，由衷感谢与会专家提出的宝贵意见，当然，本文的观点由作者负责。)

【注释】

①唐红丽：《学术成果问题根源于“评价体系”》，《中国社会科学报》2014年11月7日。

②其实，至少在2009年，中国科协“全国科技工作者状况调查”中就公布：“近半数科技工作者认为当前学术不端行为是普遍现象。55.5％的科技工作者表示确切知道自己周围的研究者有过学术不端行为，多数人认为‘学术评价制度不合理’、‘社会大环境不好’、‘监督机制不健全’是造成学术不端行为泛滥的主要原因。”(杨傲多：《第二次科技工作者状况调查显示学术不端问题突出制度建设亟待加强》，《法制日报》2009年7月14日)可见，在科技界存在着与哲学社会科学界同样的问题，而且学者们所认定的原因也是大致相同的。

③⑦《关于严肃处理高等学校学术不端行为的通知》，教社科[2009]3号。

④《关于加强学术道德建设的若干意见》，教育部网站，http：//www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_25/200407/943.html；《关于进一步加强和改进师德建设的意见》，教师[2005]1号。

⑤参见《高等学校哲学社会科学研究学术规范(试行)》，教社政函[2004]34号。

⑥《教育部社会科学委员会学风建设委员会章程》(教育部社会科学委员会第二次全体会议2006年1月17日审议通过)，教社科厅[2006]2号。

⑧参见周济：《标本兼治惩防并举全面推进高校学术道德和学风建设》(2009年3月15日)，教育部网站，http：//www.moe.gov.cn/publicfiles/business/htmlfiles/moe/moe_1204/200903/45481.html。

⑨参见《中国科学院关于加强科研行为规范建设的意见》，http：//wenku.baidu.com/link?url=-AUR42L_7B4ywrmUF7mZo6J16b-0jbQ6qyZPBKzn4hbYfJfTVf2jXOjS2Zl07DSe5Eex_QlNO5uS9xAOpq2YRwQbud39nVVqsHDVZYoDfBG；《中国社会科学院关于处理学术不端行为的办法》，http：//wenku.baidu.com/link?url=K8lcX40ibLDZ1_SA9UXFu9IrpvpiJymsCBSJCeQSGtPRFO2Yfq_XCQLv8BYFOG3R02quoE4akA_y-l0Tse0sYHP9lu8YNFqHyBDC4EPsl9q。

⑩参见王广、张梦薇、李春艳：《五十家学术期刊联手亮剑“武汉宣言”直指学术不端》，《中国社会科学院报》2008年10月18日。

(11)(12)余三定：《做学问莫买椟还珠》，《人民日报》2013年4月16日。

(13)余三定：《谁在推动学术评价走向疯狂》，《云梦学刊》2013年第4期。

(14)朱剑：《重建学术评价机制的逻辑起点——从“核心期刊”、“来源期刊”排行榜谈起》，《清华大学学报》2012年第1期。

(15)据《新京报》报道，“2013年，作为‘211’‘985’序列的清华大学科研总经费最多，为39.31亿元，财政拨款为27.75亿元，占了70.6％，而非‘211’‘985’的高校科研经费最多的西南石油大学，4.6亿元中仅有26.1％为财政拨款，约1.2亿元，两者科研经费所获的财政支持相差23倍多”。参见《“211”“985”被指成高校“贫富分水岭”》，《新京报》2014年11月9日。

(16)仲伟民：《破除学术评价对期刊发展的不利影响》，《光明日报》2014年11月3日。

(17)李剑鸣：《自律的学术共同体与合理的学术评价》，《清华大学学报》2014年第4期。

(18)高翔：《构建具有鲜明中国特色的社会科学评价体系》，《中国社会科学报》2014年4月18日。

(19)比如，原新闻出版总署就曾于2010年7月和12月分别颁布了《报纸期刊出版质量综合评估办法(试行)》和《全国报纸期刊出版质量综合评估指标体系(试行)》，由此在评价制度层面基本完成了具有“通适性”和“纯量化”特征的报纸期刊质量评价体系的打造。对此，笔者已有专文予以讨论，参见朱剑：《量化指标：学术期刊不能承受之轻——评〈全国报纸期刊出版质量综合评估指标体系(试行)〉》，《清华大学学报》2013年第1期。

(20)“体制”，百度百科，http：//baike.baidu.com/view/79359.htm?fr=aladdin。

(21)熊丙奇：《警惕科研“举国体制”加剧学术行政化》，《东方早报》2010年6月3日。

(22)仲伟民：《缘于体制：社科期刊十个被颠倒的关系》，《南京大学学报》2013年第2期。

(23)李频：《数字时代社科学术期刊改革路径的思考》，《南京大学学报》2014年第4期。

(24)王志珍：《点击科技体制改革》，《光明日报》2006年8月1日。

(25)郭雷：《科研管理体制改革三建议》，《人民日报》2010年10月19日。

(26)韩霁：《中央财政科技计划管理改革启动?——政府将不再直管具体项目》，《经济日报》2014年10月21日。

(27)《国家新闻出版广电总局第一批认定学术期刊名单公示》(2014年11月18日)，国家新闻出版广电总局网，http：//www.gapp.gov.cn/news/1663/231784.shtml。

朱剑：科研体制与学术评价之关系

小程序 | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏