江晓原:影响因子:学术江湖的《葵花宝典》

选择字号:   本文共阅读 930 次 更新时间:2017-01-16 12:06

进入专题: 影响因子  

江晓原 (进入专栏)  

 为什么“影响因子”是《葵花宝典》?


读过金庸《笑傲江湖》的人都知道,《葵花宝典》是江湖中神秘的武学秘籍,炼成之后威力极大,所以人人争夺,闹得江湖上腥风血雨。但《葵花宝典》有个致命特点——“欲练神功,引刀自宫”!小说中所有练此“神功”的人一个个身心变异,全都没有好下场。

正是在这个意义上,“影响因子”可以比作《葵花宝典》:发起这个游戏的西方人和少数西方杂志,已经在这个风靡全球的游戏中大获其利,但中国学术界如果跟着玩这个游戏,其结果必将是“引刀自宫”!

笔者将持续数期,为读者讲述这个当今学术江湖中还远远不为人所知的隐秘故事。这个故事包括如下要点:

▲“影响因子”是用来赚大钱的;

▲用“影响因子”赚大钱的人,如何让世人将他的私人商业公司误认为“国际权威科学机构”?

▲当初是哪些人和杂志发起了“影响因子”游戏,他们又如何从中大获其利?

▲“影响因子”可以如何使用“合法”手段操弄?

▲为何中国学术界跟着玩这个游戏就会“引刀自宫”?

这次第一期,我们先窥看一些《葵花宝典》中的具体内容——暂不包括“引刀自宫”的骇人场景。

✎ “影响因子”计算公式的第一个问题:两年期限

“影响因子”作为一个专门术语,1955年首次出现在“影响因子教父”尤金•加菲尔德(Eugene Garfield)发表在《科学》(Science)杂志上的一篇文章中:

通过该系统(指“科学引用索引”SCI),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

加菲尔德最初将一篇文章的被引用次数作为“影响因子”,但8年后的另一篇文章中他把“影响因子”定义修正为“期刊文章的平均被引用次数”。而汤森路透(Thomson Reuters,加菲尔德当初创建的出售SCI和“影响因子”的私人商业公司ISI如今被它收购在旗下)现今逐年发布的“期刊引证报告”(JCR)上,影响因子算法的标准定义是:

一份期刊前两年中发表的“源刊文本”在当年度的总被引用数,除以该期刊在前两年所发表的“引用项”文章总篇数,即为该期刊当年度的影响因子数值。

其中“源刊文本”,指的是SCI(后来包括SSCI 和 A & HCI)任一收录期刊上发表的所有文本。用算式表达为:

这个公式中的第一个问题是:源刊文本的“引用窗口”为什么设定为两年?为什么SCI期刊文本只在发表后第二、三年度发生的引用,才对期刊“影响因子”产生有效贡献?常识告诉我们此后引用肯定还会持续发生的。

加菲尔德1972年发表在《科学》杂志上的文章,对这一设定作了解释,他逐年统计1964至1970年SCI收录期刊的参考文献,其中发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%。明明两年内的引用只占两三成,但不知何故他却就此得出了“论文被引用主要发生在发表当年后的两年内”的论断。照理说“两年期限”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要单独撰文、或至少也应该在文章中详细说明理由,但他却只用一条注释(该文注释29)糊弄过去。难怪一些西方学者感到无从知晓“两年”标准是依据什么得来的。

针对这一问题,格兰采尔(W. Glanzel)和莫伊德(H. Moed)2002年发表的论文已经提供了一个非常有力的反驳案例。他们考察了医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在头三年,《柳叶刀》论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,到第十年《美国社会学评论》的引用率就大大高于《柳叶刀》了。

这一结果表明,对医学期刊和社会学期刊采用同样的“引用窗口”年限就不合理。医学作为最活跃的研究领域,新旧理论频繁更迭,其中某些成果发表后引发的关注甚至是爆发式的。但在人文领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。

这就表明,汤森路透逐年公布的“影响因子”很难说是客观的。然而,在“影响因子”被捧上神坛的今天,学界即使意识到了这一点,也已经别无选择。2003年加菲尔德对这一问题的回应,就完全是一副“木已成舟能奈我何”的架势:“我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子,我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。”

在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道。“它们需要单独订阅”,你想知道更多情况,另外再掏钱啊!——别忘了,SCI和JCR数据也都是要花钱向ISI购买的。


“影响因子”计算公式的第二个问题:分母变化


第二个问题出现在“影响因子”计算公式的分母中。作为分母的“引用项”(citable items)究竟指什么呢?按照加菲尔德最后的定义,“引用项”只包括“原创研究论文”(original research paper)和“评论”(review)。

我们中国人特别老实,办学术刊物就只登research paper,至多偶尔登一两篇review;办普及刊物那就根本不会登任何research paper和review。所以对中国人来说,计算公式分母中的“引用项”不会有任何问题——它就是一本学术刊物所刊登全部文章的数量。

可是到了洋人那里,情况却完全不同了!许多刊物除了刊登原创论文和评论,还要发表杂志社论、技术通信、通告、读者来信、科学讯息、观察报告、书评、影评乃至科幻小说!如今“影响因子”遥遥领先的几家最知名科学刊物——《自然》(Nature)、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),《新英格兰医学杂志》(The New England Journal of Medicine)等等,无不如此。

在1972年发表于《科学》杂志的文章中,加菲尔德将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是“全部计入”不失为较为便捷的处理手段;况且“这些期刊上的非学术文本也是潜在的被引用文本”(见该文注释28)。但这种做法对《自然》、《科学》之类的期刊非常不利,他们的排名全都在40名之后。

针对这一情况,在1975年的JCR报告中,加菲尔德对规则作了调整,规定分母项只包括三类“学术文本”:原创研究论文、评论和技术报告(technical notes)。1995年度的JCR报告中分母规则再次调整,“技术报告”也被剔除,只保留“原创研究论文”和“评论文章”两项,这一做法保持至今。“非学术文本”不再计入的理由,已经变成“它们很难获得引用”——后文将表明这并非事实。

分母大幅减小对《自然》、《科学》这类期刊的“影响因子”产生了神奇的效果,它们的“影响因子”排名全部大幅上升,其中《美国医学会杂志》竟惊人地提升了100位。对此加菲尔德只委婉承认“部分归结于这个原因”。

请注意《自然》杂志——笔者已经在本专栏谈过它刊登的那些科幻小说了,它和“影响因子”之间有着极为微妙的关系,且待后文慢慢道来。



进入 江晓原 的专栏     进入专题: 影响因子  

本文责编:陈冬冬
发信站:爱思想(https://www.aisixiang.com)
栏目: 爱思想综合 > 学术活动信息
本文链接:https://www.aisixiang.com/data/102834.html
文章来源:作者授权爱思想发布,转载请注明出处(https://www.aisixiang.com)。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2023 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统