SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）

2016-01-26 12:26阅读：

http://blog.sina.cn/dpool/blog/u/1214196680

载《上海交通大学学报》23卷5期（2015）

SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）

穆蕴秋　江晓原
（上海交通大学，科学史与科学文化研究院，200240）

SCI和影响因子：学术评估与商业运作——Nature实证研究之三（下）

摘　要：SCI论文（引用）及期刊“影响因子”，被当今学界视为最权威的学术评估手段，却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容：SCI论文（引用）和期刊“影响因子”的历史形成过程；上述两者规则设计的合理性质疑；揭示两者背后的商业化运作机制及学术包装手法。
关键词：SCI（科学引用索引）；JCR（期刊引证报告）；影响因子；尤金·加菲尔德

五、对“影响因子”两项准则合理性的质疑
六、为商业机构打造高端学术形象
七、“黄金俱乐部”的准入门槛

五、对“影响因子”两项准则合理性的质疑

　　1955年，“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中，他在两个地方谈及“影响因子”：[[1]

]
　　通过该系统（注：指科学引用索引），可以有效检索收录期刊论文被哪些文章引用过，这在历史研究中将发挥明显作用，当人们尝试评估某项研究成果的意义，或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。
　　对于意义重大的文章，引用索引具有量化价值，它能帮助历史研究者评估文章的影响——这也就是“影响因子”。
　　从这两段话可以看出，加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。
　　后来在1963年的一篇文章中，加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[2]]　这主要是为了解决期刊“体量（size）”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法，期刊优劣取决于它总的被引用次数，但通常情形下，期刊发表文章的数量越多，获得的引用次数也就越多。对一些“体量”小的期刊而言，传统方法无疑是不公平的。
　　汤森路透现今逐年发布的JCR 报告上，影响因子算法的标准定义是：期刊X在前面两年发表的源刊文本（source items）在当年度的总被引用数，除以期刊X在前面两年发表的文章（article）总数量，即为期刊X当年度影响因子的得数。[[3]] 其中“源刊文本”，指的是SCI（后来包括SSCI 和 A&HCI）任一收录期刊上发表的所有文本。算式表达为：

期刊N年度影响因子=【期刊（N-2）+（N-1）年所有源刊文本在N年度的总被引用数】/期刊（N-2）+（N-1）年发表文章总数

　　从算式可看出，计算期刊“影响因子”需遵守两项基本准则：
　　第一准则，源刊文本的“引用窗口（citation window）”是两年。通俗的解释就是，SCI期刊文本只在发表后第二、三年度发生的引用，对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。
　　加菲尔德在1972年《科学》杂志上的文章中，对这一准则的设定进行了解释（参见该文注释29）[[4]]，　他通过逐年统计1964至1970年SCI收录期刊的参考文献，发现发表年限在三年内的比例依次为：31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%（换一种呈现方式就是，期刊参考文献和注释发表年限在三年以上的比例依次为：68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%）。
　　从这组数据，加菲尔德还总结出一种趋势，随着SCI收录期刊数量逐渐增加，发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去，比例可能越来越小。但不知何故他居然就得出判定，“论文被引用主要发生在发表当年后的两年内”。
　　照理来说，“两年有效引用”作为“影响因子”算法非常重要的一项准则，加菲尔德有必要在文章中（或单独撰文）详细说明缘由，但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中，甚至无从知晓“两年”标准是按什么依据得来的。[[5]]
　　事实上，针对这一问题，学者格兰采尔（W. Glanzel）和莫伊德（H. Moed）2002年的一篇论文，已经提供了一个非常有力的反驳案例。[[6]]　他们抽样考察医学期刊《柳叶刀》（Lancet）和社会学期刊《美国社会学评论》（American Sociological Review），对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年，《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》，但随着年限逐渐累积，《美国社会学评论》的引用率大大高于《柳叶刀》（参见表4）。
　　这一结果意味着，对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域，新旧理论的更迭在频繁发生，其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域，新的思想和观点提出后，往往需要等待若干年的“发酵”，才可能引发关注。换言之，汤森路透-ISI逐年公布的“影响因子”结果，很难讲是一个客观的结论。

表4：两份期刊1980年发表文章不同年限的平均引用率

引用年限平均引用率	1980-80	1980-81	1980-82	1980-85	1980-89
柳叶刀	0.6	2.4	4.5	9.7	14.0
美国社会学评论	0.2	1.8	4.3	12.1	20.9

　　不过，在“影响因子”被捧上神坛的今天，学界即使意识到这一点，“路径依赖”已让他们别无选择。2003年，加菲尔德对“两年有效引用”的回应，就完全是一副“木已成舟能奈我何”的架势：
　　我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库，但它们需要单独订阅。[[7]]
　　在这个傲慢的表态中，“影响因子”的合理性是无所谓的，商业利润才是王道——“它们需要单独订阅”。
　　第二准则， “影响因子”算式分母的“文章”只包括“原创研究论文（original research paper）”和“评论（review）”。
　　这一准则专门针对的是那些除了发表原创论文和评论，还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物，当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》（The Journal of the American Medical Association），以及《新英格兰医学杂志》（The New England Journal of Medicine），都属于这一类型。对单纯发表原创论文的期刊，如知名的《现代物理评论》（Reviews of Modern Physics）和《化学评论》（Chemical Reviews），就不需要进行这种区分，因为它们的“源刊文本”数量就等于“文章”数量。
　　这一准则的形成也有一个渐变的过程。1972年，加菲尔德发表在《科学》杂志的一篇文章中，[[8]]　以1967、1968和1969三年的SCI数据为基础，计算 1969年度的期刊“影响因子”，他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母，理由是（参见该文注释28）：“全部计入”不失为较为便捷的处理手段；更重要的是，“这些期刊上的非学术文本也是潜在的被引用文本”。
　　这种做法显然对《自然》、《科学》之类的期刊非常不利，庞大的分母直接拉低它们的影响因子，排名结果全都落到40之后（参见表5）。
　　针对这一情况，在1975年首次作为SCI附卷发布的JCR报告中，加菲尔德对规则进行调整，规定分母项只包括三类“学术文本”：原创研究论文（original research articles）、评论文章（review articles）和技术报告（technical notes）。“非学术文本”不再计入的理由是，它们“很难获得引用”。[[9]]^、[[10]]
　　分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”，但相较1969年，它们的排名全部大幅上升，其中《美国医学会杂志》惊人地提升了100位（参见表5）。
　　分母规则在1995年度的JCR报告中再次被调整，范围进一步缩小，“技术报告”被剔除，只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[11]]
关于“准则二”还有很大的讨论空间，此处姑先指出这一点，后文将做进一步探讨。

表5：1969、1974年五本知名刊物在不同标准下的影响因子排名结果

年份	排名	自然	科学	美国医学会杂志	柳叶刀	新英格兰医学杂志
1969	修改定义前的位数	55	40	127	99	56
1974	修改定义后的位数	38	10	27	8	3

　　相较SCI推广阶段引发的争议，一个饶有意味的对比结果是，尽管“影响因子”从提出到算法定则最终确立，与《自然》和《科学》有着极深的渊源——1955年，它首次作为专门术语出现在《科学》上；1972年《科学》刊登了1969年度期刊“影响因子”报告；1976年，《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版，这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了，[[12]]　而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[13]]
　　一种可能的解释是，“影响因子”当时没有引起学界的关注。但这种解释不合常理，因为“影响因子”是基于SCI报告的数据得出的，如果SCI存在诸多不合理之处，“影响因子”当然也会存在缺陷，何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准，涉及的同样是学界非常敏感的问题，很难想象学者们能对SCI提出犀利的质疑，对“影响因子”的缺陷却完全视而不见。
　　关于“影响因子”和《自然》杂志之间的微妙关系，笔者将在后续论文“Nature实证研究之四”中，展开进一步的专题研究。

六、为商业机构打造高端学术形象

　　ISI创立之前，美国的科技情报通常由政府学术机构牵头采集、整理和公布，套用今天时髦的话来讲，加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”，可谓十分贴切。[[14]]
　　对加菲尔德而言，1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口，他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元，老年加菲尔德在一次访谈中回忆，它的第一份订单来自美国中央情报局（CIA）图书馆，出人意料的是第二份订单——它来自中国。[[15]]^、[[16]^]
　　事实证明，加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间，ISI的利润平均每年以27.5%增长，随后又开发了十余款新品，公司业务迅速拓展到全球近十个国家，成为世界第一大科技信息服务咨询公司。[[17]]
　　1988年，加菲尔德把ISI超过50%的股权卖给JPT出版公司（JPT Publishing）。1992年4月，汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说，交易主要是为了得到ISI，“ISI在全球拥有30万客户，每年净利润约为1500万美元”。[[18]]
　　当前，汤森路透和英国里德·爱斯维尔集团（Reed Elsevier，成立于1993年）、荷兰威科集团（Wolters Kluwer，初建于1836年），共同占据全球情报市场90%的份额。[[19]]
除了SCI和JCR这样的“灵魂产品”，ISI开发的其它知名产品还包括：[[20]]
　　目录快讯（CC），1956年首次面市，对各类期刊和书籍的目录进行汇编，以周刊形式出版，订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编（前面提到贝尔实验室购买的这就这种），1957年，它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品，CC在SCI出现之前一直是公司最赚钱的产品。
　　化合物索引库（Index Chemicus，简称IC），这一数据库除了有助研究者了解新出现化合物的相关研究数据，还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚，但加菲尔德对其倾注巨大热情，手下四名主要副手集体辞职也未能迫使他终止，IC如今已成为汤森路透的又一热门产品。
　　由于ISI经营的客户对象以学者和学术机构为主，所以尽可能让自身显得“学术”，也是一种非常重要的营销手段。
　　在公司草创阶段，加菲尔德对公司的冠名，已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话，“科学情报研究所”听起来就完全像一家政府科学机构了（这对中国这样的发展中国家来说尤其如此）。加菲尔德非常坦率地承认，他要的就是这种容易引起混淆的效果——为的是与化学摘要（Chemical Abstracts）和国家医学图书馆这类政府学术机构争夺市场，“特别是在国外，‘科学情报研究所’这样的叫法，很容易被当成一家非盈利机构”。[[21]]
　　ISI商业运转正式上轨之后，接纳了两位诺奖获得者成为公司董事会成员，这其中当然也有打造高端“学术”形象的考虑。[[22]]
　　此外，为了拉近和学术圈的关系，ISI为学术机构、大学图书馆设立专项奖学金，奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[

举报/Report

我的更多文章

下载客户端阅读体验更佳