新浪博客

SCI和影响因子:学术评估与商业运作——Nature实证研究之三(下)

2016-01-26 12:26阅读:
载《上海交通大学学报》23卷5期(2015)

SCI和影响因子:学术评估与商业运作——Nature实证研究之三(下)

穆蕴秋 江晓原
(上海交通大学,科学史与科学文化研究院,200240)

SCI和影响因子:学术评估与商业运作——Nature实证研究之三(下)
摘 要:SCI论文(引用)及期刊“影响因子”,被当今学界视为最权威的学术评估手段,却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容:SCI论文(引用)和期刊“影响因子”的历史形成过程;上述两者规则设计的合理性质疑;揭示两者背后的商业化运作机制及学术包装手法。
关键词:SCI(科学引用索引);JCR(期刊引证报告);影响因子;尤金·加菲尔德

五、对“影响因子”两项准则合理性的质疑
六、为商业机构打造高端学术形象
七、“黄金俱乐部”的准入门槛


五、对“影响因子”两项准则合理性的质疑

  1955年,“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中,他在两个地方谈及“影响因子”:[[1]
]
  通过该系统(注:指科学引用索引),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。
  对于意义重大的文章,引用索引具有量化价值,它能帮助历史研究者评估文章的影响——这也就是“影响因子”。
  从这两段话可以看出, 加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。
  后来在1963年的一篇文章中,加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[2]] 这主要是为了解决期刊“体量(size)”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法,期刊优劣取决于它总的被引用次数,但通常情形下,期刊发表文章的数量越多,获得的引用次数也就越多。对一些“体量”小的期刊而言,传统方法无疑是不公平的。
  汤森路透现今逐年发布的JCR报告上,影响因子算法的标准定义是:期刊X在前面两年发表的源刊文本(source items)在当年度的总被引用数,除以期刊X在前面两年发表的文章(article)总数量,即为期刊X当年度影响因子的得数。[[3]] 其中“源刊文本”,指的是SCI(后来包括SSCI 和 A&HCI)任一收录期刊上发表的所有文本。算式表达为:

期刊N年度影响因子=【期刊(N-2)+(N-1)年所有源刊文本在N年度的总被引用数】/期刊(N-2)+(N-1)年发表文章总数

  从算式可看出, 计算期刊“影响因子”需遵守两项基本准则:
  第一准则,源刊文本的“引用窗口(citation window)”是两年。通俗的解释就是,SCI期刊文本只在发表后第二、三年度发生的引用,对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。
  加菲尔德在1972年《科学》杂志上的文章中,对这一准则的设定进行了解释(参见该文注释29)[[4]], 他通过逐年统计1964至1970年SCI收录期刊的参考文献,发现发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%(换一种呈现方式就是,期刊参考文献和注释发表年限在三年以上的比例依次为:68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%)。
  从这组数据,加菲尔德还总结出一种趋势,随着SCI收录期刊数量逐渐增加,发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去,比例可能越来越小。但不知何故他居然就得出判定,“论文被引用主要发生在发表当年后的两年内”。
  照理来说,“两年有效引用”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要在文章中(或单独撰文)详细说明缘由,但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中,甚至无从知晓“两年”标准是按什么依据得来的。[[5]]
  事实上,针对这一问题,学者格兰采尔(W. Glanzel)和莫伊德(H. Moed)2002年的一篇论文,已经提供了一个非常有力的反驳案例。[[6]] 他们抽样考察医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年,《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,《美国社会学评论》的引用率大大高于《柳叶刀》(参见表4)。
  这一结果意味着,对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域,新旧理论的更迭在频繁发生,其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。换言之,汤森路透-ISI逐年公布的“影响因子”结果,很难讲是一个客观的结论。

表4:两份期刊1980年发表文章不同年限的平均引用率
引用年限
平均引用率
1980-80
1980-81
1980-82
1980-85
1980-89
柳叶刀
0.6
2.4
4.5
9.7
14.0
美国社会学评论
0.2
1.8
4.3
12.1
20.9


  不过,在“影响因子”被捧上神坛的今天,学界即使意识到这一点,“路径依赖”已让他们别无选择。2003年,加菲尔德对“两年有效引用”的回应,就完全是一副“木已成舟能奈我何”的架势:
  我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。[[7]]
  在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道——“它们需要单独订阅”。
  第二准则, “影响因子”算式分母的“文章”只包括“原创研究论文(original research paper)”和“评论(review)”。
  这一准则专门针对的是那些除了发表原创论文和评论,还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物,当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),以及《新英格兰医学杂志》(The New England Journal of Medicine),都属于这一类型。对单纯发表原创论文的期刊,如知名的《现代物理评论》(Reviews of Modern Physics)和《化学评论》(Chemical Reviews),就不需要进行这种区分,因为它们的“源刊文本”数量就等于“文章”数量。
  这一准则的形成也有一个渐变的过程。1972年,加菲尔德发表在《科学》杂志的一篇文章中,[[8]] 以1967、1968和1969三年的SCI数据为基础,计算 1969年度的期刊“影响因子”,他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是(参见该文注释28):“全部计入”不失为较为便捷的处理手段;更重要的是,“这些期刊上的非学术文本也是潜在的被引用文本”。
  这种做法显然对《自然》、《科学》之类的期刊非常不利,庞大的分母直接拉低它们的影响因子,排名结果全都落到40之后(参见表5)。
  针对这一情况,在1975年首次作为SCI附卷发布的JCR报告中,加菲尔德对规则进行调整,规定分母项只包括三类“学术文本”:原创研究论文(original research articles)、评论文章(review articles)和技术报告(technical notes)。“非学术文本”不再计入的理由是,它们“很难获得引用”。[[9]][[10]]
  分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”,但相较1969年,它们的排名全部大幅上升,其中《美国医学会杂志》惊人地提升了100位(参见表5)。
  分母规则在1995年度的JCR报告中再次被调整,范围进一步缩小,“技术报告”被剔除,只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[11]]
关于“准则二”还有很大的讨论空间,此处姑先指出这一点,后文将做进一步探讨。

表5:1969、1974年五本知名刊物在不同标准下的影响因子排名结果
年份
排名
自然
科学
美国医学会杂志
柳叶刀
新英格兰医学杂志
1969
修改定义前的位数
55
40
127
99
56
1974
修改定义后的位数
38
10
27
8
3


  相较SCI推广阶段引发的争议,一个饶有意味的对比结果是,尽管“影响因子”从提出到算法定则最终确立,与《自然》和《科学》有着极深的渊源——1955年,它首次作为专门术语出现在《科学》上;1972年《科学》刊登了1969年度期刊“影响因子”报告;1976年,《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版,这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了,[[12]] 而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[13]]
  一种可能的解释是,“影响因子”当时没有引起学界的关注。但这种解释不合常理,因为“影响因子”是基于SCI报告的数据得出的,如果SCI存在诸多不合理之处,“影响因子”当然也会存在缺陷,何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准,涉及的同样是学界非常敏感的问题,很难想象学者们能对SCI提出犀利的质疑,对“影响因子”的缺陷却完全视而不见。
  关于“影响因子”和《自然》杂志之间的微妙关系,笔者将在后续论文“Nature实证研究之四”中,展开进一步的专题研究。

六、 为商业机构打造高端学术形象

  ISI创立之前,美国的科技情报通常由政府学术机构牵头采集、整理和公布,套用今天时髦的话来讲,加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”,可谓十分贴切。[[14]]
  对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元,老年加菲尔德在一次访谈中回忆,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自中国。[[15]][[16]]
  事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间,ISI的利润平均每年以27.5%增长,随后又开发了十余款新品,公司业务迅速拓展到全球近十个国家,成为世界第一大科技信息服务咨询公司。[[17]]
  1988年,加菲尔德把ISI超过50%的股权卖给JPT出版公司(JPT Publishing)。1992年4月,汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说,交易主要是为了得到ISI,“ISI在全球拥有30万客户,每年净利润约为1500万美元”。[[18]]
  当前,汤森路透和英国里德·爱斯维尔集团(Reed Elsevier,成立于1993年)、荷兰威科集团(Wolters Kluwer,初建于1836年),共同占据全球情报市场90%的份额。[[19]]
除了SCI和JCR这样的“灵魂产品”,ISI开发的其它知名产品还包括:[[20]]
  目录快讯(CC),1956年首次面市,对各类期刊和书籍的目录进行汇编,以周刊形式出版,订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编(前面提到贝尔实验室购买的这就这种),1957年,它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在SCI出现之前一直是公司最赚钱的产品。
  化合物索引库(Index Chemicus,简称IC),这一数据库除了有助研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚,但加菲尔德对其倾注巨大热情,手下四名主要副手集体辞职也未能迫使他终止,IC如今已成为汤森路透的又一热门产品。
  由于ISI经营的客户对象以学者和学术机构为主,所以尽可能让自身显得“学术”,也是一种非常重要的营销手段。
  在公司草创阶段,加菲尔德对公司的冠名,已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话,“科学情报研究所”听起来就完全像一家政府科学机构了(这对中国这样的发展中国家来说尤其如此)。加菲尔德非常坦率地承认,他要的就是这种容易引起混淆的效果——为的是与化学摘要(Chemical Abstracts)和国家医学图书馆这类政府学术机构争夺市场,“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非盈利机构”。[[21]]
  ISI商业运转正式上轨之后,接纳了两位诺奖获得者成为公司董事会成员,这其中当然也有打造高端“学术”形象的考虑。[[22]]
  此外,为了拉近和学术圈的关系,ISI为学术机构、大学图书馆设立专项奖学金,奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[

我的更多文章

下载客户端阅读体验更佳

APP专享