非国际合作论文零被引率的中印比较

时间:2022-10-19 16:00:06 来源:网友投稿


打开文本图片集

摘 要:文章选取Science Eitation Index-Expanded数据库的中国和印度的非国际合作论文为样本,在不同引用时间窗口内,比较了中印两国的非国际合作论文总体的零被引率及学科层面的论文零被引率。分析了若干学科各年度的零被引率与其篇均被引频次的相关关系,各学科论文零被引率与其篇均作者和篇均参考文献的相关关系。发现中印的非国际合作论文零被引率比较存在三种模式:中国赶超模式、印度赶超模式和中印比肩发展模式;对于印度而言,篇均被引频次是其论文零被引率的主要因素,其次是篇均参考文献,第三是篇均作者数。对于中国而言,篇均被引频次对其论文零被引率的影响因学科而异,篇均参考文献对其论文零被引率的影响较大,其次是篇均作者数。建议中国进一步提高科学合作的作者规模,规范作者的引用行为。

关键词:非国际合作论文;论文零被引率;中印比较;学科特征;影响因素;相关分析

中图分类号: G250.25 文献标识码: A DOI: 10.11968/tsyqb.1003-6938.2015089

Abstract Based on non-international collaboration articles written by Chinese and Indians respectively in SCI-E, we compared the percentage of the never-cited in the mass and in different discipline cited windows, analyzed the correlation and the mean cited frequency, average authors and references on subject level, and it was found that there were Chinese catch-up mode, India catch-up mode and side by side mode. In the case of India, the significance of influencing factors is the mean citing, the average references, and the average authors in turn. For Chinese, the mean citing effects the percentage of never-cited articles at most subjects. The average reference is more impact than the average authors. We suggest improving collaborative scale of the authors in China, correcting authors" referencing behavior.

Key words non-international collaboration paper; percentage of never-cited articles; comparison of China and India; subject characteristic; influencing factors; correlation analysis

一般情况下,被引频次常用来表征论文的质量和影响力。过去,高被引论文得到了学者的较多关注,而低被引乃至零被引论文却很少引起学者的兴趣。论文零被引率指一个国家、机构、期刊或个人在某段时间内发表的论文集合中,在发表后的某个特定时间窗口内未被引用的比例[1]。笔者利用博士论文的相关数据比较了中国和印度国际合作论文的零被引率的历时变化、学科特征和合作关系规律,发现了它们各自国际合作论文零被引率的一些规律,国际合作关系结构和国际合作论文质量是导致各自国际合作论文零被引率差异的两个原因[2]。

就目前而言,国内外有关零被引率的研究虽然并不少见,但都没有对研究样本进行细致的分类,仅就某一时间段、某一学科领域、某些期刊或某一国的论文为样本,笼统地研究论文零被引率[3-7]。随着科学研究的国际化发展,国际合作论文日益增多[8-10]。而国际合作论文和非国际合作论文具有明显不同的文献特征。若不做零被引率的细分研究,难以避免科研政策的笼统性,缺乏针对性。因此,将非国际合作论文与国际合作论文区分开来研究,将是一件很有意义的工作。本文就是以中国的非国际合作论文和印度的非国际合作论文为样本,并将其细分到学科层面,比较研究中国和印度的论文零被引率[2],尝试为我国科技政策提供依据。

1 数据与方法

1.1 数据来源与下载

本文的数据来自网络版的科学引文索引数据库(SCI-E)。该索引由美国科学信息研究所( ISI) 编辑出版, 是一个多学科综合性检索系统, 主要收录生命科学、医学、生物、物理、化学、农业、工程技术领域内的科技文献。虽然它也存在一些不足,但仍被认为是最全面的数据库,涵盖了世界上最有影响力的研究成果,具有很强的代表性,特别是在基础研究领域[11]。它可以用来评价一个国家的科技实力[12],学术机构和个人的学术水平,优化图书期刊的馆藏结构[13]。所以,采用此数据库进行中印两国的比较研究是可行的。

我们选取的数据跨度为1985~2004年。原因有两个:一是1985年为我国科技发展的新阶段,从此,我国的科技发展步入正常阶段[14];二是我们采用先前研究的数据,最新数据的补充难度很大。数据下载时间与数据产生的对应关系是,2005年11月27日~12月2日对应1995~2004年出版的论文,2006年1月12日~20日对应1985~1994年出版的论文,检索条件是作者地址“国家/地区”字段为Peoples R China的Article文献类型和作者地址“国家/地区”字段为India的Article文献类型。之所以选择Article文献类型,是因为该文献类型反映了实质的研究内容,且在常被选用的文献类型:Articles,Letters,Notes,Editorials中占比达80%以上,有的学科甚至高达95%[15-16]。

1.2 数据处理

在SCI-E数据库中,1997年后的中国论文包括了香港论文。而中国大陆与香港并不属于一个科技系统,且香港的论文产出也不是一个小数目,因此,不去除中国香港的论文而进行中印比较,会遮蔽中国大陆的一些问题。所以,我们认为有必要暂时去除中国香港和澳门的论文,只进行中国大陆与印度的非国际合作论文零被引率比较(最终得到的研究样本数量见表1)。

中印两国的非国际合作论文的获取步骤与笔者之前的研究成果《学科层面国际合作结构的中印比较——文献计量学的视角》[17]一文基本相同,只有第三步不同:抽取的是非国际合作论文,它的完成人均为中国大陆作者或印度作者。最后,我们共获得中国的非国际合作论文245430篇,其中52篇不能确定学科归属;印度的非国际合作论文244986篇,其中117篇不能确定学科归属。

2 结果与分析

论文零被引率的研究可以分为两类:一类是限定论文引用的起点,不限定论文引用的止点,研究不同时间引用窗口的零被引率,这类研究往往不需要改变样本就可以观察到论文零被引率随着引用窗口变化的规律;另一类是不限定论文引用的起点,限定论文引用的止点,这类研究的样本往往需要改变,否则无法观察到论文零被引率随着引用窗口变化的特征。本文属于第二类情况。由于数据库的改变,往往导致数据提取困难增加,例如1997年之前区分中国大陆和中国香港的论文是十分容易的,之后就变得相当困难。所以,我们选择了第二类研究样本,因为这类样本更适合中印比较研究。我们在这类样本中花费了较大的精力抽取出了中国大陆的论文。显然,根据我们下载论文的时间可以知道,1978~1994年的论文的引用窗口是2006减去出版年份,1995~2004年的论文的引用窗口也可看作是2006减去出版年份。因为,前者的下载时间是2006年1月中旬,后者的下载时间是2005年11月底,二者相差不足2个月。引用窗口被标在相应出版年份的括号内。

2.1 非国际合作论文零被引率的总体比较

首先,我们从总体上比较不同年度非国际合作论文的零被引率,以考察两国的科学研究影响力。由于不同年份发表论文的引用窗口不同会影响论文的引用,为了保证论文引证时间窗口的相同,所以我们只能进行年对年的比较。我们分析这些数据的一个基本前提是:如果没有重大事情发生,一个国家在一定时期内的科学影响力不会发生较大变化。

从各年度非国际合作论文零被引率的中印比较(见图1)可以看出,在中国非国际合作论文产出较少的年份,中国的零被引率较高在40%上下;1992~2002年中国的论文零被引率均在30%左右;2003年和2004年的论文由于引用时间窗口较短导致其零被引率较高。印度论文的零被引率在低于30%的水平上维持了4~5年的平稳发展,然后逐渐降低,之后又缓慢升至30%左右,2002~2004年的论文由于引用时间窗口变小而致其零被引率上升。这些数值和普莱斯等人的测量大体相当[3]。

两国的非国际合作论文零被引率的演变可以简单地归结为U型。只不过在下降的过程中乃至最初上升的过程中,“中国论文”的零被引率高于印度,只是从2000年开始“中国论文”的零被引率才低于印度。1985~1998年,虽然中国的非国际合作论文零被引率一直高于印度,但两者的差距一直在缩小;1999~2004年,中国的非国际合作论文零被引率一直低于印度,且差距日益明显。这说明我国科学研究的质量在提升或中国科学的影响力在加强,并且从2000年开始超过印度。当然,2002~2004年的论文零被引率低于印度是中国科学的即时影响力提升还是中国科学质量的提高,这个问题还有待于排除本国自引后做进一步研究。

2.2 非国际合作论文零被引率的学科比较

论文的引用因学科不同而存在显著的差异,因此,我们还需要对样本进行学科分类做更进一步的考察。本文采用了Essential Science Indicator的学科分类法,依据载文期刊名称将论文分为22个学科。其中,经济学&商学和社会科学总论属于社会科学的论文,本文不作考虑。

学科比较分两种:一种是对各学科进行一一比较,比较不同年度出版论文的零被引率;另一种是以某年度出版的论文为样本,比较全部学科的零被引率。按照第一种思路对20个学科进行一一比较是一件庞杂的工作,超出了一篇文章的篇幅;按照第二种思路对20个出版年度进行截面比较,也需要较大的篇幅。而有些学科的论文很少,比较起来意义有限。因此,本文只选择部分学科和某些出版年度进行比较。选择学科的标准:要么该学科的论文产出较多,如物理学、化学、临床医学、工程学、材料学、植物与动物学;要么该学科具有两国的国家特色,如农业科学、数学(数学领域各年度论文零被引率及1999年所选学科论文零被引率的中印比较见图2)。

基于上述8个学科零被引率的统计,我们发现中国和印度在学科层面上的比较结果具有X的形状特征:在前一时期,一个国家的零被引率高于另一个国家且差距不断变小至某一年份后,两国具有相同的零被引率,随后该国家的零被引率低于另一个国家。在1999年,中国的非国际合作论文零被引率开始低于印度时,并不是各个学科的论文零被引率都低于印度:在所选的8个学科中,数学、农业科学和植物与动物学的论文零被引率低于印度,而化学、临床医学、材料科学和物理学的论文零被引率仍然高于印度。

在8个学科中,数学、物理学、化学、临床医学和农业科学为一类。前一时期,中国的学科零被引率高于印度,后一时期中国的学科零被引率低于印度。数学的交叉点在1989年与1990年之间,物理学和临床医学的交叉点在2001年和2002年之间,化学的交叉点在2000年与2001年之间,植物与动物学的交叉点在1988年与1989年之间。中国和印度在工程学领域的零被引率基本没有差别。在材料科学领域,前一时期是中国论文的零被引率低于印度,后一时期是中国论文的零被引率高于印度,交叉点在1994年与1995年之间。

3 成因分析

根据胡泽文等人的调查,论文发表时间较短、论文质量不太高、论文主题偏冷或不够新颖、所发期刊的影响力较低等是导致论文零被引的主要因素[1]。在科学计量学领域,论文质量一般用篇均被引频次表征,其他因素较难量化,我们暂不作分析。论文作者作为知识传播的主体,有助于论文摆脱零被引的困境,所以,我们认为论文作者的多少,应该是论文零被引率的一个影响因素;参考文献作为论文产生的知识基础,也会影响论文的质量,从而影响论文的零被引率。

3.1 非国际合作论文零被引率与篇均被引频次的回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种统计方法。一个国家的非国际合作论文集合的零被引率和该集合论文篇均被引频次是反映该国科研影响力的两个变量,前者为负变量,后者为正变量,这两个变量之间应该存在负相关关系[18]。从中印非国际合作论文零被引率与篇均被引频次的回归分析结果(见表2),可以看出,中国的相关数据除了农业科学、物理学和临床医学外,都具有较高的相关指数;印度的相关数据无一例外都具有较高的相关指数;无论是中国还是印度,从相关指数来看,指数拟合优于直线拟合,这说明两国的非国际合作论文零被引率与篇均被引频次符合指数关系;就指数回归分析来看,印度的相关指数高于中国,这说明印度科研影响力对其论文零被引率的解释力要优于中国。

3.2 非国际合作论文零被引率与篇均作者数的相关分析

作者是科学知识传播的一个重要起源。较早研究作者数量对论文被引情况影响的是Richard E. Stern。尽管他采用的方法简单,但还是发现作者的数量是论文是否被引的一个因素,只不过影响较小而已[19]。现任科学计量学学会**鲁索早就发现,一个作者仅有8%机会被别人引用,而多作者的合作论文有更多的机会被别人引用[20]。在中国和印度的非国际合作论文中,作者数量的多少与零被引率之间是什么关系?

从中印不同出版年度非国际合作论文在对应的引用时间窗口内各个学科的零被引率与篇均作者数之间的相关指数变化(见图3)可以看出,两国不同学科的论文零被引率与篇均作者数均呈负相关关系,且在论文出版后2~4年内,r的绝对值都达到了0.6,0.89;中国的相关系数有随着引用时间窗口变小而减小再增大的趋势,虽然有较大的跳跃性;印度的数据随着引用时间窗口变小而起伏变化。这说明中国的非国际合作论文在出版2~4年内,一个学科的论文作者数与该学科的论文零被引率呈高度负相关关系,之后该相关关系先起伏减弱而后震荡增强;印度的非国际合作论文在论文出版2~8年内,学科的论文作者数与论文零被引率呈高度负相关关系,之后虽变为中度相关关系,但马上又恢复至高度负相关关系。

3.3 非国际合作论文零被引率与篇均参考文献的相关分析

参考文献是新知识的产生基础,所以参考文献很可能会影响论文的引用。我们以某一学科论文的篇均参考文献数为变量,分析该学科领域论文零被引率与它的关系。

通过分析中印两国的非国际合作论文的零被引率与篇均参考文献数的相关系数(见图4),可以看出,两国论文的零被引率与篇均参考文献数都呈负相关关系,相关系数的绝对值基本上都大于0.5,中国的最高值将近0.8,印度的最高值为0.8396。这说明中国和印度的非国际合作论文的零被引率与参考文献是高度相关的,印度的相关性略高于中国,且相关性均随着引文时间窗口的变小而增强。

4 结语与展望

虽然从总体来看,中国的非国际合作论文零被引率相对于印度而言,中国经历了一个赶超的过程,1999年是一个分界点,但是并不意味着在学科层面上,中国与印度相比也是同样的模式。在学科层面上,中国和印度之间存在三种模式:第一种是中国赶超模式,这种模式较常见;第二种是印度赶超模式;第三种是两国比肩发展模式,后两种模式不常见但确实存在,主要表现在工程学和材料科学领域。

在所考察的因素中,对于印度而言,篇均被引频次是其论文零被引率的主要因素,其次是篇均参考文献,第三是篇均作者数。且随着引文时间窗口的变小,篇均参考文献的影响增强,篇均作者的影响减弱。对于中国而言,篇均被引频次对其论文零被引率的影响因学科而异,有的学科较强,有的学科较弱;篇均参考文献对其论文零被引率的影响较大,其次是篇均作者数,且两因素的影响都随着引文时间窗口的变小而增强。这样的变化是由于引文时间窗口的缩短导致的?还是由于论文本身的原因造成的?还需进一步研究。

鉴于以上分析结果,我们推测中国科学的影响力不仅来自科学内部,也来自科学外部。中国要想降低其论文的零被引率,有必要进一步扩大科学合作的作者规模,规范作者的引用行为[21]。

参考文献:

[1] 胡泽文.论文零被引率的演变规律及其影响因素研究[D].南京:南京大学,2014.

[2] 郭永正.国际合作论文零被引率的中印比较[J].情报杂志,2014(12):89-93.

[3] Price, D. J. D. Networks of scientific papers[J]. Science, 1965,149(3683): 510-515.

[4] Koenig, M. E. D. Bibliometric indicators versus expert opinion in assessing research performance[J]. Journal of the American Society for Information Science,1983, 34(2): 136-145.

[5] Garfield, E. How to use citation analysis for faculty evaluations, and when is it relevant?[J]. Current Coents, 1983,26(45):5-14.

[6] Abt HA. Long-term citation histories of astronomical papers[J]. Publications of the Astronomical. Society of the Pacific, 1981,93(552):207-210.

[7] Pendlebury, D. A. Science, Citation, and Funding[J].Science, 1991,251(5000):1410-1411.

[8] 中国科技信息所,译.美国国家科学基金汇编[S].科学和工程指标,1996:181.

[9] 中国科学院成都文献情报中心战略情报研究小组,编译.《美国科学与工程技术指标》报告综述[R].2004.

[10] Luukkonen T,Persson O,Sivertsen G.Understanding patterns of international scientific collaboration[J].Science,Technology & Human Values,1992,17 (1):101-126.

[11] Gupta B M, Dhawan S M. Measures of progress of science in India: An analysis of the publication output in science and technology[R]. New Delhi:National Institute of Science, Technology and Development Studies(NISTADS), 2006:29-30.

[12] Braun T, Glanctz W, Schubert A. 赵红州,蒋国华,译.科学计量学指标——32国自然科学文献与引文影响的比较分析[M].北京:科学出版社,1989.

[13] 唐品.《科学引文索引》及其在科研评价中的作用[J].图书与情报,2005(1):68-70.

[14] 谭文华.科技政策与科技管理研究[M].北京:人民出版社,2011.

[15] Arunachalam S, Gunasekaran S.Diabetes research in India and China today: From literature-based mapping to health-care policy[J]. Current Science,2002,82(9):1086-1097.

[16] Garg K C.Scientometrics of laser research in India and China[J].Scientometrics,2002,55(1):71-85.

[17] 郭永正.学科层面国际合作结构的中印比较——文献计量学的视角[J].科学学与科学技术管理,2013(2):72-81.

[18] 刘雪立,方红玲,周志新,等.科技期刊反向评价指标——零被引论文率及其与其他文献计量学指标的关系[J]. 中国科技期刊研究,2011,22(4):525-528

[19] Stern, R.E. Uncitedness in the biomedical literature[J].Journal of the American society for information science, 1990(41): 193-196.

[20] R. Rousseau. Why am I not cited, or, why are multi-authored papers more cited than others?[J]. Journal of Documentation, 1992(48):79-80.

[21] Liang L, Zhong Z, Rousseau R. Scientists’ referencing (mis)behavior revealed by the dissemination network of referencing errors [J]. Scientometrics,2014, 101(3): 1973-1986.

推荐访问:国际合作 中印 论文 零被引率