|
z指数在期刊网络传播力评价中的应用研究
□许新军*
摘要 针对目前期刊网络传播力评价研究相对薄弱的状况,探究运用 z指数评价期刊网络传播力的应用效果。采集图书馆、情报学与文献学期刊的样本数据,考察基于下载量的z指数(zd 指数)在期刊网络传播力评价中的有效性、科学性和先进性。研究结果显示zd 指数与传统期刊评价指标之间存在相关性,表明zd 指数对期刊的评价具有一定的有效性;zd指数与 hd 指数相比,在区分度、灵敏度及整体性方面具有优势,较pd指数的考察维度多,弥补了pd指数不能考察数据分布的不足,同时作为网络计量指标的zd指数具有时效性强、读者参与度高、抗干扰能力强、对期刊价值的反映程度高等特征,凸显出评价指标的科学性;与总下载量、篇均下载量、hd指数、pd指数等网络指标相比,zd指数在把握整体、又突出重点的同时,进一步深入到考察期刊下载量数据的分布状况中,矫正了数据分布对评价结果造成的偏差,说明评价指标具有明显的先进性。
关键词 z指数 期刊评价 网络传播力 下载次数 评价指标
1 引言
数字化出版、网络化传播使期刊网络传播力成为期刊整体影响力的重要组成部分,如何评价期刊的网络传播力日益受到学界的广泛关注。目前期刊网络传播力的评价指标有下载量、篇均下载量、下载即年指标等[1],评价指标不多,结果也不尽如人意。
2010年普拉塔普(Prathap G)为克服h指数在灵敏度、区分度方面的问题,提出了p 指数[2];2014 年为了改进 p 指数不能反映引文分布情况的不足,其又在p 指数的基础上,将反映被引用集中程度的η融入到了p 指数中,提出了z指数[3]。z指数不仅继承了h指数和p指数“质”与“量”兼具的优点,而且考虑了引文分布因素,将体现数量因素的C(被引频次)、体现质量因素的i(篇均被引频次),反映被引用集中程度的η有机地融合在一个指数中,是融合数量-质量-效率的 3D 效能型评价指数。具体计算公式为:z= width=299,height=20,dpi=110其中η= X/E,X = iC = width=155,height=20,dpi=110和 E为能量因子,i为篇均被引频次,C为总被引频次,P 为论文数量,Ck 为第 k 篇文章的被引频次,k=1 to P。
目前,基于网络数据的z指数研究鲜有报道,本文运用基于网络数据的z指数来进行期刊网络传播力的评价研究,通过实证分析z指数在期刊网络传播力评价中的应用效果,为更加科学、合理地评价期刊探寻新的路径。主要探究了三个方面的问题:(1)通过考察z指数与传统评价指标的关系,探究z指数在期刊网络传播力评价中的有效性;(2)通过比较z指数与新型综合性评价指标的关系,探讨z指数在期刊网络传播力评价中的科学性;(3)通过分析z指数与其他网络计量指标的关系,探寻z指数在期刊网络传播力评价中的先进性。
2 z 指数的研究进展
普拉塔普不仅提出了z 指数,而且还继续进行了深入研究。普拉塔普从热力学公式出发,运用类比和数学建模规则,阐述了z 指数计算公式的内涵,并认为z 指数能够实现对评价对象的三维评估,并剖析了 z 指数与 h 指数之间的关系[4];普拉塔普从数量、质量与一致性三个方面对聚合物太阳能电池领域所取得的成就进行了三维文献计量评价[5]。普拉塔普利用z 指数对印度大学和研究机构进行了评估,以了解印度整体科研状况,并与其他国家和地区进行了比较分析[6]。
我国学者对z 指数的相关研究,主要集中在以下四个方面:
(1)期刊评价。何晓庆和王圣洁等以SSCI收录的信息科学和图书馆学期刊为例,实证研究了z指数应用于评价期刊影响力的效果[7]。俞立平和王作功在分析z 指数原理的基础上,基于图书馆情报与文献学CSSCI期刊,采用相关系数与偏最小二乘法回归对其特点进行了分析[8]。沈军威和郑德俊等以教育学、法学、图书馆情报与文献学三个学科的CSSCI来源期刊为研究对象,进行了期刊评价指标之间的相关性分析[9]。赵蓉英和戴祎璠等在h 指数与z 指数中加入“主题”维度以弥补研究中存在的不足,并以核物理学科为例检验模型的有效性[10]。总的来看,z 指数在不同期刊样本中的适用性有所不同。
(2)学者评价。何晓庆和王圣洁等以肌肉萎缩症研究领域最具代表性的15位学者为例,实证分析了利用z 指数评价学者影响力的效果,认为z 指数优于现有的h 指数和p 指数,更具有评价的全面性和合理性,可以进一步扩大范围使用[11]。
(3)科研机构评价。何晓庆和王圣洁等对运用z 指数评价科研机构的有效性进行了实证研究,结果表明z 指数是一个三维效能指标,具有高灵敏性和稳定性,但同时z 指数也存在一些缺陷[12]。
(4)学科研究热点的识别。牌艳欣和李长玲等选择SSCI数据库中情报学期刊为样本,基于z 指数的方法构建新的指数模型,以识别高关注度研究主题,研究发现新指数模型和高关注度学科研究主题分类模型是可行、有效的[13]。李长玲,牌艳欣等尝试基于时间因子对z 指数进行改进,以降低被引频次时间滞后及累积效应的局限,提高学科研究热点的识别效果,并选择CSSCI数据库情报学领域9种优秀期刊为样本,开展国内情报学当前的研究热点识别,分析不同年度新兴研究热点的变化[14]。
纵观z指数的相关研究,可以看出研究成果较少,并都囿于引文数据的统计分析。
3 实证分析
3.1 数据来源
以中国知网(CNKI)为数据源,选取CSSCI 2019-2020年收录的图书馆学、情报学与文献学期刊作为研究对象。以2014-2018年的期刊数据为分析样本,数据采集时间为2019年6月18日-7月10日。数据采集的步骤为:首先收集期刊的全部统计数据,其次整理、剔除期刊中的公告、通知、声明、投稿须知等的相关数据。
此外,为便于区分,我们将基于引文数据的指标在指标右下角注一角标c(被引频次),将基于下载数据的指标在指标右下角注一角标d(下载频次),如zc 指数表示基于引文数据的z指数,zd 指数表示基于下载数据的z指数。
3.2 数据统计与分析
统计结果显示:20种期刊的发文量(Np)有21887篇,下载量达(Nd,tot)10046540次,篇均下载量(Nd,tot/Np)为459.02 次/篇,被引量(Nc,tot)是140330次,篇均被引量(Nc,tot/Np)6.41 次/篇,基于下载量的期刊 z 指数(zd 指数)的取值范围是[273.5257,682.1673],均值为461.4172,中值为438.2077,标准差是117.7581,其中zd指数最高的期刊是《图书情报工作》,具体数据详见表1。
表1 图书馆学、情报学与文献学期刊统计数据
width=745,height=516,dpi=110
注:表中期刊依据zd 指数大小排序。
3.2.1 zd 指数与传统期刊评价指标
在文献计量学长期发展过程中逐渐发展起来的传统期刊评价指标,历经了实践的检验,具有较坚实的理论基础与应用积累,因此,研究期刊 zd 指数与传统评价指标间的关系,对于探究期刊zd 指数在网络传播力评价中应用的有效性具有重要意义。
我们利用SPSS(19.0)软件,将期刊zd 指数与发文量(Np)、被引量(Nc,tot)、篇均被引量(Nc,tot/Np)、复合影响因子(U-JIF)、综合影响因子(MS-JIF)等指标进行了相关性分析,具体数据见表2。统计结果显示: zd 指数与它们都存在相关性,Spearman相关系数分别为:0.582、0.841、0.531、0.546、0.460,因此,从相关性来看,zd 指数对期刊的评价具有一定的有效性;另外,我们也考察了期刊zd 指数与单篇最高被引频次、最高被下载量的相关性,结果显示它们之间也存在相关性,相关系数分别为0.469、0.534,表明在一定程度上zd 指数也能够对期刊中高影响力论文有所表征。
表2 zd指数与其他评价指标的相关系数
width=745,height=105,dpi=110
3.2.2 zd 指数与新型综合性期刊评价指标
传统的期刊评价指标主要有被引量、篇均被引量、影响因子等,因它们具有从单一维度进行期刊评价的特征,评价结果难免存在偏颇,如何设计更高层面的综合性评价指标成为计量学研究的一大难题。2005年乔治·赫希(Hirsch J)提出的新型综合评价指标——h指数,为该难题的解决提供了很好的路径,其“质”与“量”兼顾的优势,受到了学界的普遍关注,被认为是计量学研究的一项重要创新成果。h指数起初是用于科研人员的绩效评价,布劳恩(Braun T)于2007年将 h 指数应用到了期刊的评价中[15]。2010年普拉塔普为解决h 指数区分度和灵敏度的问题提出了p指数,2014 年普拉塔普又在p指数的基础上提出了z指数,它们都是“质”与“量”兼顾的多元信息融合的新型综合评价指标。本文将进一步深入研究基于下载数据的z指数与它们之间的关系。
(1)zd指数较hd 指数区分度高,灵敏度高,整体性强
据统计zd指数的分布区间为[273.5257,682.1673], hd 指数的分布区间为[197,622],10%(2种)的期刊hd 指数存在同值现象,而20种期刊的zd 指数都具有唯一性,没有同值现象,表明zd 指数较 hd 指数区分度高,评价功能更强。
从指标的获取过程可以看出,hd 指数考察的是期刊发文量和下载量的平衡点,所以其只对hd 值附近的期刊论文下载量的变动较为敏感,而对期刊发文量、hd核(排序在前 hd 篇的论文组成的论文集)内高下载论文下载量的增长以及hd 核外低下载论文下载量的微量变化都不敏感;然而zd 指数是篇均下载量和总下载量的几何平均数,只要期刊发文量或下载量有所变化,都会引起zd 指数发生相应的变化,显然zd 指数的敏感性较 hd 指数高。如 hd 指数值同为 348的《图书馆建设》和《图书与情报》,发文量分别是1138篇、674篇,相差464篇,下载量分别是385610次、339684 次,相差45926次;而这些差异在zd 指数值上则有所呈现,它们的zd 指数分别为: 398.5865、417.1386,相差18.5521。
由hd指数的定义可知,hd 指数仅关注期刊中的高品质论文的数量与质量,因此其考察范围只是期刊的一个局部;而从zd 指数的计算公式zd =(Cd4/Nd2/∑Cdk2)1/3可以看出, zd指数的数据基础是期刊的发文量、总下载量及每一篇论文的下载量等,这些都是基于期刊论文的全部数据,所以zd 指数的考察范围是期刊的整体,而基于整体数据的评价指标zd 指数相较于只考量局部的hd 指数会更加全面、完整。
(2)zd 指数较pd指数考察维度多
对比zd 指数和pd 指数的计算公式不难发现,其实zd 指数只是在pd 指数的基础上引入了一个体现数据分布的η指标(η是经济学中一种测量集中度的赫芬达尔指数Herfindahl-Hirschman Index,HHI)。η的取值小于等于1,只有当分布绝对均匀时,η=1;η的值越小,表明引文的集中程度越高。由于η的加入,使得zd 指数在延续了pd 指数兼顾评价期刊的数量和质量的同时,也能很好地考量整个数据的分布状况[16],因此zd 指数较pd 指数测评的维度更多、更全面,且有利于矫正数据分布对评价结果造成的偏差,提升评价结果的合理性。例如,《情报科学》和《情报理论与实践》因二者发文量(1882篇、1669篇)和下载量(897323次、832918次)相差都不大,所以pd指数(753.5163、746.3045)也基本相同,区分度不高,而由于η的加入,它们的zd 指数分别为:614.0033、588.0788,差距较大,zd 指数不仅有力提升了评价结果的辨识度,而且有效提高了评价结果的合理性。
(3)zd 指数具有时效性强、读者参与度高、抗干扰能力较强、对期刊价值的反映程度较高的特征
网络环境下,学术论文的下载与阅读是合理引用的必要前提,通常情况下只有在先获取,并在充分理解论文所蕴含的信息与价值的基础上,才有可能在成果中予以引证[17],这个引证周期一般较长,因此引文指标一直存在时滞的缺陷;而zd 指数由于是基于下载数据的评价指标,具有实时性和易获取性等特征,因此zd 指数的时效性较强。
据统计,样本期刊的被引率最高为91.10%,最低为69.85%,均值为81.10%,而各期刊下载率均为100%,表明引文指标的门槛效应将许多期刊读者挡在了门外,只有部分读者能够转化为施引者,通过引文表达自己对期刊的评价,然而基于网络数据的评价指标有效降低了期刊评价的门槛,畅通了读者参与期刊评价的渠道,使广大读者拥有了评价期刊的投票权,而读者参与度的提升,将有利于在一定程度上规避小众评价的弊端,提升评价结果的公正性。
zd 指数的均值是461.4172,最大值是682.1673,最小值是273.5257;而zc 指数的均值是22.3418,最大值是35.0110,最小值是11.3357。zd 指数的均值是zc 指数的20.65倍,最大值是zc 指数的19.48 倍,最小值是zc指数的24.13 倍,可见zd 指数值远远大于zc 指数值。这主要是由于投票门槛的降低,评价主体更加多元,有力拉升了zd 指数的值,这将能够有效规避“精确注水”[18]的弊端,提升评价结果的抗干扰能力。
基于引文的评价指标只能够体现被引用论文的价值,而基于网络数据的zd指数则可以呈现被下载但未被引用论文的价值[19]。王传奇的“一带一路智库调研”,李敏的“基于消费者行为理论的大学生移动数字阅读付费影响因素调查”,涂萌的“第三方支付用户个人信息安全风险及对策研究”等论文的下载量分别为:1494次、1160次、1151次,都超过了1000次,被引量却为 0次 ,可见仅从引文视角评价期刊论文是远远不够的,许多期刊论文的价值未能在引文中得到呈现,而下载量指标则可以考量引文指标触及不到的地方,在一定程度上能够更全面地反映期刊论文的价值。
3.2.3 zd 指数与其他网络期刊评价指标
通过探究zd 指数与其他网络计量指标的关系,不仅可以发现它们之间的一致性和差异性,而且有利于更深刻地认识zd指数,也有助于管理者更好地选取评价指标,达到科学合理地评价期刊,引领期刊健康发展的目的。
统计结果显示:zd 指数与总下载量(Nd,tot)、篇均下载量(Nd,tot/Np)、hd指数、pd指数都在0.01水平上存在相关性,Spearman相关系数分别为:0.919、0.642、0.772、0.980,表明zd指数与它们之间具有一致性,但认真分析我们发现它们之间也存在较大差异。下载量指标因其最直观,是最早受到学界关注的网络测评指标,其从整体上呈现了期刊网络传播力的总规模,与篇均下载量、hd指数、pd指数、zd指数等网络计量指标都存在相关性,这当然是与下载量是构建其他网络指标的基本要素有关,但它自身的不足也是显而易见的,如100%的期刊下载率使期刊发文量的“累计效应”在下载量指标中体现得更加明显。如发文量最大的《图书情报工作》,在下载量排名中也位列第一;而发文量不高但质量较高的《中国图书馆学报》,在20种期刊下载量排名中未能进入前5位,位列第8位,具体数据见表3;而篇均下载量虽然能够有效规避发文量的“累计效应”,但简单的平均算法又容易造成“奖少惩多”的现象发生。如《图书情报知识》的下载量(312203次)不高,排名第 13位,但因发文量低,故其篇均下载量(690.7146次/篇)排名跃居第2位,位次提升了11位;而《图书馆学研究》下载量较高(762375次),排名第5位,但由于发文量较多,导致篇均下载量(368.2971次/篇)较低,排名则滑落到了第16位,位次下降了11个位次;另外,从统计学的角度看,由于均值需要利用所有数据的信息,因此均值容易受极端数据的影响[20]。hc 指数的数据处理方法极富创意,能够有效克服简单平均算法造成的偏差,其不仅考量了重要论文的数量,而且表征了重要论文的影响力,凸显了重要论文的价值[21],有利于激励期刊发表高品质论文,因此许新军将评价学者科研绩效的hc 指数应用到期刊网络传播力评价中[22],但只关注于高影响力论文的设计思路,也使hd指数存在一些缺陷。如hd指数考察视角狭窄,容易造成“以偏概全”的问题。20种期刊的hd指数值在发文量中的占比均值为44.48%,不到一半,最低的只有22.13 %,可见hd 指数的考察视域非常有限;同时我们也发现,hd指数存在对低质量论文不具约束力的缺陷,容易导致有些期刊一味追求发文数量,而不注重质量的状况,特别是在目前信息丰富的状态下,将会不利于期刊的健康发展。pd指数作为hd指数的升级指标,是篇均下载量和总下载量的几何平均数,能够在一定程度上实现期刊下载量和篇均下载量间较好的平衡,并且较hd指数的考察视域范围大,不但有利于激励期刊发表高品质论文,而且也有助于遏制低质量论文的涌现[23],这将对于良好学术生态的形成具有一定的积极意义。如受到学界普遍认可的《中国图书馆学报》的hd指数排名在20种样本期刊中位列倒数第4位,排在第17位,而在pd指数排名中位居第1位,提升了16位,pd指数的评价结果比较符合预期;zd指数是在pd指数的基础上增加了考察下载量数据分布的系数η,η 的融入使得zd指数成为集数量-质量-效率于一体的 3D 效能评价指标,考察维度得以扩展,使期刊评价更为合理,有利于引领期刊平稳发展。如《档案学通讯》η系数值为0.677626,在各期刊中是最高的,说明期刊下载量数据分布相对均衡,从而拉升了《档案学通讯》期刊的排名,由pd指数排名的第14位,上升到zd指数的第11位,上升了3个位次。
表3 期刊排名统计
width=745,height=516,dpi=110
注:表中A-B表示以A指标排名到以B指标排名的位次变化情况,正数表示名次上升,负数表示名次下降。
综合来看,期刊网络评价指标随着研究的深入,由最初的下载量指标、篇均下载量指标,到hd指数、pd指数和zd指数,从单一视角到综合评价,从只注重量的累计,到重视凸显重要论文的价值,再到既把握整体、也突出重点,进而深入到关注期刊下载量数据的分布状况,指标设计越来越先进,评价结果也更加趋于科学与合理。
4 结语
本文以图书馆学、情报学与文献学期刊为研究对象,实证分析了z指数在期刊网络传播力评价中应用的有效性、科学性和先进性。结果显示:zd 指数与传统期刊评价指标之间存在相关性,表明 zd 指数对期刊的评价具有一定的有效性;zd指数与 hd 指数相比,在区分度、灵敏度及整体性方面具有优势,较pd指数的考察维度更多,弥补了pd指数不能考察数据分布的不足,同时作为网络计量指标的zd指数在时效性、读者参与度、抗干扰能力及对期刊价值的反映程度等方面也具有明显的优势,凸显出评价指标的科学性;与总下载量、篇均下载量、hd指数、pd指数等网络指标相比,zd 指数在既把握整体、又突出重点的同时,进一步深入到考察期刊下载量数据的分布状况,矫正了数据分布对评价结果的影响,说明评价指标具有明显的先进性。
当然zd 指数也存在一些不足,如因网络的便捷性,下载量数据容易被注水,故可伪性较强[24];zd 指数的计算需要收集期刊每篇论文的下载量,并进行繁琐的计算,才能获得期刊的zd 指数,因此获取难度较大。另外需要说明的是:由于本文的样本仅限于图书馆学、情报学与文献学期刊,因此对此问题的研究只是初步尝试,系统深入研究zd 指数在期刊网络传播力评价中应用的可行性,还需要更多学科、更大样本的统计与分析,但从2015年Web of Science平台也推出了学术文献用量级数据——Usage来看,基于使用数据的指标研究将有望成为计量学研究的新起点。
参考文献
1 Wan J K,Hua P H,Rousseau R,et al.The journal download immediacy index(DII): experiences using a Chinese full-text database[J].Scientometrics,2010,82(3):555-566.
2 Prathap G.Is there a place for a mock h-index?[J].Scientometrics,2010,84(1):153-165.
3 Prathap G.A three-class, three-dimensional bibliometric performance indicator[J].Journal of the Association for Information Science and Technology,2014,65(7):1506-1508.
4 Prathap G.The zynergy-index and the formula for the h-index[J].Journal of the Association for Information Science and Technology,2014,65(2):426-427.
5 Prathap G.A three-dimensional bibliometric evaluation of research in polymer solar cells[J].Scientometrics, 2014,101(1):889-898.
6 Prathap G.A three-dimensional bibliometric evaluation of recent research in India[J].Scientometrics, 2017,110(3):1085-1097.
7 何晓庆,王圣洁,胡琳.z指数在期刊评价实践中的应用研究[J].中国科技期刊研究,2018,29(5):509-514.
8 俞立平,王作功.z指数评价学术期刊的适用性及其改进研究[J].情报学报,2018,37(11):1132-1139.
9 沈军威,郑德俊,张正慧,等.z指数用于中文社科学术期刊评价的实证研究——基于3个学科CSSCI来源期刊的样本分析[J].中国科技期刊研究,2019,30(10):1113-1121.
10 赵蓉英,戴祎璠,王旭.基于LDA模型与ATM模型的学者影响力评价研究——以我国核物理学科为例[J].情报科学,2019,37(6):3-9.
11 何晓庆,王圣洁,胡琳.z指数在学者学术影响力评价中的应用[J].情报理论与实践,2018,41(5):50-54.
12 何晓庆,王圣洁,胡琳.基于z指数的科研机构评价的有效性实证研究[J].现代情报,2018,38(5):82-86.
13 牌艳欣,李长玲,刘运梅.基于z指数的AAS高关注度学科研究主题识别[J].情报资料工作,2019,40(6):30-37.
14 李长玲,牌艳欣,相富钟,等.改进z指数的高被引学科研究热点识别方法探讨[J].情报理论与实践,2020,43(6):69-75,96.
15 宋丽萍,王建芳.期刊评价指标实证研究[J].图书情报知识,2013(3):74-80.
16 同11.
17 谢娟,龚凯乐,成颖,等.论文下载量与被引量相关关系的元分析[J].情报学报,2017,36(12):1255-1269.
18 周春雷.h指数的潜在缺陷——h指数精确注水问题研究[J].图书情报工作,2008,52(8):112-114,65.
19 许新军.H指数对电子期刊影响力的解析——以图书馆学情报学期刊为例[J].情报杂志,2011,30(5):63-67.
20 李泽安,陈建平,赵为华.高维数据挖掘中基于中位数回归的特征提取新方法[J].计算机应用研究,2013,30(2):374-376,413.
21 许新军.优化期刊评价指标体系的五维路径——对《中文核心期刊要目总览》的建议[J].中国科技期刊研究,2018,29(2):118-124.
22 许新军.hd指数评价期刊网络传播力的探讨[J].中国科技期刊研究,2013,24(1):83-87.
23 夏慧,韩毅.一个新的综合性科技评价指标——p指数研究综述[J].图书情报工作,2014,58(8):128-132.
24 赵星.学术文献用量级数据Usage的测度特性研究[J].中国图书馆学报,2017,43(3):44-57.
Application of Z-index in Periodical Network Transmissibility
Xu Xinjun
Abstract:In view of the relatively weak current research on the evaluation of journal network transmission power, this paper explores the application effect of using z-index in evaluating the journal network transmission power.By collecting the sample data from library science, information science and documentation science journals, this paper investigates the effectiveness, scientific and advanced nature of z-index(zd-index)based on download frequency in the evaluation of journal network transmission power.zd-index has relativity with traditional journal evaluation index which shows that zd-index has relative validity in the journal evaluation.Compared with hd-index, zd-index has higher distinction degree, better sensitivity and integrity.Besides, compared with pd-index, zd-index has more observation dimensions which make up for pd-index’s inability to observe data distribution.As the net-based index, zd-index possesses advantages of strong timeliness, high reader participation, anti-disturbance capacity, and degree of reflection to the journal’s value and the results show that the scientific nature of evaluation index.Compared with net-based indexes such as overall downloading frequency, piece downloading frequency, hd-index and pd-index, zd-index not only grasps the whole and highlights the key points, but also goes deeply into the investigation of the distribution of the journal’s downloading data.In this way, zd-index corrects the deviation on the evaluation results caused by data distribution and the results show that the evaluation index is obviously advanced.
Keywords: Z-index; Journal Evaluation; Network Transmission Power; Download Frequency; Evaluation Index
|
|