|
图书影响力评价研究进展与展望∗
□周清清 章成志
摘要 按照不同的数据来源,目前图书的影响力评价研究可以分为基于频次数据、基于内容数据以及基于多维度数据三种评价方法。基于频次数据的评价方法在数据来源及获取方面具有明显优势,评价结果更加直观,但是无法识别出购买动机差异、虚假引用等信息,难以判断图书内容涉及的深度与广度。基于内容数据的评价方法通过对内容数据的深入挖掘,能够识别出用户的意图、态度、需求,但数据获取与处理的难度较大。基于多维度数据的评价研究通过整合不同的资源,构建多维度的评价指标,从而获取综合的评价结果,但数据获取的难度大,构建科学合理的评价指标体系是难点。因此,在进行图书影响力评价时,需要充分考虑不同方法的优势与不足,依据不同的评价需求进行选择。
关键词 图书影响力 影响力评价 频次数据 内容数据 多维度数据
1 引言
图书是人类生活、文化、知识等各方面的记录,图书出版与阅读具有悠久的历史。为了更加有效地收藏与利用图书,有必要对图书进行计量与评价。与期刊论文相比,关于图书计量与评价的研究相对较少。这或与图书自身特性有关,如评价数据获取困难,尤其是图书内容数据的获取与处理费时费力等[1-2],从而导致文献计量学方法难以运用于图书领域[3]。然而,图书作为科研工作产出的重要体现、传承学术思想的重要载体,是学术交流系统的重要组成部分,与期刊或其他交流手段相比,能提供更为宽广、深入和全面的信息,尤其是人文社会科学领域,更加重视图书成果[4],因此,评价图书的影响力显得日益重要。同时,随着科技的进步、尤其是Web 2.0技术的发展,关于图书计量的各类资源逐渐丰富,相关的数据获取与分析方法日渐成熟,科学高效的图书计量与评价成为可能。
鉴于此,本研究通过梳理图书影响力评价的相关理论基础、数据、方法及应用,总结出基于不同数据来源的三种评价方法及其应用;最后,分析目前图书影响力研究存在的问题与不足,并提出改进办法
2 图书影响力评价理论基础
2.1 图书影响力
图书影响力包括多个维度,如图书的社会影响力、学术影响力等。一般而言,社会影响力是指在社会活动中产生的控制力,包括垂直影响力、横向影响力以及复合影响力[5]。垂直影响力是指信息主体的上行与下行影响力,其中,上行社会影响力是指自下而上的影响力,下行社会影响力是指自上而下的影响力。横向影响力是指不同形式的各类型信息主体之间的相互影响和作用。复合影响力是指同时包含垂直影响力与横向影响力的综合影响力。以图书的影响力而言,其上行影响力表现为图书对出版行业的出版决策影响力,对购买决策的影响力等。下行影响力为现有的图书对未来将要出版图书的影响力等。同时,图书的横向影响力包括图书对不同类型出版物的影响,如论文、报告等[5]。
学术影响力表现为学术活动中产生的作用力,目前关于图书学术影响力的内涵并没有统一的结论。多数的研究人员认为学术影响力主要来自于同行对于学术成果的评价,学术影响力的大小取决于被他人引用、认可的程度[6]。雷淑义、吕先竞认为图书的学术影响力是指通过图书内容反映社会现象与问题,揭示社会价值与规律,从而产生发展动力[7]。如图书的被引次数、下载量、阅读量等均用于评价其学术影响力。
此外,在多数情况下,质量较高的图书往往具有较高的影响力,因此图书的影响力评价结果可以为图书质量评价提供参考。但图书质量与图书的影响力不是同等概念,在研究及实际应用中需要根据具体任务加以区分。
2.2 图书影响力评价理论
评价理论是评价活动的基础,研究人员对于评价的理解虽然有所不同,但整体呈现更加深入、具体和全面的趋势[8]。评价活动首先要确定评价客体,其次根据评价目的设置评价参照系统,然后获取评价数据,确定评价方法,最后得到评价结果[9]。
评价客体是指需要被评价的对象,人类生活中的各类事物,如出版物、机构、人才、产品、服务等均可以成为评价客体。就图书评价而言,评价客体即为图书。
评价目的是进行评价的理由。在评价活动中精准识别评价主体的需求,从而明确评价活动的目的,是保证评价活动有效性的重要要求[10]。不同的评价目的会决定不同评价标准的制定,以及不同的评价方法与数据的选择,并产生不同的评价结果。如,对于图书的评价而言,“是否值得购买”,“评价图书出版社的出版质量”,这些不同的评价目的将导致不同的评价视角与结果。只有确定了评价的目的,才能进行后续的评价活动。评价参照系统是指在进行价值判断时的参照条件,主要包括:价值主体、评价视角、评价视域以及评价标准[9]。其中,价值主体是指评价中的主体,即评价客体的价值是对谁而言。例如,评价图书是否值得购买,评价主体则为潜在消费者。评价视角是指评价所选取的角度,例如,评价图书的学术影响力,那么评价视角即为学术影响力的评价,而非社会影响力等。评价视域即评价人员用于评价客体价值的比较范围。例如,评价图书影响力是比较不同图书的影响力差异,而非将图书影响力与论文影响力进行比较。评价标准则是评价人员选择何种标准进行客体价值的评估。如进行图书学术影响力评价时,可以基于“被引次数越高,学术影响力越大”的评价标准。不同评价标准的选择,会造成评价结果的显著差异。
获取评价数据是指收集并处理评价数据,包括数据的筛选与解释。数据筛选就是从海量的数据中选择有用的数据。如,为了进行图书的影响力评价,我们需要从大量的图书相关数据中获取能够评价图书影响力的数据,同时,还需要对获取的数据进行清洗,去除噪音。数据解释是一个从现象到本质的过程。如获取图书的评论数据之后,需要对评论数据进行挖掘,识别用户对图书的态度。这一过程就是数据解释的过程。
确定评价方法是指根据评价任务及数据选择合适的评价方法。如,为了评价图书的使用影响力,我们需要采用对应的分析及整合方法对相关使用数据(如借阅数据、购买数据、评论数据)进行图书评价,获得精准的图书使用影响力评价结果。
评价结果是指经过上述流程后得到的关于评价客体与主体关系的结论,包括四个步骤:首先,评价标准具体化;其次,以评价标准评价客体价值;然后,以同样的评价标准与过程对客体参照物进行评价;最后,比较评价客体与客体参照物的评价结果,从而得到评价客体的价值判断[9]。例如,评价图书影响力时,首先需要确定评价的标准,即确定评价的指标体系;其次,通过数据采集、数据处理与分析得到各个指标的得分,并采用一定的计算方法得到综合评价值;然后,以同样的评价标准及过程对参照物进行评价(如对已知的高影响力图书进行评价);最后,将图书影响力评价结果与已知的高影响力图书的评价结果进行对比,从而得到更加直观的影响力评价认知。
综上所述,影响力评价的对象包含学者、机构、图书等多种类型。本研究主要关注影响力评价在图书方面的应用,图书影响力评价的一般过程如下:首先,确定评价目的及评价主体;其次,确定影响力评价的标准,构建多维度、多层次的影响力评价指标体系;然后,获取评价数据,包括多维度、多类型、多结构的评价数据(如同行评议数据、图书使用数据等),并利用文本分析、自然语言处理等技术对评价数据进行挖掘与分析,从而进行评价数据的处理与解释;最后,获得图书影响力评价结果。
3 图书影响力评价研究的数据与方法
目前,图书的影响力评价研究按照不同的数据来源可以分为三种评价方法:基于频次数据的评价方法、基于内容数据的评价方法以及基于多维度数据的评价方法。针对不同类型的研究数据,借助不同的评价方法进行处理与分析,从而判断图书的影响力。
3.1 图书影响力评价研究数据
表1展示了部分图书影响力评价的频次数据。可以看出,目前学术界用于评价图书影响力的频次数据主要包括:被引频次数据、馆藏数据、借阅数据等,其中又以基于被引数据的评价研究成果最多。在数据来源方面,中文社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)、图书引文索引(Book Citation Index,BKCI)、Google学术等均可以获取图书的引用数据,相关研究的数据规模从几百至上万种图书不等。基于馆藏数据的图书影响力评价可以通过联机计算机图书馆中心(Online Computer Library Center,OCLC)、书目数据库等获取图书的馆藏数据。借阅数据往往通过高校图书馆获取,数据规模较大。同时,现有研究多数专注于人文与社会科学领域的图书评价,关于自然科学图书的影响力评价研究较少。这或许因为图书是人文社科领域的主要成果类型[11-12]。此外,销量数据也可作为图书影响力评价的重要资源,如各类畅销书排行榜等。总体而言,基于频次的图书影响力评价方法,数据来源丰富,数据类型多样,能够快速地评价图书的影响力,但是学术界更关注于人文社科领域的图书影响力评价。
表2列举了部分图书影响力评价的内容数据。可以看出,目前学术界用于评价图书影响力的内容数据主要为图书的引文内容数据与评论数据(包括专家评论以及在线评论),涉及的图书数量几十至几千不等。相比而言,基于图书引文内容的研究数量以及数据规模较少,或许与引文数据获取难度大有关。此外,目前几乎没有研究利用图书目录、参考文献等进行图书的影响力评价,造成评价资源的明显浪费,也导致了评价结果全面性、综合性的不足。
表1 基于频次数据的图书影响力评价研究分析
pagenumber_ebook=29,pagenumber_book=26
表2 基于内容数据的图书影响力评价研究分析
pagenumber_ebook=29,pagenumber_book=26
表3为部分图书影响力评价研究的多维度数据,可以看出,用于评价图书影响力的数据维度多样。现有研究从创新、价值、销量等多个维度进行指标的选择与体系的构建,从而评价图书影响力。不同研究采用的数据维度差异明显,这表明目前并没有权威的、标准的评价理论依据,或与评价目标的差异有关。
表3 基于多维度数据的图书影响力评价研究分析
pagenumber_ebook=30,pagenumber_book=27
3.2 图书影响力评价研究方法
3.2.1 基于频次数据的图书影响力评价方法
基于频次数据的图书影响力评价是指挖掘频次类评价数据,获取频次类评价指标,如被引次数、馆藏数量等,从而进行图书的影响力评价。基于频次数据的图书影响力评价方法如图1所示。首先,确定待评价的图书信息,即确定需要评价的图书及其相关信息,包括题名、作者、出版时间、出版社等信息,用于之后的数据获取与处理。
pagenumber_ebook=30,pagenumber_book=27
图1 基于频次数据的图书影响力评价方法
其次,选择用于评价的频次指标。目前,被引频次数据作为有效的评价依据被学者广泛应用[43-44]。也有学者认为图书被引频次不能全面地用于非西方图书的影响力评价[45]。因此,随着Web 2.0的发展,替代计量指标逐渐被用于评价图书影响力,如图书的销量数据、馆藏数据、借阅情况[46]等。此外也有研究利用在线指标进行图书影响力评价研究[47],如图书在学术社区的社交媒体指标[48]、整合的在线影响力指标[49]等。值得注意的是,赛尔沃(Thelwall M)认为替代计量指标总是与被引次数计算相关性,但并没有对相关系数强度的评价有规定,并且很难对相关系数的强度有一个现实解释[50]。
再次,获取待评价图书的频次数据。在被引数据方面,现有研究主要通过引文数据库等确定图书的被引次数[51]。其中,传统的图书被引数据的获取方法主要依靠于人工统计,为了提高获取的效率与准确性,已有研究借助网络爬虫等技术,提出了一些自动获取的方法[52]。同时,可以利用电商网站、书店等获取图书的线上与线下的销量数据,利用OCLC获取图书在全球各个图书馆的馆藏数量与分布。
最后,得到图书的影响力评价结果。通常情况下,我们认为频次类指标得分越高,图书的影响力越大。
3.2.2 基于内容数据的图书影响力评价方法
基于内容数据的图书影响力评价是指挖掘内容类评价数据,如图书评论数据、全文数据、目录数据等,获取对应内容类评价指标,从而进行图书的影响力评价。基于内容数据的图书影响力评价方法如图2所示。与基于频次数据的评价方法类似,首先需要确定待评价的图书信息。
pagenumber_ebook=31,pagenumber_book=28
图2 基于内容数据的图书影响力评价方法
其次,选择用于评价的内容指标。图书评论数据能够反映评论人员对于图书内容等多个方面的态度与观点,从而用于图书影响力评价[53]。图书评论包括图书的专业书评以及在线书评。图书的专业书评多数来自专家、学者,这类书评通常是学术性的,并且在学术交流系统中具有重要的作用[54]。图书的在线书评通常来自于电商网站、社交媒体等用户的评论,具有大众性。同时,学术出版物的参考文献也可以用于判断出版物的质量与特点,如参考文献数量可以反映论文的学术水平[55],合理地多引用高质量的期刊论文有利于文献学术质量和影响力的提高[56],并且高被引论文倾向于引用高被引文献[57]。此外,图书施引文献也能够反映其他研究课题、方向甚至学科对于图书的认可程度,进而反映图书的影响力。综上,可以发现内容类评价指标多样,可以根据不同的评价目的进行合理选择。
再次,获取待评价图书的相关内容数据。在图书评论方面,电商网站及社交媒体网站存在海量图书在线评论,可以利用网络爬虫进行相关数据的快速获取。图书的专业评论数据相对较少,目前Choice网站可以大量获取图书的专业书评,但仅限于英文图书。在参考文献与施引文献方面,各类全文数据库、引文数据库是主要的数据来源,如中国知网(CNKI)[58]、CSSCI、BKCI[59-60]、Google学术数据库等。随着各类数据存储与获取的发展,相关内容数据的获取成本逐渐下降,研究人员可以根据不同的研究目的进行相关数据的获取与处理,进而用于图书的影响力评价。
第四,对获取的内容数据进行处理与分析。在图书评论方面,可以利用评论挖掘技术获取用户对图书整体以及各个属性的情感倾向,从而获取对应的评价指标[61]。此外,在图书参考文献、施引文献等内容数据分析方面,可以借助主题模型等技术获取图书表述的主题,以及图书对于其他主题、学科的影响力[62]。总体而言,可以借助文本挖掘等技术对图书评价相关的内容数据进行对应的处理与分析,从而在内容层面获得图书影响力评价的相关指标[63]。
最后,得到图书的影响力评价结果。不同的内容数据可以得到不同的评价指标与结果,需要依据评价的具体目标选择合适的数据源。
3.2.3 基于多维度数据的图书影响力评价方法
基于多维度数据的图书影响力评价是指整合多维度的评价数据,如图书的引用数据、利用数据、内容数据等,构建影响力评价的指标体系,从而进行图书的影响力评价。为了得到更加全面的影响力评价结果,多维度数据的综合考虑成为评价研究趋势。基于多维度数据图书影响力评价方法如图3所示。
pagenumber_ebook=31,pagenumber_book=28
图3 基于多维度数据的图书影响力评价方法
同样,首先确定待评价的图书信息。其次,确定评价的理论并构建评价的指标体系。基于现有研究发现,国内外图书评价研究存在差异,国外研究者更加注重研究方法、用户需求、电子图书技术和电子图书协作的研究[64]。同时,在进行图书评价研究过程中,在参考现有的评价理论的基础上,需要考虑不同学科的特点以及不同的学术输出形式[65],定量方法与定性方法相结合[66]。在指标体系构建方面,目前已有一些相对成熟的理论与方法。如基于创新测度的人文社会科学图书评价指标体系,整合了图书的形式、内容及效用三个维度的图书评价数据构建评价体系[67];或者整合图书的出版社影响力、作者影响力、年代影响力以及高影响力图书同被引的影响力评价指标体系[68],以及根据图书的类型(如基础研究类图书与应用对策类图书)设计差异化的评价指标体系[69]等。我们需要根据不同的评价目的,构建对应的评价体系。
再次,获取评价数据。在完成评价指标体系的构建之后,需要根据不同的指标确定对应的评价数据源。现有研究利用人工判断、评论挖掘、主题建模、深度学习、文本挖掘等多种方法进行数据的采集、清洗、处理与分析,获取各个评价指标的得分,然后利用层次分析法、模糊综合评价法等进行图书评价指标权重的设置[70]。
最后,得到基于多维度数据的图书影响力评价结果。不同的评价目的需要依据不同的评价理论,从而构建对应的评价体系,通过对多维数据的处理、分析与整合,得到综合的影响力评价结果。
3.2.4 图书影响力评价方法对比
表4为以上三类图书影响力评价方法的对比分析,不同方法各有优劣。其中,基于频次数据的图书影响力评价方法在数据来源及数据获取方面具有明显优势,同时评价结果更加直观,但是该方法的不足也是非常明显的。基于频次数据的影响力评价结果是无法识别出购买动机差异、虚假引用等信息的,同时频次数据也难以判断图书内容涉及的深度与广度。基于内容数据的图书影响力评价方法弥补了频次方法在这方面的不足,通过对丰富的内容数据的深入挖掘,能够识别出用户的意图、态度、需求,但数据获取与处理的难度较大。如图书引文内容的获取,由于现有文献多数为机器不可读的类型(如PDF),因此难以通过自动抽取的方法识别文献中的引文数据,而人工抽取的方法成本高、规模小。其他内容数据,如图书的正文、参考文献数据往往不是开放获取的,这也加大了数据获取的难度。基于多维度数据的图书影响力评价研究能够弥补以上方法在评价结果全面性方面的不足,通过整合不同的资源,构建多维度的评价指标,获取综合的评价结果。但是,多源数据在提高结果丰富性的同时,也提高了数据获取的难度。此外,构建科学合理的评价指标体系是该方法的基石,也是该方法的难点。总体而言,在进行图书影响力评价时,需要充分考虑不同方法的优势与不足,依据不同的评价需求选择合适的评价方法。
表4 图书影响力评价方法对比分析
pagenumber_ebook=32,pagenumber_book=29
4 图书影响力评价研究应用
图书的影响力评价研究常用于遴选各个学科的高影响力图书。如,苏新宁借助CSSCI分析人文社会科学图书学术影响,给出了人文社会科学各学科最有学术影响力的前5名国内学术著作[71]。龚放通过分析2005—2006年被CSSCI收录的教育学图书,确定中国教育学领域有重要学术影响力的著作[72]。
同时,许多研究人员借助引用指标评价图书影响力,促进了CSSCI、Web of Science、Scopus、BKCI等引文数据库的建设。如叶(Ye J)基于BKCI提出,中文图书引文索引(Chinese Book Citation Index,CBKCI)数据库可以用于中文图书的评价[73]。巴伊兰(Bar-Ilan J)比较了Google学术、Scopus、Web of Science关于图书Introduction to Informetrics的被引频次,分析三种数据库的异同[74]。
其次,图书的影响力评价能够有效支持多项科研活动。举例而言,(1)支持图书的同行评议。如库莎(Kousha K)、赛尔沃利用来自Choice网站的学术评论系统评价图书学术影响力、理解力以及教育价值[75],结果表明Choice评论能在一定程度上辅助图书的同行评议。(2)帮助作者确定其代表作。如祖卡拉(Zuccala A)通过计算好读网(Goodreads)中读者等级,计量历史领域学术著作的广义影响力[76],结果表明,好读网能够帮助人文社科领域的作者计量其著作的广义影响力,从而选择出代表作。(3)帮助选拔人才。如雷顺利利用Google学术获取1995—2005年出版的教育类学术图书的引文量进行统计分析,得出教育学领域高影响力作者[77]。
此外,图书的影响力评价能够有效优化图书馆等机构的图书选购决策。如,路永和、曹利朝通过对关联规则综合评价的探讨,提出基于支持度、置信度、Jaccard兴趣度、吸引度和收益因素的图书推荐模型[78]。或者通过对图书在线评论的挖掘[79-80]、利用图书的网络热度[81]识别高影响力的图书推荐给读者,降低读者选择图书的成本,提高阅读质量。
总而言之,图书影响力评价研究的应用场景广泛。不仅可以帮助确定科学前沿方向,促进学科领域的稳健发展;同时也可以为学者提供高效的研究指导,识别潜在合作者,支持管理部门的出版决策,帮助科研机构选拔人才,优化图书的选购决策。因此,深入研究图书的影响力是非常具有应用价值与实践意义的。
5 现有研究存在的问题
通过对现有研究的总结,我们发现早期图书的影响力评价基于同行评议等人工评价方法。这类方法起步较早且不断完善,但是其缺点也难以忽视,随着出版物数量的激增,已经无法适用。近年来,引文数据库、全文数据库等不断增加,影响力评价研究的方法不断完善、范围不断扩大。1980年,莫曼(Morman E T)开始利用被引频次进行出版物影响力的评价[82]。此外,Web 2.0的飞速发展使得研究人员逐渐使用替代指标进行出版物的影响力评价,如出版社威望[83]、国家或国际图书馆馆藏数量[84]等。然而仅仅利用基于频次的方法不能全面评价图书影响力。
为弥补传统的基于频次方法的不足,已有研究利用其他数据进行图书影响力评估。如结合被引次数指标与图书评论以增加图书影响力评价的全面性[85]。同时,迅速发展的电子商务与社交媒体网站提供了大量评论,如亚马逊、Good Reads、豆瓣、微博等平台的评论数据[86-87]。这些评论信息丰富且表达了用户的偏好,能够高效地反映图书影响力,然而多数研究忽视了对评论内容的细粒度挖掘。总体而言,现有的图书影响力评价存在以下几个方面的问题。
5.1 理论基础薄弱,理论体系不健全
目前的图书影响力评价仍然缺乏系统、权威的理论支撑。虽然目前已有关于图书评价体系构建的理论,但是这些理论往往是宏观的,具体到特定领域仍需推广理论的指导[88]。如“全评价”理论组合形式、内容及效用评价,能够有效地指导图书的学术评价。近十年来,该理论在学术期刊、网站、学者及图书馆资源等评价上虽已有不少应用,但部分图书如教材、工具书等的影响力评价理论的构建仍待研究,如何将“全评价”理论拓展至更多维度的图书评价,需要持续的研究。同时,社会发展程度与意识形态的差异,造成研究成果的民族性、本土性、多样性等特征,国外已有的研究理论并不能直接用于评价中文图书,尤其是人文社科领域的图书。同时,由于评价主体、评价用途等差异,图书影响力评价研究仍缺乏对应的多样化理论与方法,尚未形成针对不同情境的影响力评价指导。
5.2 评价数据开放程度低,数据存在局限性
当前图书评价的数据资源开放共享程度低,导致数据获取成本高。同时,目前的评价数据,尤其是网络数据易受操控,评价结果准确性、客观性不足。此外,内容数据的深度挖掘重视不够。比如,利用在线评论进行图书评价的研究较少;并且现有研究基于评论进行图书影响力评价时,多数只进行粗粒度的分析,如只利用在线评论的星级/评分数据进行评估,忽视了细粒度的内容数据挖掘,没有关注用户对于图书不同属性的评价;现有的引文分析研究多利用引文的引用次数、作者、机构等进行评价,而忽视了引文内容的分析。
5.3 应用研究薄弱,研究系统性低
图书的影响力评价研究不仅可以反映图书的影响力差异,同时能够依据评价结果获得更加丰富的信息。如机构可以根据依据评价结果进行人才的选拔、基金项目的审批;出版机构可以进行图书的差异化出版;支持图书馆的采购决策以及面向读者的图书推送。因此,图书影响力评价的应用研究可以面向多样化的场景。然而,现有的应用研究成果相对较少,研究场景范围小,缺乏系统深入的应用研究与成果,大大降低了图书影响力评价研究的价值与效益。
6 研究展望
总体而言,现有的图书影响力评价研究成果丰富,在传统的被引频次之外,替代计量也成为热门的影响力评价方法。同时,为了弥补频次类研究在内容方面的缺失,研究人员尝试利用图书相关的内容数据进行影响力评价。然而,目前的内容数据缺乏深入分析,造成评价数据的利用不足。因此,为了全面有效地评价图书的影响力,可从图书影响力评价的理论、数据、方法以及应用方面展开进一步研究。
6.1 坚实完善的图书影响力评价理论体系建设
图书影响力评价的理论体系构建。目前的图书影响力评价研究尚未形成成熟的理论体系,导致影响力评价研究没有坚实的理论支撑。因此,理解图书影响力评价的本质,实现相关概念定义的标准化,明确当前图书影响力评价的现状与发展趋势,成为图书评价领域的迫切需求。如何将这些需求上升至理论层面,构建包含宏观指导与微观支持的理论体系,并且在理论体系构建过程中,如何借鉴国外先进评价理论,结合中文图书的实际情况,制定符合中文图书评价需求的个性化、多样化的评价理论,是值得研究的方向。
图书类型与学科差异考量。不同类型的图书在研究内容及价值取向上存在明显差异。如教材类图书旨在依据课程标准系统反映学科内容;工具类图书则是汇集特定方面的资料进行编排,用于查找知识信息;专业著作则是根据科学研究的成果撰写而成,能够推动学科的发展与建设。同时,不同学科的图书也存在显著的学科差异。因此,不同类型、不同学科的图书不能采用同一标准进行评价,需要针对图书类型制定多元化的评价标准与评价方法。
6.2 推动图书影响力评价的多源数据共享与融合
加强政策法规建设,促进数据共享。数据开放共享相关政策法规的缺乏,导致目前图书相关评价数据的共享程度低,数据获取成本高。因此,加快各类数据开放存取政策法规的建设,能够有效解决图书评价的数据瓶颈问题。
促进图书影响力评价多源数据融合。不同来源的评价数据能够反映图书不同维度的评价结果,如图书被引频次、引文内容等数据能够反映学者对于图书的评价;图书的在线评论可以反映用户对于图书内容、价格、印刷等属性的态度。因此,融合多个数据源进行图书的综合影响力判断是非常有必要的。
6.3 优化图书影响力评价方法
细化图书影响力评价的粒度。目前的图书影响力评价研究在传统被引频次方法之外,开始尝试在线或者替代数据。然而,多数替代指标缺失内容数据,无法识别用户的真实意图。而内容数据能够帮助识别虚假引证,分析用户引用、购买的意图等,能够为图书的影响力评价研究提供更加细粒度的信息。因此,深入挖掘内容数据,识别细粒度的内容分析结果,是图书影响力评价值得考虑的话题。
集成图书影响力评价方法。图书影响力评价研究,尤其是构建图书评价指标体系进行影响力评价,往往需要借助人工判断或者问卷调查等定性方法获取评价结果。在指标得分、指标权重的设置方面同样依赖专家判断等定性方法。这类方法能够充分发挥专家的经验和判断能力,然而数据获取与分析成本高,容易受到评价人员自身的偏好影响,同时难以适用于大规模的图书评价。集成自然语言处理等技术,利用文献计量、自然语言处理、信息检索等方法,对图书影响力评价的相关数据进行深入挖掘,自动获取影响力评价指标进行图书影响力的综合评估,能够弥补定性方法的不足,提高数据获取与挖掘的效率。因此,综合定性与定量方法,充分利用专家的有效经验,同时结合自然语言处理等技术,降低数据处理与分析的成本,得到更加全面的图书影响力评价结果。
6.4 深化与推广图书影响力评价的应用
图书影响力评价的深度应用。依据图书影响力结果,可以进一步分析得到作者、科研管理机构、出版机构的学术成果价值,从而进行人才的选拔、机构的评比;同时可分析用户的信息需求与行为等,为大众用户、学者、机构等提供有效的决策支持,从而为用户定制阅读推荐,帮助学者寻找科研伙伴与方向,协助机构优化选购方案等。因此,现有研究成果可以应用于多个场景,加强研究结果与实际应用的深度结合,将增强图书影响力评价的经济与社会价值。
图书影响力评价的应用拓展。在现有的应用场景之外,积极拓展图书影响力评价的其他应用价值。如,帮助图书出品人确定畅销的主题,为用户提供图文并茂的机器书评等。将图书的影响力评价结果用于更多的人类实践活动,可以提升人类活动的效率与体验。
参考文献
1 雷淑义,吕先竞.Altmetrics视角下的学术图书影响力评价研究[J].西南民族大学学报(人文社科版),2017,38(6):225-231.
2 王兰敬,叶继元.中文人文社会科学学术图书评价的瓶颈因素及对策研究[J].图书与情报,2014(6):82-87.
3 Pritchard A.Statistical bibliography or bibliometrics?[J].Journal of Documentation,1969,25(4):348-349.
4 Bokova I,SanéP,Hernes G.World social science report:knowledge divides[J].Ciência&Saúde Coletiva,2012,17(7):1925-1932.
5 刘江船.社会影响力——传播学的新视角[J].河南社会科学,2010,18(1):180-182.
6 Van Houten B A,Phelps J,Barnes M.Evaluating scientific impact[J].Environ Health Perspect,2000,108(9):A392-A393.
7 雷淑义,吕先竞.我国人文社会科学学术图书altmetrics评价:挑战及应用[J].图书情报工作,2017(11):133-139.
8 陈喜乐,李腾达.构建促进协同创新的人文社科科研评价体系研究[M].厦门:厦门大学出版社,2016:20-38.
9 冯平.评价论[M].北京:东方出版社,1995:74-109.
10 邱均平,谭春辉,任全娥.人文社会科学评价理论与实践[M].武汉:武汉大学出版社,2012:226-249.
11 Huang M H,Chang Y W.Characteristics of research output in social sciences and humanities:from a research evaluation perspective[J].Journal of the American Society for Information Science&Technology,2014,59(11):1819-1828.
12 Nederhof A J.Bibliometric monitoring of research performance in the social sciences and the humanities:a review[J].Scientometrics,2006,66(1):81-100.
13 苏新宁.我国人文社会科学图书被引概况分析——基于CSSCI数据库[J].东岳论丛,2009(7):5-13.
14 苏新宁.中国人文社会科学图书学术影响力报告[M].北京:中国社会科学出版社,2011:19-1039.
15 贾洁.我国“图书馆、情报与文献学”图书学术影响力报告——基于CSSCI的分析[J].中国图书馆学报,2010,36(2):56-69.
16 丁翼.对我国法学研究最有学术影响的国外学术著作——基于CSSCI(2000-2007年度)数据[J].西南民族大学学报(人文社科版),2009,30(8):167-175.
17 杨秦.对我国教育学研究最有影响的国内学术著作分析——基于CSSCI(2000-2007年度)数据[J].西南民族大学学报(人文社科版),2010,31(2):258-270.
18 Torres-Salinas D,Robinso-Garcia N,López-Cózar E D.Towards a book publishers citation reports.first approach using the Book Citation Index[J].Revista Española De Documentación Científica,2012,35(4):615-624.
19 Torres-Salinas D,Rodríguez-Sánchez R,Robinson-García N.Mapping citation patterns of book chapters in the Book Citation Index[J].Journal of Informetrics,2013,7(2):412-424.
20 Kousha K,Thelwall M,Rezaie S.Assessing the citation impact of books:the role of Google books,Google scholar,and Scopus[J].Journal of the American Society for Information Science&Technology,2011,62(11):2147-2164.
21 Abrizah A,Thelwall M.Can the impact of non-western academic books be measured?An investigation of Google books and Google scholar for Malaysia[J].Journal of the Association for Information Science&Technology,2014,65(12):2498-2508.
22 White H D,Boell S K,Yu H.Libcitations:a measure for comparative assessment of book publications in the humanities and social sciences[J].Journal of the American Society for Information Science&Technology,2014,60(6):1083-1096.
23 Cabezas-ClavijoÁ,Robinsongarcía N,Torressalinas D.Most borrowed is most cited?Library loan statistics as a proxy for monograph selection in citation indexes[C].Proceedings of the 14th International Conference on Scientometrics and Informetrics,2013:1-14.
24 张海营.基于rfm模型的图书馆图书评价系统研究[J].图书馆,2012(3):60-62.
25 Zuccala A,Someren M V,Bellen M V.A machine-learning approach to coding book reviews as quality indicators:toward a theory of megacitation[J].Journal of the Association for Information Science&Technology,2014,65(11):2248-2260.
26 Kousha K,Thelwall M.Alternative metrics for book impact assessment:can Choice reviews be a useful source?[C].Proceedings of the 15th International Conference on Scientometrics and Informetrics,2015:59-70.
27 Kayvan K,Mike T.Can Amazon.Com reviews help to assess the wider impacts of books?[J].Journal of the Association for Information Science&Technology,2014,67(3):566-581.
28 Zhou Q,Zhang C,Zhao S X,et al.Measuring book impact based on the multi-granularity online review mining[J].Scientometrics,2016,107(3):1435-1455.
29 Mccain K W,Salvucci L J.How influential is brooks'law?A longitudinal citation context analysis of frederick brooks'the Mythical Man-Month[J].Journal of Information Science,2006,32(3):277-295.
30 章成志,王玉琢,卢超.学术专著引用行为研究——基于引文内容特征分析的视角[J].情报学报,2017,36(3):319-330.
31 叶蓬.人文社会科学研究成果评估指标体系分析[J].探求,2001(1):60-67.
32 任全娥.人文社会科学研究成果评价指标体系研究[J].大学图书馆学报,2009,27(5):51-55.
33 任全娥.人文社会科学研究成果评价指标及其理论基础[J].情报资料工作,2010,31(1):28-33.
34 叶继元.人文社会科学评价体系探讨[J].南京大学学报(哲学·人文科学·社会科学),2010,47(1):97-110.
35 王兰敬.基于创新测度的人文社会科学图书评价研究[D].南京:南京大学,2012.
36 邱均平,王菲菲.社会科学研究成果综合评价方法研究[J].重庆大学学报(社会科学版),2010,16(1):110-114.
37 李雁翎,孙晓慧,陈玖冰.五维图书评价体系及分析模型的建构[J].情报科学,2013(8):77-80.
38 张玉,潘云涛,袁军鹏.论多维视角下中文科技图书学术影响力评价体系的构建[J].图书情报工作,2015,59(7):69-76.
39 姚莉,陈祖琴.《国家哲学社会科学成果文库》影响力评价体系研究[J].西南民族大学学报(人文社科版),2016(6):232-236.
40 陆宇飞.国家哲学社会科学基金后期资助项目评价体系分析[J].西南民族大学学报(人文社科版),2016(6):237-240.
41 王伟,杨建林.人文社会科学外译图书评价指标体系研究[J].图书情报工作,2019,63(4):61-69.
42 任全娥.人文社科成果评价体系理论与实证研究[M].北京:中国社会科学出版,2019.
43 车黎莎,许光鹏.对我国心理学研究最有影响的国外学术著作分析——基于CSSCI(2000-2007年度)数据[J].西南民族大学学报(人文社科版),2010,31(2):262-267.
44 任红娟.我国档案学高影响力学术著作研究[J].档案管理,2016(3):64-66.
45 同21.
46 同24.
47 Bornmann L.Validity of altmetrics data for measuring societal impact:a study using data from altmetric and F1000prime[J].Journal of Informetrics,2014,8(4):935-950.
48 Haustein S,Sugimoto C.Guest editorial:social media metrics in scholarly communication[J].Aslib Journal of Information Management,2015,67(3):1-15.
49 Kousha K,Thelwall M,Rezaie S.Using the web for research evaluation:the integrated online impact indicator[J].Journal of Informetrics,2010,4(1):124-135.
50 Thelwall M.Interpreting correlations between citation counts and other indicators[J].Scientometrics,2016,108(1):337-347.
51 同17.
52 Kayvan K,Mike T.An automatic method for extracting citations from Google books[J].Journal of the Association for Information Science&Technology,2015,66(2):309-320.
53 同25.
54 Alesia Z,Thed V L.Book reviews in humanities research evaluations[J].Journal of the American Society for Information Science&Technology,2011,62(10):1979-1991.
55 毛大胜,周菁菁.参考文献数量与论文质量的关系[J].中国科技期刊研究,2003,14(1):34-36.
56 梁春慧,孙艳,万跃华.高被引论文的参考文献特征研究——以化学领域为例的实证分析[J].科技与出版,2014(7):119-122.
57 姜春林,刘学,张立伟.中文高被引期刊论文的参考文献也倾向于高被引吗?——以图书情报学为例[J].情报杂志,2015(1):105-109.
58 崔腾宇,董保健,崔建强.中文体育类图书学术影响力研究——基于cnki中国引文数据库[J].运动,2014(23):147-148.
53 同19.
60 Hammarfelt B R.Interdisciplinarity and the intellectual base of literature studies:citation analysis of highly cited monographs[J].Scientometrics,2011,86(3):705-725.
61 同28.
62 郑祥云,陈志刚,黄瑞.基于主题模型的个性化图书推荐算法[J].计算机应用,2015,35(9):2569-2573.
63 张成林.基于文本挖掘的图书采访推荐清单自动生成模型[J].情报杂志,2013(4):155-160.
64 李平,初景利.国内外电子图书评价研究进展[J].图书馆建设,2006(2):26-30.
65 同11.
66 何峻.我国图书评价现状分析[J].大学图书馆学报,2012,30(3):106-110.
67 同35.
68 杨思洛,王皓,文庭孝.基于引文分析的图书影响力研究——以图书情报领域为例[J].情报资料工作,2010(1):89-92.
69 同42.
70 Sun L.Applied research of fuzzy comprehensive evaluation method based on AHPin the book evaluation index[J].Library,2009,26(9):1746-1754.
71 同13.
72 龚放.中国教育研究领域学者、论著影响力报告——基于2005研究领域学年CSSCI的统计分析[J].复旦教育论坛,2009,7(2):35-45.
73 Ye J.Development,significance and background information about the“Chinese Book Citation Index”(CBKCI)demonstration database[J].Scientometrics,2014,98(1):557-564.
74 Bar-Ilan J.Citations to the“introduction to informetrics”indexed by Wos,Scopus and Google scholar[J].Scientometrics,2010,82(3):495-506.
75 同26.
76 Haustein D S.Altmetrics for the humanities:comparing Goodreads reader ratings with citations to history books[J].2015,67(3):320-336.
77 雷顺利.教育学学术著作影响力分析——基于Google Scholar引文数据[J].图书情报知识,2013(4):106-111.
78 路永和,曹利朝.基于关联规则综合评价的图书推荐模型[J].现代图书情报技术,2011(2):81-86.
79 同27.
80 同28.
81 Shema H,Bar-Ilan J,Thelwall M.Do blog citations correlate with a higher number of future citations?Research blogs as a potential source for alternative metrics[J].Journal of the Association for Information Science&Technology,2014,65(5):1018-1027.
82 Morman E T.Citation indexing:its theory and application in science,technology,and humanities by Eugene Garfield[J].Technology&Culture,1980,21(4):384-385.
83 Donovan C,Butler L.Testing novel quantitative indicators of research“quality,”esteem and“user Engagement”:an economics pilot study[J].Research Evaluation,2007,16(4):231-242.
84 Torres-Salinas D,Moed H F.Library catalog analysis as a tool in studies of social sciences and humanities:an exploratory study of published book titles in economics[J].Journal of Informetrics,2009,3(1):9-26.
85 Nicolaisen J.The scholarliness of published peer reviews:a bibliometric study of book reviews in selected social science fields[J].Research Evaluation,2002,11(3):129-140.
86 同27.
87 同28.
88 同34.
Review and Prospect on Book Impact Assessment Research
Zhou Qingqing Zhang Chengzhi
Abstract:According to various data sources,current research methods for book impact evaluation can be divided into three categories,including frequency-based assessment methods,content-based assessment methods and assessment methods based on multi-dimensional data.The frequency-based assessment method has obvious advantages in data source and acquisition with usually more intuitive evaluation results.However,it cannot identify the differences in purchase motivations and false citation,and it is difficult to determine the depth and breadth of book contents.The content-based assessment method can detect users'different intentions,attitudes and demands by in-depth mining on contents,but the data acquisition and processing are difficult.The evaluation research based on multi-dimensional data obtains comprehensive evaluation results by integrating different resources and constructing multi-dimensional evaluation metrics.However,it is difficult to obtain evaluation data to construct a scientific and reasonable evaluation metric system.Hence,for the evaluation of book impact,researchers need consider the pros and cons of different methods,and choose evaluation methods according to different evaluation demands.
Keywords:Book Impact;Impact Assessment;Frequency Data;Content Data;Multidimensional Data
分类号 G251
DOI 10.16603/j.issn1002-1027.2020.03.004
∗国家社会科学基金项目“融合多源异构数据的图书精准画像构建研究”(项目编号:19CTQ031)的研究成果之一。
通讯作者:章成志,ORCID:0000-0001-9522-2914,邮箱:zhangcz@njust.edu.cn。及下一步的研究方向。
作者单位:周清清,南京师范大学新闻与传播学院网络与新媒体系,江苏南京,210023
章成志,南京理工大学经济管理学院信息管理系,江苏南京,210094
收稿日期:2019年4月12日
修回日期:2020年3月12日
(责任编辑:支娟)
|
|