|
基于关联数据消费的高校图书馆延伸服务探索
——以厦门大学图书馆为例
□林静 陈和∗ 陈娟 李立焰 林智南
摘要 基于关联数据消费的高校图书馆延伸服务特点在于以科研人员和广大师生的需求为核心理念,以馆藏特色资源为优势,以关联数据消费为新兴技术,进行服务创新探索。文章以厦门大学图书馆参加上海图书馆2018年开放数据应用开发竞赛为例,借助与国家重点实验室合作开发“厦大海洋人”安卓手机应用程序(APP),进行了高校图书馆延伸服务的实践探索。通过对数据关系脉络的梳理,从关联数据消费技术角度解决馆藏资源向移动客户端应用资源的转化问题,提高用户兴趣度,增强用户体验度。从图书馆业务来角度,本案例是机构知识库服务的延伸,是嵌入式学科服务的延伸;从内容延申服务的角度来说,则是集用户群体指向型、用户需求指向型和行业趋势指向型为一体的延伸服务。
关键词 关联数据 上海图书馆 开放数据应用开发竞赛 关联数据消费 延伸服务 高校图书馆 厦门大学图书馆
在全球网络知识环境下,关联数据让图书馆数据“走出去,引进来”。一方面,图书馆数据融合到网路中去,变得可利用,为网络用户提供了可靠的数据来源;另一方面,增强馆藏资源的可见度,把图书馆服务直接带给网络用户。图书馆作为关联数据的领导者,开展实际工作将关联数据在国内图书馆领域应用起来是值得期待的事情。本文旨在通过参与“上海图书馆2018年开放数据应用开发竞赛”,进行关联数据的应用实践,探讨基于关联数据消费的高校图书馆延伸服务。
1 基于关联数据消费的高校图书馆延伸服务
1.1 关联数据消费的内涵
基于汤姆·希思(Heath T)和克里斯蒂安·贝泽(Bizer C)提出的关联数据基本架构——数据发布层、数据存取整合和保存层、数据应用层[1],林海青指出图书馆可以存在于这三个功能层中,图书馆角色可以是关联数据的发布者,关联数据的消费者,也可以作为第三方进行数据存取整合和保存[2]。同时,图书馆应用关联数据具有潜在四个基本模式:发布、消费、服务和平台。
我国图书馆在关联数据应用方面尚处于起步阶段,其中,国家图书馆、中国科学院国家科学图书馆、上海图书馆等为国内关联数据应用的先行者。国家图书馆开发了网络知识组织系统(NKOS)集术语注册和服务原型系统于一体,同时开发了术语服务客户端,在系统内发布了主题词表、本体和分众分类法[3];中国科学院的“科学数据库”项目OpenCSDB将关联数据应用在科学数据知识库中,提倡发布描述数据模型的RDF本体词表[4];自2014年起,上海图书馆开始投入力量探索基于关联数据技术的数字人文项目建设模式,包括“家谱知识服务平台”[5],盛宣怀档案知识库,“名人手稿档案库”[6],书目系统[7],“中文古籍联合目录及循证平台”[8],中文百科概念术语服务平台SinoPedia[9]。这些平台从关联数据发布服务发展到关联数据发布中心(Hub),产生了一定的影响。
我国的关联数据应用主要以关联数据发布为主。发布数据以书目数据、规范数据和术语服务为主。这些权威机构发布的关联数据相较于互联网开放资源,其优势在于图书馆的专业人员采集、整理、标注、维护大量元数据,为公众提供了高质量的数据,为第三方开发应用提供了规范化、标准化的数据支撑,是可靠的数据来源[10],充分体现了图书馆员的智慧。同时,数据发布实现了数据的开放共享,给予其他图书馆及机构深度利用数据的机会。
从整个开放数据闭环系统来看,数据发布是过程中的第一部分,如图1所示[11]。数据发现、数据使用、数据关联、数据复用和数据讨论也是开放数据闭环过程中不可缺少的一部分。只有当开放数据变得有用、可用并且被用时才能演变为开放知识[12]。整个开放数据过程意味着开放数据不应仅仅被视为产品,而应视为一个具有持续性的过程。新的应用程序和开放数据的使用可能会产生新的观点,促使开放数据被创新应用。因此,在开放知识环境中,关联数据利用,即关联数据消费,也是关联数据发布以后需要关注的,包含了开放数据系统内除数据创建、发布以外的所有环节。
汤姆·希思(Heath T)指出关联数据消费方式分为通用的和领域的两种[13]。通用的消费方式为浏览和检索,领域的消费方式及则根据不同数据源所提供的不同消费接口方式而变换消费方式。夏翠娟提出了7种具体消费方式:浏览、发现、抓取、检索、混搭、推理和展现[14]。
pagenumber_ebook=75,pagenumber_book=72
图1 开放数据闭环系统[15]
1.2 关联数据消费技术
关联数据消费技术是多样的,为下一代基于Web的应用程序提供了新的机会,如聚合来自不同提供者的数据,允许集成来自多个来源的零碎信息,从而实现互补的和更完整的知识。
消费关联数据(Consuming Linked Data,COLD)作为国际语义网大会(International Semantic Web Conference,ISWC)的一个专题会议已举办了七届(2010-2016年)。会议旨在为消费关联数据的概念、算法和方法提供一个科学论述的平台,讨论的问题主要包括:实时关联数据(即在运行时使用关联数据的算法和应用程序),消费关联数据架构(如数据空间、云、NoSQL),关联数据源的集成(如实体解析、相同、词汇映射等),处理其他Web数据(如Deep Web、API、Microdata、JSON、Atom、表格等),Web级数据管理(如爬行、索引、并行处理等),用于导航和使用关联数据的新语言(如nSPARQL、Nauti LOD等),关联数据摘要、指南和模式学习,查询多个链接数据集的处理,通过Web搜索关联数据,自动发现URI和数据,缓存和复制,数据集动态性,来自多个来源的关联数据的推理,关联数据的信息质量和可信度,用于与Web交互的用户界面研究等[16]。只有通过新方法、新思路进行开发和系统调研,上述问题才有可能被恰当地解决。
就关联数据获取模式而言,林海青指出有两种关联数据消费模式:一种是本地化消费,即将关联数据收割到本地系统;另一种是动态消费,消费关联数据不需要预先收集所有来源,需要引导关联数据网络发挥其最大和最普遍的潜力[17]。从关联数据利用方式的角度,夏翠娟在《关联数据的消费技术及实现》一文指出主要包括四种方式:为本地数据建立外部关联;多种数据混搭建立新应用和服务;发现数据之间关联关系、建立知识地图;进行语义挖掘和推理发现有用的信息[18]。就消费接口访问方式,夏翠娟总结了基于语义搜索引擎、关联数据集和面向用户的大型数据集成管理平台三种数据源的关联数据消费接口分析及技术实现案例[19]。针对关联数据的可视化,陈涛提出通过SPARQL端点进行JSON数据格式的关联数据可视化[20]。这些均给予国内关联数据消费者在数据利用方面很多基础性的技术指导。
1.3 图书馆的延伸服务
1993年,美国学者韦斯特布鲁克·林恩(Westbrook L)和沃尔德曼·罗伯特(Waldaman R)将图书馆的延伸服务界定为图书馆在馆舍之外提供的所有服务[21]。之后,我国学者大部分将延伸服务从时间、空间、内容三方面考量,将延伸服务看作是基础服务和常规服务的拓展服务。吴汉华指出图书馆服务可分为基础服务和延伸服务[22]。延伸服务走向成熟将转化为基础服务,扩大基础服务范围,提升图书馆服务能力。张伟庆指出图书馆延伸服务为面向用户需求,结合本馆特点及能力,通过创新探索各类服务的新机制、新模式及新领域[23]。
1.4 基于关联数据消费的高校图书馆延伸服务的内涵
2011年,W3C图书馆关联数据孵化小组的一份研究报告收集了部分图书馆的应用案例,表明关联数据技术在描述图书馆资源及其背景方面的潜力。报告提出图书馆应用集中在八类主题:书目数据、规范数据、术语对齐、存储与异构数据分布、资源引用、数字对象、集合、社交与新应用[24]。而图书馆作为直接面向用户的机构,关联数据在图书馆Web方面的应用是一个重要方面:基于LOD的资源发现服务、数据融合与语义检索服务、学术研究和学术交流作用、跨机构的关联数据的开放与复用、图书馆与教学系统之间的集成等[25]。
针对关联数据在图书馆的应用,林海青指出关联数据技术核心问题在于如何界定关联数据的主要功能需求[26]。罗亚泓在《牛津大学博德莱图书馆的延伸服务探析》一文中从内容延伸角度将牛津大学博德莱图书馆的延伸服务大致分为用户群体指向型、用户需求指向型和行业趋势指向型[27]。笔者将此分类借鉴到本文中,用于探讨基于关联数据消费的高校图书馆延伸服务。从特定用户、特定需求与新兴技术角度出发,探索图书馆开展多元化延伸服务的可行思路与途径,其特点在于以科研人员、师生的需求为核心理念,以馆藏特色资源为优势,以关联数据消费为新兴技术,进行服务创新探索。
(1)用户群体指向型延伸服务是以“特定”用户为对象,通常是为某一学科的研究人员提供的学科化服务。例如,伊利诺伊大学厄巴纳-香槟分校的数学图书馆[28]于2015年和2016年初构建了基于Schema.org语义的Emblematica Online平台[29],将有关徽章的数字化馆藏转换成关联数据发布,促进了分布在全球6家图书馆的1300多种特藏徽章类书籍的发现,增强了学者与数字化徽章类资源的互动。目前,在本体和数据发布过程发展到具有一定程度的实用性之后,网站将项目重点转向数据使用和复用:①引入了Web环境下其他LOD资源作为关联描述,点击徽章书,可以获得作者来自VIAF记录的出生日期、死亡日期、性别等信息,以及国家图书馆、WikiPedia等维护的规范数据和信息网页;②提供对徽章描述的Iconclass术语层次结构和术语的不同层次结构下相似度搜索;③改进本体,增强本体描述能力,促使内容描述颗粒度变得更细,以减少信息损失,帮助学者在Web知识环境下获得更大的知识发现,提升用户体验度。
(2)用户需求指向型的延伸服务满足用户的个性化需求,提供超出基本业务范畴的服务。例如,德国马尔堡菲利普大学图书馆[30]提出基于关联数据机构知识库资源的参考文献出版流程:通过NLP技术提取机构知识库中收录的学术成果的参考文献,使用开源工具Metablock利用比菲尔德学术搜索引擎(BASE)解析参考文献,创建基于都柏林核心(Dublin Core)的引用术语模型的实体文献及其相互引用、被引用的关系,通过SPARQL方式往RDF文件中写入更新信息实现机构知识库被引文献信息更新,建立基于Solr的文献索引以利于Vu Find资源发现系统使用。通过语义网技术发布参考文献、建立参考文献发现机制是更广泛研究和分析引文的先决条件,工作流程将文献之间的引用关联为机器所理解,促进学术成果的交流。不仅有助于对使用作品的人给予信任,而且有助于支持学者的断言和论点,有助于读者找到有关该主题的更多信息,提高图书馆的知识服务能力。
(3)行业趋势指向型的延伸服务,深度利用了图书馆的数字化趋势,促进了数据互联和共享。图书馆不仅在创建新平台,提供新服务,而且也在不断寻求对旧有系统的改进。2011年末,全球图书馆开始应用WorldCat Local,OCLC与WorldCat编目资源数据库的单一检索接口,可以进行出版物、摘要索引、机构知识库资源等元数据的统一索引。通过WorldCat Local和WorldCat Discovery,OCLC实现了电子资源的发现和访问。为了提供用户所需的空间和开发新的学习空间,美国马里兰大学帕克分校图书馆计划撤销缩微胶片馆藏,代之以数字资源。在此之前,需要在WorldCat Discovery添加微缩胶片对应的电子版书目记录的馆藏信息,这实际上是一个利用发现系统将MARC格式书目记录转换到语义Web上的关联数据,促使编目流程适应在线电子资源新编目环境的过程。由于OCLC缩微胶片和早期英文图书在线(Chadwyck-Healey Early English Books Online,EEBO)资源的MARC记录包含了某版本的副本馆藏地注释字段,通过添加OCLC记录号(OCLC Record Numbers,OCN)增强描述OCLC EEBO的KBART(Knowledge Bases and Related Tools)文件[31],实现了在WorldCat书目提供自动化馆藏信息,区别相同版本下不同馆藏资源的副本,增强了链接解析,提升了发现服务,让读者易于了解有关缩微胶片和电子资源的可用性。
用户群体指向型、用户需求指向型和行业趋势指向型三类延伸服务往往交叉在一起,提供最大可能性满足用户需求,从而提升图书馆的服务能力,扩展图书馆的影响力。
2 厦门大学参与“上海图书馆开放数据应用开发竞赛”的实践
2.1 上海图书馆开放数据模式
近年来上海图书馆在关联数据应用推广上作出了不少努力。自2016年以来,上海图书馆已举办三次开放数据应用开发竞赛[32],目的是挖掘LOD应用的潜力,促进知识的外部消费,探索数据驱动的创新服务。上海图书馆不仅开放了本馆的平台数据,同时鼓励其他机构平台将数据加入开放数据中,如搜韵、中国历代人物传记资料库(China Biographical Database,CBDB)等。从服务角度来说,其向第三方机构或公众提供了开放数据服务,鼓励参赛者利用平台数据进行数据应用、融合、扩展与链接。竞赛以微站(移动Web应用)或IOS、安卓等平台上的APP为主要方式[33]。往届参赛作品中,竞赛数据应用模式是多样的,如数据与维基百科集成融合,与地理信息“混搭”,关联数据的可视化,与地方志、文学作品等文献资源结合用于扩展资源发现等。这些应用均提供了具体应用场景与应用模型,对图书馆业务有现实意义。
在“上海图书馆2018年开放数据应用开发竞赛”中,开放的上海图书馆数据平台有:家谱知识服务平台、盛宣怀档案知识库、名人手稿档案库、上海市文献联合编目中心关联书目数据发布平台、中文古籍联合目录及循证平台和中文百科概念术语服务平台SinoPedia。平台发布的数据集均达到开放数据5星级评价,可提供关联开放数据,支持用户使用SPARQL Endpoint,基于Http URI的内容协商和特定API多种数据接口模式获取数据[34,35],满足用户的不同开发需求。
2.2 “厦大海洋人”APP开发背景
由近海海洋环境科学国家重点实验室(厦门大学)数据中心(以下简称海洋数据中心)联合厦门大学图书馆共同参加了“上海图书馆2018年开放数据应用开发竞赛”,开发了“厦大海洋人”的安卓APP,目的在于充分展示厦门大学海洋学科的最新发展成果,促使社会公众关注海洋学科。“厦大海洋人”以海洋科研学者籍贯和近海海洋科考站位为线索,结合地理信息系统,形象直观地展现了厦门大学海洋人的海洋航迹、学术风采、科研成果和知识图谱。
2.3 数据关系脉络
应用关联数据的核心问题是如何界定关联数据的主要功能需求[36]。根据“厦大海洋人”APP主要功能中展现的对象及对象之间的关系,梳理了数据关系的脉络。
(1)人杰地灵:论文、学者-籍贯-古籍、手稿、家谱
以籍贯为核心维度查找厦门大学海洋学者的地理分布、论文产出分布,如图2(3)所示;以籍贯为关联维度,查找对应籍贯相关的古籍、手稿、家谱、古诗词,从而避免了成果宣传的单调性,如图2(2)所示,显示了和上海相关的古籍列表。对应地名的人文信息使得不论是科研人员还是普通大众,都对海洋产生了历史时空感。
(2)海上足迹:船舶-航次-站位-古地名、古地图
通过科考船某航次站位的地理信息查找返回的邻近古地名,以此补充海上历史地理信息,并提供不同时期的地名出处,如图2(1)所示。增加古今地图的对比功能,让用户领略中华疆域变迁,查看地图时还可放大或缩小以及调整透明度。
(3)知识图谱:论文、学者、机构
通过学者合作网络、机构合作网络与主题词网络,展现了厦门大学海洋学科的科研动态,如图2(4)所示。
pagenumber_ebook=78,pagenumber_book=75
图2 “厦大海洋人”APP的主要功能
根据以上脉络,选择本地数据与外部数据:(1)本地数据以馆藏资源机构知识库科研成果数据为主,同时制作古今地名对应信息表、历史地图信息、航次信息表、船舶信息表和厦门大学海洋学科知识图谱。数据存储形式均为关系数据库。(2)外部数据以上海图书馆关联开放数据为主,含上海图书馆古籍联合目录数据、上海图书馆名人手稿档案库、上海图书馆家谱数据和上海图书馆人名规范数据库。(3)运用了港口网站实时船位数据,竞赛中开放的广州搜韵文化发展有限公司数据、研究机构GRID(Global Research Identifier Database)的数据等,均提供了规范API接口的数据。本地数据与外部数据的分布呈现多源异构数据特征。
2.4 馆藏资源向移动客户端应用资源的转化
以增加“厦大海洋人”APP的文化性和趣味性为切入点,将馆藏资源作为核心数据,将动态消费关联数据等多源数据“混搭”,通过基于Http URI的内容协商方式获取整合后的数据进行展现,最终实现馆藏资源向移动客户端应用资源的转化。
(1)关联数据的动态消费[37]
采用动态消费关联数据模式获取上海图书馆的人文数据,其是APP在本地系统中消费外部关联数据的关键,主要解决多个数据集数据同步、数据更新的问题,相较于本地化消费,数据交互更灵活、实时。无论远程数据源更新与否,系统远程SPARQL实时搜索上海图书馆的数据,进行多个数据集之间的联合查询,将获取实体对应链接URI,以得到最新远程数据,避免了本地存储数据以后需要再花精力更新数据的问题。
关于哪些上海图书馆的开放数据集可检索与学者籍贯相关的作品这个问题,答案是未知的。如果通过上海图书馆开放数据模式中特定API接口查询数据,得到的资源有限,仅能获取单个数据集的某个字段对应的内容,包括“作品”“书目”“单例”“地点”“人物”“机构”“朝代”等元数据对应数据。例如,通过特定API“http://data1.library.sh.cn/gj/Webapi/works?title=泉州&key=XXX”,将获取古籍联合目录中以“泉州”为题名的作品。而为了获取所有数据集中相关的资源,不仅仅是古籍联合目录中的作品,APP选择SPARQL实时模糊搜索。整个SPARQL远程查询过程中,无需关心单个数据集中籍贯对应相关的实体以及实体之间的关系。例如,查询以“泉州”为籍贯的相关作品,链接到http://data1.library.sh.cn:8890/SPARQL,对 应 的SPARQL查询语句为:
pagenumber_ebook=78,pagenumber_book=75
检索结果将获得来源于五个数据集或者API中的多个作品,下表显示了不同数据集中的实例。
表1 使用SPARQL查询数据结果
pagenumber_ebook=79,pagenumber_book=76
(2)异构多源数据混搭
为解决本地数据与外部数据所呈现的分布式多源数据查询问题及数据更新和维护问题,APP选择由数据层、应用层和表现层组成技术框架(见图3)。厦门大学图书馆开发应用层,负责数据整合与提供数据API,海洋数据中心开发APP表现层。各层应用隶属单位主体不同,技术体系架构不同,可完全独立部署,技术灵活,极大消除了冗余,且易于扩展与维护。
pagenumber_ebook=79,pagenumber_book=76
图3 “厦大海洋人”APP技术框架
基于数据层的多源异构数据特征,系统应用层采用Django Restful Framework进行馆藏资源与外部数据集成,实现业务逻辑处理,统一资源接口,开放RESTful API接口,以完成表现层与应用层之间的交互。系统相当于在内部建立了虚拟数据中心,将本地与外部数据集成后进行二次发布。对于馆藏数据,系统通过SQL查询语句获取关系数据库中的数据;对于提供SPARQL Endpoint的外部关联数据,通过SPARQL查询语句获取数据;对于提供规范API接口的数据,通过查询API获取数据。资源之间的关联不局限于点对点的直接关联,而是借助于中间结点的间接关联。根据表现层的数据请求,系统实时从数据层获取数据,并装配成JSON格式数据后返回给表现层。
例如,用户从APP中地理信息系统中点击“泉州”图标,表现层向应用层传达相应地理信息,则应用层向表现层返回了与地理信息关联的地名链接URI:http://[服 务 器 地 址]/myapi/shlapi?lat=24.93&lng=118.58。链接URI集成了数据层中关于“泉州”的数据,包括百度百科对“泉州”的介绍,泉州经纬度信息与来自其他机构不同数据集中的数据。不同来源数据集以Type命名来区别,例如Paper、Shougao、Persons、Guji、Jiapu和Poem。其中Type为Paper,表示数据来自机构知识库WOSSCIE数据,其他数据来自百度百科、上海图书馆与搜韵。
2.5 厦门大学图书馆的延伸服务
从图书馆业务角度,“厦大海洋人”APP开发实践是机构知识库(IR)服务的延伸,是嵌入式学科服务的延伸,突破IR科研成果宣传方式的单调性,强化“双一流”建设背景下的高校形象建设。CALIS三期“机构知识库建设及推广项目”表明推广中国高校的学术资源与成果是当前IR建设的重要任务之一[38]。目前,高校机构知识库正在从多层次挖掘资源、成果与服务的应用场景,以提高其利用的深度与广度,提高用户认识度,促进学术交流。IR门户网站的成果展示功能变得越来越多样化,如提供知识分析、在线可视化功能[39],揭示研究热点、科学前沿,丰富学者信息等;同时,IR通过加强与学校机构间的协作,为高校行政机构提供可靠、准确的师生成果数据,提供成果统计分析报告等[40]。将IR成果数据嵌入到学院、实验室或者科研团队的宣传平台中,与平台服务无缝连接是一种创新服务。
从内容延伸来看,“厦大海洋人”APP的开发实践是集用户群体指向型、用户需求指向型和行业趋势指向型为一体的延伸服务。
(1)用户需求指向型的延伸服务。厦门大学自2012年起,每年都举办免费面向市民、大中小学生的海洋科学开放日活动。随着移动服务终端手机的普及,开发移动端APP配合海洋科学开放日活动显得很有必要。APP作为集研究、科普、传播等于一体的宣传平台,拓展了展览功能,向公众展现了古今海洋文明的融合。APP作为高校学科成果宣传的橱窗,展示了“双一流”高校优势学科的魅力。在开发过程中,图书馆主要负责数据整合和数据提供,充分发挥了IR在机构学术成果数据质量、开放数据等方面的优势。
(2)用户群体指向型延伸服务。一方面,科研人员为APP的用户之一。在APP中展示IR科研成果数据,是一次数据服务的探索,是厦门大学图书馆面向“双一流”建设的学科知识服务营销产品的升级实践[41]。另一方面,对海洋学科有兴趣的公众也是APP用户之一,因此,面对枯燥的专业知识,尝试通过一定方式来提高用户的兴趣度:①以科技与人文数据融合作为海洋主题数据与竞赛开放数据结合的切入点,将厦门大学典藏库中海洋相关科研成果数据,结合上海图书馆等第三方人文规范关联开放数据,展示厦门大学海洋人的科研成果与动态;②结合古今地图对比看海洋航迹,帮助用户体验古地名、古文化的变迁。
(3)行业趋势指向型的延伸服务。①数字资源合作共享是图书馆可持续发展的重要方向[42]。整合其他图书馆的馆藏资源或者第三方机构的资源和数据,与自身馆藏资源集成、融合,可进一步发挥自身馆藏特色,促进知识发现。IR数据与上海图书馆及第三方数据灵活、实时、动态集成是一次合作共享模式上的技术探索;②移动互联环境下,为移动服务提供支持,加速了大学图书馆的转型[43]。如何实现馆藏资源向移动客户端应用资源的转化[44],以提高用户兴趣度,增强用户体验度是此次APP开发实践主要解决的问题之一。
3 结语
挖掘关联数据实际需求是关联数据消费的关键性问题,实现服务增值、促进延伸服务转向基础服务的首要条件。对于图书馆,面对越来越多的关联开放数据,如何组织这些数据,为专门使用场景或特定用户提供精准的知识服务,“厦大海洋人”APP开发实践是一次有意义的探索。APP中集成了第三方的数据(以人文数据为主),使展示内容更丰富、更精彩,更容易激起用户对海洋知识的兴趣,成为海洋开放日活动的另外一扇“橱窗”,也是海洋开放日活动的延续。另一方面,在全球Web知识环境下,用户不仅是消费者,同时也是参与者与创造者。开展嵌入学院、科研团队的知识服务,发挥用户的主体地位,注重用户自身贡献与交流,同时强调图书馆的服务协同性,将充分满足用户的个性化需求[45]。
如何发现关联开放数据源是关联数据消费的方向之一。竞赛公布了主要数据源,鼓励机构与用户开发数据潜在价值,实际已经减少了数据发现的环节。目前,国内关联数据尚处于起步阶段,发布的规范数据及本体均较少,普通图书馆暂时处于无数据可用阶段。因此,现阶段可以加强开放数据过程中的数据发现,将这一环节作为数据消费的切入点。图书馆在不断发布数据的同时,可考虑多运用或者开发数据关联发现工具。
APP潜在的价值在于其数据不仅仅是厦门大学一门优势学科的成果数据,而是可扩展至其他机构的海洋学科数据,乃至全国机构的海洋学科数据。各个机构均可在Web网络上发布各自学科的数据并形成关联网络,APP的应用场景将大幅增加,有利于促进海洋学科知识生态系统科研数据的共享与互联。高校图书馆通过发挥高质量的知识生产能力,共同发布、共同消费,构建起高校图书馆数据联盟,通过共享合作,将形成良性生态循环,有利于知识生产共同体的形成,从而加快知识创新,实现互利共赢。
参考文献
1 Heath T,Bizer C.Linked data:evolving the web into a global data space[J].Molecular Ecology,2012,11(2):670-684.
2 林海青,楼向英,夏翠娟.图书馆关联数据:机会与挑战[J].中国图书馆学报,2012,38(1):58-67,112.
3 王军,卜书庆.网络环境下知识组织规范研究与设计[J].中国图书馆学报,2012,38(4):39-45.
4 沈志宏,张晓林,黎建辉.OpenCSDB:关联数据在科学数据库中的应用研究[J].中国图书馆学报,2012,38(5):17-26.
5 夏翠娟,刘炜,陈涛,等.家谱关联数据服务平台的开发实践[J].中国图书馆学报,2016(5):27-38.
6 夏翠娟,张磊,贺晨芝.面向知识服务的图书馆数字人文项目建设:方法、流程与技术[J].图书馆论坛,2018,38(1):1-9.
7 夏翠娟,许磊.中文关联书目数据发布方案研究[J].数字图书馆论坛,2018,1(164):8-16.
8 夏翠娟,林海青,刘炜.面向循证实践的中文古籍数据模型研究与设计[J].中国图书馆学报,2017,43(6):16-34.
9 陈涛,刘炜,朱庆华.中文百科概念术语服务平台SinoPedia的构建研究[J].中国图书馆学报,2018(4):1-14.
10 司莉,李鑫.图书馆应用关联数据的策略分析[J].图书馆工作与研究,2013(10):32-35.
11 Zuiderwijk A,Janssen M,Choenni S,et al.Socio-technical impediments of open data[J].Electronic Journal of E,2012,10:156-172.
12 Open_Knowledge_Foundation.What is open?[EB/OL].[2018-08-03].https://okfn.org/opendata/.
13 同1:1.
14 夏翠娟.关联数据的技术实现及方案[EB/OL].[2018-08-03].http://societyl.ibrary.sh.cn/sites/default/files/LD的技 术 实 现及案例_夏翠娟_0.pdf.
15 同11.
16 Seventh international workshop on consuming linked data(COLD2016)[EB/OL].[2018-08-03].https://www.dcc.uchile.cl/cold2016/.
17 同2:1.
18 夏翠娟,刘炜.关联数据的消费技术及实现[J].大学图书馆学报,2013,31(3):29-37.
19 同18.
20 陈涛,夏翠娟,刘炜,等.关联数据的可视化技术研究与实现[J].图书情报工作,2015,59(17):113-119.
21 Westbrook L,Waldman R.Outreach in academic libraries:principle into practice[J].Research Strategies,1993,11:60-65.
22 吴汉华.图书馆延伸服务的含义与边界[J].大学图书馆学报,2010,28(6):21-26.
23 张伟庆.国内外高校图书馆延伸服务研究现状及展望[J].大学图书馆学报,2016,34(5):78-83.
24 W3C Incubator Group.Library linked data incubator group:use cases[EB/OL].[2018-08-03].https://www.w3.org/2005/Incubator/lld/XGR-lld-usecase-20111025/.
25 黄永文.关联数据在图书馆中的应用研究综述[J].现代图书情报技术,2010(5):1-7.
26 同2:1.
27 罗亚泓.牛津大学博德莱图书馆的延伸服务探析[J].大学图书馆学报,2016,34(2):47-54.
28 Cole T W,Han M J K,Sarol M J,et al.Using linked open data to enhance the discoverability,functionality and impact of Emblematica Online[J].Library Hi Tech,2017,35(1):159-178.
29 Emblematic Online[EB/OL].[2018-08-03].http://emblematica.library.illinois.edu/.
30 Hatop G.Extraction,analysis and publication of bibliographical references within an institutional repository[J].Library Hi Tech,2016,34(2):259-267.
31 Guay B.A case study on the path to resource discovery[J].Information Technology&Libraries,2017,36(3):18.
32 张磊,夏翠娟.面向数字人文的图书馆开放数据服务研究——以上海图书馆开放数据应用开发竞赛为例[J].图书馆杂志,2018,37(3):33-38,48.
33 同32.
34 许磊,夏翠娟,刘炜,等.关联数据URI设计规范探讨[J].国家图书馆学刊,2016,25(5):22-32.
35 同18:3.
36 同2:1.
37 同2:1.
38 聂华,韦成府,崔海媛.CALIS机构知识库:建设与推广、反思与展望[J].中国图书馆学报,2013,39(2):46-52.
39 刘巍,祝忠明,张旺强,等.基于机构知识库的知识分析及可视化功能实现[J].图书与情报,2016(3):125-131,137.
40 李国俊,王瑜,王李梅,等.基于元数据的高校机构知识库建设研究——以北京科技大学机构知识库为例[J].大学图书馆学报,2012,30(4):55-60.
41 杨薇,林静,黄国凡,等.面向“双一流”建设的学科知识服务营销策略——厦门大学图书馆的实践[J].大学图书馆学报,2017,35(5):74-79.
42 范晨晓.“基于CADAL平台的资源共享与应用”国际研讨会综述[J].大学图书馆学报,2017,35(5):5-9.
43 司莉,曾粤亮.需求驱动的大学图书馆发展趋势研究[J].大学图书馆学报,2018,36(3):30-40.
44 过仕明,梁欣.国内移动图书馆服务模式发展现状与趋势调研[J].大学图书馆学报,2014,32(1):90-96.
45 郝群,成俊颖.论信息共享空间的资源组织策略[J].中国图书馆学报,2009,35(4):44-50.
Exploration on the Application of Linked Open Data in University Libraries
—Practice of Xiamen University Libraries
Lin Jing Chen He Chen Juan Li Liyan Lin Zhinan
Abstract:Based on linked data consuming the university library's outreach service is characterized by taking the needs of researchers,teachers and students as core concept,the special collection as the advantage,and the linked data consuming as the emerging technology.Taking Xiamen University Library's participation in the Shanghai Library's 2018 Open Data Application Development Contest as an example,the paper explored the practices of the university library's outreach services by developing the mobile application APP named“Xiamen University's Ocean Talents”cooperated with the state key laboratory.By combing of the data relationship and from the perspective of linked data consumption technology,it solved the problem of conversion of holding resources to mobile client application resources in order to improve user interest and enhance user experience.From the perspective of library business,practice is an extension of institutional repository's service and an extension of embedded subject service.From the content outreach,practice is user group-oriented outreach service,user demand-oriented outreach service and also industry trend-oriented outreach service.
Keywords:Linked Data;Shanghai Library;Open Data Application Development Contest;Linked Data Consuming;Outreach Service;University Library;Xiamen University Library
分类号 G250.76
DOI 10.16603/j.issn1002-1027.2020.03.010
∗陈和,ORCID:0000-0002-4506-5612,邮箱:chenhe@xmu.edu.cn。
作者单位:林静、陈和、陈娟,厦门大学图书馆,福建厦门,361005
李立焰、林智南,近海海洋环境科学国家重点实验室(厦门大学)数据中心,福建厦门,361005
收稿日期:2018年8月11日
修回日期:2019年1月7日
(责任编辑:关志英)
|
|