中国图书馆开放数据论文计量分析
来源:微智科技网
CHINA SCIENCE AND TECHNOLOGY iNFORMATION Jan.2016・中国科技信息2017年第2期 知识产权生态IP论坛◎ DOI:10.3969/j.issn.1001—8972.2017 02.001 可实现度 可替代度 真实度 在我国,图书馆的开放数据服务是起步较晚的,但却受 数据”的同义词“数据开放”,选择查全率和查准率较高的“主 题”检索字段,在知网、万方和维普检索后,导出检索记录, 利用noteexpress软件进行相加、去重后共得到2003年 ~到了各方关注,发展迅速,发表在各个期TIJA, ̄高水平,影响 较大的的文章也很多。纵观图书馆开放数据发展以及各界学 者做过的研究,虽然成果累累,但是综述方面的文章 ̄P,fE少。 2016年5月的99篇文章,年度最高发文量为15篇,最 本文针对这一情况,对2003到201 6年间的涉及图书 馆开放数据的论文进行了定量的分析,旨在为今后图书馆开 放数据的研究和发展提供思路和参考。 低发文量为1篇。 论文发表时间分布分析 表1及图1展示了国内十四年间的图书馆开放数据涉及 论文情况。 图书馆开放数据的概念 开放数据是以大数据为时代背景的,大数据对图书馆数 据的影响主要体现在数据结构方面。开放数据的发展离不开 互联网与开放存取运动,互联网作为人们获取信息的主要途 径大大提高了人们之间信息交流速度,而开放存取则使得公 众能够接触到更多的开源数据、知识、掌握更多的资源,促 进了他们的信息获取能力。开放存取运动的产物就是开放数 表1 2003年一201 6年涉及图书馆开放数据的论文的数 量统计 年份 2003 2004 2005 2006 2007 2008 2009 论文数(篇) 年份 3 4 5 2 7 2 15 2 14 1 14 d 14 2O10 2011 2O12 2013 2014 2015 2O16 论文数(篇) 12 一个领域在时间维度上被发表的论文的数量变化一定程 据,这使得信息在网络中能够得到共享、重用,从而最大程 度上实现了知识的多次使用和获取。图书馆开放数据是以图 书馆数据资源为开放对象,在保证数据安全的前提下,降低 度上反映了该领域发展的速度和理论水平的进展。图1中蓝 我国图书馆开放数据研究论支统 使用者的访问权限,面向社会广大机构和个人,对图书馆产 生的数据资源的再次利用,使得更多的个人或机构以此实现 资源的增值,避免浪费。 国内涉及图书馆开放数据的论文分析 本文采用的原始数据来自于维普信息资源系统、中国知 一网、万方数据知识服务平台三大应用较多的综合性数据库, 以“图书馆”和“开放数据”为关键词,同时考虑到“开放 年份一般里一缭l芏漾文星} 图1论文增长趋势图 15一 ◎知识产权生态IP论坛 中国科技信息2017年第2期・CHINASCIENCEANDTECHNOLOGYINFORMATION Jan.2017 核心期刊载文量变化趋势图 IIl● 黏一箨囤哑七b 朴避捧囹朴 2 2 表3图书情报领域核心期刊中的论文分布 (按影响因子高f氐排序) 序号 1 刊名 中国图书馆学报 期刊复合影响 相关载文 累计载文 累计百分 因子(2014) 量(篇) 量(篇) 比(%) 4.3880 1.9660 1.8720 1.7880 1l748O a 2 2 1 7 4 6 8 9 16 4.04 6.O6 8.O8 9.O9 16.16 __I鞲恤 箨圃 I 口{f 晕I单囤 1 II_●II_- 甚 萍囤 一 坩 蓦f晕I 目■n¨¨¨ ㈠_] 2 2 大学图书馆学报 3 4 5 图书与情报 图书情报知识 图书情报工作 lI 懈 省 强锌画 怕账螺苹厨 倒阜}举囤 避单豳 『哇卅摹I捧团 皿 {}葺 鲞鑫 年华 群 圈囹 酬 6 7 8 9 1O 情报杂志 图书馆论坛 图书馆杂志 图书馆建设 图书馆 1.6580 1。3330 1.1880 1.0320 1.0240 1 5 2 1 2 17 22 24 25 27 17.17 22-22 24.24 25.25 27-27 攀 囤 梃.1幂蝗棒醋 图2核心期刊发表论文数量统计图 瞢}制晕l箨固 11 国家图书馆学刊 1.0000 0.944 2 3 29 32 29-29 32.32 色的曲线客观的反映了每年发文的数目,近14年发文量的 变化趋势通过红色的线性趋势线反映,从表1、图1可以清 晰的看出2003年至2008年间图书馆开放数据研究论文篇 数保持在较低范围,之后的发文量有了较大程度的提升。上 12 图书馆学研究 13 14 15 16 图书馆建设 图书馆杂志 图书馆论坛 现代情报 O.918 0.888 0.866 0.816O O.564O 1 2 5 2 2 33 35 40 42 44 33.33 35.35 40.40 42.42 44.44 图中可以看出国内的图书馆开放数据的研究大致上经历了三 次变化。2003年到2008年这段时间内是整个服务的起始 阶段,这一阶段的特点是刚刚萌芽,论文数量较少。2009 17 图书馆理论与实践 注:表3中涉及到的图书情报类的期刊主要参考了2014年版 年到1 2年间为开放数据研究的探索阶段,发文量总体趋势 上升。2013~2016年为发展阶段,年发文量最低14篇。由 此看出,图书馆开放数据研究在我国是逐年发展的。 的《中文核心期刊要目总览》。复合影响因子来自于中国知网的数据。 比较表2、表3可以得出以下几个结论: 第一、表2中列出的载文量较多(大于2篇)的7种期 刊全部是图情类的期刊,其他9种也全部是图情类的期刊, 论文期刊分布分析 对某领域研究论文的期刊分布的分析可以确定该领域的 质量较高的期刊,它是是学术评价体系重要的组成部分,是 说明我国图书馆开放数据的研究绝大部分都集中在图书情报 领域; 第二、在2014年版的《中文核心期刊要目总览》中涉 及到的关于信息事业类、图书馆事业类核心期刊共有侣种, 而表3显示其中的1 7种都刊载了图书馆开放数据方面的论 衡量该领域科研工作者水平的一个重要指标,对于该领域未 来的发展和改进有着不可或缺的指导意义。表2,表3主要 从期刊分布的角度对开发数据领域的论文做了简要的分析。 文,载文量最多的是复合影响因子为1.7480的《图书情报 工作》。从中可以看到各个期刊的论文数量并不是随着影响 因子的降低而简单的呈现增长的态势: 第三、从表3中数据统计显示有44.44%的图书馆开放 数据的研究论文是发表在核心期刊上的,大约占到总发文量 的一半,说明了虽然这14年来的发文总量不多,但是总体 来说论文的质量是比较高的。 表2图书馆开放数据研究论文的期刊分布(按载文量递减) 序号 1 2 3 干U名 现代图书情报技术 图书情报工作 图书馆论坛 期刊复合影响 相关载 占论文总量的 因子(2014) 文量(篇) 百分比(%) 1.5390 1.7480 1.3330 / 13 7 5 5 13.13 7.O7 5.05 5.05 4 图书馆情报工作动态 5 6 7 中国图书馆学报 图书馆学研究 新世纪图书馆 4.3880 1.0230 0.5190 4 3 3 4.04 3.O3 3.O3 论文著者分布分析 通过对论文作者的统计,可以对一个领域的核心著者及 著者群有一个大致的了解,有利于读者了解这类人的研究近 况,促进彼此之间的交流和互动。下表中对于涉及图书馆开 8 9 大学图书馆学报 图书与情报 1,9660 1.8720 2 2 2.O2 2.O2 10 11 12 ’13 .国家图书馆学刊 图书馆杂志 图书馆 现代情报 1.0000 1.1880 1.0240 08160 .2 2 2 2 2.O2 2.O2 2.02 2.02 发数据论文的作者进行了一些统计,用以确定这个领域的核 心作者。 表4图书馆开放数据研究论文著者分布(按发文数递减) 发文数(篇) 作者数 占作者总数百分比(%) 4 3 2 1 作者姓名 张晓林:顾立平 夏翠娟 李勇文 14 图书馆理论与实践 0.5640 2 2.O2 2 1 1 86 2.22 1.11 1.11 95.56 15 16 17 河南图书馆学刊 晋图学刊 其他刊 O.1O1O 0.1850 | 2 2 39 2.02 2.O2 41.42 注:其他刊是指发表论文只有一篇的期刊。 合计 90 100 一l6一 CHINA SCIENCE AND TECHNOLOGY INFORMATION Jan 2016・中国科技信息2017年第2期 知识产权生态lP论坛◎ 如表4所示,2003~2016年5月共有90位作者发表 了99篇图书馆开放数据研究方面的文章,其中有两位著者 容包括数据平台建设的步骤,关键技术等方面。如:朱玲、 聂华、崔海媛等人以北大图书馆数据平台建设为例,认为图 书馆开放数据服务平台的建设需要经历以下几个步骤:调研 服务平台需求、平台定位、确定合作机制及内容、系统选型、 发表论文4篇,发表2篇和3篇的著者各一人,其余著者发 表的都为1篇。 发文4篇的有二人,发文3篇和2篇的均只有一人,其 余的作者都各发1篇,由此可见,图书馆开放数据研究领域 并没有形成核心著作群,这种情况对图书馆开放数据的深入 研究非常不利。 确定元数据方案及唯一标识符方案、开发本地化功能等。滑 海以华北科技学院图书馆开放数据平台为例,其平台采用以 WEB服务实现的SoA体系结构。 图书馆开放数据其他方面的研究 此外,还有一些学者研究了图书馆开放数据服务面II ̄A,g 问题、图书馆开放数据服务的优势、开放数据对图书馆信息 资源共享的影响、图书馆如何构建更加开放A,O ̄D识服务创新 平台等方面内容,丰富了图书馆开放数据研究体系。 论文主题分布分析 为了揭示图书馆开放数据领域的研究进展以及未来的发 展方向,本文对论文的主题内容进行了分析。通过对近百篇 论文的内容进行分析,再结合前人的研究成果,目前我国图 书馆开放数据的研究主要体现在以下几个方面:①开放数据 视角下图书馆角色的新定位;②图书馆开放数据AgUE务模式; ③图书馆开放数据服务平台建设;④图书馆开放数据其他方 面的研究。 图书馆开放数据发展趋势 向读者提供更多的开放数据 如今开放数据中较早投入实践的是开放数据,以及 开放学术期刊数据库等,图书馆应该加大图书馆资源整合和 开放力度,不局限于馆内资源,提高资源多样化,如:科技 报告、标准、人文活动以及实验数据资源的整合等。 开放数据视角下图书馆角色新定位研究 在开放数据的大背景下,传统图书馆的作用有了新的定 义。目前,国内学者认为图书馆的新角色主要由以下三种: 一是知识服务中心,二是开放数据的管理与保存中心,三是 嵌入式协作化知识实验室。其中刘春丽、徐跃权认为,未来 的图书馆在开放数据的大背景下会扮演匹配科学产出的知识 服务中心及管理、保存的角色。张晓林认为,科技创新为图 书馆的服务模式带了新的机遇和挑战,嵌入与协作理念及其 运行机制的建立是图书馆提供“知识实验窒”的基础。 图书馆开放数据服务模式研究 服务内容、方式是图书馆研究开放数据的主要服务模式, 总的来说,图书馆开放数据服务对于内部员工的计算机专业 知识和科技查新能力的要求比之前提高了不少。与传统的图 书馆基础服务差距较大。如:张峥嵘、刘亚丽认为:在大数 据的时代背景下,传统的图书馆应当能提供整合多个不同领 域的数据整合服务、基于知识联盟的数据开放与共享服务、 基于一站式服务平台的知识发现服务、数据的开发、创建、 共享与转换服务、数据分析服务、、数据监管服务、标 准的制定与咨询服务。赵欣认为,在新形势下各个高校图书 馆的数据开放服务应当有多种,包括检索服务、发现服务、 申请服务、获取服务、管理服务、关联服务、传递服务和存 储服务。马晓亭、尚庆生认为,图书馆的开放数据服务应当 改变之前的传统服务内容,创新服务的方式,实现多个渠道 的数据的统一,做到真正的全方位的开放,并在数据开放过 程中加强读者隐私保护。 图书馆开放数据服务平台实例研究 此方面的研究主要体现为对具体案例的分析上,分析内 提供更加便捷的工具以提高用户获取信息的速度 提供利用是开放数据的最终目的。图书馆开放数据同样 也应该以方便用户利用为宗旨 现如今图书馆大多采用一站 式知识服务平台,较好的满足了用户的需求,但对于难以理 解的数据,考虑到用户的检索水平,可以利用可视化检索工 具降低检索难度。 提供更深层次的数据分析服务 数据分析是大数据背景下的主要服务方式。图书馆开放 数据不仅增加了读者检索查找的范围,也为专利分析、科技 查新等深层次的数据分析服务提供支撑,同时涌现出的各项 数据分析业务也会使得数据的价值得到更好的体现。 结语 传统图书馆的服务在大数据的背景下已经有些欠缺了, 如何更好地服务读者,伴随着社会的进步自身也得以发展, 是当前形势下图书馆面临的一个严峻课题。这之中也伴随着 难得的发展机遇。保障图书馆在社会生活中发挥其社会教育 和公共文化的职能,必须立足长远,通过创新的方式,突破 原有的桎梏,积极探索新的发展模式,如此才能为人们提供 更好的服务。 17一