分享到:
农大论坛_农大BBS|中国农大论坛|中国农大BBS|中国农大考研论坛-www.nongdabbs.com
当前位置农大论坛 > 学科科研 > 亲,看到好文章一点要记得分享到空间哦!
 as  xxx  租房  金融专业  xxx a d 8 9  xxx a d 8 8  土管  路由器  阮灏展  íá1ü

王雪 等:科学数据的引用行为【中国第一胖离世】

发布时间:2018-02-14 来源:农大论坛 编辑:www.nongdabbs.com

  原标题:科学数据的引用行为及其影响力研究

  作者简介:王雪(1990- ),女,南京农业大学信息科学技术学院,在读硕士生,主要研究方向:信息计量;马胜利(1976- ),男,中央司法警官学院图书馆,硕士学位,讲师,主要研究方向:网络信息资源开发与利用,信息检索。保定 071000;佘曾溧(1990- ),女,南京农业大学信息科学技术学院,管理学硕士学位,主要研究方向:信息计量。南京 210095;杨波(1981- ),博士学位,南京农业大学信息科学技术学院副教授,南京农业大学领域知识关联研究中心,主要研究方向:网络信息检索,信息计量,E-mail:boyang@njau.edu.cn。南京 210095

  内容提要:科学数据引用对于实现科学数据的共享具有重要意义。基于引用行为建立针对科学数据的评估机制,有利于科研人员认识到科学数据再利用的价值,并正视数据引用的重要性,从而规范化数据引用。为了量化评估科学数据对于科研活动的价值,本研究构建了基于引用行为的科学数据集/数据仓储影响力和质量评价模型,并结合文献计量与网络计量方法,运用被引、下载、网络述及等指标,从多角度总结数据引用的行为特征,测量其与科学文献质量之间的关系,从而得出以下结论:①中英文文献在数据引用方面存在差异,英文文献数据再利用率相对较高,数据引用规范性更好;②从文献频次、下载频次、被引频次、网络述及等多角度发现数据引用多个指标之间存在一定的分组关系;③生物信息学领域中英文文献中数据集/仓储质量和文献质量之间存在显著的相关关系。

  关 键 词:科学数据 引用规范 数据共享 生物信息学

  标题注释:本研究受国家哲学社会科学基金青年项目“基于社区发现的学术WEB主题显著度研究”(项目编号:13CTQ031)和中央高校基本科研业务费专项南京农业大学创新项目“科学数据集的引用行为及其影响力研究”(项目编号:SKCX2016005)支持。

  1 引言

  随着计算机技术在科研活动中的频繁应用,科研数据成为科研活动的重要产出。科研数据的价值作为学术生态系统的一部分这一事实已被越来越多的人认可[1],然而,由于技术、经济、政治和人力资源等方面的限制,并不是所有的科研人员都有条件进行基础数据集或者平台的建设,这就需要数据创建者能够主动提交科研数据到可用的开放平台,以便其他科研人员进行深入研究,以实现数据的再利用和研究过程的复现。数据共享能够极大程度地减少数据的重复搜集、提高科研效率、增加科研产出。基于目前相关技术、政策和激励机制比较缺乏的事实,科学数据共享的实践并不是很理想。科学数据引用作为科学数据共享的主要表现形式,其引用规则的制定是当前学界讨论的重点。实现科学数据引用形式的规范化便于对数据创建者的贡献度、数据的可靠性、数据的学术影响力进行科学评价。但是,鉴于目前并没有形成规范化的数据引用形式,科学数据引用行为的研究尚存在很多未解决的问题,科学数据对于科学研究的价值及影响力的评价更是无从谈起。

  数据引用是类似于论文中的文献引用,也是一种基于出版物的引用方式。通过一定的标识技术和机制,对所使用的科学数据资源进行描述,标识数据的来源,从而在一定程度上促进数据的知识产权保护,便于进行数据引用情况的统计和分析[2]。数据引用规范化的重要性在学界已得到重视,但实施过程还是困难重重。首先,虽然研究人员已经意识到数据引用的重要性,但是还并没有形成对数据使用进行标识的习惯,致使数据引用行为随意而凌乱;其次,各学科领域的数据产生、传播、存在形式多种多样,很难制定适用于所有学科的统一标准;最后,因数据引用标准的制定涉及研究界与出版界中多个角色的利益与责任,这就需要制定的标准能平衡各方利益,而且能限定各角色应负的责任。国际数据引用综合工作组于2014年2月完成了数据引用共同原则的最终定稿[3],这些原则可以扩展到所有学科以及各种类型的数据中,且学术界和出版界在数据引用实践上达成了广泛共识。这一共同原则的出现,使得数据引用标准化的实现又向前迈进了一步。

  科学出版物应该是由观点以及支持该观点的论据组成的[4],而数据就是最具科学性权威性的论据。随着数据引用逐步规范化,对于科学数据的引用行为进行合理评估也应该引起人们重视。本研究为实现科学数据价值的定量化评价,通过构建基于生物信息学领域的数据引用元数据的框架,并借鉴基于引文分析的文献计量和基于影响力分析的网络计量的评价方法,以引用、下载和网络述及为主要评价指标,试图从多角度量化评价数据引用对于科学文献的重要程度。此外,通过中外数据引用行为对比分析,以揭示国内外在科学数据管理平台建设、科学数据引用形式特征等方面的异同点。

  2 相关研究

  近十多年来,面对如火如荼的科学数据共享活动,如何能够知道数据对于其他研究者有用呢?数据引用就是形式之一。既然数据引用如此重要,相关研究也是必不可少。Piwowar等[5]、Belter[6]以及邱均平等[7]均以量化的分析方法从基因表达矩阵实验、海洋学、生物化学三种领域通过评估数据引用行为揭示了数据共享的优越性——同类文献中,将数据存储在公共仓储中的文献具有更高的文献计量影响力。同时,梳理国内外相关研究发现,依然存在着数据引用规范格式不兼容、文献管理软件缺乏对数据引用的支持、并且数据引用利益相关者责任与义务不明确等问题[8]。

  随着学界对数据共享的急切需求,数据引用规范化已成为亟待解决的首要问题。目前,利用数据引用机制进行高质量数据推荐的目标还无法实现[9]。虽然各国家或机构在遵循《数据引用共同原则》的前提下[3],根据具体情况制定了适合自己的数据引用规则,如Dataverse Project[10]、基础科学数据共享网等[11],但数据引用的实践效果并不够理想。Piwowar[12]通过分析癌症微阵列临床试验领域10年间11603篇文章发现,目前数据共享水平低且发展缓慢,在人类与癌症这种数据影响力巨大的学科领域数据共享却极为有限。Nicolas Robinson等以DCI为基础分析发现数据引用因学科领域的差异而存在巨大不同[13],张英杰等[14]同样以DCI为基础通过调查问卷的方式研究科研人员的数据引用情况,丁楠也通过分析我国图书情报领域以及社会学期刊的数据引用行为[15,16],共同揭示了国内科研人员针对科学数据引用依然存在着认识不充分、引用行为不规范等诸多问题。同时,我们也应该认识到数据引用行为的推进需要相关机构的政策实施,Piwowar和Chapman统计分析2006年发布在基因表达谱上可以开放访问出版模式的期刊中涉及GEO数据库的数据引用行为,得出开放政策程度更高的期刊拥有更高的影响因子这一结论[17],而Mooney和Newton也在研究中发现大约有一半的期刊都有数据引用指南手册,但是却很少有文章能遵循手册对数据引用进行规范标注[18],这就需要鼓励期刊机构在树立相关政策的同时也应注意实施的力度。数据引用的对象主要是数据仓储、数据集或数据记录,数据出版主要涉及学界与出版界。Ball等对数据出版商、期刊出版商及作者各自的责任给出了详细说明[19],王丹丹也在分析数据规范引用的基础上对其参与者的责任进行了分析[20]。

农大论坛_农大BBS|中国农大论坛|中国农大BBS|中国农大考研论坛-www.nongdabbs.com
推荐图文
相关文章

Copyright @ 2010-2017 xkwok.com All Right Reserved |
免责声明:本站所发表的作文版权归作者所有,若转载或者抄袭他人作品,带来的一切后果与本站无关。
若您发现本站存在您非授权的原创作品,请第一时间联系本站删除!