- · 《吉林大学社会科学学报[09/01]
- · 《吉林大学社会科学学报[09/01]
- · 《吉林大学社会科学学报[09/01]
- · 《吉林大学社会科学学报[09/01]
- · 《吉林大学社会科学学报[09/01]
社会科学科研人员数据复用行为研究* ——以经
作者:网站采编关键词:
摘要:科研数据复用(Data Reuse),也叫二手数据使用,指的是科研人员为了新的研究目的对已有科学数据的再次利用[1-2]。目前,自然科学领域的科研数据(如实验数据)因其结构较为规范,在基因
科研数据复用(Data Reuse),也叫二手数据使用,指的是科研人员为了新的研究目的对已有科学数据的再次利用[1-2]。目前,自然科学领域的科研数据(如实验数据)因其结构较为规范,在基因学、地球科学、天文学、物理学等领域其数据复用实践较为普遍,如Piwowar等(2011)在《自然》杂志上发表的论文称,基因学使用二手数据已发表了1150篇新论文[3],比较典型的事例是Fear等(2005)利用二手数据对阿尔茨海默症的检测和早期诊断研究取得了突破性进展。社会科学领域科研人员依赖于他人收集的数据进行研究的传统也由来已久[4],这些二手数据主要包括大规模的数据集(如人口普查和一般社会调查)和小规模的二手数据收集(如来源于科研人员和科研团体的数据集),如经济学、社会学、管理学数据复用实践较多[5],是社会科学领域科研数据复用的主要阵地。
从20世纪90年代始,就有学者对科学数据复用展开探讨,而近年来随着科学数据管理的兴起,科学数据复用又再次引起学界关注。从用户(数据复用者)角度研究数据复用主要分布在基因学[6-8]、生态学[9]、地球科学[10-12]、博物馆学[13]、健康科学[14-15]、社会科学[16-19]等领域,主要研究了不同学科的科研人员数据复用行为过程特征,如数据需求、数据获取、数据处理、数据评估及使用的行为过程特征(如Zimmerman(2003),Daniels(2014),Murillo(2016),Zhang(2011),林奇秀(2017))和数据复用态度、意愿、行为影响因素及其作用机制(如Faniel(2016),Yoon等(2017),Kim (2017),文静等(2019),李佳潞(2019))等。在社会科学领域,Curty(2015),Yoon等(2017),Niu(2009)等利用访谈和问卷等方法探索了社会科学数据复用意愿和评估的影响因素;沈婷婷(2015)[19]利用内容分析法对社会学463篇样本文献进行了编码,探索了社会学二手数据利用行为,重点分析了数据使用的适用性和时效性;林奇秀和賴璟毅(2018)[20]利用内容分析对中国台湾学者发表在经济学、政治学、社会学、教育学、心理学五个学科的文章数据复用比例和数据来源类型并进行了对比,发现不同学科的数据来源类型有明显差异,经济学中的数据复用最多。因此,鉴于国内外社会科学数据复用研究针对某一学科的研究很少,为进一步深化和补充现有研究,文章以国内经济学领域为例,探索本土社会科学科研人员数据复用行为,以期为政府数据管理政策的制定和图情机构数据服务策略提供参考。
1数据来源与方法
1.1样本说明
通过咨询经济学领域专家学者,确定国内经济学领域四本权威期刊,分别是《经济研究》《中国工业经济》《经济学季刊》《世界经济》,为保证研究的实效性,选取了近三年(2017年1月—2019年12月)4本期刊发表的全部论文共1351篇论文为样本,样本来源于中国知网,具体样本的分布如表1所示。
表1 样本期刊与论文数期刊样本数(篇)样本比例(%)经济研究.7中国工业经济.9经济学季刊.8世界经济.6
1.2编码体系
1.2.1 编码依据和说明 主要编码类目的确定,按照数据复用行为过程特征研究的路线,在进行类别划分时遵循内容分析法的全面性和互斥性原则,对作者的年龄和性别、数据是否复用、是否有数据标题、数据来源类型、数据评估的判据、数据获取障碍、数据处理方式等一级类目进行识别,其中论文内未涉及的部分识别为空值,并在此基础上计算了每一篇有数据复用的文献的数据复用规范程度。
1)性别和年龄:根据内容分析所选择的样本,提取全部样本(1351篇)第一作者的性别变量与年龄变量,在检索过程中,我们对同名作者的姓名和单位进行了校对,对于同名作者进行区分并分别搜索,对于同一作者不同单位发表文章的现象,我们通过核对其履历,查看其以往单位进行最终的确定。如中国知网并不能找到完整的数据,通过百度百科、作者所在单位的官方网站以及作者兼职单位的官方声明等进行补充。
2)数据是否复用:此类目根据数据复用的定义确定,指的是论文的主体部分是否应用二手数据对新的研究问题进行研究,有复用取值1,无复用取值0。
3)有无数据相关标题:数据标题在样本文献呈现出不同的表达方式,如:数据来源、数据、样本与数据、数据说明、变量与数据等,有类似标题的识别为1,然而有的文献则没有明确的数据标题,识别为0,有无数据标题是反映研究者数据复用规范度的指标之一。
4)数据来源类型:统计不同数据来源类型出现的次数,由于同一篇文章会存在各种类型数据同时使用的情况,每一种类型都进行统计,但同一篇文章内同类型数据只统计一次。此类目用来分析各类数据来源所占比例情况,反映数据复用者的数据来源类型使用偏好。
文章来源:《吉林大学社会科学学报》 网址: http://www.jldxshkxxb.cn/qikandaodu/2021/0220/541.html