1. 研究目的与意义、国内外研究现状(文献综述)
科学数据是科研人员从事科技活动所产生的原始观测数据、统计数据,是科学研究基本来源的事实记录,具有明显的潜在价值和可开发价值,并在应用过程中得到增值。作为最基本、最活跃、影响面最宽的战略性科技资源, 科学数据对于科技创新具有显著的基础支撑作用[2] 。
近年来,科学数据的数量呈指数增长,科学数据逐渐成为和研究论文同样重要的科研产出,大多数研究人员、资助机构、图书馆和出版商都认同开放和重用科学数据的好处。
从诸多研究来看, 科学数据分享的积极因素有:(1)支持科学质询。(2)为后续研究提供基础数据。(3)投入研究的经费得到充分利用 [3], 避免因为重复研究造成资源浪费。(4)提高与其他科研人员和机构的合作机率。(5)为稀有数据的长期有效保存提供条件。(6)对作者和研究机构的声誉和知名度产生正面影响[4]。科学数据共享的阻力主要来自于以下几个方面: (1)保证数据生产者的回报。(2)时间、人力和资金花费。(3)法律问题[5]。(4)保密问题。(5)数据安全问题[6]。上述科学数据共享面临的障碍及其解决方案仍有待进一步研究。
2. 研究的基本内容和问题
科学数据共享起源于科学研究和学术创新的要求,国家政府机构、基金会、学会协会和出版者是科学数据共享的主要推动者。所需的数据存储和数据共享的政策,极大地促进了开放获取的科学数据的发展,科学家们可以根据公布的结果进行验证,探讨分析的新方法。营造科学数据共享的丰富环境,将创造更多的数据,使研究人员能够方便地发布,发现,访问和使用的数据库环境,开放获取的科学数据环境逐渐形成[1]。引文分析是应用数学,统计和逻辑方法,对期刊,报纸,书籍等分析对象的引用或被引现象的分析研究,旨在揭示其数量特点和内部规律,评价和预测科学的发展趋势。
由于数据共享机制不健全,数据质量没有得到有效保障,使得研究人员只能依靠自己观测数据,其后果是重复投入,浪费经费、人力和物力的现象广泛存在于科研实验中。调查显示,目前进行的科研项目中,90%的科学数据管理很松散,科学数据在项目完成后没有明确保管职责,数据流失、损坏的现像相当严重。这些科学数据的存储、使用、保护、更新维护等重点问题需要得到关注。本文通过对科学数据的引用与被引用现象进行分析研究,以便揭示数据分享后引用行为随时间的变化趋势、数据分享与引用次数的关系等内在规律。
3. 研究的方法与方案
由于生物化学学科正在成为当前的研究热点,在这一领域的研究成果数量众多且理论与技术都更加成熟,更重要的是针对生物化学学科科研过程,一般会产生大量科学数据。由于数据共享机制不健全,数据质量没有得到有效保障,使得研究人员只能依靠自己观测数据,其后果是重复投入,浪费经费、人力和物力的现象广泛存在于科研实验中。调查显示,目前进行的科研项目中,90%的科学数据管理很松散,科学数据在项目完成后没有明确保管职责,数据流失、损坏的现像相当严重。这些科学数据的存储、使用、保护、更新维护等重点问题需要得到关注。
(一)数据来源
本文通过选取维基百科中生物化学学科测试动物基因组中的118条参考文献作为原文,在web of science上查询原文信息与它们的引文信息,通过一一详细记录这些原文的外部特征、数据分享与被引情况,并利用excel在初步统计的基础上,经过进一步的加工和计算,以揭示科学数据分享促进引用的具体过程与规律。
4. 研究创新点
目前,国内外关于科学数据共享的研究主要侧重于科学数据共享对引用行为的促进作用。
除此之外,本文的创新之处在于还研究了以下问题:数据分享与高影响力论文之间的关系;数据分享后引用行为随时间的变化趋势;各国数据分享现状;期刊对数据分享的促进作用。
5. 研究计划与进展
我将严格按照学校规定的关于毕业论文完成的时间安排来完成我论文的各个阶段,具体安排为:
2014年2月2014年3月,进行资料收集,文献总结等工作;
2014年3月2014年4月,完成原文与引用文献的期刊、作者、影响因子、国家等信息特征的统计;
