1. 研究目的与意义、国内外研究现状(文献综述)
生物基因序列数据与农林科学研究息息相关。
本文以15种农业学术期刊作为数据来源,对我国农林科学领域的基因序列数据研究热点进行识别和挖掘。
以信息计量分析原理为基础,运用引文分析等方法对google scholar中的发文量和web of science被引频次进行计量分析,进而分析基因序列数据在什么物种领域受欢迎以及作者对基因序列数据的态度等,以发现我国农林科学领域的发展现状以及研究热点,从而给农林科学领域的基因序列数据研究和生物信息数据共享研究提供一定的借鉴。
2. 研究的基本内容和问题
关于数据共享, 现实中存在一些认知和技术上的障碍,比如科学家不愿意共享数据, 担心同行竞争,认为缺少足够的回报,不熟悉相关数据保存机构,缺少简便的数据提交工具, 没有足够时间和经费等。
解决这些问题及改善共享文化的关键在于使共享者获得适当的回报(比如数据引用)。
基于同行评审的数据发表被认为不但能够为生产、管理和共享数据的科学家提供一种激励机制,并且能够有效地促进数据再利用。
3. 研究的方法与方案
本文的研究核心是利用从1829篇农业学术文献中提取的有效生物基因序列号,在google scholar搜索出的文献量和首次提及这个基因序列号的文献在web of science中的被引频次数据作为基础,对信息计量指标进行实证分析比较。
通过研究文献量的差异和高被引频次的文献中的演变趋势,运用引文分析法、比较分析法和统计分析法进行计量分析,以发现生物基因序列的研究热点和生物信息数据共享现状及其发展趋势。
1.引文分析法本研究通过从web of science数据库中进行检索,记录文献的被引频次。
4. 研究创新点
近年来随着人类基因组计划、各种微生物基因组计划、小鼠基因组计划、水稻基因组计划以及各种动植物基因组计划的顺利实施,基因数据也随着不断增加。
如果对这些生物分子序列的数据进行科学的分析和处理将会推动生物信息学的发展,因此对某个基因序列研究的文献量的多少和文献被引频次的高低就可以判断该序列是否成为一个热点。
目前生物信息学的研究方向主要集中在核酸和蛋白质两个方面,包括核酸和蛋白质的序列、结构和功能的分析研究。
5. 研究计划与进展
热点物种领域分析文献数量的差异,可以大致的反映出农林学科领域的某些特点和规律,从而挖掘农林学科领域物种研究的现状、研究热点及发展趋势。
google scholar文献量分析本文利用从1829篇农业学术文献中提取的有效生物基因序列号877条,分别把每条序列号经过google scholar检索,以得到研究或提及这些基因序列号的发文量。
科学文献量是衡量科学知识量的重要尺度之一,某基因序列号检索出的论文量可以直观反映该基因序列被研究的情况,由此可以看出此基因序列是不是相关研究的热门。
