全文总字数:3628字
1. 研究目的与意义、国内外研究现状(文献综述)
一、课题意义
随着科学研究领域的拓展以及精密仪器的广泛使用,科学数据呈现出爆炸般增长的趋势,尤其在一些尖端科研领域,如基因组学、天文学、生态学、高能物理等领域,科学数据增长速度更为迅猛,目前已经要以 pb计量。而为计算机在科研方面大量应用,科研过程产生海量科学数据。同时,数据密集型科学研究的兴起使科学数据成为驱动科学研究发展的重要力量[1]。但又因为研究规模、研究经费等等原因,大量的研究者无法通过一般方式收集做够支持其研究所需的科学数据,引用开源或者收费的科学数据资源成为了大量研究的首选。海量的已有科学数据固然为考研工作者带来了极大的方便,也带来了相同领域不同数据来源的选择问题、不同数据来源的数据可信度、数据与研究领域匹配度等等一系列的问题。因此对不同领域科研数据的评价变得尤为重要,可以为科研工作者在数据的选择的方面提供一定的帮助,也能更好确定之后数据的收集方向。对科学数据评价的需要对其在已发表的文献中引用情况进行统计,而对于大量的文献分析则需要一种自动化程度较高的方式识别出文献中引用的科学数据。
本研宄探究了自动化地识别学术文献中数据使用行为,是对人工标引方法的有效补充和改进。自动化的识别能够实现对整个学科领域数据使用情况的全局性的把握,避免了采样调研的局限性,从而能够更加有针对性地对领域数据资源的基础设施建设提供有效建议。
2. 研究的基本内容和问题
研究的目标、内容和拟解决的关键问题
课题的研究目标
实现基于bp神经网络算法的文献科学数据引用的标引。
3. 研究的方法与方案
研究方法、技术路线、实验方案及可行性分析
实验方法
本研究将采用数据实验、统计分析,利用信息抽取、语义标注、机器学习等相关技术,实现本项目的研宄目标,编写对文献科学数据自动标引的程序。
4. 研究创新点
特色或创新之处
研究创新
1.利用半自动标注法能够在尽可能的减小工作量的同时,提高识别模型的训练效率。
5. 研究计划与进展
研究计划及预期进展
研究计划
1.学习有关bp神经网络及其优化的相关理论
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。