多策略下的引用人名识别研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

意义:

近年来,各领域的学术水平不断提高,学术论文的数量也在不断增加,由于学术文本中包含许多值得挖掘的有用信息,针对学术全文本的各种研究也不断展开。本文针对学术全文本所包含的引用作者信息进行识别抽取,学术全文本中的作者名一般表明著者对他人研究内容、成果以及观点的引用,有时可作为引文识别的标志。通过识别学术全文本的引用作者,可以挖掘出引文信息,对科研工作者对引文的抽取以及对引文的知识挖掘具有重要的作用。引文是文献的重要组成部分,是合理进行学术科研交流的必要部分,一篇学术文献的形成一般建立在多篇文献的基础上,引文体现了学术论文的引用与被引用关系,通过对引文的定量研究,一定程度上可以帮助了解某一领域的研究现状。通过识别学术论文中的人名,能够帮助研究作者所著有的学术文献被引用次数,有助于衡量文献作者的论文被响应度,论文被响应度可作为衡量文献学术价值和影响的一种测度,因而也从科研成果被利用的角度反映文献、作者在本学科领域内的影响和地位,达到评价核心文献、人才的目的。此外,迅速识别学术全文本中的人名信息,能够帮助研究学术文本的人员直接找到与本文研究内容相关的研究者们。本课题使用基于规则、基于统计以及基于深度学习模型多种方法对学术全文本中的引用人名信息进行识别,并且对这三种方法进行分析比较,探究进行学术全文本中人物姓名识别的最优方法,达到人物识别的最优效果。本文通过对人名的识别,有助于后续对文献著者的定性定量分析,有助于揭示学术文献的数量特征和内在规律,对于研究学科发展和文献的学术影响力大有裨益。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究的目标:

针对学术全文本的引文人名进行深度挖掘,对学术论文中涉及的人物名称进行人名识别,达到将学术文本中所有引用的学者姓名全部识别出的目的

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法:

1、基于规则的研究方法:根据语言特点构建人名识别规则

2、基于统计的方法:使用手工标注的学术全文本语料基于crf模型对文本中的人名进行识别抽取

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

1、利用基于规则、基于统计和基于深度学习多种方法对学术文本人名信息进行识别,探究识别人名性能最好的方法。

2、使用了较新的深度学习模型bert

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 研究计划与进展

研究计划及预期进展:

1、2020.3.20:完成开题报告;

2、2020.4.20:完成中期检查报告

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。