基于深度学习的CSSCI学术论文类别判定模型构建研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

(一)课题研究意义

随着人们对科学技术和社会发展的日益重视,学术领域呈现多元化、信息化、现代化的趋势。在这种情况下,研究者们比以往任何时候都迫切地需要高效、全面、方便的学术信息。因此,中文科技论文文本分类研究具有较高的理论研究价值和应用前景。传统的人工分类目前面临两个问题:一个是随着期刊论文数量的快速增长,人工分类显得心有余而力不足,这无疑给分类工作增加了很大的压力;第二个问题是人工分类存在一定的主观性,分类工作人员一般会通过期刊论文的标题和来源来确定论文的类别,比较少的阅读论文全文来对论文进行分类,因此分类的正确率受人的主观意识影响很大。鉴于这种情况的基础上,研究期刊论文的自动分类能够有效的解决以上两个问题,不仅可以减轻人工分类的压力,提高分类的效率,还能提高分类结果的正确率,减少主观因素的影响。

(二)国内外研究进展

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究的目标、内容和拟解决的关键问题

本课题的研究目标是:

寻找一个可以提高论文分类的效率和准确率的分类模型。通过了解当前论文的分类方法,以及其中存在的问题,结合相关的分析理论和深度学习模型,找到一个最佳的论文自动分类模型,实现高效率对论文进行精确分类。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法:

根据cssci1998-2016年所收录的所有论文的题录信息,使用神经网络算法对社科类论文进行自动分类,并尝试使用预训练词向量技术、加载预训练语言模型的迁移学习方法,提高分类器分类效率与性能。

技术路线:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

目前期刊论文自动分类工作主要是利用人工智能方法构建分类库,再利用分类库进行分类,本课题在分析国内外文本自动分类研究现状的基础上,提出运用有监督的深度学习实现自动分类,利用机器对有限的样本进行学习构建神经网络分类器,实现自动分类,不仅避免了构造分类库的问题,还可以解决构建分类库中人工标引难度大、主观性大的问题;

将迁移学习运用于论文主题分类问题,通过对不同的预训练语言模型进行下游任务fine-tuning,探索可用于文本分类的最优预训练模型;

5. 研究计划与进展

研究计划:

2019年11-12月,明确研究内容,完成文献综述,下载文献数据。

2019年12-2020年2月,数据获取工作初步完成,并着手进行数据的清洗。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。