基于深度学习的新闻文本分类算法开题报告

 2022-01-14 11:01

全文总字数:4395字

1. 研究目的与意义、国内外研究现状(文献综述)

课题的意义

文本分类早期的研究主要是基于知识工程[1],其分类的规则需要人工地去定义然后提炼出来,再按照分类规则去构建分类器,该方法不仅耗费大量的时间和精力,而且还要求领域内的专家具有一定的经。为了克服这种手工分类方式带来的困难,随着机器学习的兴起,机器学习文本分类技术开始取代早期的分类方法[2].深度学习作为机器学习的一个分支,近年来随着高性能计算的发展以及大数据时代的来临,已经在学术界以及工业界引起了广泛的影响,并渗入了各行各业。深度学习与传统机器学习最大的不同之处在于深度学习有自动获取特征的能力,这样就免去了传统方法在繁杂的特征工程中耗费的成本。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究目标

比较卷积神经网络算法和循环神经网络算法,在进行文本分类任务时的准确率;同时,实现具有较高准确率的新闻文本分类算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法

首先对新闻文本进行预处理,将其转化为可以用作神经网络算法训练的训练数据。由于字符级卷积神经网络算法和循环神经网络算法,所需的训练数据格式不同。所以需要将文本预处理分为两个部分。对于字符级的卷积神经网络,需要将新闻文本进行one-hot编码;对于循环神经网络算法,则需先将新闻文本分词,然后使用cbow模型将分词后的数据训练为词向量。

其次,分别编写卷积神经网络算法,和循环神经网络算法。并将数据集分为训练集和验证集,调整模型中的超参数,并使用十折交叉验证法对模型的准确性和泛化能力进行验证。最后,将准确率最高的模型与已有的文本分类算法作比较,验证模型的有效性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

特色或创新之处

1.使用深度学习算法来进行文本分类,免去了传统方法在进行文本分类时构建特征工程所耗费的成本。

2.将卷积神经网络算法和循环神经网络算法相比较,确定最佳的文本分类算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 研究计划与进展

研究计划及预期进展

2019.3.6-2019.3.15 完成数据的预处理部分,下载数据,并将其转化位可以用于算法训练的格式

2019.3.15-2019.4.15 完成算法部分,编写卷积神经网络算法和循环神经网络算法,调整最佳参数,并找出最佳的分类算法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。