科技类中文文本的情感分类研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

一、课题意义

文本情感分类是情感分析领域的核心问题,旨在解决文本情感极性的自动判断问题。近年来,情感分析已经成为自然语言处理领域的热点研究话题,针对各个领域的研究也越来越多。随着互联网评论数据规模与日俱增, 越来越多的学者意识到网络新闻文本情感分析的重要性,深度学习技术的快速发展吸引越来越多的研究人员使用深度学习技术来解决文本分类问题[1]。目前对新闻评论及新闻情感分析的研究已经有一定的成果,但针对科技类新闻的情感分析研究较少。近年来学术不端的事件,引起了学术界甚至大众的普遍关注,科技类文本也引起了各界人士的密切关注。针对科技类文本进行情感分析可以对学术界舆情进行分析、控制和预测,因此本项目具有实际的研究意义。

二、国内外研究进展

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

一、研究目标

该研究拟选取某一网站的科技新闻板块,对网站上的数据信息进行抓取,利用机器学习方法对文本正负面倾向进行分类,便于针对学术腐败等行为进行抽取。

二、研究内容

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

一、研究方法

1.特征提取部分

在之前研究使用tf-idf和信息增益ig的基础上,本次研究选用countvectorizer和较稳定的word2vec进行特征提取,对文本初始高维特征进行有效的降维。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

目前国内对科技类中文文本研究较少,本研究创新之处在于针对科技类中文文本用词隐晦,较少使用具有明显情感倾向的词语等特性,比较得出分类准确率更高的分类方法。

5. 研究计划与进展

一、查阅相关文献资料,撰写综述,了解研究大致流程与步骤;

二、对现有的少量文本进行预处理后尝试各类算法的可行性;

三、对算法进行调整,计算各类方法的分类准确性;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。