基于文本挖掘的菊花类诗词评论的情感分析研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

中国有着悠久的菊花文化,许多名人墨客都曾以菊花为题材创作了无数古今流传的名作,其中与菊花有关的诗词也是多如繁星。而读者在阅读菊花相关题材的诗词时,往往没有那么多的精力通读所有的诗词。本课题以网络上用户对诗词的鉴赏为切入点,尝试提取鉴赏中的情感信息,对诗词以及读者的观点,倾向和情感有一定的了解。其目的在于节省用户的时间,帮助用户更有效率的通读诗词。

情感词典最早可以追溯到1998 年,whissell[1]要求148名受试者用5个附加单词来描述数学、物理学、电视、报纸、生物学和技术等术语,然后与情感词典中广泛使用的情感词进行匹配。在之后的几十年中,众多学者在研究中对情感词典不断进行拓展完善, whissell[2]对原先构建的情感词典进行了修订,以提高词典对自然语言的适用性。情感词典较早出现在国外,英文词典资源丰富且具有优势,于是李寿山等[3]利用英文种子词典,借助机器翻译系统,构建了中文情感词典。上述的情感词典是最基础的情感词典,即只对广泛使用的情感词如“美”“棒”“差”等词进行整理形成情感词典,然后将需要处理的文本与情感词典中的词进行匹配,统计正面和负面情感词出现的次数,以进行文本情感极性判断。但是,基础情感词典中的情感词覆盖率较低,无法结合语境、语义,也无法识别同义词、近义词等,并且主要依赖人工统计文本中情感词出现的次数,所以在后来的研究中学者们对情感词典进行了进一步完善。考虑到语境迁移的影响,现有的情感词典应用到旧词新用的语料中分类效果较差,阳爱民等[4]用若干个情感种子词计算基础情感词的情感倾向值,利用搜索引擎返回的共现数构建了情感词典。rao等[5]提出了一种有效算法和三种删减策略自动构建词语级的和话题级的社交情感检测词。对于语料库的构建的研究相对于更晚一些。所用到的语料基本上是来自网络上评论信息。目前的情感语料库,就大多数来说,可以分为两类,分别是原始以及标注语料库。 mpqa 库,相对来说是较早的语料库,它是由 nrrc summer workshop主持开发的。 quan[6]等人从三个层次进行标记,并以此为基础,构建了博客语料库。在情感语料库的构建工作上我国的学者也投入了相当多的精力,如清华大学学者,标记了有关各地景点的语料[7],上海交通大学宋鸿彦[8]等人构建了一个中文意见型注释语料库。大连理工大学的徐琳宏[9]等人构建了一个关于社会上存在的文本书籍的语料库。国立台湾大学的古伦维[10]等人对其也投入了相当大的精力,构建出了一个可以用于意见提取的语料库。情感分析粗略的可以分为细粒度和粗粒度两种情况,对于目前来说,研究工作大多停留在粗粒度层面上。在此方面的情感分析工作大致集中在篇章级和句子级上,对于此方面的情感分析工作,我们可以理解为一个简单的分类问题,也就是说,在这个层次上,只是将文本分为大致的几个方向,如正向、负向等等。有些学者利用情感词典进行分类,然后计算极性求得其情感倾向。也有一些学者在情感分类中首次使用的贝叶斯、大熵与支持向量机等机器学习模型然而,随着社会的快速发展,产品属性的多样化,用户也越来越关心产品的各个属性的分析,甚至于一些用户更在乎某几个属性;商家也逐渐开始把目光放到这些评论信息上,希望从这些评论信息中找到用户的使用感受以及用户的消费倾向。因此,如果只进行些传统的粗粒度分析,对评论文本做整体上的二极划分,已经或者再也无法满足用户、商家以及生产商的需求了。因此促使众多学者将目光转向了细粒度层次的情感分析方法的研究。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究的目标:是探寻较优的基于诗词类鉴赏文本的情感分析方法。情感分析有两类方法,本课题从细粒度情感分析入手,以菊花诗词的鉴赏文本为数据,测试有实用价值的分析方案,对诗词作出清晰准确的描述及解释。

研究内容:

1.搜集诗词鉴赏的文本,对文本进行分词处理,达到精炼的要求

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法:

1.文献研究法:通过图书馆,互联网,电子资源数据库等途径查阅大量文献,理解细粒度情感分析方法的相关知识,理解情感分析中数据处理的关键点,获取类似细粒度情感分析的相关研究信息,为设计提供思路和参照。

2.统计分析法:运用数据分析软件,采用人工操作和计算机统计相结合的方法,进行定性与定量分析。经过人工和计算机校对筛选出所有合乎要求的信息,在定量研究的基础上进行定性分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

特色或创新之处

(1)以较为小众的诗词鉴赏为文本进行情感分析,可以填补当下对诗词标签内容的缺失,帮助更多人接受诗词。

(2)通过细粒度情感分析技术,为诗词鉴赏运用到更多方面提供新的视角。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 研究计划与进展

研究计划及预期进展

2019年12月,开题准备工作,查找基于网络资源的细粒度情感分析方法的相关资料,了解国内外的发展动态,对课题进行可行性分析,确定课题的最终研究方向及课题内容。

2020年1月-2020年2月,进行深入学习,认真学习与本课题相关的的理论知识。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。