基于机器学习的涉华新闻情感倾向的分析开题报告

 2022-01-21 21:23:56

1. 研究目的与意义、国内外研究现状(文献综述)

一.研究意义在世界多极化、经济全球化、社会信息化、文化多样化的今天,每个国家都得在世界舞台上更好地展现国家形象,提升国家影响力。而中华民族自成立以来,不断地开拓创新,随着改革开放的迈进步伐逐渐实现了站起来、富起来到强起来的进步,渐渐走进了世界舞台的中央,对于塑造自身形象、提升国家软实力提出了更高的要求。而中国的强势进步也使得西方一些资本主义国家产生了危机感,为了捍卫自己的国际地位和掌控势力,在许多场合利用自己国家的媒体不断地暗示国际社会,提出了中国威胁论等妄言,或者用资本主义国家的标准来污蔑、贬低社会主义国家的体制和制度,否认社会主义国家尤其是中国的政策和成就。在许多涉华新闻中,他们用资本主义国家的新闻框架来定义中国的事件,有意无意地污化中国形象,产生了许多对中国不好的影响。所以中国更应该说好中国故事,履行大国责任,重视国家之间的交往交流,从而才能更好地实现中国梦。西方资本主义国家在国际上占据着十分重要的地位,很多国际事务中有巨大影响力。故中国要踏出这关键一步的话,了解西方涉华新闻报道中的情感倾向无疑具有重要意义,能够帮助中国了解国际社会态度以及合理制定对外交往的策略。

二.国内外研究进展文本情感倾向性分析研究最早可以追溯到世纪年代,主要集中在词语的倾向性计算和文档的情感分类方面。随着研究的进展,情感倾向性分析包含了更广泛的方向。可以将情感倾向分析主要分为两类研究内容:情感评价信息的抽取和情感倾向性的分类。情感倾向性分类将文本情感倾向性分析转化为文本分类问题,利用文本分类技术,判断给定的篇章、段落、句子、或词汇的倾向性。倾向性信息抽取则是更精细的分析方法,包括情感评价对象的抽取,识别词或短语构成的评价要素、情感的主客观分类,情感信息归纳等。情感倾向分析中比较重要的步骤就是分词和句子中的极性特征词的情感判断。在自动分词中,一个重要前提是:至少要在计算的意义上清楚界定真实文本中每个词语的边界。然而, 这样一个起码的要求在二十年前还是可望而不可及的奢想。但是随着2003年7月在日本札幌的首届国际中文分词评测bakeoff成功举办以来,国内外都取得很大的进展。在国内,1983年,北航实现了第一个书面汉语实用分词系统cdws。在分词技术方面,一致认为有三种方式:1.机械切分;2.语义切分;3.人工智能切分,即无词表的汉语自动分词算法。情感分析中最具代表性的方法有基于模板规则抽取的方法和基于关联规则挖掘的方法。02年,bo pang利用贝叶斯分类器,最大熵模型,以及支持向量机等方法对电影评论进行分类,实验中支持向量机取得了最佳分类效果;abbasi等使用句法特征、体裁风格等作为分类器预选的分类特征,然后通过遗传算法迭代进行特征选取,再使用方法对阿拉伯文和英文进行情感分类,获得了比较满意的实验结果。

三.应用前景在处理海量的海外涉华新闻报道时,能够利用这些分析技术更加快速、准确地对那些西方涉华新闻中那些国家的新闻框架、处理态度和感情做出判断和了解,再依次确定本国对有国际影响的大事的处理立场和政策,说好中国故事,塑造好中国形象,提升国家地位。中文分词也是自然语言处理的一个重点突破点,因为中文的复杂、含蓄、暧昧的特点,使得中文分词效果一直不如英文分词。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

一.研究目标本次设计项目目的是针对西方涉华新闻中情感倾向,用机器学习的方法来对特征词进行划分、选取、判断,得出这些新闻报道中那些西方国家的新闻框架和情感态度。

二.研究内容随着互联网的快速发展及互联网的开放性、虚拟性和隐蔽性等特点,人们越来越多地使用网络来发表自己的观点,各个国家更是能借助互联网彼此互通态度、对国家事件认知,而任何言语的影响也就快速、广泛地产生了。

西方国家的涉华新闻报道所形成的舆论力量也成为社会管理者及政府不可忽视的力量。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

一.研究方法1. 通过查阅书籍资料以及网上搜寻相关资料做好前期准备 2. 结合相关资料,了解自然语言处理方面知识3. 获取处理所需的语料库4. 编写具体代码,完善特征提取、分词和操作几个模块性能5. 进行模块间的整合,并调试完成6. 运行完善

二. 研究路线

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

1.涉足新的领域:涉华新闻中情感倾向分析,具有重大的研究意义和实用价值 2.结合多种算法研究比较,尽可能优化完善。

5. 研究计划与进展

2018年1月6号-1月20号:选定论文题目,准备毕业设计论文资料; 2018年1月21号-2月10号:上网查找资料,学习编程方法; 2018年2月11日-3月15日:实现功能和目的,比较算法性能;2018年3月16日-4月10日:完善实现的算法;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付