学术不端事件中的Web用户情感演化研究开题报告

 2022-01-31 09:01

1. 研究目的与意义、国内外研究现状(文献综述)

(一)课题研究意义

在国家的大力支持下,我国的学术水平呈现飞速增长的状态,学术期刊论文发布数量不断高速增加[1]。但是在这样值得欣喜的成绩下,学术界却被爆料出很多学术不端的事件,在社交网络平台上引起了广泛的关注和讨论。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

(一)研究目标

研究基于情感分析、统计分析和数据可视化方法,对学术不端事件在专业学术型网络社区、公众网络社区中衍生的情感态势的进行了演化研究,提出了一种情感演化分析体系,对比分析两类网络社区用户情感演化的不同,最后通过具体学术不端事件进行验证,从而把握舆情演变规律,提出有针对性的舆情应对方法。

(二)研究内容

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

(一)研究方法

1、文献研究法。通过对中国知网、万方、Webof Science、EBSCO 等中外文数据库的检索,查找期刊、博硕士文献等资料,收集全面现有的研究为本研究提供理论支撑,全面的梳理阅读国内外关于学术不端事件文本数据集获取途径研究、情感倾向判别、與情演化分析研究等相关学术文献,借鉴现有的研究成果,在此基础上展开研究得出自己的研究结论。

2、案例分析法。在对近几年发生的学术不端事件梳理的过程中,基于案例的动态发展阶段、社会影响力和资料的可获取性的原则,选取有代表性的学术不端事件为典型案例进行研究。基于案例在专业性学术社区、公众网络社区中的文本数据,结合文本数据挖掘的方法,对学术不端事件的舆情情感生态演变模型,并利用统计分析的方法进行各阶段特点分析。

3、文本数据挖掘法。舆情情感演化过程是一种文本建构的过程。通过对专业性学术社区(例如小木虫)、公众网络社区(例如微博)中文本及用户的评论文本、用户属性等资料进行数据获取,结合文本数据挖掘研究方法,对数据集进行清洗和情感分析,使情感倾向可量化,定义情感热度划分情感演变的不同阶段,以建立舆情情感生态演变模型。

4、统计与可视化分析。通过统计分析方法,利用散点图作情感分布可视化分析。通过折线图和面积图,判断各阶段情感态势演化情况,在对情感热度进行数值离散化处理的基础上,通过堆积柱状图显示不同情绪类型的比例关系。最后通过评论信息的空间分布属性、评论者的年龄规律和关注人数、粉丝人数,作地域分布热力图、用户年龄段占比分析以及舆情意见领袖影响趋势对比,进一步分析舆情的空间分布规律。

(二)技术路线

三)实验方案

本课题研究工作分为四个阶段

第一阶段:数据源确定、文本数据集获取与预处理

(1)对近几年发生的学术不端事件梳理,确定选取有代表性学术不端事件为典型案例;

(2)分别针对小木虫学术社区、微博、微信公众号进行数据获取。数据获取内容包括主体报道,报道评论以及评论者属性等数据的获取;

(3)对数据中重复、缺失严重的数据以及无效、无关数据、异常数据进行删除。

第二阶段:情感倾向分析

(1)利用Python语言对文本数据集进行中文分词,去停用词等文本处理工作;

(2)随机选取文本数据集评论中正向情感和负向情感样本各300条,人工标定情感倾向的正负,作为训练集;

(3)利用朴素贝叶斯分类器进行评论测试集的情感倾向预测。

第三阶段:舆情情感演变阶段划分

定义情感热度,计算情感热度,绘制出全时段评论的情感热度分布图,划分演变阶段并对演变过程中出现的情感拐点、趋势变化进行分析说明。

第四阶段:舆情情感演变统计可视化分析

利用散点图作情感分布可视化分析,通过折线图和面积图,判断各阶段情感态势演化情况,对比分析两类不同网络社区情感态势情况。通过评论的空间分布属性、评论者的年龄和关注人数、粉丝人数,作地域分布热力图、用户年龄段占比分析以及舆情意见领袖影响趋势对比和舆情的空间分布规律。

4. 研究创新点

网络舆情研究中,将一个事件看作具有一定的生命周期,即任一事件的舆情都会经历从产生到爆发直至消亡的过程,具有一定的时间连续性,本研究针对的学术不端事件也是如此。因此,国内外的研究中在针对生命周期演化分析研究上达成了较为一致的共识。但是,根据研究视角的不同,对于舆情阶段的划分有所不同。

现有微博舆情的研究则多聚焦于與情的生成演化,探讨舆情生命周期中的某一个或几个环节,对完整的舆情演化变化的研究并不多见。其次,目前对于舆情发展阶段的划分多从微博评论量、转发数、关注度等角度进行考虑,以情感倾向作为划分依据并没有太多研究将其考虑考虑在内。

本研究的特色之处是情感倾向为舆情阶段划分判据的全生命周期演化阶段分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 研究计划与进展

根据研究内容及毕业设计要求,具体研究计划预期及进展如下:

时间

研究项目

进展

2020年3月1日—

3月15日

完成第一阶段计划,数据源确定、文本数据集获取与预处理

形成可进行情感训练的文本数据集

2020年3月15日—

3月25日

完成第二阶段,情感倾向训练与预测

形成量化的情感数据集

2020年3月25日—

3月30日

完成第三阶段,舆情情感演变阶段划分,计算情感热度,绘制出全时段评论的情感热度变化图,并进行分析和说明。

可视化情感演化分析模型及分析结果

2020年4月1日—

4月10日

完成第四阶段,舆情情感态势演化可视化分析

产出各类数据分析图表及数据分析结果

2020年4月

准备论文研究成果汇报,完成项目研究的论文

完成论文

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。