1. 研究目的与意义、国内外研究现状(文献综述)
本课题的意义
随着微博的广泛使用,人们的生活发生了诸多变化,信息传播模式也发生了极大的改变。微博已不仅是一个社交平台,更成为了一个媒介平台,人们既可以在微博上接收信息,也能在这个平台上创造和传播信息。而微博上的信息良莠不齐,充斥着大量的水军,大量水军的造势能够引导网民对于某些热点事件的态度,从而导致网络上的信息质量堪忧,因此如何自动识别微博水军对于控制网络舆情,提高互联网信息质量具有重要的作用。
国内外研究概况
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
研究目标
通过大量的微博数据建立数据库作为实验数据集从博主的发文内容和评论内容中提取特征进行建模后通过算法分析对数据处理后并进行数据分析对比,最后得出结论是否为水军。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与方案
研究方法:
1、大量数据的挖掘;
2、文本内容特征的模型的建立;[文本相似度,url率,活跃度(发文频率),提及与被提及次数,](sigmoid 函数, 逻辑回归的方法)
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
1.现在对微博的研究较少,有较强的实用价值;
2.对原创微博进行研究,数据更具结构性,结果更准确;
3.通过多种算法比较,得到数据更具有可靠性。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
5. 研究计划与进展
2015年12月-2016年1月,完成微博的数据挖掘建立数据库;
2016年2月,完成文本特征的建模;
2016年3月,完成文本的处理;
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
