1. 研究目的与意义、国内外研究现状(文献综述)
近年来,微博作为一种新型的网络社交服务,不仅为广大的网络用户提供了一个分享信息的平台,使得每个个体都可以成为自媒体;同时也成为了一个巨大的定制化社交平台,人们通过微博可以及时获取自己关注的账户的动态,并进一步与其互动、交流。
微博的发展记录了人们的生活,见证了社会的进步。
目前,新浪微博占据了国内微博市场的大多数份额,如此大的用户群也使得对其的用户行为特征研究成为了热点。
2. 研究的基本内容和问题
为了对新浪微博用户的行为特征进行更为有效的分析建模,本文借鉴了国内学者杨小朋与何跃对腾讯微博用户行为特征分析的所使用的研究方法,在采取到的新浪微博用户及微博数据的基础上,进一步验证微博热度的可信度,从用户行为特征的角度出发,定量分析用户粉丝数、关注数等一些关键数据并,分析其总结出的用户行为模型,最终得出微博用户行为特征与分类。
3. 研究的方法与方案
研究方法:利用开源网络爬虫进行微博数据挖掘,借鉴了国内学者杨小朋与何跃对腾讯微博用户行为特征分析的所使用的研究方法,使用spearman相关系数考察用户粉丝数量、关注数量以及微博数量等几组变量之间的关系紧密程度。
利用pearson相关系数分析微博的热度与微博转发数量的关系,进行聚类分析,得出微博用户行为特征分类。
技术路线:数据字典设计,数据采集,数据获取,数据可视化分析。
4. 研究创新点
利用开源网络爬虫进行数据搜索,并结合数据可视化软件进行分析。
5. 研究计划与进展
研究计划是在采取到的新浪微博用户及微博数据的基础上,使用spearman相关系数考察用户粉丝数量、关注数量以及微博数量等几组变量之间的关系紧密程度。
利用pearson相关系数分析微博的热度与微博转发数量的关系,进一步验证微博热度的可信度。
其中微博热度(mci)是指学者杨小朋建立的评价微博影响力的指数,也就是评价用户信息行为的影响力指数,其公式为:mci=粉丝数/微博数,并验证其有效性,提出改进方案。
