1. 研究目的与意义、国内外研究现状(文献综述)
1、课题的意义国内最大的问答型社区 知乎,它创立于2001年1月底,截止2017年9 月,知乎个人注册用户总数超过 1 亿,日活跃用户量达 2600 万,人均日访问时长 1 小时,月浏览量 180 亿,但不同的用户参与度不同,其影响力也有较大差异。
2017年5月,有数据表明,只有约16%的用户贡献过答案,而剩下的约84%的知乎用户从未回答过问题;且几乎一半的答案从未被赞过,约35%的答案从未被关注。
对于知乎这样的社会化问答平台而言,用户需求呈现多样化,单一的产品和服务并不能满足所有用户,也就不可能最大程度地激发用户的参与积极性及其创造能力。
2. 研究的基本内容和问题
1、研究目标和内容本次研究的主要目标是对知乎用户进行分类,对不同用户的影响力进行分析并提出相关建议。
具体内容如下: (1)数据采集与处理①采用python爬虫程序随机获取十万条知乎用户的特征数据并存入mysql数据库。
②数据清洗:主要是剔除空白数据和无效数据。
3. 研究的方法与方案
本研究通过阅读文献,具体研究方法和技术路线如下: (1)数据采集与处理①采用python爬虫程序随机获取十万条知乎用户的特征数据并存入mysql数据库。
②数据清洗:主要是剔除空白数据和无效数据。
(2)用户分类①利用spss对特征变量进行正态性检验与相关分析,为聚类分析作准备。
4. 研究创新点
1、基于客观数据和算法对知乎用户进行分类; 2、分析不同类型用户的特征及影响力,可以为知乎社区以及其它网络社区的管理与服务提供参考。
5. 研究计划与进展
2017.09-2017.10确定论文方向并做相关文献调研;2017.10-2018.02明确论文研究思路及研究方法;2018.02-2018.03数据的采集与清洗;2018.03-2018.04对用户数据进行进一步的处理与分析;2018.05 研究论文撰写与修改。
