基于HITS算法的社交网络用户影响力评价方法文献综述

 2022-10-19 19:30:30
  1. 文献综述(或调研报告):

社交网络在人们的日常生活中扮演着重要的角色,已经成为了人们生活的一部分,并对人们的信息获得、思考、生活产生深刻的影响。在社交网络的信息传播交流过程中,具有较强影响力的用户以及关键领袖在其中发挥的作用越来越明显[1]。研究用户的影响力并识别出其中的关键意见领袖即具有高影响力的用户对于产品营销、舆情导向等都有重要作用。

不同学者对于用户影响力有着不同的定义。社会学家Rashotte[2]将用户影响力定义为“个体在思想、情感、态度或者行为上的变化与其他个体或群体的交互结果”。 Wilson等[3]和Benevenuto等[4]通过对用户的研究发现影响力就是直接或间接产生影响的能力。刘耀庭[5]认为用户影响力本质上就是用户间的相互作用。张鹏威等[6]在综合了相关研究后给出了用户影响力的概念:用户影响力是用户在信息传播过程中一种将自身与他人区别,并能够在信息的传播中改变受众态度或行为的能力。用户影响力可按不同维度进行划分,能够通过一些因素区分影响力的高低,并最终体现出对信息传播的影响。

因此,如何衡量用户影响力,辨别高影响力的用户就成为了研究人员关注的问题。Cha等人[7]选取了Twitter用户的粉丝数、转发数、评论数三个属性,结果表明用户的粉丝数与其微博的被转发数和评论数并不成正比例关系。孙红等人[8]综合考虑用户的交互行为以及网络的拓扑结构,提出了MBUI-Rank算法,实验结果表明该算法计算出的用户影响力较为准确客观。罗芳等人[9]在PageRank算法的基础上进行改进,结合了用户基本属性、用户交互行为和用户博文内容三个维度因素,提出了MDIR(multi-dimension influence rank)算法,在多种影响力评价指标上取得了良好的效果。

传统的PageRank算法在度量用户影响力时,将社交网络用户类比为网络中的网页,考虑用户间的关注与被关注关系,存在着初始PageRank值确定不够客观,以及PageRank值分配方式不够合理等问题。HITS算法与PageRank两者均是基于链接分析的搜索引擎的排序算法,近些年也同样被应用于用户影响力的评价中。HITS算法是由康奈尔大学的Kleinberg博士[10]于1998年首先提出的,全称为Hypertext-Induced Topic Search。他将网页分为hubs(中心级别)和authorities(权威级别)两类,authorities为具有较高价值的网页 ,依赖于指向它的页面 ,而 hubs 为指向较多 authorities的网页 ,依赖于它所指向的页面。HITS算法就是通过两者的迭代计算以得到针对某个检索提问的最具价值的网页。

大量的研究致力于对传统的 PageRank 算法进行改进用于挖掘社交网络中的关键用户[11],并且 PageRank 算法也体现了其独有的高效率和结构稳定性。郭博等[1]在分析知乎问答平台时发现,用户的多次提问与回答的行为是用户的活跃度和信息扩散能力的体现,并不会因为该行为导致影响力的贡献分散。同时使用了另外一种常见的网络结构挖掘算法 HITS,用于多角度的度量用户在知乎平台中的社交以及问答行为,并对最终的排序结果进行加权综合,进而形成知乎用户影响力的动态挖掘算法。HITS算法利用一种相互增强的关系,被用于识别满足需求的关键用户和信息传播者。

在总结分析多种用户影响力评价方法的基础上,计划将HITS算法与用户基本属性与社交网络特性结合,挖掘用户的影响力。进而得到用户在各种指标下的影响力排名,构建基于HITS算法社交网络用户影响力评价模型,并验证算法的有效性。

[1] 郭博,许昊迪,雷水旺.知乎平台用户影响力分析与关键意见领袖挖掘[J].图书情报工作,2018,62(20):122-132.

[2]Rashotte L. Social influence [J]. Blackwell Encyclopedia of Sociology, 2007,01: 4426-4429.

[3]Wilson C, Boe B, Sala A, Puttaswamy K P N, Zhao B Y. User Interactions In Social Networks And Their Implications[J]. ACM Eurosys, 2009,(7):21-26. 9

[4]Benevenuto F, Rodrigues T, Cha M, Almeida V. Characterizing user behavior in online social net⁃ works[J]. Acm Internet Measurement Conference, 2009,(9):49-62.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。