社交网络中交叉群组探测技术研究开题报告

 2022-01-28 21:42:41

1. 研究目的与意义、国内外研究现状(文献综述)

研究背景及意义:

web2.0时代的到来,使得互联网技术朝着更加人性化的方式发展。twitter、facebook、微博、朋友网、人人网等社交软件也随之兴起并飞速发展,目前,人们的日常交流活动基本都是在这些社交软件所提供的平台上进行。人与人之间以这些社交软件为媒介进行有目的的信息交流,从而产生关系网络,这种以人和人与人之间关系而构成的社会网络结构,称之为社交网络[1]。

群组划分是社会网络服务的一项特征,例如人人网对好友关系有一套自己的分类方式,用户可以自行对好友进行分组,从而对信息的收发做分组的管理。但是作为用户却未必能够养成并保持这种分组的习惯(例如我自己就从来没有对好友做过分组)。与此同时我们揣测,作为真实关系的线上反映,人人网的好友网络是能够自动呈现出一定的人群分割的,而在社会网络分析中,对网络成分的分析也确实是一项重点。通过分析网络的结构,提取出其中的群组,能够让我们更好地理解这个网络的组成方式,从而更好地管理和利用信息流。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究目标及内容:

本研究的主要目标是基于在场地和用户/地点属性的用户签入的信息,研究多模型多属性以边为核心的群组聚类框架,以发现基于位置的社交网络(lbsns)中重叠且有层次的群组。通过采用模间和帧内模式特征,该框架不仅能够聚类拥有不同社会观点的志同道合的用户,还能发现社会有明确表明社区成员的利益的轮廓。该方法的有效性通过收集foursquare的数据集,经过大量的实验评估来验证。具体研究内容有以下几个方面:

1)从服务提供商的角度来看,找出具有共同兴趣的群体和了解每个群体所感兴趣的东西一样重要。相较于现有的群组探测方法,很少有针对检测到群组的的剖析,本研究打算研究群组探测框架的同时,综合考虑群组的语义分析。通过刻画探测到的群组的语义,来有效地支持现实世界的应用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法:

本研究拟在充分理解多模型多属性以边为核心的群组聚类框架的基础上,拟用java程序设计语言实现m2clustering和hm2clustering聚类算法,并通过实验,在foursquare数据集上进行聚类分析,并可视化聚类结果。可能会用到的第三方工具包有java矩阵工具包(universaljavamatrixpackage)、sql驱动工具包(sqljdbc4)、java开源类库jmathlib等。

数据的预处理阶段拟用matlab清除无效数据,以及完成数据的规约处理。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

1)大多数现有的群组探测方法是基于结构特征(如链接),但在线社交网络的结构信息往往是疏弱的,因此,只考虑网络结构信息很难探测出可解释的交叉群组。幸运的是,LBSNs提供有关通过签入用户和地点的丰富信息,使得它可以根据聚类用户的不同喜好和兴趣分成不同的社区。

2)本研究从一个以用户/地点的联系边为中心的角度探测群体,其中,每条边被看作为两种模式,即用户模式顶点和一个场地模式的顶点之间的链接。而现有的多模聚类方法主要关注的是模间的的特征,本研究拟同时采用模间和帧内特征来对用户/地点对进行聚类。通过引入用户和场地的不同属性作为帧内模式特征,可以从不同的角度揭示群组的语义特征。

5. 研究计划与进展

1)2015.01-2015.02聚类算法,数据预处理等相关知识的学习,体验foursquare的签到功能及数据格式,了解foursquare用户及地点的帧内属性。

2)2015.02-2015.03设计有效的目标函数以及用户-地点、地点-用户、用户社会影响力、用户地理跨度、地点-时间的相似性度量。

3)2015.03-2015.04数据预处理。包括无效数据的清除,大规模数据集的规约降维等。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版