一种在基于网络的社交网络推荐中使用社会信任路径的智能推荐系统外文翻译资料

 2022-12-16 19:58:31

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


一种在基于网络的社交网络推荐中使用社会信任路径的智能推荐系统

Imane Belkhadir, Elamine Didi Omar, Jaouad Boumhidi

摘要:在本文中,我们将社交正规化方法与用户之间的信任信息结合起来,整合社交网络信息以使推荐系统受益。信任和评级记录(标签)都用于预测用户项矩阵中的缺失值(标签)。 特别是,我们使用算法进行最佳推荐信任路径选择,识别多个推荐信任路径并确定生成不同推荐的聚合路径。 对真实数据集的实证分析表明,社会信息和信任的结合实现了对现有方法的优越性能。

关键词:协同过滤,大数据,推荐系统,社交网络,信任

  1. 介绍

在过去几年中,社交网络上的可用数据量激增。为了克服信息过载,推荐系统已成为向用户提供关于诸如电影,音乐,书籍,新闻和网页之类的项目的个性化推荐的关键工具。但是,社交网络会生成大量数据包括人际关系,地点,兴趣......随着社会的快速发展,基于社交的推荐系统的研究引起了很多数据科学研究者的极大兴趣。事实是,当我们被多种选择困惑时,我们可能会转向我们最信任的朋友,以获得最佳建议,因为他们是我们可以立即获得建议的人。因此,为了提供更准确和个性化的推荐结果,关系和信任信息都应该纳入。

推荐系统通过估计用户将给予该项目(例如书籍,电影,假期)的评级来向用户推荐项目。可以通过使用启发式和机器学习方法来执行评级的估计。法。在文献中有三种基本方法来提供推荐,即基于内容,协同过滤和混合。基于内容的过滤使用项目相似性来给出推荐,协同过滤使用用户相似性。 [1]确认用户喜欢接收他们认识的人或他们相似且基于信任的推荐的推荐方法比仅基于用户相似性的方法执行得更好。

本文基于[2],它集成了社交网络图和用户项矩阵,以提高传统推荐系统的预测精度,我们整合了一种算法,用于最佳推荐信任路径选择,识别多个推荐信任路径并确定用户之间的聚合路径。在推荐过程中,用户之间的友谊和用户标记的标签用于推荐。 用户-项目标签可以被认为是二维矩阵。 相似的用户被聚类以计算用户之间的相似性以及用户和项目之间的相关性。 聚类的目的是识别最适合实际推荐任务的朋友。 基于[3]中的方法,社交网络信息的上述两个详细方面被用于设计社会正规化术语。

在[2]中,考虑了不同朋友可能有不同甚至相反品味的情况。即使同一组的朋友专注于同一项目,他们也可能有不同的喜爱程度。然后,我们应用Dijkstra算法来识别聚合路径。 我们在真实数据集上进行了实验,以评估该命题对预测精度的性能。该实验对传统的推荐系统有重要改善。

在本文的其余部分安排如下。第2节介绍了相关工作的概述。第3节定义问题并提出了该方法的细节。第4节介绍了实验结果。最后,我们在第5节得出结论。

  1. 相关工作

信任是社交网络中最重要的概念之一。 这是一个重要的社会概念,可以迅速影响用户的决策[4]。人们使用这种信任概念来帮助决定他们与他人互动的程度[5]。在此基础上,决策支持系统作为支持决策过程的工具,还使用用户之间的信任信息来更有效地帮助他们在社交网络中做出决策。特别是,大多数现有的成功推荐系统都会考虑信任关系,并向目标用户推荐来自其可信用户的项目[6]。已经表明,将信任结合到推荐系统中可以提高建议的质量和覆盖范围[7-10]。因此,信任推理一直是近年来备受关注的焦点。

在信任传播的研究中,Golbeck [11]提出了TidalTrust,用于建立源用户和目标用户之间的信任关系,这是基于对所有最短信任路径中最强信任路径的信任值进行平均。作者研究了所提出的算法在模拟和实际信任网络方面的性能。 SUNNY算法[12]使用概率抽样技术来估计置信度,并仅基于具有最高置信估计的信息源来计算信任。 实际上,SUNNY在更自信的子网络上执行TidalTrust的信任推理程序。 [13]中的工作描述了一种称为MoleTrust的信任推理算法,该算法发现从源用户到给定目标用户的所有最短路径,并通过计算加权平均值来聚合所有直接信任值。为了提高准确性,MoleTrust忽略了可信度低于0.6的用户的任何信任信息。

Shakeri等人[14引入了基于区间的信任模型,以提供信任和信心的综合表示。他们还提出了两个运算符,命名为信任区间乘法和求和,其中前者在从源用户到给定目标用户的所有路径上传播信任和信心,后者聚合两个或多个信任意见。[15]中的工作提出了一种名为MeTrust的多维基于证据的信任管理系统。 MeTrust算法使用-norm来评估每条路径的信任度和加权平均值,以组合多条路径之间的信任,其中每条路径的权重是从路径上信任的不确定性推导出来的。

Kim和Song [16]研究了可用信任路径长度和不同聚合方法对信任传播准确性的影响。 作者提出了四种基于强化学习来预测信任价值的策略,并评估了这些策略的预测准确性:最短路径中的加权平均聚合,最短路径中的最小 - 最大聚合,所有路径中的加权平均聚合,以及所有路径中的最大聚合。 他们观察到最好的是所有信任路径中的组合策略最小加权平均值。Kim还在[17]中提出了基于该策略的丰富信任传播方法。在他的工作中,通过将基于同质性的信任网络与基于专业知识的信任网络相结合,他解决了信任网络的稀疏性问题。

Hang等人[18]提出了一种信任路径选择方法,其中信仰被认为是最相关的值得信赖的服务。 在[13]中,提出了一种基于间接信任的机制来消除不值得信任的建议。 但是,尚未考虑建议的信任值。在上述方法中,尽管考虑了信任值,但它们不适用于确定在线社交网络中的可信决策。

最近,在线社交网络中用户生成的数据项开创了大数据问题的新时代[19]。 使用统计工具或传统数据分析方法无法有效处理或分析大量数据。在在线社交网络分析的背景下,大数据产生了许多具有挑战性的研究问题[20]。在大数据的新时代,识别在线社交网络中最相关的信任信息具有挑战性。在[21]中,已经提出了几何差分学习模型来处理在线社交网络中的多媒体大数据以用于视频推荐。因此,我们提出了一种推荐的信任路径选择方法,该方法可帮助参与者识别不可信赖的建议和推荐的信任路径。

  1. 社会推荐框架

在这一节中,我们首先使用一个综合的例子来说明一些与社会推荐有关的缩写,这些缩写贯穿本文。 然后,我们描述了融入社交网络信息的模型。框架工作的简要流程图如图2所示。在[3]中,如前所述,用户被聚类以获得合适的朋友圈,然后我们计算用户之间的最短路径以获得最可信的用户。 最后,我们将解释如何利用正则化术语来对框架进行建模。

如图1(a)所示为典型的朋友网络图。 用户之间有5个用户(节点),具有6个关系(边缘)。 每条边代表两个用户之间的连接。 用户经常按照5点整数(越大越好)或标签对某些项目进行评级,以表示对每个项目的偏好程度。 目标是预测用户项矩阵的缺失值或标签,如图1(c)所示。在图1(c)中(3),Tij表示用户i给予项目j的标签(值)。

例如,在图1(a)中,我们可以看到U1与U2和U5有连接。 U2与U1和U5有连接。在图2(c)中,U1关注项目I1,I3和I7,并使用标签(T11,T13和T17)分别标记它们。 除了项目I1,I3和I7之外,U3还关注项目I4。相反,U2关注的项目I2,I5和I6与U1的关注完全不同。所以,很明显,U1不会因为不同的关注而向U2寻求帮助。虽然U4与U1有联系,并且他/她也关注项目I4,但在咨询关于项目I4的事情时,U1将转向U3而不是U4以帮助做出最终决定。很明显,U1和U3具有最相似的特点。

下面的流程图介绍了框架体系结构:

3.2拟用模型描述

传统的推荐系统忽略了用户之间的友谊。他们只是使用用户项矩阵来生成推荐。事实上,我们经常需要根据以下规则有意或无意地听取朋友的建议:(1)具有相同或相似品味或有好感的用户的推荐。(2)某些领域专家的建议。基于以上两点因素,提出了具有社会正规化的矩阵分解框架[3]。正如我们在流程图中看到的那样(图2),为了获得更好的推荐结果,合适的朋友群被聚集并计算最短路径以及用户和项之间的相关性。将友谊和标签组合为正则化术语以约束矩阵分解框架。因此,我们考虑到现实情况,不同喜好的朋友会推荐不同的结果。

(a)用户项目相关性

传统的推荐系统通常忽略用户和项目之间的相关性。在[3]中,为了计算用户和项目之间的相关性,基于[4]将用户和项目映射到标签空间,并且根据以下公式计算相似度:

其中Ru表示用户u的标签向量; Vj表示项目j的向量。

与(1)类似,标签的权重根据以下公式定义:

其中Wjt表示项目j对标签t的权重,Muj是标签列表,| M uj |是用户u给项目j的标签数量。这里的度量也是余弦相似度。

(b)信托计算公式

为了计算用户之间的信任值,我们遵循Lathia等人提出的方法。[23]基于用户评级与其推荐人评级对其共同项目的差异。因此,随着评级值之间的距离增加,信任度线性下降。假设我们有两个用户Ua和Ub。他们之间的信任形式如下[23]:

计算用户和推荐人在Ua的n个历史评级上的评级值与每个评级尺度中的最大值之间的总差异。并且为了获得两个间接用户之间的信任值,我们采用分配给其连接路径边缘的信任值的常规乘法:

该信任传播公式有助于Ua作为源节点与其所有间接邻居找到其相互信任值。

对直接或间接邻居的建议进行预测时,根据通过计算或传播计算得出的信任值,采用其评级的加权平均值。

3.3社会正规化

在[4]中提出了一种具有社会正规化的矩阵分解框架。它首先包含了每个用户的所有

社交关系。但是,它不符合实际情况。基于我们应该为不同的推荐任务确定最合适的朋友群的直觉,我们将用户的友谊纳入矩阵分解框架。在本文中,我们只考虑基于个体的正规化方法。基于[4]中提出的社会推荐模型,目标函数定义如下。

其中Iij是指标函数,如果用户i评价项目j,则该指标函数等于1,Tij 表示用户i给予项目j的标签,Tij表示用户i的项目向量,Vij是项目j的向量,|| . ||sup2;F 代表Frobenius范数,beta;gt; 0,并且F(i)是用户i的朋友列表。公式(3)中的最后两个正则化项用于避免过度拟合。在上述目标函数中,强加了社会正规化术语:

其中S(i,f)表示用户i和f之间的友谊,该功能允许正则化术语以不同方式对待用户的朋友。更多细节可以在[10]中找到。在本文中,我们不仅整合了用户之间的友谊,还可以将用户和项目之间的相关性转换为模型。我们提出以下正则化术语,以便在一个用户和他们的朋友之间单独施加约束:

其中alpha;gt;0,beta;gt;0,l(j,f)表示项目j和用户f之间的相关性。该功能可以根据项目以不同方式对待朋友。如果用户i给项目j提供了标签,并且项目j和用户f之间的相关性很高,例

如l(j,f)= 0.95,这意味着用户f对用户i的品味做出了巨大贡献。S(i,f)表示用户i和f之间的友谊。S(i,f)或l(j,f)的值越小表示特征向量Si和Sf之间的距离应该更大。 目标函数可以定义如下:

我们可以将梯度下降算法应用于特征向量Si和Vj,以获得目标函数的局部最小值。

  1. 实验分析

在本节中,我们对真实数据集进行实验,以验证我们方法的有效性。 提议的方法在JAVA中实现。 所有实验都在具有Intel处理器(1.80GHz)和4 GB内存的Windows机器上进行。

4.1数据集

随着Web 2.0技术的快速发展,每天都会产生大量的数据。 人们通过社交网络的服务相互影响。 为了进行这些实验,Epinions,FilmTrust被用作评估方法的数据来源。

用于评估的第一个数据集是Epinions。 Epinions网站是一个社交平台,用户可以在这里交换他们对不同类型文章的意见。用户可以投票选择文章,并通过信任图与他人进行社交联系。Epinions的每个成员都维护着一个“信任”列表,它表示用户之间信任关系的网络和呈现不信任关系网络的“不信任”列表。 该网络被称为“信任网”。

第二个数据集是FileTrust数据集,是从FilmTrust中提取的。 这个数据集有两个文件,rating.txt和trust.txt。 ratings.txt包含35,497条数据记录,它有三个属性(userid,movieid和movieRating)。

4.2度量

在实验中,我们使用了常用的度量、精度和召回等指标来衡量所提出方法的预测质量。精度和召回定义如下:

其中R(u)表示用户u可以标记的标签,T(u)表示用户u标记的实际标签。精度是指您标记的项目数占整个推荐项目的比例。它反映了您对推荐项目感兴趣的可能性。召回是指您标记的物品数量占所有物品的比例。我们还计算平均绝对误差定义如下:

其中Rij表示用户已经给予项目j的评级,表示用户对j项的评级表示法,表示方法预测的值,t表示测试的评级数量。

该测量是最流行的误差函数。 它评估推荐系统提供的预测质量。 我们还计算了均方根误差,由等式(10)描述:

在文献中,广泛使用均方误差的根来代替MSE来评估推荐系统。它被著名的Netflix大奖赛用来识别最佳过滤算法。

4.3模拟和结果分析

第一个实验是在epinions数据集上进行的,前面介绍了两种方法:基于社交网络的推荐系统(RSboSN)和具有可信路径选择的基于社交网络的推荐系统(RSTP)。

我们注意到RSTP方法提供了更好的性能

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[19599],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版