CPLR:协作配对学习对个性化推荐进行排名外文翻译资料

 2022-11-22 10:28:27

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


CPLR:协作配对学习对个性化推荐进行排名

刘洪志a,b,吴中海a,b,*,邢章c

a北京大学软件工程国家工程研究中心,北京,100871,中国

b北京大学软件与微电子学院,北京102600,中国

c北京大学电子工程与计算机科学学院,北京,100871,中国

摘要:与显式反馈数据相比,隐式反馈数据更容易收集并且更为广泛。然而,由于缺乏负面的例子,隐式反馈数据也更难以分析。由于其高性能,贝叶斯个性化排名(BPR)是一种众所周知的隐式反馈数据个性化推荐算法。然而,它有以下问题:(1)将所有未观察到的反馈看作是可能仅由未见过的负面例子,(2)将所有观察到的反馈视为可能仅由噪声行为引起的正面例子,(3)假设用户的偏好是独立的,这在实际中是难以实现的。为了解决所有这些问题,我们提出了一种新的个性化推荐算法,称为协作配对学习排名(CPLR),它考虑了用户对两个项目偏好的观察反馈和没有项目的影响。考虑到这些信息,我们尝试优化广义AUC而不是BPR中使用的标准AUC。 CPLR可以被看作是一个广义的BPR。除BPR外,BPR的一些扩展算法,如社会BPR(SBPR)和基于群体偏好的BPR(GBPR)是CPLR的特例。大量的实验证明了我们的方法与传统的协作过滤方法和最先进的成对学习算法排序相比的前景。与五个实际数据集的基线算法性能相比,Pre@5,MAP和NDCG的CPLR分别提高了17%,23%和22%。

关键词:学习排名;协作过滤;隐式反馈;广义AUC;个性化推荐

1 引言

为了解决信息过载和长尾问题,个性化推荐已成为当今在线业务的核心组成部分。例如,像亚马逊这样的网上购物网站给每个客户一个个性化的产品推荐,以增加他们的销售[6]。谷歌新闻等在线新闻门户使用个性化推荐来增加其点击率[7]。 YouTube等在线视频门户网站为每位客户提供个性化的视频推荐,以提高点击率和观看时间[8]。

关于个性化推荐的广泛研究集中在明确的反馈上,比如MovieLens和Netflix等数据集中的5星级评分[1,9,10]。与显式反馈数据相比,隐式反馈数据更为广泛且更易于收集。但是,隐式反馈数据也更难以分析,因为只有积极的反馈,比如用户购买产品,阅读新闻或观看电影。它缺乏负面的例子,即缺乏用户真正不喜欢的项目的实质证据,因为没有正面反馈的例子可能是由看不见的而不是反感造成的[11]。在本文中,我们关注隐式反馈数据的个性化推荐问题。

贝叶斯个性化排名(BPR)是一种众所周知的隐式反馈数据个性化推荐算法,因为其性能较高[12]。它假定用户偏好具有观察到的积极反馈的项目而没有项目。但是,它会将所有未观察到的反馈视为负面示例,并假定用户的偏好是独立的。没有观察到反馈的项目可能是未标记的正面示例,而不是反面示例,因为用户可能会喜欢它,但尚未看到它。一些工作试图通过使用社交网络信息,自适应BPR(ABPR)[14],三位一体BPR(TBPR)等社会BPR(SBPR)[13]等辅助信息来缓解这些限制[ 15]和置信学习BPR(CL-BPR)[16]使用异构反馈信息。另外,BPR将所有观察到的反馈视为相同。然而,一些观察到的行动数据往往是嘈杂和偏见[17,18]。潘和陈[19,20]试图使用群体信息来缓解这个问题。然而,他们认为组内用户的影响是相同的,并假设所有未观察到的反馈与BPR中的反例相同。

在本文中,我们提出了一种称为协作成对学习排序(CPLR)的个性化推荐算法,该算法使用协作过滤的思想来放松BPR的所有上述三个约束,并且可以运行而不使用除观察到的正反馈之外的任何附加信息。

本文的主要贡献包括:

  1. 我们提出了一种个性化的推荐算法,称为协作成对学习排序(CPLR),它使用协作过滤的思想来推广BPR。 CPLR考虑了用户对两个项目的偏好与观察到的反馈和没有项目之间的影响。 根据用户和目标用户之间的相似性设置不同的用户影响。
  2. 我们评估CPLR,并与五种现实世界数据集的最新推荐方法进行比较。 与传统的协作过滤方法和最先进的成对排序学习算法相比,大量实验证明了我们方法的前景。 与基线算法相比,Pre @ 5,MAP和NDCG的CPLR分别提高了17%,23%和22%。
  3. 根据实验结果,我们进一步分析了为什么CPLR比BPR及其几种扩展算法(如SBPR [13]和基于群体偏好的BPR(GBPR)[19])的性能更好。
  4. 我们通过实证评估和分析不同参数设置对CPLR性能的影响。 此外,我们根据数据集的特征总结了一些参数设置的建议。

本文的其余部分安排如下。 第2节提出问题并介绍一些背景知识。 第3节讨论相关工作。 第4节描述了所提出的模型和算法。 第五部分介绍了所提出的算法的经验评估以及与其他最先进的算法的比较。最后,第六部分总结了本文。

2 背景

在本节中,我们首先阐述问题,然后介绍BPR的基础理论工作[12]。

2.1问题定义

ui表示一个用户和一个项目,我们分别定义隐式用户反馈矩阵R如下:

U是用户集,我I项目集。 设定的PuII表示用户u给出正反馈的项目,即Pu = {i | Rui = 1}。 用户u对项目i的预测偏好被认为是rui。 我们使用gt;来表示相对优先顺序。 例如,相对偏好顺序(u,i)gt;(u,j)表示用户喜欢项目i到项目j。

我们的目标是仅使用隐式反馈数据给每个用户一个来自I Pu的项目的个性化排序列表,即假设我们只知道每个用户u的正反馈Pu。 我们试图预测每个用户对项目的相对偏好,而不是预测绝对喜欢或不喜欢。

2.2贝叶斯个性化排名(BPR)

BPR [12]的主要思想是将隐式反馈作为相对偏好而不是绝对喜欢或不喜欢。 它假设用户如果观察到用户项目对(u,i),但(u,j)不是,则用户更喜欢项目i到项目j。 这写成(u,i)gt;(u,j)。 因此,对于每个用户u,所有项目之间的相对偏好的可能性表示如

下,

相对偏好的概率函数P(·)被logistic sigmoid函数近似

sigma; (x) = 1/(1 eminus;x ).

基于所有用户相互独立的假设,两个不同用户u和w的相对偏好的联合概率可以简化为BPR(u,w)= BPR(u)BPR(w)。 因此,对于所有用户,整体可能性计算如下,

BPR算法的目标是搜索模型参数copy;的最优设置以最大化该概率。 BPR的目标函数定义为:

BPR的目标函数可以看作AUC的平滑近似值(接收器操作特性的曲线下面积)[12]。

3 相关工作

3.1合作过滤

协同过滤是推荐系统使用的流行技术。 它根据系统中其他用户的评分或行为做出预测和建议[21]。 这种方法的最初实现[22]称为基于用户的协作过滤(User-CF),它基于过去其他用户喜欢的具有相似口味的项目向活动用户提供建议。 这是一个基于邻域的方法,它根据当地邻域信息做出预测。

基于邻域的方法也被称为基于内存的算法,因为原始评分矩阵被保存在内存中并直接用于生成建议[23]。 基于邻里的方法简单而有效。 但是,他们提出严重的可伸缩性问题,因为他们需要处理所有数据来计算单个预测。 对于大量用户或项目,这些算法不适合在线系统[9]。

尽管模型的构建可能需要相当长的时间,但基于模型的方法在预测时间上往往比基于记忆的方法更快[9]。 潜在因子模型(如矩阵分解)是常用的基于模型的方法。 他们将这两个项目和用户转化为相同的潜在因素空间,然后尝试通过表征这两个项目和用户对评分模式自动推断出的因素的评分[25]。

基于邻域的方法和基于模型的方法都有其优点和局限性。 基于邻里的方法在检测本地化关系时非常有效,但无法捕获全局结构信息。 相反,潜在因素模型在估计总体结构方面很好,而在检测强烈的局部关联方面却很差[26]。 Koren [27]提出了一种将邻域预测和潜在因子模型预测结合成单一预测函数的组合方法。 这种整合可能会提高预测的性能。 然而,它仍然存在严重的可扩展性问题,因为它增加了模型训练和在线预测的计算复杂性。

在本文中,我们提出了一种将基于邻域的方法和基于模型的方法相结合的组合方法。 与Koren的方法不同[27],我们只使用当地邻里信息来帮助训练全局模型。 因此,我们可以保持基于模型的在线预测方法的高计算效率。

3.2学习排名

一般来说,学习排名是指在排序任务中训练模型的机器学习技术[28]。已经提出了很多学习排名方法的信息检索方法,特别是对于文献检索[29]。

排序算法的学习通常可以分为三类:逐点,成对和列表。针对每一个例子,点状方法都会降低排名,使其回归或分类,例如Perceptron Ranking(PRanking)[30]和McRank [31]。成对方法将排序定义为成对分类问题,如排序SVM [32]和RankNet [33]。 Listwise方法试图减少列表级排名损失,如AdaRank [34]和ListNet [35]。

从理论上讲,列表式方法的表现要好于成对方法,并且成对方法将优于逐点方法,因为在问题建模期间信息丢失较少[28]。但是,listwise方法的复杂性也要高得多。列表型方法的样本复杂度为O(n!),其中n为示例数量,而逐点方法和成对方法的样本复杂度分别为O(n)和O(n2)[36]。另外,为某些应用程序获取地面实况排名列表是不可能或不容易的。

大多数现有的协作过滤方法都是逐点的,试图预测每个单例的评级或绝对偏好。近年来,一些成对和列表方法已被提出用于个性化推荐[12,14,37-39]。在本文中,我们提出了一种基于隐式反馈的个性化推荐的成对学习排序方法。

3.3隐式反馈的个性化推荐

关于个性化推荐的广泛研究集中在显式反馈上[1,9,10]。 与显式反馈技术相比,隐式反馈技术具有非侵入性,更好的客户体验和更广泛的应用优势。 Oard和Kim [40]讨论了使用隐式反馈进行推荐的可能性。

在隐性反馈数据中,所有负面的例子和未标记的正面例子混合在一起。 为了解决这个问题,胡等人[11] 和Pan等人。 [41]提出对矩阵分解框架内目标函数中的正例和负例的误差项赋予不同的权重。 这些方法假设所有未观察到的反馈与反例相同,并且需要确定之前的正例和反例之间的相对权重。

与以前的点状方法[11]和[41]不同,Rendle等人提出了BPR。 [12]是一种用于隐式反馈的个性化推荐的两两排序学习方法。 它使用从问题的贝叶斯分析导出的优化标准。 BPR避免使用成对等级学习的思想设定相对权重,这已经在实证中证明是非常有效的。 它将用户的反馈视为相对偏好,而不是绝对喜欢或不喜欢。 然而,它(1)将所有未观察到的反馈看作是可能由不可见所引起的反面事例,(2)将所有观察到的反馈视为可能仅由噪声行为引起的正面事例,以及 3)假定用户的偏好是独立的。

考虑到所有用户彼此独立的假设在现实中难以实现,Pan和Chen [19,20]试图放宽这个约束,并提出了一种称为基于群体偏好的贝叶斯个性化等级(GBPR)的方法, 。它假设,对于用户u,如果项目i被消费,但项目j未被消费,而一组用户G对项目i也有正面反馈,则项目i上的组偏好比用户u对项目的偏好更强j,即(G,i)gt;(u,j)。 GBPR考虑用户之间的交互。然而,GBPR中的用户之间的影响只反映在用户观察到的反馈数据中,也就是说,只有观察到的反馈数据(即本文正项目集中的项目)的偏好受到影响由用户的组。而且,GBPR中的组是随机选择的。

赵等人。 [13]试图使用社交网络信息来区分项目而没有观察到反馈,并提出了一种称为Social-BPR(SBPR)的方法。他们认为用户倾向于将更高的等级分配给他们的朋友喜欢的项目。 SBPR可以缓解稀疏问题。但是,除了用户的行为信息外,还需要额外的社交网络信息。此外,明确的朋友在某些情况下可能会有不同的偏好或兴趣[42]。

潘等人。 [14]根据来自“浏览”活动的称为检查记录的另一种隐式反馈将未消耗项目分为两个子集。他们认为用户对他/她的“浏览”项目的偏好要高于未被浏览的项目。他们的方法将用户的考试记录作为不确定的数据,并试图了解每个考试记录的信心,这使问题变得更加困难。邱等人。 [15]采取了另外两种行动,即“观点”和“喜欢”作为辅助手段来增强“购买”建议,从而提出了三位一体贝叶斯个性化评级(TBPR)方法。具体而言,他们引入三位一体偏好来调查三种类型的项目中的用户偏好的差异:具有购买行为的项目(类型A);只有辅助动作的项目(B型);没有任何操作的项目(类型C)。他们只考虑了A型和B型之间、B型和C型的相对偏好

Wang等人[16]也研究了异质隐式反馈问题,其中隐式反馈有多种类型可用。他们研究了不同类型的隐式反馈的特点,并提出了一种使用这些信息的方法。然而,他们的方法需要在使用成对排名学习之前估计用户喜欢第i项的信念cui。

Wang等人[43]试图使用印象时间信息调整成对偏好的置信度。他们认为两个项目的印象时间之间的时间间隔越长,相对偏好的置信度越低。但是,这种方法假定用户像BPR一样是独立的,并且印象时间信息在大多数(用户,项目)对中都是错过的。

邱等人。 [44]尝试使用邻域信息将项目分为不同的项目组,并使用特定的排名关系。 核心概念“项目组”被定义为具有与最近邻居集

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[22879],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版