

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
个性化新闻推荐系统中对用户兴趣的建模与动态扩展
李乐a、郑莉a、杨帆b、李涛b
a佛罗里达国际大学计算机学院,迈阿密,FL 33199,美国
b厦门大学信息科学与技术学院,厦门 361005,中国
文章信息:
关键字:新闻推荐、个性化、配置整合、时间敏感加权、长期配置文件、短期配置文件、吸收随机游走、推荐分离。
摘要
用户分析是解决个性化新闻推荐问题的一个重要步骤。传统的用户分析技术往往基于用户静态历史访问数据来建立用户描述。然而,由于新闻仓库的频繁更新,用户的阅读兴趣会随着时间的推移而发展,而他的长期阅读习惯会保持稳定,这都是可能的。因此,对新闻推荐中的用户分析做偏好评估势在必行。此外,在基于内容的新闻推荐中,因为根据用户描述来智能选择相似新闻文章的机制,用户的偏好趋于稳定。为了激励用户的阅读动机,一个成功的推荐系统应该能够推荐用户感兴趣的新闻文章给用户。
在本文中,我们最初提供的实验,研究在现实世界的新闻推荐系统中的用户兴趣的演变,然后提出了一种新的建议的方法,无缝集成长期和短期的阅读偏好,来给用户推荐新闻。给定一个最新发布的新闻的层次结构,首先根据用户长期描述,来区分不同的新闻组,然后在每个选中的新闻组中,根据用户短期描述来选择待推荐的新闻项目。我们进一步从这些新闻项中通过随机游走模型来选择新闻,来提高推荐新闻列表的多样性。大量的实验数据证明我们的方法是有效的。
- 简介
基于内容的新闻推荐的一个关键问题是如何构建基于用户自己的阅读史用户的个人描述,称之为“用户分析”。为了解决这个问题,大多数基于内容的推荐系统考虑到用户的阅读历史,并把它当成一个整体,整合到用户描述中(Billsusamp;Pazzani, 1999a; Kim amp; Chan, 2003)。当推荐新闻文章时,研究工作也考虑到了用户上下文。比如,Jancsary,Neubarth,andTrost(2010)假设用户偏好不仅仅取决于标题和内容,还取决于用户当前上下文。Liu, Dolan, and Pedersen (2010) 开发了贝叶斯框架,从当前用户活动来预测用户当前新闻热点,以及从所有用户活动预测新闻发展趋势。然而,他们没有考虑到用户的阅读兴趣。事实上,通常用户感兴趣的主题应该是相对稳定的,长期来看可能略有出入,而用户访问的内容可能会改变不同的短期观点。图1显示了一个用户的阅读兴趣随着时间推移而改变的例子。
图1兴趣漂移的一个例子
如图1所示,用户对新闻报道的兴趣与体育有关;然而,在t3-t2阶段,他可能喜欢2011年世界自行车锦标赛,然后在t2-t1,他可能对2011年棒球世界杯感兴趣,最后从t1-t0,他比较关注南佛罗里达全明星慈善赛。对于如何提高推荐系统的精确度,考虑用户的兴趣偏移可能更合理,或者说在对用户阅读描述建模时用户兴趣的变化。
另一个问题静态分析分析。回想一下,在基于内容的推荐系统,推荐往往是通过计算给定用户的描述之间的相似度,然后选择排名靠前的新闻来实现的。这一战略有利于类似的文章,并忽略与用户描述相比排名较低的文章。因此,如果一个新闻阅读者长时间使用这样的系统,他的描述变得过于单调,没有多样的主题。注意,当我们指的是“静态分析”,我们关心的是一个用户可能感兴趣的内容的细粒度的主题。通常用户感兴趣的主题会保持相对稳定或者略有变化。为了缓解这一问题,典型方法包括将推荐结果多样性研究,比如在单个推荐系统中推荐具有不同主题的新闻文章(Zhang amp; Hurley, 2008),或者提高结果的创新性。比如,提供另读者惊喜的新闻条目。(Iaquinta et al., 2008; Murakami, Mori, amp; Orihara, 2008)。在我们之前的研究中(Li, Wang, Li, Knox, amp; Padmanabhan, 2011),我们把新闻推荐问题建模成最大覆盖问题,在其中考虑推荐结果的多样性。然而,大多数的方法在这个方向上只考虑到相似性的新闻项,而不考虑其他用户的意见。
在本文中,我们扩展我们以前的工作(Li, Zheng, amp;Li, 2011)并研究如何对新闻读者短期阅读兴趣以及扩展他们的阅读兴趣建模。我们之前提供了一个研究用户兴趣的实验,研究表明用户兴趣随着时间推移会改变,但用户的长期阅读兴趣变化很小。然后,扩展我们之前的推荐方法(Li amp; Zheng et al., 2011),称之为LOGO,在其中推荐新闻项给在线用户时,无缝集成用户的长期阅读兴趣和短期阅读兴趣。我们基于一种时间敏感加权方案(Dingamp;Li,2005)构建用户长期兴趣描述,通过分析用户最近阅读历史来构造用户短期兴趣描述。为了推荐新闻,我们基于用户长期兴趣和短期兴趣来建立一种用户-新闻相似图形关系,然后引入随机游走模型(Zhu, Goldberg, Van Gael, 和Andrzejewski, 2007)来选择具有多样化主题的新闻文章。通过这种方法,我们不仅能考虑到用户兴趣给他推荐相关的新闻文章,还能通过介绍多样化主题来扩展用户兴趣。我们的工作有以下三点成就:
- 在对用户描述建模时我们考虑到用户兴趣的演变,并且通过无缝集成用户喜好来表示用户兴趣;
- 我们构建了一个两阶段的新闻选择策略,其中长期描述首先用来区分新闻组与指定的首选项,然后在短期描述是适用于对个人用户过滤特定的新闻文章;
- 我们基于过滤的新闻文章和用户短期描述建立一种用户-新闻项关系图,然后在它上面执行吸取随机游走来选择具有多样化主题的新闻文章。
我们的工作提出了一种新的方式来捕捉用户的阅读兴趣漂移,同时扩展用户的偏好。
- 相关工作
最近,推荐新闻文章吸引了越来越多的关注。大型新闻门户网站,比如谷歌和雅虎新闻,为用户提供大量的个性化新闻推荐服务。现有的新闻推荐系统可以大致分为两个不同的组:基于内容和协同过滤。(例如, TF-IDF) (Capelle, Frasincar, Moerland, amp; Hogenboom, 2012; Jurafsky, Martin, Kehler, VanderLinden, amp; Ward, 2000; Ren amp; Feng, 2013),或主题分布的语言模型(例如,PLSI和LDA),并通过具体的相似性测量,以评估新闻文章之间的关联。
-
- 基于内容的推荐
基于内容的推荐系统尝试依次寻找在内容方面与用户历史阅读文章相似的新发表的文章。一般而言,新闻内容往往用向量空间模型来表示。例如,News Dude(Billsus&Pazzani, 1999年b),是利用TF-IDF个人新闻推荐方法结合的K值最近邻算法推荐新闻项目给个人用户。另一种基于内容的方法是Newsjunkie (Gabrilovich, Dumais, amp; Horvitz, 2004),它通过信息新颖性的形式化措施过滤新闻文章,然后表明如何把这种技术应用到基于用户阅读历史的个性化新闻推送中。Lee and Park (2007)提出一种移动网络新闻推荐系统,该系统在建模过程中集成新闻文章属性和用户兴趣。然而,纯粹基于内容来智能推荐,可能会导致忽略用户兴趣的改变,为了扩展用户兴趣,应该避免这种情况
-
- 协同过滤
该系统利用新闻收视率的用户提供推荐服务,在一般情况下,他们是免费的。请注意,新闻收视率通常是典型的二元,一个新闻点击对应一个1的评级,而非点击被表示为0的评级(Das, Datar, Garg, amp; Rajaram, 2007)。在实践中,大多数协同过滤系统构建基于用户过去评级的行为,或者使用一个组的用户相似的给用户以预测的新闻收视率(Resnick, Iacovou, Suchak, Bergstrom, amp; Riedl, 1994; Sarwar, Karypis, Konstan, amp; Reidl, 2001),或在一个概率方式建模用户的行为(Hofmann, 2004; Lin, Xie, Guan, Li, amp; Li, 2014; Pennock, Horvitz, Lawrence, amp; Giles, 2000)。协同过滤系统可以在用户之间历史阅读信息的重复度比较高,内容几乎是静态(Schafer, Konstan, amp; Riedi, 1999)的情况下有效的捕捉用户行为。然而,在很多基于web的方案中,内容频繁变化,同时内容的知名度也随时间变化(Li, Chu, Langford, amp; Schapire, 2010)。
-
- 混合推荐
正如上面所讨论的,基于内容和协同过滤系统可以提供有意义的建议,并在案例中也有一些缺点。为了得到更合理的结果,许多研究者探讨结合这两种方法的可行性,并提出了混合解决方案新闻推荐推荐。代表性的例子包括Burke (2005), Chuand Park (2009) and Rao, Jia, Feng, and Zhao (2013), 在这一过程中,通过将其与基于内容的过滤相结合来推荐新闻项目的协同过滤能力通常得到缓解。混合方法也扩展到其他领域,例如,多媒体;例如,Albanese, Chianese, dAcierno, Moscato, and Picariello (2010) 提出了一个浏览系统,结合底层特征和语义描述符的使用模式来预测用户的行为和提供有效的多媒体推荐推荐。在这项工作中,我们提出的方法本质上是对新闻推荐的混合,其中内容特征用于模型时空兴趣演变,而用户的性关系被集成到新闻选择的过程。
-
- 短期动态推荐
近几年,很多关于短期动态推荐方法的研究工作被提出。大部分的研究工作沿着这条线的重点放在时间方面的协同过滤模型。例如,Koren(2009)研究推荐系统的多特征转变的问题。他们提出了在协同过滤方法通过数据寿命跟踪时间变化的行为。Xiang et al. (2010) 提出了一个基于会话的时间图,同时采用时间信息模型的长期和短期的偏好。Lathia, Hailes, Capra, and Amatriain (2010) 研究推荐的Top-N推荐的时间特性,特别是,建议项目的时间分集。他们研究了不同的用户评价模式如何影响时间分集。一个详细的调查,可以简称Soto (2011)。我们的工作是正交的,在一个意义上,我们认为暂时的兴趣漂移为一个单一的用户。
另一个方向,与短期动态用户建模相关的研究,涉及上下文感知推荐方法,在对用户兴趣建模时,这方面考虑不同的面向用户的上下文(例如,时间、位置等)(Adomaviciusamp; Tuzhilin, 2011; Cantador, Bellogiacute;n, amp; Castells, 2008; Son, Kim, amp;Park, 2013)。例如,Montes-Garciacute;a, Aacute;lvarez-Rodriacute;guez, La-bra-Gayo, and Martiacute;nez-Merino (2013) 提出了一个上下文感知的推荐系统,以使记者能够在不同的源识别相似的主题。在建立用户描述时,新闻语境特征,例如,时间,当前用户的兴趣,位置或现有的趋势,都被考虑进来。上下文感知推荐等方法可以很容易地集成到我们所提出的框架,即,他们可以作为识别用户描述短期的替代品。
-
- 推荐系统中的随机游走模型
随机游走模型一般适用于协同过滤算法在解决个性化问题。这样的例子有电影推荐(Liu amp; Yang, 2008; Wijayaamp; Bressan, 2008; Yildirim amp; Krishnamoorthy, 2008)。在这些系统中,转移概率的归一化相似度矩阵从电影分级计算,并将电影评分最高的Top-N推荐给用户。虽然电影推荐领域的结果显示是很让人满意的,但是不能保证个性化新闻推荐直接采用随机游走模型也能达到良好的性能。原因是,在后面的数据特点等以及问题的新闻推荐的设置是从那些电影推荐明显不同:
- 新闻资料在新闻阅读社区变化显著增加。数量庞大的新发表的文章将被添加到日常的仓库,而在电影推荐系统中,电影库是相对稳定的。
- 新闻偏好往往是二元的,即,用户可以选择点击(1)或不按(0)的一篇文章,而在电影推荐的头像,收视率是明确的用户,在一个范围内的1-5或者1-100基于外显式评价的方法可能不适用于新闻推荐方案。
-
在电影推荐中,可以随意使用一些
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[153847],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
