

英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
基于深层语义分析的位置感知新闻推荐
Cheng Chen[1,2], Thomas Lukasiewicz[3], Xiangwu Meng[1,2] and Zhenghua Xu[3]
[1]Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia, Beijing University of Posts and Telecommunications,Beijing, China
[2]School of Computer Science, Beijing University of Posts and Telecommunications, Beijing, China
[3]Department of Computer Science, University of Oxford, Oxford, UK
摘要:随着移动设备的普及和移动网络的快速增长,用户现在可以随时随地浏览新闻,因此他们的新闻偏好通常与其地理环境密切相关。因此,许多研究工作都放在了位置感知新闻推荐上;探索的方法主要可以分为基于物理距离和基于地理主题的方法。至于基于地理主题的位置感知新闻推荐,ELSA是最先进的地理主题模型:据报道,它的性能优于许多其他主题模型,例如BOW,LDA和ESA。然而,ELSA中基于维基百科的主题空间存在高维度,稀疏性和冗余性等问题,极大地降低了ELSA的推荐性能。因此,为了克服这些问题,本文提出了三种新颖的地理主题特征模型,CLSA,ALSA和DLSA,它们分别将集群,自编码器和面向推荐的深度神经网络与ELSA集成,从基于维基百科的主题空间中提取密集,抽象,低维和有效的主题特征新闻和地点。实验结果表明:(i)CLSA,ALSA和DLSA在推荐位置感兴趣的新闻推荐中,在推荐有效性和效率方面均大大超过了最先进的地理主题模型ELSA; (ii)深度本地化语义分析(DLSA)实现了最显着的改进:其精确度,召回率,MRR和MAP都比ELSA好3倍;而其推荐时间成本仅为ELSA的1/29左右;(iii)DLSA,ALSA和CLSA也可以通过揭露用户在新地点的潜在新闻偏好来弥补“冷启动”问题。
关键词:位置感知新闻推荐;显式语义分析;自动编码器;深度神经网络
1介绍
如今,新闻阅读是许多人不可或缺的日常活动。 随着智能手机的最近流行和移动网络的快速发展,越来越多的人倾向于通过他们的手机或其他手持设备(例如平板电脑)在线阅读新闻。 但是,由于每天产生的大量新闻文章,读者无法在网上浏览所有新闻。 因此,旨在过滤掉不相关的在线信息并向用户推荐他们喜欢的新闻的推荐系统已被广泛研究[1,8,11,22]。
在典型的新闻推荐系统中,通常从他/她的新闻阅读历史或其他在线活动历史中获知用户的新闻偏好;因此他/她的新闻偏好在这些系统中几乎是静态的。 然而,在现实世界中,用户的新闻喜好通常随着他们的位置的变化而变化; 例如,当人们在办公室工作时,人们可能更喜欢经济或政治新闻; 但他们可能喜欢在家里阅读娱乐或体育新闻。 由于用户的新闻偏好与他们的地理背景密切相关,因此基于用户的地理环境推荐新闻的位置感知新闻推荐系统最近吸引了许多研究工作。 主要有两个研究方向:基于物理距离和基于地理主题的方法。
具体而言,基于物理距离的新闻推荐[2,3,14,16]旨在为用户提供离他们最近的新闻; 因此,新闻文章与用户的相关性是根据GPS坐标基于他们位置之间的物理距离来衡量的。 然而,在许多新闻文章中对事件地点的描述在实践中非常模糊和一般(仅提及城市或郊区); 因此,为这类新闻获取准确的GPS信息是非常困难的,有时甚至是不可能的,这极大地限制了基于物理距离的方法的应用。
鉴于这种现状,提出了基于地理主题的方法[12,19,23],以实现更通用的位置感知新闻推荐,其中,不使用GPS坐标,而是使用主题向量来描述位置,并且 新闻文章与用户的相关性通过新闻的主题矢量与用户的当前位置之间的相似度来度量。 因此,地理位置的主题表示对于基于地理主题的位置感知新闻推荐和一系列主题模型(如潜在狄利克雷分配(LDA)[5],显式语义分析(ESA)[10],概率论 潜在语义分析(PLSA)[24]及其改进模型[12,19,23])已被使用。
最先进的地理主题模型是显式本地化语义分析(ELSA)[19],据报道,它在基于地理主题的位置信息中胜过了许多其他地理主题模型(例如,BOW,LDA和ESA)意识到新闻推荐。 ELSA的推荐过程如下:首先使用具有地理标签的文档集合(称为地理标签文档)作为相应位置的描述;然后,它使用显式语义分析(ESA)将地理标记文档和新闻文章投影到主题空间[10],其中维基百科概念被视为主题;因此,通过考虑本地主题的相应概念之间的链接信息,将两个位置(例如,国家,城市或场所)和新闻表示为主题矢量(分别称为本地化位置配置文件和本地化新闻配置文件)通过相应的本地化位置和新闻简档之间的相似性来估计用户和候选新闻文章;最后,向用户推荐具有前k最高相关分数的新闻。
然而,由于维基百科上的概念数量庞大(数百万),ELSA所产生的基于维基百科的主题空间非常高。 因此,ELSA的在线新闻推荐过程非常耗时,这在实际的实时在线响应中是不可接受的。 另外,维基百科的主题空间也存在稀疏性和冗余性问题,这在很大程度上降低了ELSA的新闻推荐效果。
因此,为了获得更好的推荐性能,本文首先提出两种地理主题特征模型,即基于聚类的本地化语义分析(CLSA)和基于自动编码器的本地化语义分析(ALSA),以通过主题特征建模来解决这些问题。通常,CLSA和ALSA分别将集群和自编码器(神经网络)与ELSA集成,以便从ELSA中基于维基百科的主题空间中提取更密集,更抽象和更低维度的主题特征,以表示新闻和位置。我们的实验研究表明,CLSA和ALSA都能提高位置感知新闻建议中的ELSA性能。然而,这两种解决方案仍然存在以下缺点:CLSA中的聚类学习和ALSA中的自编码器的学习目标分别是尽量减少与新闻推荐的目标没有直接关联的簇内距离和重构误差,即将用户的本地目标新闻与不相关的新闻区分开来;所以在新闻推荐中,由此产生的基于群集或基于编码器的新闻和位置的主题特征表示可能不是非常有效的。
受此观察的启发,我们进一步提出另一种新的地理主题特征模型,称为深度本地化语义分析(DLSA)模型,以解决ELSA中的高维度,稀疏性和冗余问题。 DLSA利用深度神经网络将ELSA中基于维基百科的主题空间映射到抽象的,密集的和低维的主题特征空间,其中位置和用户的本地目标新闻之间的局部相似性被最大化,并且具有用户不相关的消息被最小化。 DLSA具有以下优点:DLSA中的深度神经网络以推荐为导向的学习目标进行训练,即将用户的本地目标新闻与不相关的新闻区分开来,从而产生新闻和位置的深层主题特征表示对于位置感知型新闻推荐比ALSA和CLSA更有效。因此,在位置感知新闻推荐中,DLSA的性能优于CLSA和ALSA的性能。虽然我们只研究它们在ELSA中的应用,但是所提出的模型CLSA,ALSA和DLSA可以很容易地用于解决其他主题模型中的类似问题。
总之,这篇论文的贡献简要说明如下:
- 我们确定了ELSA基于维基百科的主题空间中的高维度,稀疏性和冗余问题,这大大降低了ELSA的位置感知新闻推荐性能。
- 因此,我们提出了三种新颖的地理主题特征模型(CLSA,ALSA和DLSA),以通过主题特征建模来解决这些问题。这三个模型分别将聚类,自编码器和面向推荐的深度神经网络与ELSA相结合,以获得抽象,密集,低维和有效的位置和新闻的主题特征表示。
- 使用公共真实世界的数据集进行大量实验。结果表明:(i)建议的CLSA,ALSA和DLSA在推荐有效性和效率方面均优于最先进的地理主题模型ELSA,具有位置感知型新闻推荐; (ii)DLSA实现了最显着的改进:其精确度,召回率,MRR和MAP都比ELSA好大约3倍,而其推荐时间成本仅为ELSA的1/29;(iii) DLSA,ALSA和CLSA可以通过发现用户在新地点的潜在新闻偏好来弥补“冷启动”问题。
2相关工作
2.1新闻推荐
典型的新闻推荐系统旨在向用户推荐最符合其个人兴趣的新闻[8,11]。用户对新闻的兴趣通常通过其明确的评价或浏览历史(例如,访问过的页面,阅读时间和下载)来建模。提出启发式和基于模型的方法[22]用于新闻推荐:前者主要基于数学或统计解(例如余弦相似性和欧几里德距离),而后者则利用机器学习技术或数学模型(例如,贝叶斯网络和决策树)。具体而言,Abel等人[1]提出将新闻与社交媒体信息(tweets)相结合,构建三种用户配置文件,然后计算用户配置文件与新闻文章之间的余弦相似度,以实现个性化新闻推荐。 Yeung等人[22]使用贝叶斯网络来预测用户感兴趣的新闻类别的级别,并提供实时个性化的新闻推荐。
2.2基于位置的新闻推荐
然而,在移动和无线网络时代,用户的新闻偏好也受其地理环境的影响,即人们通常比远离他们的人更关注附近发生的新闻。因此,越来越多的研究工作 已被纳入位置感知新闻推荐,主要侧重于两个研究方向:基于物理距离和基于地理主题的研究。
对于基于物理距离的新闻推荐,GeoFeed [2]和GeoRank [3]向用户推荐在用户当前位置或给定范围内发生的一些消息,其中GeoRank仅使用用户和新闻的静态位置点,而 GeoFeed允许空间范围的新闻; 佩德罗等人[16]利用用户和新闻文章之间的欧氏距离来衡量新闻文章的重要性; LocaNews [14]根据消息位置的不同距离保留了三种新闻版本,并向用户提供最合适的新闻; 温等人[21]提出了一个名为MobiFeed的新闻流推荐框架,以进一步调查基于用户移动轨迹的新闻推荐。
然而,在现实世界中,许多新闻文章中对事件地点的描述非常模糊和笼统(仅提及城市或郊区);因此,获取这类新闻的准确GPS信息非常困难,有时甚至是不可能的。 因此,基于物理距离的方法的应用是有限的。
至于更通用的位置感知新闻建议,提出了基于地理主题的方法。代替使用GPS坐标,使用主题向量来描述位置,并且新闻文章与用户的相关性通过新闻的主题向量与用户的当前位置之间的相似度来度量。因此,地理位置的主题表示对于基于地理主题的位置感知新闻推荐和一系列主题模型(如潜在狄利克雷分配(LDA)[5],显式语义分析(ESA)[10],概率论潜在语义分析(PLSA)[24]及其改进模型[12,19,23])已被使用。基于主题的位置感知新闻推荐中最先进的地理主题模型是显式本地化语义分析(ELSA)[19],据报道其优于许多其他主题模型,例如BOW,LDA [5]和ESA [10]。然而,ELSA中基于Wikipedia的主题空间存在高维度,稀疏性和冗余性问题,这大大降低了ELSA的推荐性能。因此,本文提出三种新颖的地理主题特征模型(CLSA,ALSA和DLSA),通过主题特征建模来克服这些问题,并获得更好的推荐性能。
2.3使用深度学习的建议
由于能够提取有效的表示[4],深度学习已经成功地应用于许多在线推荐应用,如音乐推荐[20],电影推荐[17],标签感知推荐[25]和 多视图项目推荐[9]。
与我们的工作类似,[9]中提出的推荐系统也基于具有推荐导向培训目标的深度神经网络。 但[9]与这里提出的DLSA有很大不同:(i)[9]不是一个位置感知模型,因此它的建议对用户地理环境的变化不敏感; (ii)[9]不旨在解决维基百科主题空间中的巨大维度,稀疏性和冗余问题; 和(iii)[9]必须为每个神经网络训练自己的参数; 而在我们的工作中,共享参数应用于深度神经网络,因为我们工作中的所有输入主题向量共享相同的基于维基百科的主题空间; 因此,我们工作中模型培训所需的时间大大减少。
3新闻推荐中的显式局部语义分析
显式局部语义分析(ELSA)[19]是基于地理主题的位置感知新闻推荐中最先进的主题模型,据报道该模型的性能优于许多其他主题模型,如BOW,LDA和ESA。 由于与我们的工作密切相关,我
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[22556],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
