题 目 电子商务特征分级推荐系统的设计与实现外文翻译资料

 2022-12-16 19:55:21

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


外文翻译

题 目 电子商务特征分级推荐系统的设计与实现

作 者 Luo Yi, Fan Miao, Zhou Xiaoxia

摘要:本文提出了一种新的特征分级方法,它是一种用于电子商务中商品推荐的综合算法。它是一种基于特征挖掘集成,情感分析,记录客户历史行为的技术。功能评分的整个过程可以是分为5个关键步骤:1.提取一组商品类别的整体特征集;2.提取修饰语集和否定词集;3.获取特定特征集和特征评估集;4.获取特定特征权重集;5.获取项目权重集。在这5个步骤之后,我们可以用一个获得的评分方程对所有项目进行评分和排名。然后,对所需的以及排名靠前的项目进行推荐。此外,我们利用以著名电子商务网站亚马逊上的手机评论为实验数据,讨论了一些重要的结果,这些结果表明,特征分级确实有效。最后,简要介绍了基于特征分级的原型推荐系统。

关键词:特征分级;特征挖掘;情感分析;历史行为;推荐

1.介绍

在电子商务中,有两种主要的方法与客户面对面见面。一个叫做“客户活跃型”是客户通过一些搜索引擎自己实现的。另一种方法是由商家通过一种推荐系统来推荐商品。我们称之为“项目活动型”。

对于“客户活跃型”,客户在搜索中输入的内容引擎揭示了他/她想要什么。现有的商品搜索引擎使用的技术与基于关键字匹配的普通网页,这意味着保存在数据库中的项目应该被标记有足够的关键词。然而,大多数这样的关键词都是由商家手工添加的。这种机制效率很低。也很容易忽略一些重要的特性。如果有一个系统可以自动挖掘密钥组类别项目的特征(即关键词);这样就可以用更少的手动操作,提高综合效率。这应该是我们的第一个任务,因为功能的挖掘不仅有利于现有的“客户主动”搜索方法,而且是我们建议的推荐算法的基础。

至于“项目活动型”,我们有更多的话要说,因为它更好地执行推荐系统的功能。自从电子商务诞生以来,出现了许多推荐算法。最新流行的方法是称为协同过滤。它有两个典型的类型,一个基于用户,另一个基于项。主要基于用户的想法是许多用户可能有类似的购买行为使他们成为一个群体。一旦会员购买了某件商品,该商品将推荐给同一组中的其他成员。然而,基于项目的方法将类似的商品而不是用户连接在一起。如果购买了一件物品,则建议使用类似的物品。这两种方法的集成取得了较好的性能,使得协同过滤算法在当代大型电子商务网站中得到了广泛的应用。

然而,这种算法没有考虑到每个项目后的评估和审查的多样性。因此,有时会推荐许多低评级项目,仅仅是因为它们与用户购买的产品类似。因此,一个更好的系统应该了解如何对推荐商品进行排名,并提供相关和高度赞赏的商品。显然,它涉及评估,只能通过评估客户主观意愿来完成。 因此,我们的任务是分析客户评论,然后提取他们的感情定位,以完成最终的评分和排名过程。

此外,我们还相信目前的通用模型推荐将逐渐变得更加个性化。这就是我们进一步提出改进算法的原因可以针对特定的基于客户的历史行为。

图1 特征分级算法原型系统

2. 算法设计

特征分级算法的总体过程如图2所示。开始时,只有商品及其评论存储在数据库中。

获取项目权重集

获取特定功能集和功能评估集

提取修饰符集和否定词集

提取一类商品的

整体特征集

得到最终的评分方程并做推荐

获取特定的特征权重集

图2 特征分级算法的总体过程

按照箭头,我们可以得到推荐方程。现在我们将继续讨论细节。

  1. 提取一类商品的整体特征集

这个关键点是整个系统的基础。首先,我们使用ICTCLAS(计算学院技术上,汉语词汇分析系统)将每个复习词分为独立词和部分语音标签。通过进一步的优化,可以得到满意的分割和标记结果。下面是一个例子。

图3 拆分和标记的评论示例

在得到所需的评论之后,我们现在需要从这些单独的词中提取典型的特性。根据汉语的表达习惯,特征总是以“n”为标记的名词。我们首先提出了使用关联挖掘(通常是Apriori算法)来识别特征的想法。这意味着通过挖掘经常出现在评论中的相关词语来实现。使用它的原因是,一旦客户对某个项目做出评论,就会涉及到相关的词语。通过使用先验算法对整个评论进行处理,最终得到合适的特征集。另一个简单的方法是词频计数:通常,特征总是名词,而且比句子中的其他词出现的频率更高。我们可以简单地过滤这些排名靠前的单词以形成最终的特性集。它很快,但不太可靠。

  1. 提取修饰语集和名词词集

在接下来的情感分析中,我们首先要认识评论中的修饰语,并判断它们的取向。在拆分的评论中,修饰语总是用“/a”和“/v”标记的词。这里我们只考虑极化修饰语,即那些只能是正的或负的修饰语。我们利用字网中的修饰同义词组来识别修饰词及其方向,这是一种简单有效的方法。在字网中,同义词被分为一组,因此我们可以简单地将同一组中的词以相同的情感取向对待。(见图4)

图3 WordNet中的极化修饰同义词组

我们最初用手挑选一些合格的改良剂作为种子,并用加减1个标签标记它们。然后他们处理一个特定的修饰语,我们首先检查是否只是一个种子。如果是,则直接判断其方向;如果不是,则需要遍历字网中目标修饰符的同义词。一旦同义词变成种子,可以判断原始修改器的方向原来的修饰语可以通过这样的同义词来判断。另外,我们将在数据库中添加一个新的修改器,这样可以提高存储的种子组,并提高后续判断的准确性。我们将最终化的修饰符集定义为模型。然后我们需要提取否定词,因为它们也有助于最终的情感识别。负词总是用“/ d”标记,我们可以手动拾取它们。负字集表示为NEG.

3. 一些主要过程的实验结果

综合推荐设计后算法上,我们利用了Amazon.cn(http://www.amazon.cn)多波段手机的信息。它们的标题和评论存储在数据库中。基于这些现实数据,我们测试了我们提出的算法中的一些主要过程。

  1. 提取集合N,MOD和Neg

表一给出了集合提取的实验结果。然后我们将这些集合添加到数据库中以供进一步使用。

表1 集合提取结果

Item

Number

Review

15099

Overall features

91

Opinion Modifier

850

Negative

35

  1. 评论的情感取向判断

表二显示了方向判断的结果评论。 通过整合WM和SM我们可以看到最终的准确率约为86%。

表2 审查的定向判决结果

Item

Number

Review

15099

Feature hit review

10267

Correct judgement

8829

  1. 分析时间复杂性

在下面最糟糕的情况中,我们的方法有时间复杂度t*m,其中t指的是物品的数量和m是指整体功能的数量。但是,现有的基于项目的协同过滤的复杂性可以是t*t*p在最糟糕的情况下,其中p是数字购买该商品的顾客。这个比较揭示了我们的方法比现有方法具有更少的时间复杂度。

4. 原型系统的实现

基于我们提出的特征分级算法,我们开发了原型系统(见图4)与基础数据库并继续记录特定的客户的历史行为。客户可以用它来制造实时推荐和综合推荐。对于实时推荐,要求客户输入他/她的偏好特征。然后系统将评分并根据客户当前的需求对所有项目进行排名通过特征分级的方法。图4是据客户罗毅介绍显示了实时推荐的结果。

图4 对客户罗毅的实时推荐

综合推荐,因为客户的保存历史行为,然后系统直接使用对项目进行评分的记录。图5是综合推荐给客户范苗。

图5 对客户范淼的综合推荐

此外,评论的情感分析模块是添加到功能列表中,以便客户可以创建自己的回顾一些项目。新的评论当然会影响未来的建议。

5. 结论和未来的工作

本文创造性地提出了一种特征分级的推荐算法,并进一步介绍了相应的原型系统。本文主要对该算法的5个过程进行了设计,并对一些关键的实验结果进行了讨论。这些结果表明,特征分级方法是行之有效的。它克服了现有推荐系统的一些缺点,并扩展了推荐系统的能力。我们未来的努力将花在改进评论的情感分析上。我们计划将处理范围从简单句扩展到复合句,包括过渡句、比较句、祈使句等。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[19623],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版