稀疏数据条件下的电商平台恶意用户发现方法开题报告

 2023-02-24 10:57:22

1. 研究目的与意义

伴随着信息时代的到来,人们的消费方式发生着日新月异的改变,越来越多的人使用网络购物。在电商平台上,对产品和服务的在线评论是消费者越来越重要的信息来源。但是,在当前的信誉评分系统中存在着许多问题,其中最普遍的即为用户的随意评分或者恶意评分所引发的评分偏差问题,尤其是存在请水军进行大规模的好评或者差评,以此来提高或者降低某个商品的评分的情况,这会严重误导消费者。而水军这个群体数量众多,评分不依据客观事实,同时隐蔽性强,混杂于大量正常用户中,对商品评分造成了不良影响。这对电子商务平台的发展是不利的,严重影响了网上商品交易的正常秩序。

因此,电商平台恶意用户的检测问题是电子商务平台健康、可持续发展以及可信交易环境搭建必须解决的问题。同时,在目前电商平台恶意用户检测的现实情况中,往往由于数据量巨大且存在的数据稀疏问题给检测方法带来了巨大的挑战。实现在数据稀疏条件下电商平台的恶意用户发现方法,既能剔除恶意用户,又能评估出一个商品的真实质量,对电子商务平台健康、可持续发以及可信交易环境搭建具有重大意义。

2. 研究内容和预期目标

研究内容:本项目主要实现在数据稀疏条件下电商平台的恶意用户发现方法,既能剔除恶意用户,又能评估出一个商品的真实质量。首先使用矩阵填充技术,对低度用户的评分信息进行填充,使低度用户的度达到阈值。接着,使用现有水军检测算法(dr、ior等)进行水军检测,通过对比填充前后数据集的水军检测算法效率,验证进行矩阵填充后现有水军检测算法效率是否提高。

拟解决的关键问题:如何对低度用户的评分信息进行填充,需要寻找合适有效的矩阵填充方法;如何确定低度用户的阈值,使得实验效果较好。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

目前已有许多水军检测算法。Plaureti等人提出了一种迭代的方法IR(Iterative Refinement Ranking),在这种方法中,用户的信誉与其评分和相应对象的质量之间的差值成反比,用户信誉和商品质量进行迭代计算,直到它们变得稳定。Zhou等人提出了基于相关系数的排名方法CR(Correlationbased Ranking),该方法对恶意用户攻击具有较强的鲁棒性,其中用户的信誉是由其评分和对象的估计质量之间的相关系数决定的。Liao等人通过引入信誉再分配过程和两个惩罚因子,进一步改进了CR方法。Gao等人提出了基于群组的排名方法GR(Group-basedRanking)。后来Gao等人在2015年又在GR的基础上提出了基于群组的迭代排名的方法IGR(Iterativegroup-based ranking),在GR的基础上增加了迭代部分。迭代的运用在后续研究中得到了广泛的运用。Wu等人在消除用户评分偏差的方法 IBR(Eliminating the Effect of Rating Bias)中也运用了迭代的思想,将用户评分的偏差与原来的评分对比分为三类,一是消极,二是积极,三是无影响,商品的质量是通过用户的偏差进行修正的。虽然基于偏差的算法在极端用户攻击中取得了卓越效果,但是对于随机用户并没有明显的提升。后来,Lee等人提出了基于偏差的随机恶意用户筛选方法DR(Deviation-based Ranking)。由Wu等人提出的BR(BayesianRanking)算法基于Beta分布假设。Sun等人提出一种IOR(Iterative Optimization Ranking)方法,该方法基于用户评分偏差与评分特征,具有更好的检测效率。

4. 计划与进度安排

2022.12-2022.1阅读相关参考文献,分析目前的水军检测算法

2022.2-2022.3寻找合适的矩阵填充算法,完成低度用户的缺失评分填充

2022.4 基于填充好的数据集,复现目前效率较好的水军检测算法,对比结果

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1] p. laureti, l. moret, y.c.zhang, y.-k. yu, information filtering via iterative refinement, europhys.lett. 75 (6) (2006) 1006.

[2] y.-b. zhou, t. lei, t. zhou,a robust ranking algorithm to spamming, europhys. lett. 94 (4) (2011) 48002.

[3] j. gao, y.-w. dong, m.-s.shang, s.-m. cai, t. zhou, group-based ranking method for online rating systemswith spamming attacks, europhys. lett. 110 (2) (2015) 28003.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。