多源数据的真值发现算法Python实现开题报告

 2021-08-08 12:08

1. 研究目的与意义

冲突是组织程序过程中经常出现的一种普遍现象, 实质上是两个或两个以上的相互依赖的个体间的一种互动关系。

信息冲突指拥有信息所有权和信息使用权的双方因对信息占有、使用、销售、转让等信息运行过程存在的认知和诠释差异而构成的冲突行为。

有差异就有冲突。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

2. 国内外研究现状分析

在2008年, Yin X, Han J, Yu P S在《Truth discovery with multiple conflicting information providers on the web》中给定多了数据源提供的对于多个真实对象的大量的冲突描述信息,如何从这些信息冲突中为每一个真是对象找出最准确的描述,并给出了一个解决方案 TruthFinder,该方案,通过迭代计算数据源的准确度和值的信心度来达到真值发现的目的。

TruthFinder:针对真实性问题,即符合事实,研究了如何从各种网站提供的大量相互冲突的信息中找出真实的事实,设计了一个一般的真实性问题框架,并提出了一种利用关系的真实性查找算法。

网站与其信息之间的HIPS,即如果一个网站提供了许多真实的信息,那么它是值得信赖的;如果一个信息是由许多值得信赖的网站提供的,那么它很可能是真实的。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

3. 研究的基本内容与计划

毕设分为三步,首先阅读大量文献了解信息冲突产生的原因,熟悉已有的真值发现算法;进而学习Python,通过Python的数学函数,实现TruthFinder,KDE,KDEm,CRH的算法实现,通过图形化界面,对比分析四个典型算法的准确度;最后撰写真值发现问题的算法分析论文。

若时间,技术允许的前提下,尝试在图书作者这个数据集上面测试四款算法的能力。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

4. 研究创新点

1.对TruthFinder、KDE、KDEm、CRH算法的对比分析。

2.将四个算法在图书作者这个实例中运用。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,微信号:bysjorg 、QQ号:3236353895;