关联规则数据挖掘算法分析开题报告

 2022-01-26 11:24:26

1. 研究目的与意义、国内外研究现状(文献综述)

本课题的意义、国内外研究概况、应用前景等(列出主要参考文献)意义:数据挖掘技术可以用来支持商业智能应用和决策分析,例如顾客细分、交叉销售、欺诈检测、顾客流失分析、商品销量预测等等,目前广泛应用于银行、金融、医疗、工业、零售和电信等行业。

数据挖掘技术的发展对于各行各业来说,都具有重要的现实意义。

国内外发展概况及应用前景:国内:与国外相比,国内对dmkd的研究稍晚,没有形成整体力量。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究的目标、内容和拟解决的关键问题研究目标:具体实现apriori、fp-growth及eclat算法,对算法进行验证分析主要有以下几个目标:1、 深入了解各个算法思想;2、 算法的代码实现;3、 对各个算法进行测试并进行对比;4、 将对比结果直观的表现出来并对各个算法进行具体的分析比较。

研究内容:这次所要做的算法是基于关联规则的数据挖掘算法,算法主要包括apriori算法、fp-growth算法以及eclat算法,这三个算法是关联规则中具有代表性的算法。

在进行验证时,对mushroom、accidents、t10i4d100k 三个数据集做频繁模式挖掘实验,设定不同的阈值,对比不同算法挖掘频繁模式的时间与结果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法、技术路线、实验方案及可行性分析研究方法:1、 通过查阅书籍资料以及网上搜寻相关论文资料做好前期准备;2、 结合相关资料,了解算法的思想与步骤;3、 编写具体代码,实现算法;4、 对不同的算法进行测试;5、 将各个算法的结果显示;6、 对不同的算法进行比较与分析;7、 将分析结果系统整理。

可行性分析:用于测试的mushroom、accidents、t10i4d100k 三个数据集被广泛用于频繁模式挖掘,accidents与mushroom数据集较小,数据稠密,而t10i4d100k数据集较大,频繁项集较分散,是一个稀疏型的数据集;通过对三个数据集的数据挖掘的结果与时间进行分析与比较,从而看出不同的算法的更适于何种数据集及各种算法的优缺点分析。

开发环境拟采用my eclipse10.0及以上版本,都为现阶段被大量使用的开发环境,易于该系统的开发以及之后答辩时的展示和使用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

特色或创新之处1、 可以清楚的显示算法的执行结果及时间;2、 方便对算法进行对比与分析。

5. 研究计划与进展

研究计划及预期进展12.20之前前期资料搜集,开题报告书写12.20-1.20 系统学习数据挖掘1.20-2.20三个算法的思想学习并设计实现算法步骤2.20-3.20将算法的代码实现完成3.20-4.01对不同的算法进行比较与分析

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版