1. 研究目的与意义、国内外研究现状(文献综述)
1研究背景及意义
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,其中,定义学习机理为其关键[1]。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,有效提高学习效率。[2]
决策树作为一类模仿人脑在日常生活中处理决策问题的方法,具有如面对“是否”、“好坏”等二分类任务的二叉树结构[3][4][5]。在得到问题结论即最终决策的过程中,决策树算法可以利用之前每一次对数据的判断结果来得出下一步优化策略,产生“学习”的效果,使求解范围不断缩小。
在实际生活中,随着信息技术在多个领域不断被广泛深度地运用,不同类型的数据会越来越多,需要分析数据的任务也会越来越多,目前我们仍面临着机器学习模式偏差可能带来的许多风险,这使得机器学习技术不断进行改进和向前发展。而决策树可以使用不熟悉的数据集合,并从中提取一系列规则。这在实际生活中面对大量繁杂冗余的数据进行有效分析具有重要作用。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
对目前决策树算法进行性能上改进,使得决策树算法在面对大量的数据时,能够更加高效地进行决策判断,尽可能的减少更过拟合现象,好地利用在之前每一步积累下来的经验,使得最后的结果更加的准确。
3. 研究的方法与方案
1研究方法
针对目前决策树方法所具有的缺点。考虑采用集成方法,如随机森林(random forest,rf)来提升学习的准确度。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
考虑采用集成方法对传统决策树算法进行改进,有效减少目前决策树算法的过拟合现象,使得决策树算法有更加广泛的应用空间。
5. 研究计划与进展
1研究计划
决策树算法作为机器学习的主算法,在处理决策问题中具有重要的作用,但仍具有一定的局限性。本课题准备首先了解决策树算法提出的背景、研究意义以及在不同时期的发展。然后分别针对两类核心类型即决策树的生成和对应的剪枝方法进行深入了解,目前已知的经典算法分别为ID3算法,C4.5算法,CART算法,然后在了解算法的同时也会讨论不同方法在求解策略思路上的不同,进而总结归纳出决策树算法的优缺点。最后针对决策树方法的缺点提出性能加强方法。
2预期进展
预计在四月之前充分了解数据挖掘已经决策树的相关理论知识;在四月份期间对决策树的各种经典算法进行学习,充分了解各算法的长处与不足;’在五月份期间研究根据集成方法对于决策树算法的改进并逐步优化算法;最后在课题结束之前对论文的各项细节进行认真修改。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
