1. 毕业设计(论文)的内容和要求
1.了解hadoop分布式平台。重点是分布式文件系统hdfs和并行化编程模型mapreduce
2.研究常见的推荐算法,了解每种的推荐思路以及他们的优缺点。
3 对hadoop分布式平台、推荐系统与推荐算法研究的前提下,自己设计一个基于关联规则的电影推荐算法,算法通过对电影数据集中电影间关联规则的分析,向用户推荐电影。同时,提出一种预测评分的评分策略,对向用户推荐的电影预测用户对其的评分。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 实验内容和要求
1、计划进行的工作:上网搜集资料,学习Hadoop有关知识,安装实验所需的环境、设计推荐算法等;2、对各项工作的要求: (1)在收集资料方面:了解研究课题的意义以及国内外研究的现状。 (2)学习Hadoop知识:了解Hadoop分布式平台的相关概念以及工作的原理,知道Hadoop两大关键组件分布式文件系统HDFS和MapReduce。 (3)安装环境:在自己的电脑上准确的安装实验所需要的虚拟机,Hadoop环境。 (4)设计算法:在了解了常见的Hadoop推荐算法后,设计一种基于关联规则的电影推荐并行算法,同时提出了一种预测评分的评分策略,实现对推荐电影的预测评分。最后,对设计的推荐算法的运行时间与准确度进行测试分析。
3. 参考文献
[1] 蔺丰奇,刘益.信息过载问题研究述评[j]. 综述与述评,2007,30(5):710-714.
[2] 封俊.基于hadoop的分布式搜索引擎研究与实现.山西:太原理工学校,2010.
[3] 杨庄.基于hadoop的推荐系统研究与应用[d].湖北:湖北工业大学,2014.
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 毕业设计(论文)计划
1、选定课题并完成选题表:2022年11月15日--2022年12月10日;2.查阅相关资料,做好算法模块的设计:2022年12月11日--2022年1月20日3、撰写任务书,设计算法,编码实现,编写论文:2022年1月21日--2022年4月10日;4、修改提高:2022年4月11日--2022年5月4日;5、打印上交:2022年5月5日--2022年5月10日。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
