1. 毕业设计(论文)的内容和要求
我们现在处于一个大数据的时代,不管是云计算、社交网络、物联网,还是移动互联网和智慧城市,都要与大数据扯上关系。
尤其是在电商模式冲击下的零售行业,更要用大数据来服务自身。
商家应该在大数据的分析下实时地调整商品的摆放顺序,商品的摆放位置以及超市进货的周转周期,同时利用大数据的分析增加更大的用户粘度。
2. 实验内容和要求
设计的主要内容主要的功能模块有:(1)、根据发票数据做篮物分析,求出关系最紧密的放在一个货架上(2)、根据数据进行排序,排名前10的放在超市的中间部位(3)、根据数据求滞销商品和零库存商品(4)、根据商品流动,求商品的存货周转天数(5)、根据发票,求会员用户粘度设计的要求(包括技术要求、工作要求)技术要求:(1)、flume:日志转移工具,主要负责收集、聚合、移动大型数据(2)、hdfs:分布式文件系统,主要负责存储大型数据(3)、mapreduce:分布式数据计算模型,主要负责对大型数据的计算(4)、hbase:分布式的,面向列的非结构化的数据库,主要负责对文本数据的加载,通过hbase语言进行数据分析(5)、mysql:关系型数据库管理系统,主要把前面对大型数据分析整合出来的有用数据导入到mysql关系数据。
(6)、linux:linux是一套免费使用和自由传播的类unix操作系统,是一个基于posix和unix的多用户、多任务、支持多线程和多cpu的操作系统。
是搭建hadoop分布式集群的平台。
3. 参考文献
[1]黄斌,许舒人,蒲卫.基于mapreduce的数据挖掘平台设计与实现[j]. 计算机工程与设计. 2013(02)
[2]费仕忆.hadoop大数据平台与传统数据仓库的协作研究[d]. 东华大学 2014
[3]董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.hadoop系统性能优化与功能增强综述[j]. 计算机研究与发展. 2013(s2)
4. 毕业设计(论文)计划
确定论文选题,收集课题有关资料,对课题进行详细的了解分析,查看大量的文献。
完成论文开题报告,填写毕业论文任务书。
大量收集论文资料,理清论文思路,将关于论文的想法与导师进行交流,根据导师的建议和自己的分析理解,发现论文构思的不足之处,对论文思路进行完善。
