1. 研究目的与意义、国内外研究现状(文献综述)
1、选题目的、意义聚类分析[1]又称群分析,是根据物以类聚的道理[2],对样品或指标进行分类的一类多元统计方法。
本文主要是采用聚类分析法[3],对于各地区各行业的工资水平样本进行聚类分析,得出结果并对结果进行分析,从而可以为大学生就业提供宏观上的方向指引。
首先,介绍关于聚类分析的思想以及发展状况。
2. 研究的基本内容和问题
本研究的目标:本课题的目的在于通过收集数据和对数据挖掘技术的理论知识,结合当前各地区各行业的工资水平,利用聚类分析法对样本平均工资水平进行分析。
具体来说就是利用聚类分析法,找出各方面数据的一些区别与联系,根据得出的结论分析各地区各行业工资水平的差异,从而对大学生就业的选择提供一定的知道作用。
本研究的内容:(1)系统聚类法和k-均值法(快速聚类法)的原理与应用;(2)各地区各行业的平均工资水平的差异;(3)对于大学毕业生选择工作的建议。
3. 研究的方法与方案
研究方法:(1)文献查阅法:利用南京农业大学图书馆馆藏资料以及购买的中国知网、维普的电子文献资料,查找、检索与聚类分析法及各地区各行业工资水平分析等相关的博硕士论文、期刊论文、会议论文以及文字资料,仔细研读以期找出一些有益的研究线索、方法与思路。
(2)matlab聚类分析法:基于matlab软件,利用聚类分析法的原理以及方法,结合收集的样本数据,进行数据分析,得出数据分析结果,并对数据分析得出的结果进行深入评价、分析。
(3)归纳总结法:在上述结果及其数据结果分析的基础上,进行归纳、总结,对大学毕业生就业选择剔除宏观上的具有针对性的建议与观点。
4. 研究创新点
特色或创新之处本文尝试从聚类分析法中的系统聚类法和K-均值法(快速聚类法)的概念和特征入手,结合新形势下大学生就业选择的困难,将两种分析方法引入到大学生就业选择相关的问题研究中,通过分析样本数据,以期得到一些有意义,对大大学生就业问题具有针对性、科学性的科研成果。
5. 研究计划与进展
研究计划及预期进展本研究的具体计划,主要分为三个阶段:第一阶段:文献综述的查找以及各省各行业工资的数据收集;第二阶段:根据已有文献中的成果和自己所收集的数据,进行初步数据统计和分析;第三阶段:用聚类分析法的两种分析方法在MATLB中进行分析和研究预期进展如下:2017年1月中旬完成第一阶段;2018年3月底完成第二阶段;2018年5月底完成第三阶段,同时完成论文的撰写以及修改工作。
