K均值聚类算法在时间序列分析中的应用开题报告

 2021-08-08 14:48:45

1. 研究目的与意义

时间序列存在于金融经济、气象水文、信号处理、医疗机械等众多领域,对时间序列进行观察、研究,提取其中不易察觉的有用信息,能很好的找出客观事物发展的规律,预测其发展趋势,并能对客观事物进行必要的控制。所以,对于时间序列的研究有其必要的。时间序列数据是普遍存在的,对时间序列进行聚类分析的研究可以获得大量时间序列数据中隐藏的与时间有关的有价值的信息,达到知识的获取,进而进行在知识指导下的活动。Kmeans均值聚类算法是典型基于距离的聚类经典算法,算法采用数据对象与簇质心的距离作为相似性的评价指标,即认为两个数据对象的距离越近,其相似度就越大.该算法认为簇是由距离靠近的对象组成的,因此把紧凑且独立的簇作为最终聚类目标.由于Knleans均值聚类算法描述容易、实现简单、快速,因此广泛适用于簇个数已知的聚类算法。在理解并掌握时间序列的基本概念以及处理方法的基础上,采用K均值聚类算法,对时间序列数据进行分类处理,并分析处理结果,从而为进一步研究打下基础。

2. 国内外研究现状分析

随着时间序列数据越来越普及,对于它的研究也越来越深入。Agrawal等人首先发表了关于时间序列相似搜索的研究论文【31。此后,相关研究项目和研究者不断增加。Mannila.H等的研究,可以认为是事件序列挖掘的开始。IBM公司篚JAgrawal和UC Irvine的Pazzani研究小组较早且持续开展相关研究,UC Riverside的E.Keogh和UI Urbana.Champaign的J.Han研究小组是目前TDM界最活跃的群体。还有美国的UC Santa Barbara、Maryland大学、Massachusetts大学、南澳洲的F1inders大学等,也活跃着相应的研究小组。国内的相关研究大约从2000年开始起步,复旦大学、浙江大学、中国科技大学等都曾对时态数据的相似性度量有相关的研究,但缺少系统性。

3. 研究的基本内容与计划

研究内容:

时间序列数据的聚类分析是一个刚刚起步的新领域,它是在相似性度量的基础上来实现的。当前对于时间序列的聚类分析还比较少,基于距离的时间 序列聚类方法,有先以限幅方式离散化序列后,用k-means算法进行聚类.虽然k-means有许多缺点,但仍然是最流行的

研究计划:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

随着计算机技术的发展和大规模数据的存在,时间序列的数据挖掘研究也发展迅速。

时间序列数据存在于生活和生产的各个领域,由于数据采集的方法和测量标准等各有不同,则噪声普遍存在于时间序列数据中,这都是序列挖掘要解决的问题数据挖掘最有效的手段就是聚类分析,它是数据挖掘工具中的常用方法。

利用聚类分析方法可以从大量的时间序列数据库中挖掘出潜在的重要信息,获得的重要信息用来指导生产和生活,从而获得更好的生产及生活水

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。