1. 研究目的与意义
在数据处理时,由于测量设备自身的物理属性、数据采集方法及采集条件的局限性等原因,获取的数据往往含有大量的噪声。合理地估算噪声尺度对于噪声敏感的数据处理具有重要的意义。例如在高频金融数据的采集和存储中,对了解和估计真实波动具有重要意义,有效的噪声估算能为描述市场衍生物的动态演变及自身性质提供重要信息。
数据噪声通常是均值为0的随机变量。所谓噪声尺度,是指噪声随机变量的均方差。噪声尺度估算是一个典型的反问题,由给定的含有噪数据估算其噪声尺度。
2. 研究内容和预期目标
本课题主要研究内容是:
(1)通过添加独立同分布噪声的方式研究与噪声尺度变化具有较大相关性的统计量,以此建立噪声尺度估算依据,并从理论上予以分析。
(2)建立噪声尺度估算模型并通过算例予以验证。
3. 研究的方法与步骤
本课题采用曲线模型为例,通过考察基本几何量(如边长平方均值的平方根、相邻边夹角余弦均值,相邻点法矢内积均值等)随噪声尺度的变化规律,然后以此为基础建立数学模型,用增量法估算噪声尺度,并用一种高级语言编程(MATLAB,Java,C\C 等)实现上述算法。
4. 参考文献
[1]机器学习,周志华,北京:清华大学出版社,2016年1月
[2]统计学习基础-数据挖掘、推理与预测,robert tibshirani, jerome friedman著,范明,柴玉梅,咎红英等译,北京:电子工业出版社,2004年
5. 计划与进度安排
1、2022年3月5日-3月18日,完成开题报告; 2、2022年3月19日-6月5日,毕业论文写作,按开题报告撰写论文; 3、2022年4月23日-5月6日,中期检查,汇报课题进展情况,回答教师提问。
4、2022年5月16日-5月22日,完成论文初稿; 5、2022年5月30日-6月5日,论文定稿,经指导老师批阅,达到质量要求后定稿
