面向手写数字集的流形降维算法比较开题报告

 2022-01-23 20:28:44

1. 研究目的与意义、国内外研究现状(文献综述)

本课题的意义

当今社会正处于信息爆炸时代,数据已普遍成为计算机科学研究的重点。整个信息技术行业从追求计算速度转变为数据处理能力,数据变得越来越重要。随着数据规模的不断增大,数据表示能力的迅猛发展,人们从因特网获得和存储数据的能力在逐步提高,各个领域数据的维数也越来越高。高维数据给数据表示带去便捷的同时,也产生了一连串的问题。其拥有的高维数据量、背后隐藏的复杂规律、难于观察等特点,使得分析数据的难度呈指数增长,人们想要提取出有用的信息特征也变得困难。而随着样本数据维数的增加,现实世界能获取到的样本数目逐渐减少,估计多变量函数的难度系数和计算数据的工作量也呈现指数增长,这就是我们所说的维数灾难问题。在现今的数据分析和处理过程中维数灾难随处可见,这给后续的数据建模、模式识别等带来了极大的挑战。

一般来说,处理维数灾难的常用方法是降维(又称维数简约)。数据降维是指在保持主要特征的基础上,把原始数据从高维空间映射到低维特征空间的过程[1]。这种转换后的低维数据表示使得数据变得容易理解和处理,大大降低了计算的复杂程度,能获得数据更加合理的表示方式,实现数据的紧凑表示,提高识别的精度,有利于对数据的进一步处理,如可以利用传统的方法在归约后的空间完成挖掘,以及结果可视化呈现,有力的解决了维数灾难的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究的目标

阿拉伯数字作为全球独一无二的全通用符号,在进行手写数字的分类识别一系列相关研究时候大部分不需要考虑到文化背景,这样就为各国各地区的研究工作者提供了一个施展才智的大舞台[11]。而实现数字识别的首要任务是对数字进行降维,手写数字包含有0到9一共10类,一张字符图像最起码含有数百上千个像素,如果看成一个向量就包含数百上千维,而且书写习惯和风格不同会导致字符模式不稳定,其本质特征难以显现,直接处理这些数据会很困难,通过降维可以发现高维空间的低维嵌入流形,可以很容易把这些数字分开,利于后续对字符进行分类识别,实现手写数字的识别可以推广其他问题,对拼音字母的分类识别等研究含有指导影响。

研究内容

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法和技术路线

(1)搜集查阅相关资料,了解基于流形学习的数据降维现状及意义,掌握流形降维的三种常用算法的相关实现原理:局部线性嵌入(lle)、有监督局部线性嵌入(slle)、laplacian特征映射(le)、等距离映射(isomap)。

(2)以matlab为编程平台,实现以上三种降维方法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

对非线性数据降维的三种常用算法:局部线性嵌入(LLE)、有监督局部线性嵌入(SLLE)、Laplacian特征映射(LE)、等距离映射(ISOMAP)进行实现,通过分析一系列的模拟实验,以大量数据的表现,对四种算法的适用情况及性能进行总结,并结合实际,可以为手写字数据的降维提供最优化的方案。

5. 研究计划与进展

第1周收集资料,通过学习相应书记和查阅资料,了解课题研究的基本内容、目的和意义,对课题目前的发展和较为常见的降维算法有所了解和掌握,确定设计思路。

第2周学习了解局部线性嵌入(lle)、有监督局部线性嵌入(slle)、laplacian特征映射(le)、等距离映射(isomap)算法;

第3周 巩固和学习matlab的使用,编制局部线性嵌入方法(lle)、有监督局部线性嵌入(slle)算法实现程序,并上机进行调试和优化,对数据降维处理过程进行仿真。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版