1. 研究目的与意义
n 随着计算机技术及网络通讯技术的飞速发展,特别是因特网的出现和普及,过去的几十年里,人类在生产和生活中积累的数据量急剧增长,信息时代,信息的价值不言而喻,对这些积存的海量数据进行分析,归类,从中挖掘出对人类生产生活有用的信息迫在眉睫。生产,生活中产生的数据都具有非负性,如工厂产品的产量,销售公司的销售额等。面对这些大规模数据,人类似乎显的束手无策,幸运的是,数学中的矩阵分解思想各人类带来了福音利用矩阵分解,可将大规模问题转化为小问题来处理。经典的高纬数据分析,降维方法,如主分量分析,独立分量分析都可看做某种矩阵分解方法,但是它们允许分解得到的矩阵因子中的元素可以存在负值,但负值在实际应用中往往缺少物理意义。
n 在信号分析,图像分析,文本分析,生物医学工程和化学工程等领域,信息或信号处理的许多数据具有非负性的特点,如灰度图像,物质成分含量,文章中单词出现的次数和统计学中的概率转移矩阵等。面对大规模的高维的非负数据,如何针对其非负性,寻找有效的方法,对其进行降维和分析,非负矩阵分解应运而生。
n 认知学研究表明,人类对整体的感知是基于对部分的感知。非负矩阵分解的思想正是源于此。它是一种较新的矩阵分解方法,它对矩阵因子的元素的数值加入了非负性约束。非负性约束的引入,可使通过对原始的高纬的非负数据进行非负矩阵分解,分解得到的结果不存在负值,在实际应用中具有明确的物理意义,从而得到智能化的,纯加性,低维的数据描述,且具有一定程度的稀疏性,稀疏性在一定程度上能抑制外界噪声的干扰。
2. 国内外研究现状分析
国外:nmf的思想课追溯到1994年paatero和tapper在文1】中提出的正矩阵分解,在这篇文章里他们尝试对环境方面的实际数据进行因子分析,但真正使nmf的研究流行起来,并成为一个研究热点,是1999年lee和seung2】提出一个以广义kullback-leibler散度为目标函数的基于基本nmf模型的算法,并将其应用于人脸图像的表示,将orl人脸库上的人脸图像向量化,构成一个非负矩阵,运用nmf算法进行分解,将得到的基图,像矩阵中的每一列转换为与orl人脸库中人类图像等尺寸的图像矩阵,发现呈现在人们面前的是人脸面部的某些部件,如眼睛,鼻子,嘴巴等。2001年lee和seung3】对基于基本nmf模型的算法进行了深入的研究,提出了两个经典的nmf算法:基于欧氏距离的乘性迭代算法和基于广义kullback-leibler散度的乘性迭代算法,并给出了收敛性的证明,这两个算法因为提出比较早,收敛速度较
快,已经被用于各个领域,现已成为基准。
芬兰赫尔辛基大学hoyer教授4】提出一种改进的nmf模型,即带稀疏限制的非负矩阵分解模型,并给出了相应的分解算法,相对前述算法的最大优势在于可以很方便的控制基矢量的稀疏程度。li5】等人根据化学计量学需要提出了带正交限制的非负矩阵分解模型,montano6】等人提出了非平滑非负矩阵分解。
3. 研究的基本内容与计划
内容:随着计算机和信息技术的发展,矩阵分解成为处理大规模数据的一种有效手段。传统的矩阵分解工具,例如,pca和svd等,分解的结果常常含有负值,而负元素在实际问题中往往没有合理的物理解释。对于非负矩阵,非负矩阵分解的目标是找两个非负矩阵和,使得(1)其中(1)式的求解可以看做最优化问题, 常用的目标函数有两个:一个是由欧式距离得到(2),另一个通过相对熵得到:(3)。
lee和seung给出了一个乘法更新算法,式(2)的更新规则为:(4)和(5),式(3)的更新规则为(6),(7),(8)表示求转置矩阵,成为基矩阵,其中每一列成为一个基向量,代表数据中的本质特征,称为系数矩阵,矩阵和的初始值任意,算法交替的更新和,直到他们的改变足够小即为分解结果。为了防止更新过程中出现分母为零的情况,可以在分母上加一个充分小的正数。
负矩阵分解[3]问题可描述为:已知一个非负矩阵v,要找出非负的n*r矩阵 w和非负的n*m矩阵h,使 v=wh。由上述可知,非负矩阵分解是用非负性约束来获取数据表示的一种方法。非负性是对矩阵分解非常有效的条件限制,它导致了对于原始数据的基于部分的表示形式,即样本数据只允许加性和非负的组合。算法所得到的非负基向量组具有一定的线性无关性和稀疏性,从而使得其对原始数据的特征及结构具有相当的表达能力。这使得该算法具有很强的应用背景。
4. 研究创新点
非负矩阵的应用是及其广泛的,因此,要想将其应用全部总结出来时不可能的。本文旨在通过具体的实例的应用展示非负矩阵在处理相关问题上的简便性、灵活性和可行性。
本文通过非负矩阵的加法、乘法、初等变换等运算性质,及非负矩阵在矩阵求逆、行列式展开等方面的应用,充分详细地举例说明,体会其优越性。