ISPRS摄影测量与遥感学报
遥感支持向量机:综述
Giorgos Mountrakis lowast;, Jungho Im, Caesar Ogole
环境资源工程系,SUNY环境科学与林业学院,林业博士,雪城,纽约13210,美国
文章历史:
2010年6月6日收到
2010年9月17日收到修订的形式
接受日期:2010年11月1日
2010年12月3日上线
关键词:
支持向量机,评论,遥感,SVM,SVM
摘要:
继续提出和评估广泛的机载和卫星派生图像的分析方法。在本文中,我们回顾了支持向量机的遥感实现(SVMs),一种有前途的机器学习方法。本由于近年来发表的作品数量呈指数级增长,因此这一审查是及时的。SVM在遥感领域中特别有吸引力,因为它们具有即使在有限训练样本中也有良好的能力,而这是常见的遥感应用的限制。不过他们也遭受参数分配问题,这会显著影响得到的结果。本文提供了超过一百篇出版作品的各种应用的实证结果摘要(截至2010年四月)。我们希望,本次调查将为未来应用程序的支持向量机和算法增强的可能领域提供指导方针。
copy;2010国际摄影测量与遥感学会(ISPRS)。由...出版Elsevier B.V.保留所有权利
目录
1介绍3
2支持向量机概述4
3简要综述6
4 SVM工作专注于算法的进步7
4.1分类7
4.2回归12
5 面向应用的SVM论文14
5.1生物物理工作14
5.2土地覆盖利用的工作15
5.2.1植被/农业15
5.2.2不透水表面/市区17
5.2.3土地覆盖土地利用的工作19
5.3其他方面工作21
6 分析与总结23
致谢25
参考文献25
1.介绍
远程感测数据用于许多应用中。通常情况下,图像分类过程启动数据转换成有意义的信息。但不幸的是,图像分类不是一个简单的任务。正如CHI等人(2008)所指出的,遥感数据的分类特别艰巨,因为大部分的监督学习计划需要足够数量的训练样本,而定义和获取参考数据往往是一个关键问题。不同参数和非参数的各种分类技术已经被开发,并在不同的环境中使用——包括遥感
以前的论述,如Plaza(2009)等人的论述,重点是关于处理特定类型的图像方法的最新发展,例如高光谱图像。本文提供的是审查遵循算法的观点而不是图像特性。更具体地说,我们关注支持向量机(SVM)在遥感中的应用。开展这项研究的动机来自不同的来源。首先,SVM不像其他分类器那样众所周知(例如,决策树,神经网络的变体),在一般遥感界,如果不超过执行既定方法,他们可以匹配。第二,他们的表现增益似乎非常适合于遥感应用,其中通常提供有限量的参考数据。第三,虽然该方法并不广泛流行,但近年用这种方法已经在SVM遥感工作上取得了重大突破,这表明它是是最新的和适当的。
这项综述的重点是最近的发表在8个主要的遥感期刊的研究论文(2010年4月可用),即ISPRS Journal of Photogrammetry and Remote Sensing,
Remote Sensing of Environment,Photogrammetric Engineering&Remote Sensing,IEEE Transactions on Geoscience and Remote Sensing,IEEE Geoscience and Remote Sensing Letters,International Journal of Remote Sensing, Canadian Journal of Remote Sensing 和GIScience and Remote Sensing。与主题点相关的研究论文数量有限,因此在这篇综述中与主题点相关的研究论文来自其他来源。入选论文范围广泛:(i)煤炭储量检测的应用到城市增长监测,(ii)从分米计的分辨率到几公里像素大小,(iii)从单个光谱分辨率到几百个波段,以及(iv)从最大值开始的比较方法似然分类器到神经网络。为了完整起见,在深入具体工作之前我们首先回顾一下支持向量机方法的基础知识。然后对相关的论文进行总结,并列一般模式,使我们能够得出结论和建议,来作进一步调查。
2.支持向量机概述
支持向量机(SVM)是一种有监督的非参数统计学习技术,因此没有对底层数据分布的假设。在其原始的构想中(Vapnik,1979),该方法呈现一组标记的数据实例和SVMtraining算法,旨在找到一个超平面将数据集分离成离散的预定义数字。用与训练样例一致的方式长期最优分离超平面用于指代决策边界,最小化错误分类。学习是指寻找一个迭代过程,分类器具有最佳决策边界来分离训练模式(在可能的高维空间中),然后分离相同配置(尺寸)下的仿真数据(Zhu和Blumberg,2002)。
在其最简单的形式中,SVM是线性二进制分类器,从两个可能的标签之一分配给定的测试样本。在远程的情况下要标记的数据样本的实例,感测分类通常是从多光谱或高光谱图像的个体像素导出的。示出了这样的像素作为模式向量,并且对于每个图像带,它包括的一组数值测量。基于诸如纹理的像素空间关系,特征向量的元素也可以包括其他判别变量测量。图1示出一个在二维输入空间中的简单的两类可分类分类问题的场景。一个重要的概括SVM的方面是,不是所有可用的训练示例都会被用于分离的描述和说明书中。超平面位于边缘的点的子集(称为支持向量)是唯一的定义超平面的最大余量。
线性SVM的实现假设多光谱特征数据在输入空间中是线性可分离的。实际上,不同类别成员(簇)的数据点彼此重叠,这使得线性分离困难。基本线性判决边界通常不足以让分类图案具有高精度。技术和解决方法例如软边缘法(Cortes and Vapnik,1995)和内核窍门是用来解决不可分性问题的。SVM优化中的附加变量(称为松弛变量)和映射(使用合适的数学函数)非线性相关性进入较高的(欧几里得或希尔伯特)空间。 内核函数通常需要满足Mercer定理为了成为SVM中的有效内核(Scholkopf和Smola,2001)。 内核函数的选择通常有一个方面对分析结果。此外,典型的遥感问题通常涉及多个类的识别(多于两个)。 对简单的SVM分类器进行多类使用方法分类调整,如一对所有,一对其他,和有向无环图(内尔et al.,1990)。
支持向量机是特别有吸引力的遥感领域,由于他们能够成功地处理小训练数据集,往往产生比传统方法更高的分类精度(Mantero et al.,2005)。利益的基本原则SVM是学习过程,遵循所谓的风险最小化。在这个方案下,未经预先假设的未知数据的误差数据的概率分布,统计技术等因为最大似然估计通常假定数据dis-贡献是先验已知的。Burges(1998)在一个组织有序SVM教程中描述了一个简单的实验来说明一个优点的SVM在图像识别题。在该演示中,一个基本的基于SVM的多路识别器的性能在先验知识的情况下进行评估图像分类。准确性证明是大致相同的像素首先被混洗,每个图像实例受到相同的随机置换。然而,当“破坏”(或去除先验知识)的行为发生,SVM仍然超越甚至最好的神经网络。这个发现在遥感应用中特别有吸引力,因为从远程采集数据感知的图像通常具有未知的分布,例如最大似然估计(MLE)多变量正态数据模型不一定匹配假设。即使数据匹配,其维数被假定为匹配光谱带的数量,正态分布,假设分布可以使用钟形函数来描述,使用一个钟形(高斯)功能不再是健全的,因为浓度在高维空间中的数据往往是在尾部(Fauvel等人,2009)。这种现象将继续在遥感中遇到的新的传感器增加光谱分辨率。
还有另一个有趣的概念,作为一个到SVM的关键吸引力。很多作者常说过度拟合的概念(Montgomery and Peck,1992年),然而被不同地称为“他人的偏置方差权衡”(Geman等人,1992)或“容量控制”(Guyon等人,1992),基于SVM分类已知,在其间达到正确的平衡在给定有限数量的训练模式上获得的精度能够泛化到不可见的数据。
除了从SVM制定得到的好处也是几个挑战。关于SVM的可塑性是内核的选择。虽然有很多选择是可用的,一些内核函数能不提供用于遥感应用的SVM配置。 经验证据表明内核如径向基函数和多项式内核应用于基于SVM的卫星分类图像数据产生不同的结果(Zhu和Blumberg,2002年 )。一个对SVM内核及其功能的良好说明,在众多的文件(例如,Kavzoglu和Colkesen 2009 )。从非专家用户的角度来看,SVM理论是一个有点 -特别是由于更有效的SVM的事实变体通常包含一些难以理解的概念。这限制了SVM的有效跨学科应用。许多SVM教程可供选择(如 Cortes和Vapnik(1995年)和Burges(1998年),但这些不包含详细讨论了新提议的越来越多SVM的变体。 在遥感领域有一个良好的起点将是一本教科书 TSo和Mather(2009年),提供一个远程分析方法的整个领域的审查感测数据,包括SVM。对那些对规则提取SVMs感兴趣的人从最近的计算机科学评论是可用的(Barakat和Bradley,在按)。Chen和Ho(2008年)提供了极好的遥感统计学习的一个参考。应该注意到,对于本评论,术语SVM是包括的传统的SVM方法以及基于SVM的变体,大多数后者仍然严重依赖于标准SVM方法。
3.简要概述
支持向量机(SVM)最近发现了许多遥感方面的应用。关于这次议论,我们确定了108篇相关论文,在过去的2.5年中有超过一半的出版(图2)。这种增长趋势预计还将增长,使这一个审查现有工作的关键时间。
SVM论文包括广泛的遥感应用,折叠域和传感器。这个不同群体的总结是在介绍卫星传感器是优选的光谱(图3)。对变化检测有一些有限的兴趣(10%的论文),一种模式,因为陆地卫星存档现在可以免费使用。有一个在高分辨率和中分辨率传感器之间几乎相等,主要与伊科诺斯岛和陆地卫星成像有关,还可用于高分辨率机载传感器。
4.SVM工作专注于算法的进步
本节总结了实现的SVM进步在过去十年。仅仅对比SVM 性能,其他方法或论文结合SVMs具体应用将在下一节中讨论。
4.1分类
SVM通常是需要训练样品的监督分类器。文献表明SVMs不是相对敏感,培训样本规模和科学家已经改进SVMs成功工作的有限数量和质量的训练样品。例如,FOODY和Mather(2004年b)结果表明,只有四分之一的原始训练样本获得SPOT HRV卫星图像足以产生同样高的精度为一二作物分类。Mantero等人。(2005年)估计使用SVM的主题类的概率密度。基于SVM方法使用递归过程生成先验概率能力估计已知和未知类通过适应贝叶斯最小误差决策规则。该方法进行了测试使用合成数据和两个光学传感器数据(即DaedalusATM和Landsat TM)和确认的方法有效性,当地面参考数据的可用性有限时。Bruzzone等人(2006年)传递推理学习理论被纳入SVM的遥感分类。他们的基于SVM的方法定义分离超平面符合将未标记样品集成在一起的过程与训练样本。实验表明建议方法是有效的,特别是对于一组不正确的远程由于训练样本有限,传感分类问题。FOODY和Mathur(2006年)提出了一个关注更多的混合像素列,传统的纯像素采集,假设一个SVM分类器,三波段的分析多光谱SPOT HRV图像显示混合像素的好处对作物类型分类任务进行抽样。FOODY等人(2006年)评估了一类问题的四个数据集缩减方法(cotton与其他)使用SVM和LISS-III数据,发现数据减少是可行的(〜90%)以最小的信息损失。
Sahoo等人(2007年)调查了本地化,高度敏感的转化,以捕获hy视角特征。他们比较了所谓的S变换到没有它的分类器,并发现令人鼓舞的结果。实施提出的算法是一个SVM地质分类中的小数据样本。Blanz和Melgani(2008年)调查了局部K -nearest适配以形成SVM方法的局部变体。其结果表明得到了实质性改进,特别是与非线性内核函数的集成。Tuia和Camps-Valls(2009年)解决了内核预测的问题提出一种通过分析未标记的样品识别内核。Camps-Valss等(2010)提出了一种改进的方法,使用希尔伯特 - 施密特的各种图像类型的依赖独立性准。Marcocini等人(2009年)讨论了通过复合内核结合空间信息发现实质性的改进,但额外的计算成本。Camps-Valls等人(200
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[140942],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
