基于随机森林模型的遥感影像分类方法研究开题报告

 2022-02-14 19:55:39

1. 研究目的与意义

遥感(Remote Sensing)作为现代科学技术的重要组成部分,已经在生活中方方面面起了很大的影响,并为国家的经济发展提供了巨大的帮助。自 1972 年美国成功发射了第一颗多光谱陆地观测卫星以后,各个国家都纷纷开展了自己对太空的探索、试验和应用,并不断有新的卫星发射上天。目前随着遥感技术的多元化,使得卫星能探测的波段得到大大的扩展,使得获取的图像空间分辨率在不断提升,空间信息含量更加丰富,图像数据量也急剧增加。由于数据量的不断增加,数据信息也越来越复杂,使得对数据的处理再无法靠传统的人工解析这种高成本方式,且人工解析往往因其解析周期长,带有个人主观性等缺点,已无法很好的处理这海量数据。为了实现对海量遥感数据的自动化处理,机器学习(Machine Learning)算法的发展为其带来了转机。其中,随机森林算法作为机器学习中的一种重要集成学习算法,因其稳定性强、速度快等特点已被广泛用于多种类型的遥感图像分类处理当中。在现实生活中,遥感数据往往会因多种原因而不可避免的带有噪声,从而对遥感数据的分类精度带来很大影响。然而随机森林本身就具有一定的抗噪声性能,但其受噪声的影响却仍然不确定,尤其当受噪声污染数据不多时,可以利用算法本身的一些特性,过滤掉噪声所带来的影响。目前,对噪声数据的处理方式,往往是先对噪声污染数据进行数据修复,然而,修复算法通常会给数据自身带来一些影响,反而会影响到后期的分类过程。因而,如果能够不修复而直接进行分类,将会更加的高效。所以,研究随机森林算法受噪声的不确定性影响也变得更有意义。

其次,在面对海量数据时,如何提高分类的效率也成为一个重要的研究课题,而对于随机森林这种集合分类器而言,保持随机森林最精简状态成为提高效率的最好方式。随机森林作为一种集合分类器,是将多棵决策树集合在一起,通过群众投票方式得到分类结果。因此,森林中众多决策树也会出现优劣之分,在随机森林中,也存在着这么一个最小森林,使得作为集合分类器的整体优势存在,而规模却得到减小。因此,好的修剪方式将会大大提高随机森林的分类能力,是非常有实际研究价值的。

2. 研究内容和预期目标

一、研究内容

1.随机森林(random forest,rf)算法是由美国科学院的 breiman 与 cutler 等人提出,是一种基于分类与回归树的集成万方数据学习算法。随机森林是一个功能强大的机器学习分类器,是一种与传统的决策树相比基于非参数回归算法的集成学习方法。随机森林作为一种分类算法,因其具有分类速度快、准确率高、能适应高维度特征等特点,在遥感数据分类领域的使用越来越广泛,同时在不同种类遥感数据中的应用工作也在不断的增多。

2.随机森林没有复杂的参数调节,最近十年里在遥感图像分类中的应用研究十分广泛,如遥感图像的土地分类和生态区的划分,还有对树种的分析,pierce先通过提取树冠的不同特征,并应用随机森林来对森林火灾进行预警,降低了火灾防护难度。随机森林还用于探测裸露的碳资源和城镇区域的分析。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

1.查阅资料:根据毕业论文任务书上提供的参考文献寻找有关随机森林、遥感分类的资料。同时在知网等信息资源平台查阅相关资料,了解相关信息,掌握专业知识,以便于后期论文工作的开展。

2.整理搜集论文所需相关数据源,汇总资料。本文的数据来源于 landsat 5 的 tm 图像,landsat 是光学对地观测卫星,美国陆地探测卫星系统,自 1972 年发射第一颗卫星 landsat 1 到最新的 landsat 7,tm(thematic mapper)是landsat 卫星上安装的专题绘图仪,用来对地球表面来成像。没有特别说明,tm 图像就是指 landsat4 或 5 的 tm 图像。特别的,landsat 7 收集到的数据命名为 landsat7 etm 数据,和 tm 相比,etm 多了一个全色波段,并且第六波段分辨率为 30m。

3.本课题使用随机森林模型进行可见光影像数据分类方法的研究。随机森林的建立大致分为三个步骤:为单一决策树抽样产生训练集、建立单一决策树、森林的形成及算法的执行。以下给出随机森林算法整体过程:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]詹国旗,杨国东,王凤艳,辛秀文,国策,赵强.基于特征空间优化的随机森林算法在gf-2影像湿地分类中的研究[j].地球信息科学学报,2018,20(10):1520-1528.

[2]崔小芳,刘正军.基于随机森林分类方法和多源遥感数据的湿地植被精细分类[j].测绘与空间地理信息,2018,41(08):113-116.

[3]郜燕芳,李俊明,刘东伟,任周鹏,王楠楠.基于随机森林模型的城市不透水面提取研究——以呼和浩特市为例[j].冰川冻土,2018,40(04):828-836.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

一、研究工作准备阶段(2022.3.11——2022.3.31):

2022.3.11——2022.3.24为准备工作阶段,包括查阅资料、实验数据收集等;

2022.3.25——2022.3.31为开题阶段,主要工作是撰写开题报告等。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版