EddyNet:对海洋涡旋进行像素分类的深层神经网络外文翻译资料

 2022-11-28 17:34:03

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


EddyNet:对海洋涡旋进行像素分类的深层神经网络

Redouane Lguensat, Member, IEEE, Miao Sun, Ronan Fablet, Senior Member, IEEE, Evan Mason, Pierre Tandeo,and Ge Chen

摘要:这项工作展示了EddyNet,一个深度学习为基础的框架,为了对由哥白尼海洋和环境监测服务提供的海面高度图中的涡旋进行自动检测和分类。EddyNet由一个卷积编码器-解码器和一个像素分类层组成。输出是一个与输入具有相同大小的地图,其中像素具有以下标记{0:非涡旋,1:反气旋,2:气旋}。Keras Python代码、训练数据集和EddyNet权重文件是开源的,可以在https://github.com/redouanelg/EddyNet免费获得。

关键词:中尺度涡旋、分割、分类、深度学习、卷积神经网络。

1、引言

通过使用比原来的三层(输入层,隐藏层,输出层)更深入的人工神经网络(ANN)开始了所谓的深度学习时代。目前仍在进行的发展和发现正在产生令人印象深刻的成果,并且在各个不同的领域达到了最先进的表现。请读者阅读[1]作为深度学习的一般介绍。特别是卷积神经网络(CNN)引发了图像处理领域的深度学习革命,现在在计算机视觉应用中无处不在。这导致了遥感界的许多研究人员对这种强大的工具的使用进行了研究,应用于如物体识别,场景分类等任务中。深度学习在遥感数据中的更多应用可以在[2]、[3]及其中的参考文献找到。

在最近的深度图像分割学习成果的基础上,我们提出了“EddyNet”,这是一个对哥白尼海洋和环境监测服务提供的海面高度(SSH)地图进行自动涡旋检测和分类的深度神经网络(以下简称AVISO-SSH)。EddyNet的灵感来源于广泛使用的图像分割体系结构,特别是例如U-Net[4]等U形结构[4]。我们研究了比例指数线性单位(SELU)[5]、[6]而不是经典的ReLU 批量标准化(R BN)的使用,展示了我们大大加快了训练过程,同时达到了可比的结果。我们采用基于Dice系数(也称为F1度量)的损失函数,并且阐明了与使用分类交叉熵损失相比,两个最相关的类(气旋和反气旋)得分更高。我们还将随机失活层补充到我们的架构防止EddyNet过度拟合。

我们的工作加入了遥感和机器学习社区之间正在出现的交叉融合,这对于处理遥感图像分割问题有重要的贡献[7]-[9]。就我们所知,目前的工作是第一个提出基于深度学习的架构进行涡旋的像素分类,处理这种特定类型数据的挑战。

本文章安排如下:第二节介绍涡流检测和分类的问题及相关工作。第三节描述了数据准备过程。第四节介绍了EddyNet的架构,并详细介绍了训练过程。第五节报告了这项工作中考虑的不同实验,并讨论了结果。我们的结论和未来的工作方向在最后的第六部分陈述。

2、问题陈述及相关工作

海洋中尺度涡旋可以被定义为旋转的水团,它们在海洋中无所不在,并且携带关于大规模海洋环流的决定性信息[10]、[11]。涡旋运输不同的相关物理量,如碳、热、浮游植物、盐等。这个运动有助于调节天气和混合海洋[12]。探测和研究涡旋有助于考虑它们在海洋气候模型中的影响。随着高度计任务的发展以及可以同时使用两个或多个高度计的实现,海面高度(SSH)的合并产品达到了足够的分辨率以允许中尺度涡旋的检测[14]、[15]。SSH地图使我们能够区分两类涡旋:ⅰ)被正SLA(海平面异常,对于给定的平均值为SSH异常)识别的反气旋式涡旋和ii)以负SLA为特征的气旋式涡旋。

近年来进行了几项研究,目的是以自动化的方式检测和分类涡旋[16]。文献中主要有两类流行的方法,即基于物理参数的方法和基于几何轮廓的方法。基于物理参数的方法最流行的代表是Okubo-Weiss参数方法[17]、[18]。然而,Okubo-Weiss参数方法因其基于专家和特定区域的参数以及它对噪音的敏感性而受到批评[19]。从那时起开始发展其他技术,如小波分解,缠绕角等。基于几何的方法依赖于将涡旋看作椭圆形并使用闭合轮廓技术,最流行的方法仍然是Chelton等人提出的方法[11](在下文中称为CSS11)。结合了两种想法的方法称为混合方法(例如[22]、[23])。过去也使用机器学习方法来提出问题的解决方案[24]、[25],最近它们再次受到越来越多的关注[26]、[27]。

我们建议在这项工作中利用深度学习的进展,以解决海洋涡旋检测和分类问题。我们提出的基于深度学习的方法需要一个训练数据集,其中包含SSH图及其相应的涡旋检测和分类结果。在这项工作中,我们根据基于SSH的py-eddy-tracker方法(以下简称PET14)[28]的结果来训练我们的深度学习方法,Mason等人开发的算法与CSS11密切相关,但有一些显著差异,例如不允许在涡旋中出现多个局部极值。图1给出了一个PET14结果的例子,该图显示了大西洋西南部的涡旋的识别(见[29])。涡旋跟踪算法的输出提供每个分类涡旋的中心坐标以及其速度和有效轮廓。由于我们的目标是按像素分类,即对每个像素进行分类,因此我们将输出转换为分割图,如图2所示的示例。我们在这里考虑对应于具有最高平均地转旋转流的闭合轮廓的速度轮廓。速度等值线可以看作是涡旋中最有能量的部分,并且通常小于有效半径。下一节将进一步描述产生像素级分类图的训练数据库的数据准备过程。

图1:一张来自南大西洋的SSH地图的快照,图为中PET14算法检测到的涡旋,红色的形状代表反气旋,而绿色的形状是气旋

图2:SSH-分割图训练对的例子,反气旋(绿色),气旋(棕色),非涡旋(蓝色)

3、数据准备

如前一节所述,我们将PET14的输出视为我们基于深度神经网络算法的训练数据库。我们使用15年(1998-2012)每天的已经被检测和分类的涡旋。相应的SSH地图(AVISO-SSH)由哥白尼海洋环境监测服务(CMEMS)提供。SSH地图的分辨率为0.25°。

由于内存限制,我们架构的输入图像是128times;128像素。前14年的数据被用作训练数据集,最后一年(2012)被搁置在一边以测试我们的架构。我们考虑图1所示的南大西洋地区,并切割没有发现涡旋的顶部区域。然后我们从每个SSH图中随机采样一个128times;128的补丁,这为我们留下了5100个训练样本。这类数据的一个重要特性是它的动态变化缓慢,单个涡旋可以存活几天甚至一年以上。除了128times;128补丁可以包含几个气旋和反气旋的事实外,我们认为数据增强(例如,将补丁的旋转版本添加到训练数据集中)是不需要的;我们观察到实验(这里未显示),这甚至导致性能下降。下一步是从AVISO-SSH中提取128times;128的SSH补丁。对于没有数据的陆地像素或地区,我们将标准填充值替换为零;这有助于避免异常值,并且不会影响检测,因为涡旋位于非零SSH区域。最后的和关键的步骤是创建训练补丁的分割ground truth。这是通过将速度轮廓坐标映射到分辨率为0.25°的AVISO-SSH坐标方格中最近格子上来创建多边形来完成的。然后每个多边形内的像素由多边形代表的涡旋的类进行标记:{0:非涡旋/陆地/无数据,1:反气旋,2:气旋}。图2给出了来自训练数据集的一个{SSH图,分割图}对的例子。

4、我们提出的方法

A.EddyNet架构

EddyNet架构是基于U-net架构[4]。它从具有3个阶段的编码(下采样)路径开始,其中每个阶段有两个3times;3的卷积层,然后是标度指数线性单位(SELU)激活函数[5](称为EddyNet_S)或经典的ReLU激活函数 批量标准化(称为EddyNet),然后是2times;2最大池化层将输入的分辨率减半。解码(上采样)路径使用转置卷积(也称为解卷积)[30]返回到原始分辨率。就像U-net一样,Eddynet也得益于从收缩路径到扩展路径的跳转连接来解析源自早期阶段的信息。由于与架构容量相比,训练样本的数量较少,所以初始的利用原始U-Net架构的实验显示出严重的过拟合。众多的尝试和超参数调整导致我们最终决定采用3级全32位过滤器架构,如图3所示。与广泛使用的架构相比,EddyNet具有参数少的优点,因此可以降低内存消耗。我们的神经网络仍然可以过滤数据,表明它可以捕获涡旋检测和分类的非线性反问题。因此,我们在每个最大池化层之前和每个转置卷积层之前添加随机失活层;我们选择了这些位置,因为它们是最大数量的过滤器(64)存在的串联中涉及的位置。随机失活层有助于规范网络并提高验证损失性能。关于EddyNet_S,我们提到了三个要素:i)权重初始化与EddyNet不同,我们在实验部分详细介绍了这方面的内容。ii)SELU激活函数背后的理论基于自我规范化的属性,旨在通过网络层次保持输入接近零均值和单位方差。随机将单元设置为零的传统随机失活可能会损害这个性能;[5]因此提出了一种称为AlphaDropout的新随机失活技术,通过随机设置负饱和值激活来解决这个问题。iii)SELU理论最初来源于前馈网络,将其应用于CNN需要谨慎设置。在初步实验中,使用我们的类似U-net的架构和SELU激活导致了非常嘈杂的损失,甚至有时会爆炸。我们认为这可能是由于跳过连接可能会违反SELU所需的自我标准化属性导致的,因此决定在每个最大池化层、转置卷积和连接层之后,在EddyNet_S中保留批量标准化。

图3:EddyNet架构

B.损失衡量标准

虽然深度学习中的多类分类问题通常使用分类交叉熵成本函数进行训练,但分割问题支持使用基于重叠的度量。Dice系数在分割问题中是一种流行且广泛使用的成本函数。考虑预测区域P和ground truth区域G,并且通过将|P|和|G|表示为每个区域中的元素的总和,dice系数是交点在区域总和上的比率的两倍:

Dice系数为1得到完美的分割结果,而dice系数为0是指完全错误的分割。从F1度量角度来看,dice系数是精度和召回度量的调和平均值。

该实现使用one-hot编码矢量,一个基本细节是EddyNet的损失函数使用了一个soft可微分版本的dice系数,它考虑了softmax层的输出,因为它没有二值化:

pi是softmax层给出的概率,0le;pile;1,gi当被判别为正确的类时为1,错误的类为0。我们后来发现最近的一项研究使用了另一种soft dice损失版本[31];这两个版本的比较超出了本作品的范围。

由于我们处于多类分类问题的环境中,因此我们尝试使用每个类的三个“一对多”soft dice系数的均值来最大化我们网络的性能。我们的神经网络旨在最小化的损失函数就简化为:

5、实验

A.性能的评估

Keras框架[32]与Tensorflow后端在这项工作中被考虑。EddyNet使用ADAM优化器[33]和小批量16张地图在Nvidia K80 GPU卡上进行训练。EddyNet使用零均值和{2/输入单元数量}为方差的截断高斯分布[34]来初始化权重,而EddyNet_S使用零均值和{1/输入单元数量}为方差的截断高斯分布来初始化权重。训练数据集被分成4080个图像用于训练,1020个用于验证。当验证数据集损失在连续五个时期中停止改进时,我们还使用早期停止策略来停止学习过程。然后EddyNet权重是导致最低验证损失值的权重。

然后比较EddyNet和EddyNet_S在使用经典ReLU BN和使用SELU时的情况。我们还将dice损失(方程3)代表的基于重叠的度量与传统的分类交叉熵(CCE)进行比较。表1比较了四种组合的整体准确度和平均dice系数(原始不是soft),在50个随机集合上的平均值,每个集合都是来自2012年的360张120times;120的SSH图。训练EddyNet_S大约只需要训练EddyNet一半的时间。关于训练损失函数的比较表明,在EddyNet和EddyNet_S中,用dice损失训练导致我们两类涡旋(气旋和反气旋)的dice系数较高;dice损失产生比用CCE损失训练更好的整体平均dice系数。关于激活函数的效果,我们以更长的训练过程为代价,用EddyNet获得了更好的度量。可以看到Eddynet和EddyNet_S给出了接近的输出如图4所示。

表1:从测试数据集的50个随机设置的360个SSH补丁的结果计算出的度量,我们报告了平均值并将标准变化放在括号之间。

图4:使用Eddynet和EddyNet_S的涡旋分割结果示例:反气旋(绿色),气旋(棕色),非涡旋(蓝色)

B.幽灵涡旋

幽灵涡旋的存在是涡旋检测和跟踪算法遇到的常见问题[14]。幽灵涡旋是检测算法找到的涡旋,然后在连续的地图之间消失,直到再次出现。为了指出错过的幽灵涡旋的位置,PET14使用检测到的涡旋中心之间的线性时间插值并存储幽灵涡旋的中心位置。我们使用EddyNet检查幽灵涡旋的中心像素是否与实际的涡旋检测相对应。我们发现EddyNet将幽灵涡旋的中心分配给正确的涡旋类,55%的时间是反气旋,45%的时间是气旋。EddyNet可能是一种检测传统方法遗漏的幽灵涡旋的相关方法。图5显示了两个幽灵涡旋检测的例子。

图5:幽灵涡旋的检测:[左]幽灵涡旋中心标示的SSH地图:反

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[21982],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版