

英语原文共 2 页,剩余内容已隐藏,支付完成后下载完整资料
基于CNN的无人值守地面传感器方法笛卡尔极坐标变换
B.-S. Kim, J.-Y. Sun, S.-W. Kim, M.-C. Kang and S.-J. Ko
用户引导分割(UGS)的主要目的是在用户交互最少的情况下获得较高的分割精度。提出了一种基于卷积神经网络(CNN)的UGS方法,该方法采用单次点击作为用户交互。该方法首先将直角坐标系中的输入图像转换为以用户导向点(UGP)为原点的极坐标变换图像。转换后的图像不仅可以有效地将UGP传递给CNN,而且可以使单尺度卷积核充当多尺度核的角色,在不添加任何额外参数的情况下,根据UGP改变其在笛卡尔坐标系中的接受域。此外,还引入了特征选择模块(FSM),并利用该模块从极性变换后的图像中提取径向和角向特征。实验结果表明,与采用直角坐标图像的CNN相比,本文提出的基于极坐标变换图像的CNN在PASCAL VOC 2012数据集上的分割精度(联合上的平均交)提高了3.69%。FSM实现了1.32%的额外性能改进。此外,该方法比传统的基于非cnn的UGS方法平均提高了12.61%。
简介:图像分割是一种计算机视觉技术,它将图像分割成若干段。在各种分割方法中,用户引导分割(user-guided segmentation, UGS)是一种广泛应用于图像合成和地面真实感生成的方法,它提取用户交互选择的特定前景。通常,UGS方法使用不同类型的用户交互,例如拖放、绘制边框和单击/多次。
传统的UGS方法利用颜色和边缘信息作为特征提取所需要的前景。然而,这些低水平的基于特征的方法往往导致不满意的结果。最近,卷积神经网络(CNN)被应用于各种计算机视觉和图像处理技术。这些基于cnn的方法通过迭代训练获得最优特征,取得了令人瞩目的性能。
要将CNN框架应用到UGS中,需要对CNN进行训练,考虑到用户导航点(UGP)的先验信息,只需单击一下鼠标即可指定。为此,我们提出了一种新的基于cnn的基于极坐标变换的UGS方法。在该方法中,首先将输入图像以UGP为原点转换成极性变换后的图像。应用于极性变换图像的卷积核可以有一个接收域,接收域的大小根据内核中心到UGP的距离自适应地改变,使得提取高层上下文特征时不需要任何额外的参数。然后引入特征选择模块(FSM),利用该模块对极坐标图像的径向或角向像素点进行特征提取。为了训练所提出的UGS网络,我们使用PASCAL VOC 2012实例分割数据集和在每张图像中随机选择的UGPs。实验结果表明,采用极坐标变换后的神经网络和有限状态机比采用直角坐标输入的神经网络和不采用有限状态机的神经网络具有更好的性能。此外,该方法在分割精度上优于传统的非cnn方法,用户使用方便。
提出的方法:本文首先给出了直角坐标到极坐标的变换,然后给出了FSM的解释。
笛卡尔坐标到极坐标的转换:图1给出了该方法的整体网络结构。如图1所示,将输入图像转换为极坐标系统,并将其输入到UGS的CNN中。
提出的UGS方法要求用户通过单击指定图像的前景。如果我们假设每个像素属于用户指定的前景的概率被建模为一个以UGP为中心的高斯分布,那么远离UGP的前景像素就可能被错误地分类为背景。
近年来,基于cnn的语义分割技术[3,5]将大规模内核获取的上下文信息结合起来,以提高其性能。受这些技术的启发,我们打算利用大规模的核函数来提高对远离UGP的像素点的分割精度。然而,在笛卡尔坐标系中直接使用大尺度核时,由于参数[3]较多,CNN存在优化问题。为了解决这一问题,我们采用了直角坐标到极坐标的变换,并将得到的极坐标变换后的图像输入到UGS的CNN中。图2说明了这两个坐标系中内核之间的关系。注意,当3times;3卷积核应用于极坐标图像时,其对应的核在笛卡尔坐标系中的大小随核中心到UGP的距离而变化。图2中,距离UGP径向距离较小的黄色3times;3核在直角坐标图像中实际核相对较小(图2a),而距离UGP较远的绿色3times;3核实际核尺寸较大。换句话说,随着内核中心到UGP的距离增加,笛卡尔坐标图像中的实际内核大小也随之增大。因此,使用极坐标图像作为CNN的输入,单个核可以在不需要任何额外参数的情况下实现多尺度核的效果,便于基于UGP提取更多的上下文信息。
图1基于极坐标变换和有限状态机的UGS方法概述
|
|
|
|
a |
b |
图2笛卡尔坐标系与极坐标系统的关系。红点表示UGP
a笛卡尔坐标系的像
b笛卡尔向极坐标变换的合成像
定义笛卡尔坐标系与极坐标系统之间的变换为:
x = rcos x0
y = rsin y0
其中(x, y)表示笛卡尔坐标系中的一个像素位置,(x0, y0)对应于UGP,如图2a所示。下标r和theta;表示径向和角之间的距离(x, y)和(x0, y0),分别,因此(r,theta;)意味着一个像素在极坐标系中的位置所示图2 b。因此,UGP位于(x, y) = (x0, y0)转换成(r,theta;)= (0,0)Cartesian-to-polar坐标变换后,如图2所示。
特征选择模块:如前所述,极坐标系统中的位置(0,0)表示UGP,如图2所示中的红点。如图2a和图b中的红点线所示,笛卡尔坐标图像中与UGP距离为r的像素点被放置在极坐标图像的同一列上。同样,用黄色点线在无花果。2 a和b,分别有相同的角theta;值在笛卡儿坐标图像位于同一行在极坐标图像。受这些特征的启发,我们提出了FSM方法,从极坐标变换图像中提取更有效的特征。
如图1所示,所提出的网络采用基于vgg16的stri- 32全卷积网络(FCN-32s)[7]作为基础网络,所提出的FSM由1times;3、3times;1和3times;3个不同大小的卷积核组成。利用前两个核提取径向和角向特征,利用后一个3times;3核提取极坐标变换后图像两个方向的相关特征。然后将这些径向、角向和相关的特征连接起来,然后使用1times;1卷积核来降低它们的维数。
实验结果:为了训练网络,我们使用PASCAL VOC 2012训练数据集对[4]进行实例分割。然后,在PASCAL VOC 2012测试数据集上,以实例分割和Berkeley数据集[8]为例,对该方法的性能进行了评估。由于PASCAL VOC 2012 dataset提供了实例级注释,我们为每个实例随机分配一个UGP,其中包含UGP的对象被认为是用户指定的前台。因此,对于每个实例,获得一个UGP及其对应的地面真值标签图像来训练和测试提出的基于cnn的UGS方法。对于没有实例级注释的Berkeley dataset,我们选择每幅图像中最突出的对象,并在选中的对象中随机分配一个UGP。该方法将FSM得到的特征图输入基线分割网络FCN-32s[7],如图1所示。采用以下学习策略:初始学习速率、动量、重量衰减和小批量大小分别设置为0.001、0.9、0.0005和1。
为了评价所提出的基于cnn的UGS方法,进行了笛卡尔向极坐标变换的烧蚀研究和FSM方法。表1总结了每一种设置的性能,其中分割精度用union上的平均交集(mIoU)[5]来测量。基于cnn的UGS不需要直角坐标到极坐标的转换,也可以通过移动输入图像将UGP放在图像的中心来考虑。这个设置在表1中表示为“图像移动”。如表1所示,使用极坐标转换图像作为输入的网络显示两个数据集的mIoU值都高于使用“图像移动”设置的网络。这说明在CNN中使用笛卡尔向极坐标变换可以有效地处理用户导航。此外,与没有FSM的方法相比,增加了FSM的方法对每个数据集的准确率分别提高了1.32和1.48%。注意,基于图像移位的CNN方法无论是否使用FSM,其精度都没有显著提高。结果表明,该方法适用于从极性变换后的图像中提取UGS特征图。
为了验证提出的基于cnn的UGS方法的有效性,我们将该方法与两种传统的UGS方法的分割精度进行了比较[1,2],如表2所示。Rother的方法使用一个包围框作为用户交互,
这比基于单击的UGS更不方便。另外,由于Rother的方法是非基于cnn的方法,并且主要利用颜色信息,所以精度最低,如表2所示。Jain的方法需要多次点击来进行用户指导,不仅使用了颜色信息,还使用了额外的信息,如边缘和几何形状。因此,与Rother方法相比,Jain方法对PASCAL VOC 2012和Berkeley数据集的准确率分别提高了3.23和2.35%。注意,所提出的基于cnn的UGS方法比非基于cnn的UGS方法具有更高的精度。这说明将CNN框架应用于UGS可以实现更精确的分割。
结论:本文提出了一种基于cnn的基于极坐标变换的超重力测量方法。转换后的图像不仅能有效地将UGP传递给CNN,而且能使卷积核在不需要任何额外参数的情况下,自适应地改变接收域。本文提出的FSM方法通过提取极坐标图像径向和角向的更多信息特征,提高了分割性能。实验结果表明,采用极坐标变换后的神经网络与采用FSM的神经网络相比,具有更好的性能。此外,该方法在分割精度和用户便捷性方面均优于传统的基于非cnn的UGS方法。
部分图表、致谢及参考文献已略去(见原文)。
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20961],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
