基于深度残差网络的图像分类开题报告

 2021-11-21 04:11

1. 研究目的与意义(文献综述)

1.1研究目的及意义

随着信息化时代的到来,计算机技术迅猛发展,如今可以利用计算机进行各种各样的信息处理,其中对于图像的处理是计算机技术的一项重要的应用。图像分类,是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

卷积神经网络(convolutional neural networks,cnn). 是专为计算机视觉领域设计的架构,适宜处理诸如图像分类、图像识别之类的任务。卷积神经网络仿造生物的视知觉(visual perception)机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-like topology)特征(例如像素和音频),进行学习、有稳定的效果且对数据没有额外的特征工程(feature engineering)要求。

残差网络是由来自microsoft research的4位学者提出的卷积神经网络,在2015年的imagenet大规模视觉识别竞赛(ilsvrc)中获得了图像分类和物体识别的优胜。 残差网络的特点是容易优化,并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接,缓解了在深度神经网络中增加深度带来的梯度消失问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本课题拟通过对残差网络进行研究,依托于anaconda和pycharm平台,使用python语言编写卷积层,池化层,全连接层等神经网络相关结构,设计基于深度残差网络的图像分类方法。设计网络如图2.1所示:

在该网络中,卷积层主要有3×3滤波器并遵循两个简单的设计规则:(i)对于相同的输出特征映射大小,层具有相同数量的滤波器;和(ii)如果特征映射大小减半,则滤波器的数目加倍,以保持每层的时间复杂度。我们直接通过跨距为2的卷积层来降低采样率,网络以全局平均池化层和带softmax函数的千路全连接结束。然后插入快捷连接,恒等映射捷径:(式1),函数代表着将要被学习的残差映射,可以在输入输出同维度的时候(图2.1中的实线箭头)直接使用。当维数增加时(图2.1中的虚线箭头),我们可以考虑两种选择:(a)捷径仍然执行恒等映射,并为增加的尺寸填充额外的零项。这个选项不会引入额外的参数;(b)用(式2,其中仅在匹配维度时使用)中的捷径投影来匹配尺寸(通过1×1卷积完成)。当捷径穿过特征映射的两个部分时,这两种选项都以2的步幅来执行。该网络有18层,若要设计更深层的网咯,可按表1来构造。

我们对imagenet的实现遵循以下参考论文[3,4]中的实践。图像的较短边被随机采样以进行缩放调整,以此将图像调整到[256,480]的大小。从一个图像或者从其水平翻转中随机抽取一个224×224的截图,减去每像素的平均值。其中采用参考论文[3]中的标准颜色强化。在每次被卷积之后被激活之前,我们采用[6]中批量生产标准化(bn),像[6]中那样。我们如[15]那样初始化权重,从无到有地训练所以普通网和残差网。我们使用小批量大小为256的sgd。学习率从0.1开始,当误差平台和模型被训练到60×104的迭代时除以10。我们使用0.0001的权重衰减和0.9的动量。我们按照[6]的做法,在测试中,为了进行比较研究,我们采用了10-crop试验[3]。为了获得最好的结果,我们采用了如[4,15]所示的完全进化形式,并对得数在多个尺度上(图像的大小调整为{224,256,384,480,640})取平均值。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉anaconda,pycharm等工具软件的使用。

(3)第7-9周:通过anaconda,pycharm平台使用python语言编写神经网络卷积层、池化层、全连接层等相关结构。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] he k , zhang x , ren s , et al. deep residual learning for image recognition[j]. 2015.

[2] szegedy c , ioffe s , vanhoucke v . inception-v4, inception-resnet and the impact of residual connections on learning[j]. 2016.

[3] krizhevsky a , sutskever i , hinton g . imagenet classification with deep convolutional neural networks[c]// nips. curran associates inc. 2012.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。