基于卷积神经网络的道路场景语义分割开题报告

 2021-11-21 16:15:13

1. 研究目的与意义(文献综述)

1.1研究意义及目的

语义分割是计算机视觉领域中的一项关键的任务,在实际中应用广泛,其中针对道路场景的语义分割是自动驾驶的核心技术之一,通过对行驶场景中的各种目标进行分割,提取车辆前方可通行的道路区域, 为智能驾驶系统的路径规划和车辆控制提供道路信息,具有重要的现实意义。

图像语义分割也需要完成这样两个任务:图像语义识别和图像分割。语义在图像领域是指图像中客观对象的类别等信息,对图像语义的识别即要求分辨图像中的对象是什么;不同于目标检测采用候选框分割对象,图像语义分割是对图像进行像素级别的分类,以实现对对象的精确定位、完整地呈现其轮廓特征。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

首先将道路图像进行输入,然后生成多个图片区域,接着用卷积神经网络来提取特征,一般来说,卷积神经网络的基本结构包含以下几个部分:卷积层,池化层,非线性变换层和全连接层。卷积神经网络是一个多层的神经网络,它的每一层都由多个特征图组成,而每个特征图中的点代表一个神经元。

开始

输入道路图片

生成多个图片区域

卷积神经网络提取特征

输出道路图片

卷积

批规则化

激活函数

最大值池化

卷积

批规则化

激活函数

最大值池化

上采样

分类

图1 道路图像语义分割一般流程

最初的几个阶段是由卷积层和池化层,降采样层组成,卷积层的单元被组织在特征图中,在特征图中,每一个单元通过一组叫做滤波器的权值被连接到上一层的特征图的一个局部块,然后这个局部加权和被传给一个非线性函数,一般称为激活函数,比如ReLu。在一个特征图中的神经元使用相同的过滤器,不同层的特征图使用不同的过滤器。这样做的好处有,在多维数据中,例如图像,一个像素值的附近的值经常是相关的,可以形成非常重要的局部特征。反过来说,不同位置局部统计特征具有差异性,所以不同位置的神经元可以共享权值。卷积层的作用从本质上来说是局部特征的提取,那么池化层的作用是在语义上把相似的特征结合起来,一般来说,池化层计算特征图中的一个局部块的最大值或者平局值,相邻的池化神经元通过移动一行或者一列来从小块上读取数据,因为这样做就减少的表达的维度以及对数据的平移不变性。通过这样几个卷积层、通过非线性变换和池化层的作用,再在后面加上全连接层,这就形成了一个完整的深度神经网络结构,一方面可以直接用于特征的提取,另外一方面再添加一个分类层,就能得到一个分类器。

3. 研究计划与安排

第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。

第6-9周:编程实现各算法,并进行仿真调试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] h. farzad, s. hannes, d. babette,t.carme and b. sven, “combining semantic and geometric features for objectclasssegmentation of indoor scenes,” ieee robotics automation letters,vol. 2,no. 1, pp. 49-55, jan. 2017.

[2] w. fan, a. samia, l. chunfeng andb.abdelaziz, “multimodality semantic segmentation based on polarization andcolorimages,” neurocomputing, vol. 253, pp. 193-200, aug. 2017.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版