1. 研究目的与意义(文献综述)
1、目的及意义
1.1 研究目的及意义
2014年国务院提出《中国制造 2025规划》制造业提案,作为将来10年我国科技发展的重要战略目标,力争在新的一轮科技发展浪潮中取得带头作用,要求科技引领、系统布局、人工智能产业竞争力达到国际领先水平,并要求认真贯彻执行[1]。与此同时,美德韩等国也将“再工业化”、“工业4.0”和“超越it强国,走向ai强国”等战略作为国家制造业经济复苏、再发展的有力工具。另一方面,随着人口老龄化加剧劳动力短缺,我国制造业正在经历着自动化代替传统劳动力的强制转型,其中工业机器人作为其中一环起到了重要作用。广泛的分布在物流分拣,家庭看护,灾难救援和公共医疗等领域,机器人扮演比以往更加重要的角色。工业机器人的出现不但缓解了制造业领域劳动力短缺的压力,还以更高的稳定性、创造性和环境适应性成为工厂提高生产效率,降低成本,提高产品质量的重要途径。这几年由于国家扶持和各大高校加大力度对工业自动化方面的投入,其理论知识和实际应用的水平都有了很大的改进和提升,也正因如此,从2010年起工业机器人的制造数量每年增长40%[2]。极大的促进了中国的工业的自动化产业的发展。传动的工业机器人进行简单的重复动作,适用性和鲁棒性都很低,对劳动力仍有一定要求,所以使用自动识别、抓取的工业机器人成为制造业的理想选择。在实现具有自适应能力的工业机器人这条道路上,机器学习的发展起到了关键性的作用,由于神经学习网络在机器视觉领域的巨大成功,越来越多的人开始研究将这门技术应用到工业自动化领域。
2. 研究的基本内容与方案
2、研究(设计)的基本内容、目标、拟采用的技术方案及措施
本课题计划使用改进的mask r-cnn神经网络生成目标物的抓取框,首先研究卷积神经网络的框架和组成结构,整理在卷积神经网络的基础之上实现目标识别的网络构架。论述边缘图像信息对确定抓取点的重要意义,然后对传统的目标边缘生成算法进行研究,得出传统边缘检测的优缺点。研究基于卷积神经网络和反卷积的掩模生成网络,验证网络可以实现图像目标分割并且进行分类的假设。提出卷积神经网络更注重纹理信息的设想,并使用grad-cam方法验证设想。定义抓取框,提出基于灰度、掩模和深度图像的抓取框预测网络可以提高抓取框精度的假设,并建立基于掩模图像的改进抓取框预测网络。
在训练阶段,首先选取数据集,然后对数据集进行扩充强化。设定训练参数,使用数据集对网络进行训练。使用训练得到的权值进行测试验证,验证将掩膜信息输入网络有助于提高抓取成功率的假设。并且对网络的泛化性设计实验并进行分析,验证增加掩膜信息有助于增强网络泛化性的假设。
3. 研究计划与安排
3、进度安排第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。
确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
4. 参考文献(12篇以上)
4、参考文献[1]周济.智能制造“中国制造2025”的主攻方向[J].中国机械工程,2015,26(17):2273-2284.[2]谢邦晋.基于机器视觉的工业机器人定位抓取技术.内燃机与配件, 2018(21):216-218.[3]Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278-2324, 1998.[4]Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions. CVPR, 2015.[5]He K, Zhang X, Ren S, et al. Deep residual learning for image recognition Proceedings of the IEEE conference on computer vision and pattern recognition. 2016:770-778.[6]Ren S, He K, Girshick R, et al. Faster R-CNN towards real-time object detection with region proposal networks. International Conference on Neural Information Processing Systems. MIT Press, 2015:91-99.[7]Liu W, Anguelovd E, et al. SSD: Single Shot Multi Box Detector. Computer Vision-ECCV 2016. Springer International Publishing. 2016:21-37.[8]Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation. IEEE Trans-actions on Pattern AnalysisMachine Intelligence 2014, 79(10): 1337-1342.[9]He K, Gkioxari G, Dollar P, et al. Mask r-cnn International Conference on Computer Vision. New York: IEEE 2017: 2980-2988.[10]胡家珩,岑咏华,吴承尧.基于深度学习的领域情感词典自动构建——以金融领域为例. 数据分析与知识发现, 2018,2(10):95-102.[11]聂雯.基于ResNet模型的全极化SAR影像分类研究. [D].湖北大学,2018.[12]He KM, Zhang XY, Ren SQ, et al. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015,37(9): 1904-1916.[13]齐丽娜,张博,王战凯.最大类问方差法在图像处理中的应用.无线电工程,2006,36(7):25-26.[14]皮思远.基于深度学习的工业机械手抓取检测方法研究[D].华南理工大学,2018.[15]郭迪.面向机器人操作的目标检测与抓取规划研究[D].清华大学,2016.[16]杜学丹,蔡莹皓,鲁涛.一种基于深度学习的机械臂抓取方法.机器人,2017,39(06):820-828 837.[17]张毅,张烁,罗元,徐晓东.基于Kinect深度图像信息的手势轨迹识别及应用.计算机应用研究,2012,29(09):3547-3550.[18]王彦.基于视觉的机械手目标识别及定位研究[D].西安理工大学,2010.
