1. 研究目的与意义、国内外研究现状(文献综述)
自科学诞生以来,科学可视化作为一种简洁、直观的视觉化手段,就被自然而广泛的应用到学术研究的方方面面。近年来,随着科学传播学的发展过程中的研究和应用需求不断扩张,科学可视化开始发挥愈加重要的作用。而学术图片是科学可视化传播的重要媒介之一。随着现代学术研究持续发展,大部分学术领域的研究发展呈现出越来越快的加速发展趋势,现代大量学术研究的成果最终以学术论文的方式呈现出来,而在这些论文中,涌现出了大量的学术图片,例如,论文中的概念图,数据展示图等。学术图片的元数据一般为表述图片信息的15个数据项,包括图片中文标题、图片英文标题、图片说明、图片关键词、图词、一级分类、二级分类、图片尺寸、图片大小和图片清晰度。学术图片的重要性日益提高。然而,现代对于这些日益重要的学术图片的分类研究较少,尤其是对于学术图片基于深度学习算法模型进行分类的研究则更少。深度学习是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的人工智能目标。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对图像数据的解释有很大的帮助。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理以及其他相关领域都取得了很多成果。但其在学术图片分类研究上运用的较少。本人通过初期调查研究发现,深度学习同样可以适用于学术图片的分类。由于深度学习具有适合于针对图片等复杂信息学习的特点,其可以使机器拥有和人类相似的分类能力。如果可以设计出一个可以用于对学术图片进行分类的深度学习模型,那么文献信息管理工作者的工作量则可以大大减少。并且,学术图像分类也是学术图像分割、行为分析等其他高层视觉任务的基础。因此,本课题主要集中研究基于深度学习模型的学术图片分类问题。
2. 研究的基本内容和问题
研究的目标:构建一个适用于学术图片分类的深度学习分类模型,通过调整参数,优化模型结构等方式对模型进行不断改进,使其对学术图片的分类效果和准确度达到最优。研究的内容及关键问题:1. 数据挖掘。编写爬虫,通过爬虫程序爬取文献数据库中文献内出现的图片。2. 数据洞见。根据爬取的图片数据,结合他人对于学术图片的分类方式。研究本课题学术图片都应当分为哪些类别,确定一个合理的分类方式。3. 数据预处理。对爬取得到的学术图片按照内容二确定的分类方式,进行图片标注,将其手动分类。4. 数据拟合。构建深度学习模型,将图片数据输入模型拟合,对模型输出的分类结果进行整理。5. 数据分析与可视化。计算分类模型的准确率,制作结果统计图表。6. 研究如何调整模型结构或参数,进行模型优化。7. 得出结论
3. 研究的方法与方案
研究方法、技术路线、实验方案:首先,编写网络图片爬虫,爬取文献数据库的文献中出现的学术图片(包括概念图,数据展示图等)。
研究应当如何分类,分为哪些类别。
对爬取的图片按照研究好的分类方式进行人工手动分类。
4. 研究创新点
首先正如前文所说,目前对于通过深度学习模型进行图片分类的研究有很多,大部分都是利用深度学习模型对光谱图片、服装图片、遥感图片或道路交通图片等进行分类,然而对于学术图片的分类少有人研究。作为信息管理专业的学生,应当利用自己的专业知识,对学术文献中出现的学术图片进行分类,以减少信息管理人员的工作量。除此之外,大部分学者利用深度学习模型进行图片分类都没有对模型进行优化,没有研究如何构建一个更好的分类模型,也没有研究如何优化模型,使其达到更好的图片分类效果。
5. 研究计划与进展
3月份完成学术图片数据爬取、学术图片分类方式确定、并开始着手于图片标注。除此之外,对于论文的开头部分(包括题目、摘要、关键词、引言、第一部分研究现状内容)和格式的调整等均需要在3月内完成。
在中期汇报之前完成数据爬取、学术图片分类方式确定和图片标注并开始着手于深度模型的构建。
4月份拟合图片数据分析结果并改进模型,制作数据可视化统计图,得出结论。
