全文总字数:7453字
1. 研究目的与意义、国内外研究现状(文献综述)
课题的意义、国内外研究进展、应用前景等(列出主要参考文献)1. 课题的意义:随着大数据信息时代的到来和多媒体技术的广泛采用,互联网上产生了海量的文本和图像数据。
数据和信息呈现爆炸式增长,每一个行业几乎都需要成千上万的数据,大规模数据的应用面临巨大的挑战。
有效数据显示,因特网有接近4亿可访问网站,百度、谷歌等搜索引擎每天接受30亿条信息搜索。
2. 研究的基本内容和问题
研究的目标、内容和拟解决的关键问题研究目标:研究、实现、几种高效的基于哈希的跨模态检索算法,设计基于哈希的跨模态检索系统,在系统上实现算法的对比,并将系统以图形界面进行可视化显示。
研究内容:(1) 下载开源数据集作为实验数据,并划分为训练集和测试集;(2) 集中提取跨模态数据中各模态数据的特征表达;(3) 选择基于哈希的跨模态检索算法,现选择scm、imh和dcmh算法,研读算法并设计实现;(4) 完成算法的比较,设计并构建基于哈希的跨模态检索系统,对系统进行图形界面可视化,并根据不同的数据集和算法不断调整和优化,提高检索系统的检索精度。
拟解决的关键问题:(1) scm、imh和dcmh算法的研读和复现。
3. 研究的方法与方案
研究方法、技术路线、实验方案及可行性分析研究方法:(1) 阅读相关文献、书籍以及学术论文;(2) 获取相关开源数据集;(3) 与导师及相关领域的前辈交流;(4) 通过实验,不断调整参数优化识别结果;(5) 通过在不同的数据集上进行实验,对比同一算法的正确率;通过不同算法在同一数据集上的实验,对比不同算法的正确率。
技术路线:实验方案:实验一:数据集获取(1)选用wiki、nus-wide、sun dataset等开源数据集(2)划分为训练样本和测试样本实验二:基于哈希的跨模态检索算法的实现与对比(1) 实现scm、imh和dcmh算法,重点实现dcmh算法。
(2) 完成三种算法的比较实验三:基于哈希的跨模态检索系统的实现利用python语言设计实现跨模态检索系统,并根据不同的数据集和算法不断调整和优化系统,提高检索的精度。
4. 研究创新点
特色或创新之处
(1)实现多种对以图文为例的基于哈希的跨模态检索算法的对比(2)设计并构建以图文为例的跨模态检索系统5. 研究计划与进展
研究计划及预期进展(1)2019年1月至2019年3月研读文献,学习并掌握scm、imh和dcmh算法等跨模态检索算法,在适当的数据集上进行模拟训练。
(2)2019年3月至2019年4月完成算法对比实验,初步设计并构建基于哈希的跨模态检索系统。
(3)2019年4月至2019年5月不断完善并改进基于哈希的跨模态检索系统,撰写毕业论文。
