1. 研究目的与意义
随着多媒体信息技术的发展,视频已经成为一种重要的信息载体,日益增多的视频数据给人工处理带来了很大困难。
在视频处理和分析中,人们所关心的区域通常仅占视频中的一小部分,即所谓的显著区域。
它通常包含人类感兴趣的重要目标,最能表达视频的内容,是人的视觉能够在较短时间内将注意力集中到视频中某个能引起人们关注的区域。
2. 研究内容和预期目标
研究内容:显著性提取模拟人眼视觉注意机制,能够自动识别人眼对视频的感兴趣区域。
利用自然图像的幅度谱特性,谱残差是最近提出的一种无关视觉底层特征的视频显著性提取方法。
本毕业设计将通过引入三维傅立叶变换,研究视频数据的相位谱特性,并建立三维数据的相位谱理论,从而现实视频数据的显著性区域提取。
3. 研究的方法与步骤
1. 从谱残差到显著图的获得如图可知大量图像的log频谱和频率的曲线形状,在log-log scale上,几乎是一条直线。
文中的log频谱就是对图像傅里叶变换后的振幅谱取自然对数。
然后作者又提出了既然大量图像的log振幅谱都差不多趋近一条直线,那么一幅图像的log振幅谱减去平均log振幅谱就是显著性部分2. 三维离散傅立叶变换, 构造三维数据的相位谱。
4. 参考文献
[1] x. hou, et al., saliency detection a spectral residual approach, cvpr 2007。
page(s):1 - 8。
[2] c. guo, et al, spatio-temporal saliency detection using phase spectrum of quaternion fourier transform, cvpr 2008,page(s):1 - 8。
5. 计划与进度安排
[1]2022.1.10-2022.2.28,查阅本课题相关资料,学习图像处理基本原理[2]2022.3.1-2022.3.31,制定研究方案,确定技术路线[3]2022.4.1-2022.4.30,算法研究与测试,记录实验数据[4]2022.5.1-2022.5.31,整理实验数据,完成论文撰写
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。