1. 研究目的与意义
图像和视频是信息社会的主要数据资源,海量的视频图像数据给高效智能信息处理带来了挑战。我们注意到,人们关心的内容通常只是整幅图像或整段视频中很小的一部分,因此,有必要直接检测出它们,以获得高效的处理结果。这种处理思想源自于人类视觉的选择性注意机制和感知组织原则。由此,我们需要面对如下问题:如何利用视觉显著性的感知原理?如何描述和区分视频图像信息中可能存在的多种显著性事件?如何将这些心理学原理有效地引入图像分析进程?如何从静态图像或动态视频序列中快速检测用户关心的显著区域或事件? 我们都知道一般的视频图像显著模型都是将显著性问题转化为目标特殊性质检测的问题,例如一些颜色特征、亮度特征、纹理特征等等,面对不可预测、无数的视觉模式类别,我们需要一个通用的显著性检测系统。如果要提出一个通用的显著性检测系统,那么根据以往的模型,就必须找到目标通用的特征,但这非常难,因为每个目标都有自己与众不同的特性。我们可以从另一个角度思考,目标通用特性提取不到,那就研究背景的通用特性,通过视频目标和背景通用特性的差异求取视频显著区域。为此,本设计将围绕上述思想开展研究。
2. 研究内容和预期目标
研究内容:1. 引入三维傅立叶变换,为研究视频数据的幅度谱特性提供。
2. 依据三维数据的谱残差理论,从而现实视频数据的显著性区域提取。
预期目标:
3. 研究的方法与步骤
显著性提取模拟人眼视觉注意机制,能够自动识别人眼对图像或视频的感兴趣区域。利用自然图像的幅度谱特性,谱残差是最近提出的一种无关视觉底层特征的图像显著性提取方法。本设计将通过引入三维傅立叶变换,研究视频数据的幅度谱特性,并建立三维数据的谱残差理论,从而现实视频数据的显著性区域提取。
1.由于傅立叶变换的可分离性,通过在每个维度分别进行一维的傅立叶变换,从而实现视频数据体的三维傅立叶变换。
2.研究三维数据傅立叶变换的幅度谱特性,用幂律分布对其进行数据拟合,为谱残差方法提供依据。
4. 参考文献
[1]l.itti, c.koch, e.niebur,et al.a model of saliency-based visual attention for rapid scene analysis. ieee transactions on pattern analysis and machine intelligence, 20(11):12541259, 1998. 1, 5.
[2]x. hou, et al., saliency detection a spectral residual approach, cvpr,2007 1,2,3,4,5,7.
[3]c. guo, et al., spatio-temporal saliency detection using phase spectrum of quaternion fourier transform, cvpr.pages 18,2008.
5. 计划与进度安排
2022.1.10-2022.2.28,查阅本课题相关资料,学习图像处理基本原理
2022.3.1-2022.3.31,制定研究方案,确定技术路线
2022.4.1-2022.4.30,算法研究与测试,记录实验数据
