- 综述主题
现今图像分类是很多领域都需要研究的问题,应用广泛。特别是图像的合理分类对提高基于内容的图像检索结果的准确性具有十分重要的作用。20世纪70年代,图像分类主要依靠人工标注的方法。随着计算机技术和数字化图像技术的发展,图像数据库的规模越来越大.①我们已经进入的大数据时代,大数据正在悄然改变我们的生活,我们的生活工作中能看到形形色色不计其数的图片,随之而来的一个问题是我们将如何有效地处理这些图片数据。人们逐渐将研究的重点转移到基于图像内容分析的自动分类研究上。近年来,许多研究人员对图像的分类进行了深入研究,并提出了各种解决方案。
就像最简单的JPEG图像压缩算法。原始的图像信号经过DCT变换之后,只有极少数元素是非零的,而大部分元素都等于零或者说接近于零。这就是信号的稀疏性。而且在通常情况下,绝大多数的图片都是稀疏的,我们也是希望在字典上3原始信号的表达是稀疏的,即其中只有较少的非零项,因为matlab只对非零元素进行操作,这样做会使得计算速度更快,图片处理起来更加的方便快捷②1。
- 研究意义
随着计算机技术的发展,多媒体数据大量涌现,如何从大量的信息中快速、有效地检索到所需的内容,已经成为多媒体技术研究中的热点问题。其中图像信息资源的分类检索已成为国内外研究的热点。相对于文本,图像的数据量更大,如何建立有效的图像描述和分类机制就成为了一个迫切需要解决的问题。③而信号的稀疏表示则是将信号分解在一组过完备非正交基这样做的目的是使得表示原信号的系数向量尽量含有较少的非零值,从而让信号的表示更加简单,从而降低信号处理难度,提高信号分解效率,使得图片分类更加容易④。
- 研究方法2
基于稀疏表示的图像分类算法实现中,我们先要提取一个图片的特征值。来表示这个图片的信息方便我进行图片处理,然后进行特征值分析,此处我们使用检测局部特征的经典算法SIFT。为了防止两张图片具有相似的特征值但相同特征值点所在图片的位置不同(即两张不同的图片有相同的特征值点),需要建立线性空间金字塔模型,将一张图片切割成多张,每一张再进行特征值分析。在建立实现模型之后,再进行一定数量的训练,在实现这一步时需要进行线性分类器算法1。
I、编码寻找稀疏点,也就是进行特征值提取分析
SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,SIFT特征不只具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角,仍然能够得到好的检测效果。整个算法分为以下几个部分⑤:
- 构建尺度空间。这是一个初始化操作,尺度空间理论目的是模拟图像数据的多尺度特征。
- LoG近似DoG找到关键点lt;检测DOG尺度空间极值点gt;。为了寻找尺度空间的极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小,以确保在尺度空间和二维图像空间都检测到极值点。
- 除去不好的特征点。这一步本质上要去掉DoG局部曲率非常不对称的像素。
- 给特征点赋值一个n维方向参数。上一步中确定了每幅图中的特征点,为每个特征点计算一个方向,依照这个方向做进一步的计算, 利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性具体的方向维度需要进行测试比较之后再设置。
- 关键点描述子的生成
- 根据SIFT进行Match
II建立模型,SPM空间金字塔匹配模型
SPM即Spatial Pyramid Matching,是一种利用空间金字塔进行图像匹配、识别、分类的算法。SPM是BOF(Bag Of Features)的改进,因为BOF是在整张图像中计算特征点的分布特征,进而生成全局直方图,所以会丢失图像的局部/细节信息,无法对图像进行精确地识别。为了克服BOF的固有缺点,作者提出了SPM算法,它是在不同分辨率上统计图像特征点分布,从而获取图像的局部信息⑥。
