基于离散Tchebichef变换的图像压缩开题报告

 2022-01-06 08:01

全文总字数:4427字

1. 研究目的与意义(文献综述)

1.1研究目的及意义

随着网络技术和信息技术的飞速发展,网络中信息的需求量越来越大。这其中就包括对信息传输的需求,而信息传输中大部分表现为图像,所以图像信息量的大小将直接影响到网络传输的速度。信息时代带来了“信息爆炸”,使数据量大增。因此,为了保证图像信息的存储和传输,对图像进行压缩成为必然要求。从数学的观点来看,图像压缩的过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现在:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。

图像压缩按照原始图像是否可以完全恢复,分为有损数据压缩和无损数据压缩。无损图像压缩方法有行程长度编码和熵编码法。有损压缩的方法有色度抽样、变换编码和分形压缩等。按压缩技术所依据和使用的数学理论和计算方法进行分类,可以分为统计编码(statiscal coding)、预测编码(predictivecoding)和变换编码(transform coding)。针对于现行的图像压缩变换,由于技术的进步越来越大,现存技术存在巨大的提升空间。图像压缩技术的性能也亟待提升,特别针对于精细方面的研究如医疗科学技术、卫星遥感和航空航天等领域需要性能更加优秀的方法。由于离散切比雪夫变换具有良好的正交性而被用于图像的分析中,发现其性能不差于离散余弦变换。因此从离散切比雪夫变换入手获得更高质量的压缩变换变得十分必要,其优秀的特性也使其代替其他变换成为可能。

1.2国内外研究现状

图像压缩编码技术可以追溯到1984年提出的电视信号数字,到今天已经有六十年的历史了。kunt提出了第一代数据压缩编码的概念,他把20世纪四十年代中研究的去除冗余为基础的编码方法称为第一代编码。第二代数据压缩编码从20世纪90年代开始,数学家因为不满足与huffman中某些致命弱点,设计出另一种更为精确,更能接近信息论中熵极限的编码方法—算术编码。第三代数据压缩编码技术主要从90年代至今,图像压缩技术的主要成果体现在小波编码、分形编码等。由于小波变换理论、分形理论、人工神经网络理论和视觉仿真理论的建立,人们开始突破传统的信源编码理论,有关图像编码技术的科技成果和科技论文也与日俱增,图像编码技术开始走向繁华。

剩余内容已隐藏,请联系客服!

2. 研究的基本内容与方案

基于离散切比雪夫变换的图片压缩是基于JPEG压缩系统基础上进行的改良研究。首先是将图像分割成大小为8×8的小块,这些小块在整个压缩过程中都是单独被处理的。由于图像在现今生活中已经很难看到只关于亮度变化的黑白照片,因此我们要对彩色图片进行处理,根据应用的场景不同有常见的RGB和CMYK模型。而在JPEG压缩过程中,需要把图案转换成YCbCr模型,Y表示亮度,Cb和Cr分别表示绿色和红色的色差。在一般的JPEG 压缩过程中,我们常用的是DCT变换,由于DTT的基函数与DCT的基函数非常相似,且前者是离散的,在进行离散正交变换时,没有任何数值上的逼近误差。切比雪夫多项式相应的插值多项式能最大限度地降低龙格现象,因此在变换过程中会尽可能的降低误差。经过DTT变换后的数据仍处于“可逆”的状态,接下来就要进行量化。根据人眼对于高频分量和低频分量的敏感程度不同,将量化表中不同频分量乘以不同系数,使或多或少数据变成零,而这个系数则决定了图片压缩质量。获得量化表之后要进行Z字型扫描,将二维矩阵变成一个一维数组,方便后面的数学运算。最后就是对数据进行Huffman编码,最终将得到图片压缩后的数据,进而可以减小内存的占用以及信道传输中占用的带宽。解压缩的过程则与压缩过程相反Huffman解码、解量化、DTT的逆变换,将数据重新组合成图片。原理框图如下图1和图2。

图一

基于离散切比雪夫变换的图像编码

图二 基于离散切比雪夫变换的图像解码

我们将重点讨论DTT变换和量化过程。DTT变换和反变换经历下面的数学

变换得到,对于二维输入序列X(i,j),关于DTT变换的序列Y(n,m)通过公式

(1)

DTT反变换被定义为

(2)

其中。

相同的,对于大小为N×N的输入数据,DTT和它的逆变换可以被写成矩阵形式

(3)

其中,

通过KS检验之后,我们发现DTT系数的高频部分通过拉普拉斯分布能更好的近似。由于DTT与DCT的基函数不同,因此我们必须设计一个适于DTT变换的量化表。对于第一个直流系数,我们无法寻找一种分布来描述,因此视为均匀随机分布源,其量化步长可以根据情况选取合适的值。接下来,剩余的63个系数将按照拉普拉斯分布, 我们预设最大整数量化步长为[18],其中。相应的最佳盲区大小通过下面公式计算

我们使用中缩放参数和量化步长来简化产生的失真,方程如下

定义重建图像失真为,如果预设的比源方差,大,我们设。另外,通过下面的二等分搜索方程来选择

使用拉普拉斯分布的基于DTT的优化量化表和设计方案都显示出来。

图三基于拉普拉斯分布的DTT优化量化表

图像压缩和解压缩的框架与基于DCT的JPEG基准系统相似,包含以下三个基本步骤:DTT变换,量化,熵编码。它们的不同之处在于,在编码时使用DTT正向变换代替原始浮点DCT变换,在解码时使用DTT反变换代替反向浮点DCT变换。大量的实验显示当PSNR的大小接近40dB时的图片质量是可以接受的。我们对两种变换进行对比发现,PSNR高于DCT方法,RMSE低于DCT方法,因此基于DTT的图像压缩与基于DCT的图像压缩非常具有可比性。就目前情况来说,DTT可以不失为一种由于DCT的方法。

3. 研究计划与安排

第1周—第3周 搜集资料,撰写开题报告;

第4周—第5周 论文开题;

第6周—第12周 撰写论文初稿;

剩余内容已隐藏,请联系客服!

4. 参考文献(12篇以上)

[1]xiaob, shi w, lu g, et al. an optimized quantization technique for imagecompression using discrete tchebichef transform[j]. pattern recognition andimage analysis, 2018, 28(3): 371-378.

[2] xiao b, lu g, zhang y, et al. losslessimage compression based on integer discrete tchebichef transform[j].neurocomputing, 2016, 214: 587-593.

[3] coutinho v a, cintra r j, bayer f m, etal. pruned discrete tchebichef transform approximation for imagecompression[j]. circuits, systems, and signal processing, 2018, 37(10):4363-4383.

剩余内容已隐藏,请联系客服

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。