相同量化矩阵的JPEG重压缩检测外文翻译资料

 2022-11-22 10:21:30

848 IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY, VOL. 5, NO. 4, DECEMBER 2010

Detecting Double JPEG Compression With the Same

Quantization Matrix

Fangjun Huang, Member, IEEE, Jiwu Huang, Senior Member, IEEE, and Yun Qing Shi, Fellow, IEEE

Abstract—Detection of double joint photographic experts group (JPEG) compression is of great significance in the field of digital forensics. Some successful approaches have been presented for

detecting double JPEG compression when the primary compres-

sion and the secondary compression have different quantization

matrixes. However, when the primary compression and the

secondary compression have the same quantization matrix, no

detection method has been reported yet. In this paper, we present a

method which can detect double JPEG compression with the same

quantization matrix. Our algorithm is based on the observation

that in the process of recompressing a JPEG image with the same

quantization matrix over and over again, the number of different

JPEG coefficients, i.e., the quantized discrete cosine transform

coefficients between the sequential two versions will monotonically

decrease in general. For example, the number of different JPEG

coefficients between the singly and doubly compressed images is

generally larger than the number of different JPEG coefficients

between the corresponding doubly and triply compressed images.

Via a novel random perturbation strategy implemented on the

JPEG coefficients of the recompressed test image, we can find a

“proper” randomly perturbed ratio. For different images, this

universal “proper” ratio will generate a dynamically changed

threshold, which can be utilized to discriminate the singly com-

pressed image and doubly compressed image. Furthermore, our

method has the potential to detect triple JPEG compression, four

times JPEG compression, etc.

Index Terms—Digital forensic, double joint photographic ex- perts group (JPEG) compression, quantization matrix.

  1. INTRODUCTION

OUBLE joint photographic experts group (JPEG) com- pression means that a JPEG image has been compressed

D

once again by JPEG compression. The detection of double JPEG

Manuscript received April 08, 2010; revised August 25, 2010; accepted Au- gust 26, 2010. Date of publication September 02, 2010; date of current ver- sion November 17, 2010. This work was supported by the 973 Program of China (Grant 2011CB302204), by the National Natural Science Foundation of China (Grant 60633030), and by the Research Fund for the Doctoral Program of Higher Education of China (Grant 20070558054). The associate editor co- ordinating the review of this manuscript and approving it for publication was Dr. Wenjun Zeng.

F. Huang was with the Department of Electrical and Computer Engineering,

New Jersey Institute of Technology, NJ 07102 USA. He is with the School of

Information Science and Technology, Sun Yat-Sen University, Guangzhou, GD

510006, China (e-mail: huangfj@mail.sysu.edu.cn).

J. Huang is with the School of Information Science and Technology,

Sun Yat-Sen University, Guangzhou, GD 510006, China, and is also

with the State Key Laboratory of Information Security, Institute of Soft-

ware, Chinese Academy of Sciences, Beijing, 100190, China (e-mail:

isshjw@mail.sysu.edu.cn).

Y. Q. Shi is with the Department of Electrical and Computer Engineering,

New Jersey Institute of Technology, NJ 07102 USA (e-mail: shi@njit.edu).

Color versions of one or more of the figures in this paper are available online

at http://ieeexplore.ieee.org.

Digital Object Identifier 10.1109/TIFS.2010.2072921

compression is of great significance in digital forensics. There are at least two reasons why forensic experts pay attention to the detection of double JPEG compression [1], [2]. The first one is that the doubly compressed JPEG images often result from image forgery. For example, in image-splicing, one part of the source image is copied to the target image to generate a new composite image. If the source image or target image is in JPEG format, the spliced image may need to be JPEG com- pressed, hence exhibiting traces of double JPEG compression. These traces can be used to detect the forgery image or even identify the manipulated areas [3], [4]. The second one is that some JPEG steganographic schemes such as F5 [5] and Out- Guess [6] may generate doubly compressed images if the input cover image is in JPEG format. Detection of double JPEG com- pression can help to identify the steganographic algorithm or improve the detection accuracy rate of the steganalytic schemes. Furthermore, in addition to the aforementioned two applica- tions, the techniques and methods resulted from the research of double JPEG compression detection can also be applied to dig- ital audio [7] and digital video [8], [9] forensics.

Recently, some successful approaches have been presented

for detecting double JPEG compression when the primary compression and the secondary compression have different quantization matrixes (sometimes referred to as quantization tables). Lukaacute;s and Fridrich [1] addressed the distribution of JPEG coefficient (i.e., the quantized discrete cosine transform (DCT) coefficient) histogram of the individual mode

剩余内容已隐藏,支付完成后下载完整资料


相同量化矩阵的JPEG重压缩检测

摘要:双联合图像专家组(JPEG)压缩检测技术在数字取证领域具有重要意义。当主压缩和次压缩具有不同的量化矩阵时,已经提出了一些成功的方法来检测双重JPEG压缩。然而,当主压缩和次压缩具有相同的量化矩阵时,尚未报告检测方法。在本文中,我们提出了一种可以用相同的量化矩阵检测双重JPEG压缩的方法。我们的算法基于这样的观察:在重复压缩具有相同量化矩阵的JPEG图像的过程中,不同的JPEG系数的数量,即在顺序的两个版本之间的量化的离散余弦变换系数将单调减小。例如,单压缩图像和双压缩图像之间的不同JPEG系数的数量是通常大于相应的双重和三重压缩图像之间的不同JPEG系数的数量。通过对重新压缩的测试图像的JPEG系数实施的新颖的随机摄动策略,我们可以找到“适当”的随机扰动比率。对于不同的图像,这种通用的“适当”比率将产生动态改变的阈值,其可以用来区分单压缩图像和双压缩图像。此外,我们的方法有可能检测三重JPEG压缩,四倍JPEG压缩等。

索引术语 : 数字取证,双联合摄影专家组(JPEG)压缩,量化矩阵。

1引言

双联合摄影专家组(JPEG)压缩意味着JPEG图像已经通过JPEG压缩再次被压缩。双JPEG压缩的检测对数字取证具有重要意义。专家注意检测双重JPEG压缩的原因至少有两个。第一个是双倍压缩的JPEG图像通常是由图像伪造产生的。例如,在图像拼接中,源图像的一部分被复制到目标图像以生成新的合成图像。如果源图像或目标图像为JPEG格式,拼接图像可能需要JPEG压缩,因此会显示双JPEG压缩的痕迹。这些痕迹可用于检测伪造图像,甚至识别操纵区域。第二种是,如果输入封面图像是JPEG格式,一些JPEG隐写方案(如F5和Out-Guess)可能会生成双重压缩图像。检测双JPEG压缩可以帮助识别隐写算法或提高隐写分析方案的检测准确率。此外,除了上述两种应用之外,由双JPEG压缩检测研究所产生的技术和方法也可应用于数字音频和数字视频取证。

最近,当主压缩和次压缩具有不同的量化矩阵(有时称为量化表)时,已经提出了一些成功的方法来检测双重JPEG压缩。 Lukaacute;s和Fridrich [1]研究了双重压缩的JPEG图像中个体模式的JPEG系数(即量化离散余弦变换(DCT)系数)直方图的分布,指出了一些异常特性,如“缺失值”和如果主压缩和次压缩具有不同的量化矩阵,则可以在JPEG系数直方图中存在“双峰”。提出了可以从双压缩图像估计主量化矩阵的三种不同方法。 Popescu和Farid也指出,主压缩和二次压缩中不同的量化矩阵可能会在单独模式的JPEG系数直方图中引入一些异常模式,并且可以通过评估属于傅里叶变换的周期属性来检测双重压缩的JPEG图像单个模式的JPEG系数直方图的变换。在[12]中,付等人提出了一种称为广义Benford定律的模型,以适应所有JPEG交流(ac)模式下JPEG系数的第一位数字的分布。通过观察分布是否符合所提出的模型,可以检测到双重JPEG压缩。在[13]中,李等人。指出通过使用广义Benford定律来拟合某些选定单个交流模式的JPEG系数的第一位数的分布,可以大大增强检测双重JPEG压缩的性能。

结合多类分类策略,可以识别主要JPEG压缩中的质量因子(QF)。 在[14]中,Chen等人 提出了另一种基于机器学习的方案,其中从每个给定的JPEG图像中提取324个特征。借助于支持向量机(SVM),可以有效地区分双重和单独压缩的JPEG图像。

然而,当主压缩和次压缩使用不同的量化矩阵时,所有现有算法只能检测到双重JPEG压缩。 如果一次压缩和二次压缩具有相同的量化矩阵,则由不同量化矩阵引入的异常不存在,因此以前用于不同量化矩阵的双重JPEG压缩的目标检测方法不能工作。 就我们所知,在文献中没有报道检测方法可以使用两个JPEG压缩中使用的相同量化矩阵来检测双重JPEG压缩。

在本文中,我们提出了一种用相同量化矩阵检测双重JPEG压缩的方法。由于JPEG压缩和解压缩过程中存在三种误差(即量化误差,截断误差和舍入误差),即使单个压缩图像再次用相同的量化矩阵再压缩,一些JPEG系数仍然会被修改,并且获得的双重压缩图像可能与原始单个压缩图像有一些差异。此外,当重复压缩JPEG图像时,连续两个版本之间的不同JPEG系数的数量一般将单调减少。例如,单压缩图像和双压缩图像之间不同JPEG系数的数量通常大于相应双重压缩图像和三重压缩图像之间不同JPEG系数的数量。我们的检测方法基于对再压缩测试图像的JPEG系数执行的新颖随机摄动策略。通过使用这种新的随机摄动策略,可以找到“适当的”随机扰动比率。对于不同的图像,这种通用的“适当”比率将产生动态改变的阈值,其可以用来区分单压缩图像和双压缩图像。此外,我们的方法有可能检测三重JPEG压缩,四倍JPEG压缩等。

本文的其余部分安排如下。 在第二节中,我们提出了新的检测算法。 第三部分提供了实验结果和讨论,第四部分给出了结论。

2. 提出的检测方案

在本节中,首先对基于JPEG压缩和解压缩过程的简要回顾分析了三种可能引入对双重压缩图像干扰的误差。 然后,通过广泛的实验,我们证明单压缩和双压缩图像之间存在一些统计差异。 此外,随着我们使用相同的量化矩阵一次又一次地重新压缩图像,连续两个版本之间的统计差异将单调减小。最后,我们提出了一种新的随机摄动策略,可用于检测双重JPEG压缩。

  1. JPEG压缩和解压缩过程中存在的三种误差

JPEG压缩和解压缩过程[15]的关键步骤如图1和图2所示。这些数字说明了灰度图像压缩和解压的特殊情况。 彩色图像可以近似视为多个灰度图像。 在一般的情况下,我们假设图像在空间域中的像素值由该范围内的整数表示。

如我们所知,基于DCT的JPEG压缩是一种有损压缩方法。在压缩和解压缩过程中有三种不同的错误。第一个是压缩过程中存在的量化误差。通过将二维DCT应用于原始图像数据的不重叠8 8块,我们将获得DCT系数。然后将获得的系数馈送到量化器。在量化器中,通过量化步骤分割DTCT系数,然后四舍五入。分割DCT系数的实际浮点值与舍入整数值(即,上述JPEG系数)之间的差被称为量化误差。第二种和第三种错误都存在于解压过程中。将逆DCT(IDCT)应用于去量化的JPEG系数后,所获得的浮点数需要属于该空间域的区域。为了重建图像数据,不属于的值将分别被截断为0或255。也就是说,如果重构图像中的像素值小于0,则它被截断为0;如果重建的像素值大于255,则将其截断为255.这种错误称为截断错误。另外,属于的浮点数需要四舍五入到最接近的整数值,同时在空间域中重建图像。舍入过程中存在的错误称为舍入错误。

由于前面提到的三种误差,即量化误差,截断误差和舍入误差,即使图像用与图像的量化矩阵相同的量化矩阵进行双重压缩,双压缩图像也可能与原始单压缩图像有一些差异。

  1. 单压缩JPEG图像和双压缩JPEG图像之间的统计差异

假设JPEG图像表示为,其中n表示该图像已被JPEG压缩的次数。例如,意味着这个图像是一个单压缩的JPEG图像,意味着图像JPEG重压缩。非零JPEG系数in的数量表示为,并且其间的不同JPEG系数的数量表示为。系数之间的变化率定义为,并且。三个不同的图像数据集被用来举例说明单压缩JPEG图像和双压缩JPEG图像之间的统计差异。所有图像最初都是未压缩的彩色图像。其中,从未压缩的彩色图像数据库(UCID)[16]下载了1338个尺寸为384times;512或512times;384的图像,1543个图像从自然资源保护服务(NRCS)[17]下载,尺寸为512times;768,另外还有尺寸为512times;512的1128张图像我们实验室的小组成员在不同的地方用不同的相机拍摄了的照片。首先将所有这些图像转换为灰度图像,然后将获取的灰度图像进行JPEG压缩,以研究单压缩图像与双压缩图像之间的差异。值得注意的是,对于本文中的双重压缩的JPEG图像,辅助压缩具有与主压缩中相同的量化矩阵。

选择对应最高标准JPEG压缩与QF={70,75,80,85,90,95}的量化矩阵进行测试。 上述三个图像数据集分别进行测试。 在表I中,列出了关于不同QF的范围和平均值。 从表I可以看出,对于属于不同数据集的图像,其范围可能不同,这意味着不同数据集中的图像可能会有不同的行为

选择与具有QF={70,75,80,85,90,95}JPEG标准压缩对应的量化矩阵进行测试。上述三个图像数据集分别进行测试。在表I中,列出了关于不同QF的范围和平均值。从表I可以看出,对于属于不同数据集的图像,其范围可能不同,这意味着当使用相同的量化矩阵重新压缩它们时,不同数据集中的图像可能具有不同的行为。此外,从表I可以看出,对于任何图像数据集,其值都分布在相当宽的范围内,这意味着相同数据集中的图像在再压缩过程中也可能具有不同的行为。此外,从平均值可以发现,一般压缩图像与双压缩图像之间的差异在主压缩与二次压缩具有相同量化矩阵时较小。例如,对于这三个图像数据集,对于任何图像QF,平均值都小于7%,尤其是当QF不超过90,变化率小于0.5%。如[14]所示,很难检测到这种小的差异。

  1. 用相同的量化矩阵对多个JPEG压缩的统计分析

在介绍我们的检测方法之前,我们研究了顺序JPEG压缩图像之间的变化趋势。实验也分别在三个图像数据集上进行。图3中示出了对应于不同QF的变化趋势,其中横轴表示相同图像数据集中的所有图像的指数,而纵轴表示相同图像数据集中所有图像的平均值。由于QF对应的平均值远远大于QF对应的QF从70到90的平均值,我们分别进行说明。从图3可以看出,无论选择什么样的图像数据集或图像QF,其平均值都大于平均值,并且平均值和平均值之间的间隔比那些之间和一般。这些实验结果表明,当用相同的量化矩阵一次又一次地重新压缩JPEG图像时,连续两个版本之间的不同JPEG系数的数目将单调减少。 JPEG图像的这种固有属性可以被我们用来区分单独压缩的图像和双重压缩的图像。

  1. 利用随机摄动策略检测双JPEG压缩

鉴于正在检查的JPEG图像,我们的检测方法提议如下。 请注意,解压缩JPEG图像包括四个步骤(如图2所示),即熵解码,去量化,IDCT和重构。 在接下来的演示中,将JPEG图像解压缩到空间域意味着我们将完成所有四个分解步骤。

  1. 解压缩到空间域,然后使用相同的量化矩阵重新压缩它。 我们获得JPEG图像,不同JPEG系数的数量由D表示。

2)熵解码以获得其JPEG系数,并随机选择一部分获得的JPEG系数(包括直流(dc)分量和交流分量中的所有系数)进行修改。每个随机选择的系数任意减少或增加1。然后再次对修改的JPEG系数进行熵编码以获得JPEG图像。应该修改的系数的比率表示为(每个非零JPEG系数的修改系数的数量)。值得注意的是,在这一步中,我们不会将JPEG图像解压缩到空间域中,而只是进行熵解码以使其JPEG系数进行修改。修改后,修改的JPEG系数被熵编码以直接获得JPEG图像(熵解码和编码过程可以在JPEG工具箱[18]的帮助下进行)。

3)解压缩到空间域,然后用相同的量化矩阵重新压缩它。我们可以获得JPEG图像。由之间的不同JPEG系数的数量表示。

4)重复步骤2和3的时间。请注意,每次都要随机选择要修改的JPEG系数,但应该修改的JPEG系数的比率保持不变。每次我们可能有不同的价值,分别表示。

请注意,在步骤1中,我们不知道测试JPEG图像是单倍还是双倍压缩的。但是,如果测试图像是单独压缩的图像,则由于在这种情况下将获得相对较大的值。否则,如果测试图像被双倍压缩,我们将会得到一个相对较小的值,因为在这种情况下。也就是说,值是由测试图像决定的;即,如果测试图像是单独压缩的,则其值将相对较大,并且如果测试图像被双重压缩,则该值将相对较小。然后,在执行以下两个步骤(即,我们的检测算法的步骤2和3)之后,所获得的主要由修改比率确定的值将具有比测试图像单独压缩时更小的机会当测试图像被双重压缩时。出于同样的原因,获得的价值将有更多的机会不低于测试图像时比测试图像被单独压缩时的双倍压缩。

由上可见,我们的检测方法成功的关键是应该修改的JPEG系数的部分。修改后的部分太大或太小都不会导致良好的检测结果。例如,如果修改比率选择为1,则无论测试图像是单倍还是双倍压缩,所获得的值可能比一般更大。因此,即使测试图像是单个压缩图像,根据(1)它将被确定为双重压缩图像。至于我们的方法,主要的挑战是找到“适当”的比例,这可以使得所获得的比例小于如果测试图像是单个压缩图像(注意在这种情况下获得的),并且不低于测试图像被双重压缩(注意在这种情况下获得的)。也就是说,如果我们能够找到一个“适当”的比例,这可以使属于该区域的价值,根据(1)可以做出正确的决定。但是,由于图像复杂,为了使图像属于该区域,我们可能需要对不同的图像应用不同的“适当”比例。如果是这样,这将极大地限制我们提出的方法的应用。在第三节中,我们将证明对于具有相同QF的不同图像,存在一个通用的“适当”比率。另外,如果我们能够找到属于该区域的“适当”比率,则该提出的方法也可用于确定三重JPEG压缩或四倍JPEG压缩等。

III. 实验结果和讨论

我们所有的实验都是在上述三个图像数据集上进行的,即UCID,NRCS和OurLab。对于这三个数据集中的每个图像,分别生成单压缩图像和双压缩图像。双JPEG压缩的检测是一个两级预测问题(二元分类),其中结果被标记为正类或负类。在我们的实验中,真正的意味着双重压缩图像被预测为双重压缩图像,而真实负值意味着单一压缩图像被预测为单一压缩图像。因此,假否定意味着双重压缩图像被预测为单个压缩图像,并且假正意味着单个压缩图像被预测为双重压缩图像。由于在我们的实验中,单压缩图像和双压缩图像具有相同的

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[22896],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版