在PDF文档中隐藏新单词外文翻译资料

 2022-12-04 15:35:53

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


在PDF文档中隐藏新单词

摘要:本文提出了一种基于PDF文档结构的新算法和隐藏信息生成的新词。通过软件Fontographer,我们生成两个具有相同字符代码的字体文件。秘密密钥存储在第一个文件中,它包含从新单词形成的字体形状。私人空白字符存储在第二个文件中,它们不具有字体形状。私人空白字符嵌入在PDF文档中,并且分配密钥被传送到第三方。在水印提取阶段,我们需要从第三方下载secrete键,然后用它替换私人空白字符的字体。由于嵌入的水印是空白字符,与PDF文档中的原始页面对象重叠,因此不会影响PDF文档的内容以及格式。这些保证了水印的安全性和鲁棒性。总之,我们的算法简单,稳健,安全。

关键词:数字水印;PDF; 文件;信息隐藏

I.引言

随着互联网的快速发展,电子文件的信息交换变得更加方便,但越来越多的问题出现,如非法复制,篡改和恢复[1]。 如何保护电子文件的安全性,如WORD,PDF,变得越来越重要。 数字水印是解决这个问题的有效方法之一。

数字文档水印是将特殊信号嵌入到电子主机文档中的方法,不会影响原始文档的使用。 嵌入式数字水印应该是不可见和健壮的。 经过非法和恶意攻击,我们也可以提取水印[2]。 数字文档水印的主要应用领域:

  1. 版权保护

版权所有者将水印嵌入到原始文档中,并发布水印文档。 版权所有者可以通过从销毁的文档中提取算法来提取该水印,以便在水印文档被盗版时保护其权限。 这要求水印算法必须具有鲁棒性,不可察觉性和安全性。

  1. 防篡改

一些数字文件严格要求原始文件的完整性,如合同和法律文件。 在这种情况下,我们需要设计一种脆弱的水印算法。 即使没有任何原始文档信息,我们也可以提取水印并验证文档的完整性。

  1. 复制控制

随着互联网的快速发展,网络文档资源越来越丰富。 但同时我们也要解决非法复制问题。 例如,用户可以在线阅读免费小说,但操作人员必须面对非法复制的问题,因此需要解决复制控制问题。 现在水印技术是一个非常好的选择,可以有效地控制非法拷贝。

  1. 秘密沟通

数字水印技术是一种信息隐藏方法。 我们可以将一段秘密信息嵌入到文档中并发送给接收者。 接收机可以使用提取算法来提取秘密信息。 这也需要水印算法的鲁棒性,不可察觉性和安全性。

数字文档水印一直是处于发展的时期中,但还有很长的路要走,特别是在PDF水印方面。

PDF是一种文档格式,因此PDF文档的水印是属于文档水印的。 目前,有几种文档水印方法,如“基于语法”,“基于语义”,“基于格式”等[3]。 基于语法和语义的水印将大大改变原始文档的内容,基于格式的水印主要是通过字移码,行移码和字间距[4]。

本文提出了一种在PDF文档中隐藏新词的新方法。 我们的方法很容易,但对一些攻击具有很高的不可察觉性和鲁棒性。 最后,该算法适用于所有语言的PDF文档。

AI.PDF文件相关

PDF(PDF形式)由Adobe系统公司于1992年发明,具有“字体嵌入式”,“所见即所得”等优点。 PDF是一种独立于软件,硬件,操作平台的文档格式,因此是跨平台的。 它是从PS(PostScript)开发的,它不仅具有与PS相同的“页面描述能力”,而且具有交互式(超链接,标签)功能。 由于这些优点,PDF文档成为信息传递最重要的方法之一。

  1. 格式

PDF文件可以从四方面了解:“对象,文件结构,文档结构和内容流”[5]。

对象是PDF文档的基本元素,包括八个基本类型:布尔值,数字,字符串,名称,数组,字典,流和空。

文件结构确定对象如何存储在PDF文件中,如何被访问以及如何更新它们。 该结构独立于对象的语义。

文件结构由四部分组成[6]:

1)文件头:指定PDF规格的版本号。 它出现在PDF文档结构的第一行。

2)文件体:PDF文件的主要部分由一系列间接对象组成。 它是文档的组件,如字体,页面和图像。

3)交叉引用表:为了实现随机访问。 包括地址索引表。 它包含间接对象偏移量和信息是否使用间接对象。

4)文件尾:启用读取PDF文件的应用程序来分配交叉引用表和某些特殊对象。 它包含加密的PDF文件安全信息。

内容流包含描述页面或其他图形实体的外观的指令序列。

B.编辑软件

可以使用几套软件来分析PDF文档。

1)Fontographer:它是一种专业的字体设计工具,可以轻松创建或扩展现有的字体库。 它包括分数,标记,符号,标志等。它可以生成OpenType字体和TrueType字体,或创建一个新的字体包。 在本文中,我们使用Fontographer V5.1.0软件。

2)Adobe Acrobat:它是由Adobe公司出版的一系列PDF制作软件。 它可用于阅读,编辑,创建,修改,管理和共享PDF文档。 本文主要使用它来嵌入和提取水印。 在本文中,软件版本是Adobe Acrobat XI Pro。

3)Foxit PDF Editor:它可以编辑和修改PDF文档的任何页面内容。 它由福昕软件公司出版。 通过使用它,我们可以选择,插入,更新,删除和编辑布局。 在本文中,软件版本为Foxit PDF Editor V2.2.1。

在本文中,我们使用“Fontographer”来生成由新词组成的水印。

BI.生成水印

PDF是一种跨平台的文档格式,当我们按保存按钮时,它将存储所有信息(字体,图像)。PDF独立于操作系统平台,具有“所见即所得”的特征,所以很难使水印不可察觉。

通过软件Fontographer,我们可以生成由隐藏信息生成的新词组成的水印。 在这个软件中,E000-EFFF区域的Unicode可以用来生成新的字 - 我们需要的水印信号。 使用新词的优点是:当新的字体文件未保存在此计算机中时,计算机将不会显示这些新词。 所以这个字体文件可以用作一个分配密钥,我们可以把它发送给第三方。

PDF是基于页面输出的文档格式。 在PDF文档中,每个文本字符都被认为是一个图像模型,每个字符对应一个特定的图形[7]。 字符图形按字体分类,包括一组特定的字符代码和图形。 字体定义字符代码和图形之间的关系。

我们的方法的关键点如下:我们创建两个对应于相同字符代码的文件。 第一个文件包含字符代码和字体形状,这被称为分离密钥,我们将其发送给第三方。 第二个文件包含没有字体形状的字符代码,我们称之为“私人空白字符”。 在水印提取过程中使用分密密钥,在水印嵌入阶段使用私有空白字符。 私人空白字符是空白字符,我们将其嵌入到PDF文档中。 私人空白字符通过使用代码输入法嵌入,后者与其他页面对象重叠[3]。 在水印提取阶段,我们首先提取空白字符,然后通过分配键中的字体修改字体。

水印生成过程的框图如图1所示。

IV.嵌入和提取算法

  1. 嵌入算法

步骤1:软件Fontographer用于生成新的字体。 在新词生成过程中形成的Key1(分配密钥)和key2(私有空白字符)放在Adobe Acrobat的字体库中。

步骤2:打开PDF文档并选择key2的字体。 使用代码输入法输入水印信息。 所以PDF将显示空白字符。

步骤3:Foxit PDF Editor用于将空白字符与原始页面对象重叠。

步骤4:保存此文档,并获取嵌入的文档。

水印嵌入过程的框图如图2所示。

B.提取算法

步骤1:从第三方下载分配密钥。

步骤2:打开测试的PDF文档并选择文本内容,通过分配键修改字体。 之后,将显示文档中嵌入的新词。

水印提取方框图如图3所示。

V.实验结果

  1. 生成水印

根据水印信息,我们生成两个新的字体文件:key1和key2。

B.嵌入水印

我们选择key2的字体,并使用代码输入法输入从水印信息生成的新词。 到目前为止,空白字符嵌入到文档中,如图6所示。

可以通过将空白字符与原始页面对象重叠来实现不可察觉性,如图7所示。

C.提取水印

可以通过用font1的字体替换字体来提取水印,如图8所示。

注意我们的方法也适合中文文件。 这里我们给出模拟结果作为中文文档的一个例子,如图9,10和11所示。

VI.性能分析

  1. 不可感知性

在水印嵌入算法中,我们只使用key2来嵌入水印。 key2文件由一些空白字符组成,因此当我们将嵌入的字符与原始页面对象重叠时,可见的输出字符将不会被更改。 因此,将获得完全的不可察觉性。

B.安全性

我们可以将key1文件存储在第三方,并在提取时从第三方下载。 即使发现嵌入水印,也不能非法恢复真实的水印信息。 因为嵌入式信号只是空白字符,所需的分配密钥在第三方受到保护。 显然这种方法是非常安全的。

C.鲁棒性

我们只在PDF文档中嵌入空白字符,真正的水印信号存储在第30方。 所以很容易被强壮。 另一方面,如果将水印嵌入到多个位置,则该算法可以容易地对位置相关的攻击进行鲁棒,如切割,删除,添加等。 显然我们的方法具有很好的鲁棒性。

VII.结论

本文提出了一种在PDF文档中隐藏信息的新方法。 隐藏的信息包含在Fontographer软件生成的新词中。 在这种方法中,水印是不可察觉的,高安全性和鲁棒性。 关于鲁棒性细节的进一步研究正在进行之中。

REFERENCES

  1. Z. Jalil and A. M. Mirza. “A review of digital watermarking techniques for text documents.” Proceedings of 2009 International Conference on Information and Multimedia Technology, pp.230-234.
  2. M. A. AlAhmad, I. F. Alshaikhli, and A. E. Alduwaikh, “A new fragile digital watermarking technique for a PDF digital holy quran,” Advanced Computer Science Applications and Technologies (ACSAT), 2013 International Conference on, pp. 250–253.
  3. S. R. Zhang, Z. Yao,X. C. Meng, and C. C. Liu, “New digital text watermarking algorithm based on new-defined characters,” Computer, Consumer and Control (IS3C), 2014 International Symposium on, pp. 713–716.
  4. C. Li and F. C. You, “The Study on Digital Watermarking Based on Word document,” Conference on Mechatronic Sciences, Electric Engineering and Computer, MEC 2013, pp. 2265-2268
  5. Z. Y. Zhong, Y. H. Guo, and G. A. Xu, “Digital watermarking algorithm based on structure of PDF document,” Computer application, 2012, pp. 2776–2778 2782. (In chinese)
  6. Adobe Systems Incorporated. PDF Reference (sixth edition): Adobe Portable Document Format version 1.7. Adobe Systems Incorporated. Nov.2006.
  7. S. M. Huang, X. M. Sun, and Z. J. Fu, “A novel information hiding algorithm based on page object of PDF document,” Distributed Computing and Applications to Business, Engineering and Science (DCABES), 2011 Tenth International Symposium on, pp. 266–270.

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[25305],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版