




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第8 8章章 文本水印技术文本水印技术 第第8章章 文本水印技术文本水印技术 8.1 文本水印介绍文本水印介绍 8.2 文本水印的嵌入方法文本水印的嵌入方法 8.3 文本水印检测和失真补偿文本水印检测和失真补偿 8.4 中文的文本数字水印技术需要研究的几个问题中文的文本数字水印技术需要研究的几个问题 8.5 小结小结 第第8 8章章 文本水印技术文本水印技术 8.1 文本水印介绍文本水印介绍 数字水印的研究主要集中于图像、 音频、 视频等方面, 对以文本文档为载体的数字水印研究较少, 但文本水印同样具有很重要的价值。 本章我们对文本水印技术作一些简单的介绍。 第第8 8章章 文本水印技术文本
2、水印技术 通过嵌入水印鉴定文档是否被盗版或篡改的技术很早就出现了。 例如以前的绘图师把所绘城市的一条街道加入或删去一点小细节作为水印标记以鉴别自己绘制的地图。 随着计算机、 打印机和扫描仪等设备的应用和普及, 书刊、 杂志、 报纸的网上发行和其他一些专用文档的网上传输已成为现实并继续高速发展。 第第8 8章章 文本水印技术文本水印技术 8.2 文本水印的嵌入方法文本水印的嵌入方法 8.2.1 行间距编码 行间距编码就是在文本的每一页中, 每间隔一行轮流地嵌入水印信息, 但嵌入信息的行的相邻上下两行位置不动, 作为参照, 需嵌入信息的行根据水印数据的比特流进行轻微的上移和下移。 在移动过的一行中
3、编码一个信息比特, 如果这一行上移, 则编码为“1”, 如果这一行下移, 则编码为“0”。 第第8 8章章 文本水印技术文本水印技术 一般来说, 大部分的文档格式都有一个特点: 一段内的各行的间距是均匀的。 尽管人眼已熟练于区分不均衡的情况, 但是经验告诉我们: 当垂直位移量等于或小于 1/300英寸时人眼将无法辨认。 为了方便准确地提出水印信息, 通常页面上第一行和最后一行都不作为嵌入的行, 对较短的行也不动, 不作编码。 行间距编码提取水印信息可以采用质心检测法, 质心定义为水平轴上一行的中心。 第第8 8章章 文本水印技术文本水印技术 我们用R,+表示移动行和其上一个不动行的质心之间的距
4、离, 用R,-表示移动行和其下一个不动行的质心之间的距离,并用X,+和X,-表示在原来未作修改文档中相应的质心距离。 因此我们可以作如下判断, 如果,XXXXRRRR(8 - 1) 则它上一行的距离被增大, 即这一行被下移。 同样如果,XXXXRRRR(8 - 2) 第第8 8章章 文本水印技术文本水印技术 则它与上一行的距离被缩小, 即这一行被上移。 这样水印的数据流就随着行间距的改变而被嵌入到文本中, 在此给出一个如图8 - 1所示的实例。 图中第二行文字向下进行了位移, 图中粗黑线表示各行的质心, 为了便于说明, 我们将黑线加粗, 以显示行间距的改变。 第第8 8章章 文本水印技术文本水
5、印技术 图 8 - 1 行间距编码实例 encode the document. This encoding is most easilyapplied to the format file. The embedded codeword maybe coded from the format or bitmap.This is a method of altering a document by verticallyshifting the locations of text lines to uniquely增加行间距减少行间距正常行间距第第8 8章章 文本水印技术文本水印技术 8.2.2
6、字间距编码 在文档中可以进行字间距编码, 在这种方法中, 水印标记的嵌入是通过将文本某一行中的一个单词进行水平移位。 通常是在编码过程中, 将某一个单词左移或右移, 而与其相邻的单词并不移动, 这些不动的单词作为解码过程中的参考位置。 编码实例如图8 - 2所示。 第第8 8章章 文本水印技术文本水印技术 图 8 - 2 字间距编码实例 第第8 8章章 文本水印技术文本水印技术 8.2.3 特征编码 特征编码通过改变文档中某个字母的某一特殊特征来嵌入标记。 在这种编码中, 水印信息作为可见的噪声(失真)叠加到字母笔划的边缘和文本中图像的边界上, 对噪声图案进行二值编码, 从而达到嵌入水印的目的
7、。 比较典型的方法是设计两种字体, 通过改变字母位图边界上的像素位置, 使两种字体在视觉上看起来几乎一样, 但又可以检测出不同, 就像字符笔划边缘上叠加了微弱的噪声, 由此可以通过它传递水印信息。 第第8 8章章 文本水印技术文本水印技术 8.3 文本水印检测和失真补偿文本水印检测和失真补偿 8.3.1 预处理 在文本水印的嵌入和检测过程中, 要使处理过的行偏移、 字偏移或笔划失真对读者来说是难以识别的, 然而又必须能从拷贝中提取出来, 这就对水印的稳健性提出了很高的要求。 文本文档通常是由一些设备再生的, 打印机、 复印机、 扫描仪等都可以看作是有扰信道, 它们向文本中引入的噪声可以认为主要
8、是椒盐噪声。 第第8 8章章 文本水印技术文本水印技术 8.3.2 水印检测和提取 在行间距编码算法中, 被嵌入水印的行和与它相邻的上下两行都要求有足够的长度, 即不能太短。 对被嵌入的行可以同时进行行间距编码和字间距编码。 通过行间距编码, 使行在它的原来位置上作了轻微的上下偏移(大约在1/150英寸左右), 通过字间距编码, 使特定的词块有轻微的左右偏移。 但是在打印、 拷贝和扫描过程中使这些轻微的偏移叠加了噪声, 去除这些噪声是水印鉴别和提取的关键, 现就对此噪声作进一步的分析。 第第8 8章章 文本水印技术文本水印技术 在通常情况下, 我们假设噪声是均值为0的高斯白噪声, 实际情况亦是
9、如此, 由此我们可以估算文本失真程度并提出相应的补偿失真的方法。 无论是行间距编码还是字间距编码, 其基本的原理模型都是一样的, 如图8 - 3所示。 它分为三个部分, 对行间距编码来说, 中间区域为被改动行, 即在上下方向有轻微的移动, 两边区域即左右两行的位置不变, 作为控制行; 同理, 对于字间距编码来说, 中间区域为嵌入了水印信息的字块, 在水平方向有轻微的移动, 两头区域的字块不动, 作为控制块。 我们可以通过以上模型作理论分析。 第第8 8章章 文本水印技术文本水印技术 图 8 - 3 行(字)间距编码模型 ebqp0b1e1b2e2b3e3W第第8 8章章 文本水印技术文本水印技
10、术 在各种可能的噪声中, 由于文本的传输、 污损、 扭曲以及放大和缩小等噪声引起的失真最为严重, 这些失真理论上可以通过一定的算法得到补偿, 两个比较简单的办法是通过质心检测法和相关检测法鉴别水印。 我们用下面的函数表示一页文本的图样: f(x,y)=0 or 1, x0,W, y0,L (8 - 3) 第第8 8章章 文本水印技术文本水印技术 其中, W和L分别表示文本的宽度和长度, 它取决于扫描的分辨率。 为了简化起见, 我们假设f(x,y)和x,y取连续值。 对于单独的一行来说, 可表示为 f(x,y)=0 or 1, x0,W, yp,q (8 - 4) 其中, p和q分别表示这一行的
11、顶部坐标和底部坐标, 因此在水平方向上的非零像素的值的集合为第第8 8章章 文本水印技术文本水印技术 g1(x)=g0(x)+N(x), xb,e (8 - 7)Wqpydxyxfyh0,),()(8 - 5) pqWxdxyxfx, 0,),()(8 - 6) 在垂直方向上的非零像素的集合为 第第8 8章章 文本水印技术文本水印技术 1. 行间距编码检测算法 我们用质心检测法进行水印检测, h(x)表示没有嵌入水印时的像素集合, 图8 - 3中三个区域的质心可以表示为3 , 2 , 1,)()(idxxhdxxxhciiiiebebi(8 - 8) 第第8 8章章 文本水印技术文本水印技术
12、在传输及拷贝过程中, h(x)加入噪声后得到g(x), 即 g(x)=h(x)+N(x), xb1, e3 (8 - 9)而两个控制块的质心变为 U1=c1+V1 和 U3=c3+V3 (8 - 10)第第8 8章章 文本水印技术文本水印技术 其中, Vi(i=1, 2, 3)为叠加在ci上的高斯白噪声, 且均值为0, 方差为2i。 中间行由于被嵌入信息, 质心有的偏移, 质心偏移有以下两种情况: U2=c2+V2-, 则表示如果向上偏移 (8 - 11) 或 U2=c2+V2+, 则表示如果向下偏移 (8 - 12)第第8 8章章 文本水印技术文本水印技术 在计算过程中, 我们计算相邻的两行
13、之间质心的差值来代替计算中间行质心的绝对偏移, 即只计算U2-U1和U3-U2的值, 当中间区域左右偏移量相等时, 这样计算可以使判决错误概率减小到最小。 我们可以得到两个公式: u=(U2-U1)-(c2-c1) (8 - 13) l=(U3-U2)-(c3-c2) (8 - 14)若 2321lu,则向上偏移,否则向下偏移 (8 - 15) 第第8 8章章 文本水印技术文本水印技术 2. 字间距编码检测算法 同样, 按照上面的模型, 假定be为一行中的一部分, 它被分成三个词块, 分别为b1e1、 b2e2和b3e3。 其中b1e1和b3e3为控制词块, 保持不动, 而b2e2为调制词块,
14、 根据嵌入比特作轻微的或左或右偏移。 假设在这三个字块的空隙中h(x)=0, 我们用hl(x)表示向左偏移后的结果, 用hr(x)表示向右偏移的结果, 则在向左偏移(0)后, 可以得到hl(x)= h(x), xb2- or xe2 h(x+), b2-xe2- 0, e2-xe2(8 - 16) 第第8 8章章 文本水印技术文本水印技术 同样, 在向右偏移(0)后, 可以得到hr(x)= h(x), xb2 or xe2+ 0, b2xb2+ h(x-), b2+xe2+(8 - 17)第第8 8章章 文本水印技术文本水印技术 ,),()()(,),()()(3131ebxxNxhxgebx
15、xNxhxgrl 如果向右偏移, 则有 在此, 自然地比词块之间空白区域小得多。 经过传输和拷贝等处理后得到g(x), 它被叠加上噪声N(x), 如果向左偏移, 则有(8 - 18) (8 - 19) 第第8 8章章 文本水印技术文本水印技术 假定N(x)为零均值的高斯白噪声, 则可以根据计算g(x)的值来检测是向左还是向右偏移。 在此可以得到字间距编码的最优检测公式: 0)()()(0)()()(3131xhxhxgxhxhxgeblebl若 若 则向左偏移 (8 - 20) 则向右偏移 (8 - 21)第第8 8章章 文本水印技术文本水印技术 以上给出了两种编码的最优判决, 具体的文本水印
16、的检测过程可分为以下五个步骤: 第一步: 扫描文本, 得到文本图像; 第二步: 在文本图像中对明显的偏移作一些修饰; 第三步: 对文本缩放和褪色引起的失真进行补偿; 第四步: 对水平和垂直方向的偏移作错误概率估计; 第五步: 用去除噪声后的文本计算出行偏移和字偏移, 还原出水印。 第第8 8章章 文本水印技术文本水印技术 8.4 中文的文本数字水印技术需要研究中文的文本数字水印技术需要研究的几个问题的几个问题 文本水印的嵌入方法主要是利用文本的空间特征, 但不同的文字的空间特征又存在差别。 我们知道, 英文字母和汉字在空间特征上就有所不同。 比如说英文的字移, 即各单词之间的间隔是不同的, 因此所提出的方法是将间距最大的调小一些, 将间距最小的调大一些。 第第8 8章章 文本水印技术文本水印技术 而对中文而言, 这种方法就不太可行, 因为中文情况下汉字不存在英文意义下的字间距, 汉字排版时基本上是没有字间距的, 我们所看到的汉字之间的距离主要来自与汉字的字身宽度与字心宽度之差。因此需要根据汉字的特征提出相应的水印嵌入方法, 这是我
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025外汇质押人民币贷款合同范本
- 民间资金借款抵押合同
- 药材种植协议书范本
- 2025商业混凝土销售合同范本
- 婚后贷款协议书范本
- 藏獒转卖协议书模板
- 2025年03月河北邯郸武安市事业单位春季博硕人才引进55名笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025年03月新疆阿勒泰地区吉木乃县红十字会招募红十字志愿者笔试历年典型考题(历年真题考点)解题思路附带答案详解
- Unit 9 From Here to There 第三课时Developing the Topic(含答案)仁爱版2024七下英语日清限时练
- 武汉铁路职业技术学院《智能机器人》2023-2024学年第二学期期末试卷
- 2024年广东省万阅大湾区百校联盟中考一模数学试题
- 《短视频拍摄与制作》课件-3短视频中期拍摄
- 数字贸易学 课件 马述忠 第13-22章 数字贸易综合服务概述- 数字贸易规则构建与WTO新一轮电子商务谈判
- 2024年电路保护元器件行业营销策略方案
- 污泥技术污泥运输方案
- 年产3.5万吨丙烯腈合成工段工艺设计课程设计
- 【方案】分布式光伏项目勘察及建设方案
- 半导体行业对国家国防战略的支撑与应用
- 智能点滴自动监控方法设计
- 办学许可证续期申请书
- Cpk及Ppk计算电子表格模板
评论
0/150
提交评论