数字视频水印和相关理论基础

上传人：5*** IP属地：湖北上传时间：2021-11-07 格式：DOC 页数：37 大小：1018.50KB 积分：30 举报 版权申诉

已阅读5页，还剩32页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第1章绪论1.1 课题研究背景随着社会的不断进步和信息技术的不断发展，各种形式的多媒体数字作品纷纷以网络形式发表，然而数字作品的便利性和不安全性是并存的，它可以低成本、高速度地被复制和传播，这样就为创造者和使用者都提供了很大的便利，但这些特性也容易被盗版者所利用，数字水印技术的研究就是在这种应用要求下迅速发展起来的。视频信息中包含着较多不同于图像的特殊信息，这些特殊信息大大影响了传统的数字水印技术在视频水印方面的应用。随着目前数字视频产品等多媒体信息的大量使用,市场上也迫切需要对数字视频产品进行加密保护。然而由于水印嵌入时必须考虑到如何更好地与视频编码结合起来,而视频编码又因为不断的发展而

2、会发生变化,新发展的一些视频编码关键技术可能会限制水印的嵌入技术的于这些原因,使得在数字视频产品中要嵌入合适的水印难度比较大；而另一方面针对于视频的更加精确的人眼视觉模式还没有完全地建立起来,没有一个很好的标准在视频中找一个较好的区域进行水印的嵌入,因此在数字视频产品中嵌入水印的方法选择上受到了较大的限制。也正因为还有很多技术上的工作没有得到很好的解决,而数字视频水印技术又将应用于越来越多的地方,这就给研究工作带来许多的机遇,同时也更是一种挑战。Caronni于1993年最早提出了“数字水印”的概念，该概念的提出引起了学术界、电子出版界的极大兴趣，之后该技术被广泛地应用于图像、音视频等其他数字

3、媒体。因为它在隐含标注、版权保护、真伪鉴别和秘密通信等领域有着广泛的应用前景，因此成为一个日益重要的研究领域。 1.2 研究的目的与意义研究数字视频水印技术的目的与意义在于可以有效的实现网络环境中数字视频作品的版权保护和认证，面对人类社会的数字化时代，在网络交流日益普及和电子商务逐渐启动的今天，数字视频作品的版权保护和认证问题及数字信息的安全传输问题是在人们面前需要迫切解决的问题。而数字视频水印技术将是解决这类问题的一种最有效和最有潜力的技术，多媒体数字水印系统软件的开发具有显著的经济效益和社会效益，对于规范数字化市场，促进信息产业的健康持续发展极为重要的意义。数字水印技术的发展虽然已经有

4、二十余年的历史，对数字产品的版权保护成为一个新的信息安全问题。之前对数字信息和数据的保护一直使用的传统手段是加密技术。但是加密技术存在比较明显的缺陷，就是它只能在传输数据的过程中起到保护作用，在数据被接收或解密之后就不再具备保护作用了，所以加密技术只能够满足有限的要求。并且取得了长足的进步，但是水印技术还没有成为数字内容安保体系中的有效组成部分，数字水印技术面临的难题是各种各样的攻击手段。比如几何攻击，包括旋转、平移、缩放、扭曲、剪裁等，即使是很小程度上的几何攻击，也可能会改变空间位置的同步关系，对于很多算法来说，一旦破坏了载体和水印的同步性，就很难正确提取出水印信息。比如共谋攻击，几个非法用

5、户联合起来就能够去除载体中的水印信息，而躲过检测者的跟踪。因此，数字水印是一个正在发展的课题，重难点就在于怎样提高数字水印的鲁棒性。今后，数字水印技术的研究将着重于如何完善数字水印理论以及提高数字水印算法鲁棒性、安全性等性能，研究其不可见性和鲁棒性以及在应用中的抗攻击能力之间的平衡等方面。设计出强安全性、高鲁棒性的数字水印系统和算法是当前水印技术领域急需解决的问题。最初对数字水印技术的研究主要集中在图像水印方面。最近几年来，因为数字视频产品的大量出现，对数字视频产品进行版权保护的需求日益强烈，基于数字视频的水印技术研究成为水印技术研究的一大热点。由于视频数据占据的内存容量都比较大，所以通常我们

6、都是采用压缩数据格式进行交流传播或者存储，这就使得基于压缩标准的压缩视频水印技术研究成为了视频水印研究的一个重点。1.3 研究现状分析数字视频水印的发展基本上与图像水印的发展同步的，从提出图像水印的概念开始，数字视频水印的概念也随之提出，随着几年的DVD等视频产品的普及，反而对数字视频水印产品的要求更为迫切，数字视频水印研究是数字水印研究的一个热点。密码学，纠错编码，信息论，扩频通信，信号处理等已经充分运用到视频水印系统，现有的视频水印技术从嵌入策略上可以分为三类：第一类：水印直接嵌入到原始视频流中，然后进行视频编码。如:空域，变换域。此类方案的优点是:水印嵌入的方法比较多，原则上数字水印方案

7、均可以应用于此。缺点是会增加视频码流的数据比特率，经压缩后会丢失水印，降低视频质量，对于已压缩的视频，需要先进行解码，然后嵌入水印后再重新编码。第二类:水印嵌入到编码阶段离散余弦(DCT)域中的量化系数中。此类方案的优点是水印仅嵌入在DCT系数中，不会增加视频流的数据比特率，易设计出抵抗多种攻击的水印，但缺点是会降低视频的质量，因为一般它也有一个解码、嵌入、再编码的过程。第三类:水印直接嵌入到压缩比特流中。此类方案的显著优点是没有解码和再编码的过程，因而不会造成视频质量的下降，同时计算复杂度低。缺点是由于压缩比特率的限制而限定了嵌入水印的数据量的大小。1.4 本文主要研究内容本文是基于扩频的数

8、字视频水印技术研究，以鲁棒性视频水印技术为研究对象，以提高水印的不可见性和鲁棒性为研究目的。通过查阅国内外大量关于数字水印的文献资料，总结分析视频水印的特征以及视频水印的特殊要求，在对视频水印相关概念和技术进行学习和总结后，主要完成了以下工作：(1) 研究了视频水印的主要特征，分析了视频水印所特有的特征，学习了扩频通信的原理，研究了水印的生成过程。学习了压缩标准以及结合压缩标准嵌入水印的算法。研究了人眼视觉模型。（2) 由于视频的I帧的离散余弦变换DCT的直流系数DC是一个始终在视频系统中存在并且很鲁棒的参数,就是将扩频调到后的水印信息加到I帧的DCT的直流系数中,在DCT的直流系数DC上加入

9、水印。通过缩小放大攻击，放大缩小攻击，裁剪攻击，噪声攻击四种攻击类型进行仿真，并通过IDCT变换提取水印，通过实验观察这种方法的抗攻击性。（3) 通过人类视觉系统模型的学习，以及压缩标准和扩频技术的学习。在此基础上提出了基于扩频的自适应视频水印算法，详细介绍了算法的基本思想及设计步骤，基于扩频的自适应视频水印处理算法对视频的图像进行分块，同时考虑帧内和帧间的信息，根据运动信息和区域复杂度对视频的图像块进行分类和处理。通过分析，人的研究对于运动物体的感知略于对静止物体的感知，对快速运动的场景分辨略于快速运动，这样使得水印嵌入的位置自适应于人类视觉系统。通过嵌入不同强度的水印，对比提取出水印的抗攻

10、击性。最后通过四种类型的攻击进行仿真。实现与基于扩频的DCT域数字视频水印的对比。1.5 本文结构本文主要通过5个章节进行介绍，分别如下：第一章首先介绍了基于扩频的数字视频水印技术的研究背景，研究意义和研究目的，最后对数字视频水印技术研究现状进行分析。第二章主要对数字视频水印进行介绍，包括数字视频水印的特征，分类及数字视频水印的特殊性。最后对数字视频水印技术进行概述。第三章主要为基于扩频的数字视频水印技术的相关理论基础，包括扩频原理，m序列，数字视频水印的生成过程。以及对DCT，MPEG，人眼视觉性能和水印攻击类型进行介绍。第四章首先对基于扩频的DCT视频水印技术的实现过程进行介绍。最

11、后通过攻击实验仿真并对结果进行分析。第五章首先对基于扩频的自适应视频水印技术的实现过程进行介绍。最后通过加入不同强度的水印进行仿真，并通过攻击实验仿真对实验结果分析。最后进行文章总结。1.6 本章小结本章的主要内容为概述部分。简要介绍了本文的研究背景，本文的研究意义和研究目的，并对数字视频水印技术研究现状进行分析，在此基础上提出了本文相应的研究内容以及本文的结构。第2章数字视频水印和相关理论基础数字视频水印顾名思义就是加载在数字视频上的水印，主要是对数字视频作品进行版权保护，从而确保版权所有者的合法利益。在现实生活中，数字视频己成为大众生活中不可或缺的娱乐方式，而相应的版权保护技术尚未发

12、展成熟，这就使得以数字水印为重要组成部分的数字产品版权保护技术的应用研究更为迫切。为了保护版权可以在数字视频内容中嵌入水印信号，以此作为版权保护的依据。视频水印从实现算法来说与静止图像水印并无根本的区别，许多图像水印的算法都可以直接移植到视频水印中去。视频水印与图像水印最大的区别就是可用的信号空间，也就是能嵌入的水印数据容量。对于图像而言，嵌入水印数据容量是十分有限的。这使得许多研究者在图像水印中尽量应用HVS模型，在不牺牲图像质量的前提下，嵌入一个稳健性尽量好的水印，且总希望能嵌入更多的水印信息。对于视频而言，可用的信号空间就大的多，水印数据可以分散到连续的画面上，对单幅画面隐藏水印信息的

13、容量要求不高。但值得注意的是，视频水印算法在多数情况下有实时性的要求，即能处理连续的帧序列，因此算法还必须具有时间上的有效性，有效性以不影响视频的正常播放质量为前提。因为视频水印可以根据视频本身的数据连续性来适应水印数据的大小，所以从水印容量的角度来看，数字视频是隐藏大量水印信息的最佳载体。但由于空间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立，使视频水印技术相对于图像水印技术发展滞后，同时现有的标准视频编码格式又造成水印技术引入上的局限性。另一方面，由于一些针对视频水印的特殊攻击形式(如帧重组、帧删除、帧间组合等)的出现，为视频水印提出一些区别于静止图像水印的独特要求。2.1数字

14、视频水印的介绍2.1.1 视频水印的主要特征由于数字视频是连续播放的，相邻画面之间内容有高度的相关性，并且还存在动态编解码的过程。因此视频水印与图像水印在某些要求上有明显的不同，它还有一些图像水印不具备的特征，但总的特征可以概括为: 安全性。即水印被嵌入视频后，非授权人不能将其删除掉。只要不知道确定的参数，即使知道水印算法也不能将水印移除。稳健性。视频水印应该能抵抗无意或故意的攻击，这些攻击包括信号叠加、滤波、剪切、编码、压缩、模数转换和回放等。视频信号嵌入水印后不会影响到计算复杂度。计算复杂度的核心是确保水印的实时性和可操作性。计算复杂度越低，水印的可实用性越强，但必须要保证水印有合乎

15、要求的稳健性。视频速率的恒定性。即水印加入后不能增加视频比特流的速率，必须服从传输信道规定的带宽限制。如果嵌入水印后增加了播放的速率，解码出的声音和视频图像则有可能不同步，引起失真，这是应当避免的。同步检测机制。提取水印时应有严格有效的同步检测机制来确保水印的正确恢复。在进行水印算法设计时，就必须考虑到要有准确可靠的同步提取和同步丢失检测及再次同步的机制。快速嵌入/检测:因为视频的数据量大而且有实时性的要求，所以算法必须在很短的时间内完成。盲检测。水印检测原则上不能用原始视频数据，这是因为在检测时使用原始视频会大大增加运算复杂度，而且利用原始视频来检测水印也是不现实的。水印容量:对于

16、视频水印，我们规定水印容量为在单位时间内嵌入水印信息的数据量。通常我们要求能够有尽量高的嵌入水印速率。一个水印系统能够嵌入水印信息的最大理论值可以从信息论的角度计算出来。2.1.2 视频水印的分类可以从不同的角度对数字视频水印进行分类。我们知道，数字视频水印的提取过程与图像水印的提取过程有很大的不同，图像水印的提取过程是静态的，而视频水印的提取过程在时间上是连续的，它是在连续帧上进行提取的，提取出的水印可以是文字、图像、连续语音信号和同时可播放的视频信号，因此可以根据嵌入视频水印的内容不同将其分类。 1) 按嵌入域分类，主要可分为空域(时域)方法及变换域(频率域)方法。空域替换法是用待嵌入的信

17、息替换载体信息的冗余部分，一种简单的方法就是变换域方法就是在宿主的某个变换域，如小波域中嵌入信息，除了静止图像上变换域中嵌入水印的优点外，还能很好地与视频压缩标准兼容。 2) 按载体的数据域分类，包括基于原始视频方法和基于压缩视频方法。基于原始视频的水印算法，是对未经编码的视频流数据进行处理，在原始视频中嵌入水印。基于压缩视频的水印算法，则与某种视频压缩标准如常见的MPEG-1， MPEG-2，MPEG-4相结合，在编码视频中嵌入水印。在压缩视频中嵌入和提取水印，既可以在视频编解码器中进行，也可以作为单独的模块，直接在编码视频流上进行。前者需要修改视频编解码过程，在编码器中加入水印嵌入和提取功

18、能，适用于可以直接介入视频编码过程的情况。例如:采用自己的编码器，对摄像头捕获的原始视频流进行编码。后者不需要修改视频编码器，但是需要对编码视频流进行分析，在压缩码流中找出需要嵌入水印的数据并完成水印的嵌入，适用于不能直接介入视频编码的过程，而只能得到视频流情况:在第三方制作的视频流中嵌入版权信息。在压缩域内的水印嵌入(直接在压缩比特流中插入水印)优势在于水印嵌入程序可以处理压缩的视频流，它与未压缩的视频流相比具有较低的数据率。水印嵌入以后也不必再进行重新压缩，这对于实时水印嵌入技术来说是非常重要的。为了在压缩域中嵌入水印，水印嵌入程序必须分析视频流以识别水印嵌入所需的合适的结构，并修改压缩流

19、以嵌入水印。采用块运动补偿视频压缩技术进行压缩处理过的水印流，部分原因是大多数现代视频压缩标准(包括H.261，H.263+， MPEG-l，MPEG-2，以及部分MPEG-4均采用块运动补偿技术以充分利用视频中的时间和空间冗余信息。这些压缩技术的共同特征包括:离散余弦变换，以块和宏块为单位进行编码以及运动矢量。当然，一些图像采用帧内编码(不使用时间预测编码)，而一些图片则使用一个预先解码的图片作为预测器进行编码。从技术特性来看，这两种方法还可作进一步的细分:（1）基于原始视频水印方法:按嵌入域分，一些方法直接在原始视频数据中嵌入水印，如Hartuang和Kalker称为空域法。另一些方法先对

20、原始视频数据进行某种变换，如DCT变换，小波变换，或傅立叶变换，然后在变换域中嵌入水印，称为频域法。（2）基于压缩视频水印方法:按嵌入位置分，一些在变换系数上嵌入水印，这些方法主要是借鉴了图像的频域水印技术；另一些方法在运动向量中嵌入水印。频域水印有三种处理方法:第一种方法，将视频流看作一个三维信号，其中两维在空间上，一维在时间上，对其进行3维变换，然后进行水印处理。第二种方法，将视频流看成是静态图像的序列，采用图像水印技术进行处理，因此有很多文献声称它们的算法适合视频序列。第三种方法，按块进行频域变换，由于视频编码标准中也是按块进行频域变换，因此这种方法大都是和视频编码器相结合进行，属于压缩

21、视频水印。目前，许多学者普遍认为变换域水印具有更好的稳定性，因此人们对视频水印的研究大多数相对集中于后者，如视频采用MPEG-2, MPEG-4压缩编码处理都是在变换域中进行的。 3) 按密钥分类，如嵌入和提取采用相同的密钥，则称其为对称水印，否则为非对称水印。 4) 按水印的特性分类可以将数字水印分为鲁棒水印，脆弱水印和半脆弱水印。 5) 按水印的可见性分为可见性水印和不可见性水印。现在一般研究不可见性水印。2.1.3 视频水印的特殊性除了具有一般数字水印技术所具有的特征以外，由于数字视频不仅仅是一个在规则间隔时间内显示的图像序列，可能影响水印技术的一些视频特征包括:（1）连续帧之间具有很大

22、的空间相关性。多数情况下，连续的视频帧不是相互独立的，相反具有较大的相似性。由于帧之间存在大量的数据冗余和以及帧内冗余，视频水印很容易遭受盗版攻击，包括帧平均、帧丢失、帧交换、静态分析等等。（2）在所有帧中嵌入相同的水印可能会不安全，因为攻击者可能会掌握大量有关水印结构的知识去估计和删除水印。（3）嵌入水印一定不能显著地增加带水印视频流的数据率，特别是在带宽资源非常有限的场合。（4）现场对内容进行水印标记，嵌入复制控制信息和嵌入指纹进行内容跟踪等都要求嵌入实时水印。其它的一些应用如检测版权保护信息和假冒视频产品的认证，也要求实时水印检测。由于视频的上述特殊性质，它对视频水印方案的设计还有如下

23、一些特殊的要求：（1）实时处理性，水印嵌入和提取应具有低复杂度。然而不同的应用有不同的要求。如果水印用于审计追踪，每个接收端都必须提取水印，则水印提取应该容易。如果为不同的接收者嵌入身份标识，水印处理在大量的分布视频序列上进行，因此为了考虑水印上所有可能的攻击，水印提取可能比较复杂，而水印嵌入在这种情况下复杂度应该低。（2）随机检测性，可以在视频的任何位置，短时间内检测出水印。随即检测性比实时性具有更严格的要求:一个水印方案是实时的，但是如果只能从视频的开始位置按播放顺序一步一步检测出水印，则不具有随机检测性。如果跳转到视频的任何一个位置，也能够检测出水印，则具有随机检测性。（3）与视频

24、编码标准相结合，视频数据由于其数据量极大，在存储传播中通常要对其进行压缩，现在最常用的视频压缩编码标准是MPEG-1，MPEG-2和MPEG-4。如果在压缩视频中嵌入水印，很显然要与视频的压缩编码标准相结合。如果是在原始视频中嵌入水印，由于水印嵌入是利用视频的冗余数据来携带信息，而视频压缩编码标准则需要去除视频中的冗余数据，如果不考虑视频压缩编码标准而盲目地嵌入水印，则嵌入的水印很可能在编码过程中就完全丢失了。（4）盲检测和较强的鲁棒性，使用原始宿主信息，更有利于检测和提取水印信息。但是，检测用到的原始宿主信息容易暴露给恶意的攻击者。而且在某些应用中并不能获得原始的宿主信号。即使能够获得原始

25、的宿主信号，也因为数据量巨大，使用原始的宿主信号也是不现实的。对于视频数据来说，这一点表现得尤为突出。因此，除了极少数的方案外，目前主要研究的视频水印技术是盲视频水印技术。对于视频数据还存在特有的处理和攻击方法，必须保证视频水印方案对这些攻击和处理的鲁棒性。对视频的任何处理，只要没有将视频破坏到失去使用价值的地步，都应该不会破坏所嵌入的水印。（5）无意和有意攻击，采用各种压缩编码标准如MPEG-1，MPEG-2，MPEG-4等对视频进行编码，在NTSC，PAL，SECAM和通常的电影标准格式之间转换所带来的帧速率和显示分辨率的改变，以及屏幕高宽比的改变、帧删除、帧插入、帧重组等视频编辑处理、

26、A/D、D/A转换，如录制在模拟录像带时，在帧转换中可能给视频带来的影响，包括低通滤波，添加噪声，对比度的几何改变以及几何失真等。Hartung等将水印攻击分为四类:简单攻击，检测失效攻击，混淆攻击和移去水印攻击。在视频上的攻击也基本属于这四类组成。对于单个视频帧，基于静态图像的攻击一般来说仍然有效。对于连续的帧，有统计平均和统计共谋攻击。平均攻击是针对局部连续的帧求平均，以消除水印。这种攻击对于在各帧中嵌入随机的，水印独立的方案比较有效。在共谋攻击中，从单个的帧中估计出水印，并在不同的场景中求平均以取得较好的精确度，接着从每帧中减去估计的水印。这种攻击对于在所有帧中嵌入相同的水印方案有效。因

27、此必须考虑视频的各种可能的攻击处理，来实现较好的水印。从上面介绍可以看出视频数字水印与静止图像数字水印技术的差异:（1）可用信号空间不同。对于静止图像，空间非常有限，这就促使许多研究者利用HVS模型，使水印到达可视门限而不影晌图像质量。而对视频水印来说，信号空间非常大，但视频水印经常有实时或接近实时的限制，与静止图像水印相比，降低复杂度的要求更重要。在某些情况下，甚至不能如静止图像那样充分使用基于HVS的模型。一个好的视频水印的要求:必须考虑帧间信息，以能抵抗帧平均，帧剪切等攻击，可以把水印信息分布在连续的几幅帧中，而且应该能从一个短序列中恢复全部信息。（2）对于静止图像，水印的主要应用在于

28、说明作品的所有者，给出版权标识。而数字视频的情况有所不同，一部影视作品的版权所有者是无需质疑的，视频作品的每个拷贝中都应该用一个唯一的水印，防止非法拷贝。（3）复杂度:在某些应用中，水印嵌入和检测的复杂度是不对称的。水印嵌入应当复杂，以抵抗各种可能的攻击，而水印提取和检测基于实时应用应当简单。（4）压缩域处理:视频数据可以通过压缩的形式存储。如在VOD服务器上，基于复杂度要求，更易将水印加入压缩后的视频码流中，如果解码后加入水印再进行编码，计算量将相当大。（5）码率恒定:加入水印不应增加视频流码率。因此，当前的图像水印算法还不能很好地保护视频数据。如果在视频的每一帧中嵌入固定的图像水印则容易引

29、起维持统计和视觉可见性的问题。2.1.4 视频水印技术概述Arena等人提出了水印直接嵌入在MPEG-2比特流中的方案，从而避免了将水印嵌入在像素域中所必需的将视频码流解码与再编码的繁重运算。Hatinkaos和Kundu，提出了一个依赖于内容的空间嵌入视频水印方案。这一视频水印算法基于以下两个关键思想:统计不可见性与设置内容同步。Mobasser提出了一个应用直接序列扩展频谱模型的视频水印方案。一段视频是由一些帧组成的，而每一帧可以看作是由数个比特面组成的，这样，这段视频就可以看作是在时间轴上的以比特面为单位的一维序列。一个0,1 m一序列作用于这个一维序列，大部分比特面保持不变，而有少数比

30、特面的更改并不能影响视觉效果，这些位置就是用来嵌入水印的。Kutter提出了在运动矢量中嵌入水印的方案，将水印嵌入在幅度值大且相对变化小的运动矢量中。在MPEG压缩算法中，运动补偿预测技术用于减少帧间的时间冗余度，只有预测到有误差的图像才被编码。在MPEG视频序列中，大部分的帧是运动补偿预测编码帧，所以，在运动矢量中隐藏水印信息可以更有效的利用视频比特流中的信息。国内学者张志强提出了一种在MPEG-1和MPEG-2压缩视频流中嵌入可视水印的方案。可视水印不同于不可见水印，它是通过在图像表面半透明的显示版权信息来防止盗版。2.2相关理论基础2.2.1 MPEG压缩视频标准简要介绍为了节约数据存储

31、空间和便于传输，视频的主要存在模式是压缩格式的，因此视频水印也在很大程度上是与压缩编码标准紧紧联系在一起的。当今视频压缩的国际标准包括MPEG-I , MPEG-2, MPEG-4, ITU-T的H.261和H.263等，都采用混合编码。他们的基本编码思想是运动补偿预测和基于块的变换编码。在MPEG压缩标准中，数据流是以多路复合流的格式存储和传输的。多路复合流由音频流和视频流复合组成。多路复合流的基本单位时包，而一个包由三个组组成。组分为视频组和音频组，在此只介绍视频组。它采用分层的语法定义，每一层包括一个或多个从属层。由于视频流被分成多个图片组，每个组包含特征相近的一些图像帧的集合，帧又被分

32、成画面，再分成宏块。画面内编码的基本单位是宏块，一个宏块由6个8*8像素块构成:四个亮度块Y0, Y1, Y2, Y3，一个色度块U，一个色度块V。注意，四个亮度块覆盖的画面区域与每个色度块覆盖的画面区域是相同的，原因是由于色度信息的信息量比亮度信息少，为了提高数据压缩率而对色度信息作了适合人类视觉系统灵敏度的亚采样。MPEG视频压缩编码的目的是为了在保持较好画面质量的同时获得较高的压缩比。由于在编码过程中不能保持精确的像素值，所以该算法是有失真的，视频压缩的最优性能依赖于高质t画面、高压缩比与数据流读取三者之间矛盾的折衷。原始视频信号的数据量非常大，不利于存储和传输，所以视频信号需要进行数

33、据压缩。为了获得高压缩比，就必须有效的去掉视频在时域和空域上的冗余。MPEG-2采用基于块的运动补偿以减少时域冗余。运动补偿用于对当前画面作相对于前一幅画面的因果预测，对当前画面作相对于后一幅画面的非因果预测，或作相对于前、后画面的差补预测。对每一个8*8像素的画面区域均定义一个运动矢量，以保证能有效恢复画面。用DCT变换对差值信号(即预测误差)作进一步压缩，以消除空域冗余:然后以一个不可逆的过程对DCT系数量化，删去不太重要的信息;最后，将运动矢量与DCT信息结合，并用变长码进行嫡编码，得到压缩的视频流。因为要提高压缩比，就必须去掉视频图像中大量的冗余信息。去掉冗余有效的办法就是采用预测编

34、码。为此，定义了三种主要的画面类型:(1) 帧内编码画面（I画面):不参考其他任何画面而独立编码。I画面为编码序列提供了预测基准点，解码过程可以始于这些点，I画面的压缩比不高。(2) 预测编码画面(P画面):它相对于前面一幅帧内画面或预测编码画面进行有运动补偿的预测编码，且通常可以作为后继预测画面的参考画面，它的编码效率较高。(3) 双向预测编码画面(B画面):它需要前向和后向的参考画面作运动补偿，它的压缩程度是最高的，B画面永远不被用作预测的参考画面。这三种类型的画面在一个视频序列中的组织是非常灵活的，这由编码器决定，并依赖于应用的要求。MPEG-2视频流采用分层式数据结构,共由六层组成(

35、1) 视频序列层,视频序列层由序列头、一个或多个图像组和序列结束码组成,序列头主要包括图像大小、宽高比、比特率、量化表等解码所需的信息。(2) 图像组层,图像组层是由头信息,一帧或连续若干帧图像组成的可以随机访问的一段以及结束码组成,头信息主要包括时间码等。在图像组层中,以I帧作为图像序列中的随机访问点,在I帧之后跟随一系列P帧和B帧。一个图像组至少包含一个I帧,且总是以I帧作为第一帧。(3) 图像层,图像层包含头信息和一帧图像所有的编码数据。头信息主要包括时间参考,图像编码类型,即I、P、B或D,D图像只包含每个块的直流分量,用于极低比特率的图像浏览,前后向运动矢量类型和范围等。(4) 条层

36、,条层由一个或多个相邻的宏块组成,引入条层的目的主要是出错恢复。其头信息是等长编码的,所以,在比特流出错时,解码器可以据此恢复同步。头信息包含条的垂直位置等。(5) 宏块层,宏块层由四个亮度块和两个色度块构成,宏块的大小为16x16,其头信息包括量化加权因子和宏块的类型等。(6) 块层,块层是MPEG-2中的最小编码单位,大小为8xs,包括DCT系数和块结束标志(EOB)。 2.2.2离散余弦变换离散余弦变换,是将一个8x8空间窗口的图像采样数据或者是预测误差数据作离散余弦正交变换,得出64个DCT变换系数。DCT变换是一种与傅立叶变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函

37、数是实偶函数,那么其傅立叶级数中就只含有余弦项。将函数扩展成偶函数后进行傅立叶变换,再将其离散化可导出余弦变换,因此称为离散余弦变换。一个在时间域中需要许多数据点表示的信号,通过变换转换到频率域后,只需要几个点就可表示这个相同的信号。正是因为此,许多数据压缩技术都是将数据转换到频率域来达到数据压缩的目的。2.2.3 人眼系统特性在研究不可见水印技术时，不可见性是衡量数字水印算法的一个重要指标，而不可见性就是指水印载体在嵌入水印后人眼所不能察觉出来的程度，也就是说，好的水印不可见性要能使通过肉眼无法直接判断载体中是否包含水印信息。我们在研究数字水印技术的时候，观察者必须被考虑在内，这就是我们研究

38、自适应数字水印时必须结合人类视觉系统的原因，这对于研究自适应数字水印具有重要意义。自适应数字水印算法的基本思想就是根据HVS的对比度特性，自适应地调整水印信息在载体不同部位的嵌入强度。而自适应改变水印局部嵌入强度的依据就是 HVS的视觉掩蔽特性。视觉掩蔽可以分为照度掩蔽、频率掩蔽和纹理掩蔽。照度掩蔽可以这样描述：当背景越亮时，HVS的对比度门限越高。根据照度掩蔽特性，对背景较亮的区域，拉伸系数可以取得大一点；反之拉伸系数应该取小一点。也就是说在图像背景较亮的区域，水印嵌入强度可以适当加大；反之则应适当降低嵌入强度。频率掩蔽可以描述为：一个一定频率的空间正弦信号，将降低其他相

39、近频率的空间正弦信号的可检测性。纹理掩蔽指的是：背景纹理越复杂，HVS对噪声越不敏感。这意味着，在纹理较复杂的区域，可以隐藏的水印能量就较强；纹理较简单的区域，可以隐藏的水印能量就较弱。个一定频率的空间正弦信号，将降低其他相近频率的空间正弦信号的可检测性。2.2.4 水印攻击类型评估水印系统的鲁棒性能时需要在水印收到攻击下进行，因此首先介绍常用的攻击方法。攻击是指未授权的第三方对数字水印进行一些操作，并以减弱、破坏、去除水印为目的的行为。攻击分为无意攻击和恶意攻击两类：无意攻击是非特意人为的、不可避免的攻击，如传输过程中的噪声干扰，扫描打印后的各种几何失真等；恶意攻击是受好奇心或者经济利益等驱

40、动而有意对水印展开的攻击。恶意攻击又分为被动攻击和主动攻击：只是试图破坏水印算法的攻击是被动攻击；试图篡改、复制水印的是主动攻击。为了对比本文提出的算法的性能优势，通过对比多种攻击类型水印提取效果进行仿真分析，本文主要使用的攻击类型有如下几种类型：（1）缩小放大攻击，对加入水印的视频帧进行缩小，然后再放大还原到原来像素大小的视频帧，其数学公式如下所示：(3-5)(3-6)其中为原始的加入水印的视频帧图像，为缩小后的视频帧图像，为放大后的视频帧图像，公式3-5和公式3-6分别表示视频帧图像的缩小和放大。当进行缩小操作的时候，以2倍缩小为例，那么相邻的四个像素将以四个像素的平均值做为缩小后的像素；

41、当进行放大操作的时候，以2倍放大为例，那么相邻的像素值之间通过插入一个过渡像素值作为放大后的像素。通过图像的缩小和放大处理之后，视频帧图像中的像素值将受到邻近像素的干扰和影响。（2）放大缩小攻击，水印的放大缩小攻击，对加入水印的视频帧图像进行放大，然后再缩小还原到原来像素大小的视频帧图像，其数学公式和公式3-5和3-6相似，其计算过程和缩小放大攻击相反。同样道理，通过视频帧图像的放大和缩小处理之后，其像素值将受到邻近像素的干扰和影响。（3）滤波攻击，水印的滤波攻击，将嵌入水印后的视频进行滤波处理，根据滤波公式：(3-7)根据公式3-7可知，水印的滤波攻击，即将一个窗口内像素和对应的滤波器权

42、值函数h相乘后的和作为滤波后的像素值，因此，滤波后像素信息不仅受到窗口内的像素影响，而且受到滤波器权值的影响。（4）裁剪攻击,所谓裁剪攻击，即将嵌入水印的视频中的某一区域赋值为零，其数学原理如下所示： (3-8)当嵌入水印的视频受到裁剪攻击之后，嵌入到图像中的水印信息将部分丢失，因此会在较大程度上影响视频的水印提取效果。（5）噪声攻击水印的噪声攻击，即将嵌入水印的视频加入高斯白噪声进行干扰，其数学原理如下所示： (3-9)当视频受到噪声干扰之后，其像素值将受到噪声的影响，而嵌入在视频中水印信息的扩频码受到噪声干扰，当噪声较大的时候，会导致扩频序列极性的改变，从而在一定程度上干扰嵌入到视频中的

43、水印信息。2.3 本章小结本章主要介绍数字视频水印的特征，分类及数字视频水印的特殊性。并对视频水印技术进行相关的介绍。并对相关理论进行介绍,包括MPEG和DCT。最后介绍了人眼系统特性和本文采用水印攻击的类型。为后续设计方案的提出奠定基础。第3章扩频数字水印的生成3.1概述水印信号可分为无意义水印和有意义水印两种，无意义水印都是无意义的随机序列，他们在嵌入算法中被直接使用，进而加入到载体数据中。但是，有些水印算法中原始的水印信号则是有意义的信号，即信号是代表一定意义的文本、声音、图像或视频信号。使用有意义水印的一个显著特点是在水印提取后，提取的水印非常直观，不需要再利用原始水印信号进行相关性

44、计算，可以直接使用它对载体中是否含有水印进行判别。对一个给定的有意义水印，无论它的类型是文本、声音、图像还是视频，在进行水印的嵌入时，绝大大多数算法都要求将它首先转化为二值(0和1或 -1和1)的序列，这种转化又是各种各样的。简单的方法是直接使用水印在计算机中的存储形式(数字信号的二进制形式)，但该方法的保密性较差，如果攻击者从载体数据中获得了水印数据，就可以直接了解水印内容，对水印的攻击就很容易了。有些算法则是根据加密或图像的置乱算法，将水印信号变换成看似杂乱无章的二值序列，这样水印攻击者即使可以获得水印数据，但他得到的是没有任何意义的乱码，这样攻击者就无法确定是否得到了真正的水印，从而可在

45、一定程度上防止对水印系统的攻击。3.1.1 扩频通信的原理在20世纪50年代，为了实现一种拦截概率小、抗干扰能力强的通信手段，提出了扩展频谱(spread spectrum)通信技术，简称扩频或扩谱。扩频技术最早只是用于军用通信和制导等军用系统，它的理论基础是信息论和抗干扰理论。香农在其信息论中得到如下重要公式:(3-1)式中，C表示信道容量，B是信道带宽,PN是噪声功率，PS是信号功率。香农公式表明了无失真传输信息的能力同信噪比以及信道带宽之间的关系。令C代表人们所希望具有的信道容量，把式换成自然对数变为:(3-2)对于干扰环境的典型情况，PS/PN 1，则对上式用幕级数展开，略去高次项得：

46、(3-3)通过上述的分析可得出一个重要结论:对于给定的信道容量C可以用不同的带宽B和信噪比Ps/PN的组合来传输信息。如减少带宽则必须发送较大的信号功率;如有较大的传输带宽，则同样的信道容量能够用较小的信号功率来传送，这表明宽带系统具有较好的抗干扰性。因此，当信噪比太小，不能保证通信质量时，常用宽带系统改善通信质量，使信号在强干扰情况下，仍然可以保持可靠通信。根据上述原理，人们发明了扩频技术。它是一种信息处理技术，它利用与待传输数据(信息)无关的扩频码对待传输的信号进行频谱扩展，使之远远超过待传输信息所必需的带宽，在接收机中采用相同的扩频码解扩和恢复数据。Pickholtz等将扩频技术定义为

47、这样一种传输方式:信号在大于所需的带宽内进行传输。带宽扩展是通过一个与信号独立的码字(扩频码)完成，并且在接收端对这个码字进行同步接收，并用于解扩和随后的信号恢复。由于扩频码的随机性、扩频信号的宽带性，扩频系统具有以下几个特点: 扩频信号是不可预测的伪随机宽带信号，扩频系统具有很高的抗干扰能力，因为干扰者难以通过观察改善其干扰性能，而只能采用发射同被干扰信号不匹配的干扰技术。扩频信号的功率相当均匀地分布在很宽的频率范围，以致待传输信号功率密度很低，侦察接收机难以检测。因此，扩频系统具有低截获概率特性。扩频系统具有良好的码分多址通信能力，对不同的用户使用不同的码，别人无法窃听他们的通信。因此

48、，扩频系统具有高保密性.尽管传输信号的能量可以很大，但在每一个频段上的信噪比很小。即使部分信号在几个频段丢失，其他频段仍有足够的信息可以用来恢复信号。因此，检测或删除一个扩频信号是很困难的。这种情况与隐藏系统很相似，隐藏系统就是试图在整个载体中扩展秘密信息，以达到不可察觉的目的。由于扩展信号很难删除，所以基于扩频的信息隐藏方法都具有很好的鲁棒性。3.1.2 m序列的产生扩频作为一种新型的通信方式，具有抗干扰、抗噪声、低功率谱密度、保密性好等优点。它利用伪随机序列对被传输信号进行频谱扩展，使之占有的信道带宽远远超过其在一般通信意义下所必需的最小带宽。在接收端利用同一伪随机序列对接受信号进行同步

49、相关处理以解扩和恢复数据。扩频技术中使用的伪随机序列具有类似白噪声的性质，但又是周期的、有规律的，可以人为地产生和复制。由于其具有类似白噪声的性质，相关函数具有尖锐特性，因此易于从其它信号或干扰中分离出来，具有优良的抗干扰特性。伪随机序列通常由二进制移位寄存器产生，而m序列是最常用的性能优良的伪随机序列。m序列具有如下性质:(1)序列中两种不同元素出现的次数大致相等;(2)若把n个同种元素连续出现叫做一个长度为n的元素游程，则序列中长为n 的元素游程比长度为n+l的元素游程多一倍;(3)序列具有类似白噪声的自相关函数(函数)特性。m序列发生器由带反馈的k级移位寄存器构成。k级移位寄存器经过模2

50、加后反馈到第一个寄存器作为输出，第k个寄存器的输出即为m序列。3.2 扩频数字水印的生成过程数字视频水印生成的原理是：原始信息往往是由一组0 1, -1 1或者-c c组成的能代表数字产品版权信息的m序列号(这里c是正整数)，他未必具有伪随机特性。为了扩展原始信息的能量谱，该窄带信息可被一个宽带伪随机噪声序列发生器所调制，调制后的ID序列就可以作为水印嵌入到数字产品之中。本文采用Hartung和Girod等提出的基于片率概念的扩频方法。该方案对原始信息按片率进行扩展后再用伪随机序列进行调制，其原理如图3-1 图3-1 基于片率概念的扩频水印生成令Aj为一比特序列，其中j=1,.，表示嵌入视频

51、中的所有比特数，Bi是水印对应比特位，则:Aj =。令Bi为一比特序列，则Aj=Bi,(j*Cr)i<(j+1)*Cr 式中Cr为切普速率(Chip Rate.即扩频倍数)。这里Cr是每个水印位所扩展到直流系数的个数。Pi为噪声扩展序列，为0, 1的m序列，但这里当序列值为0时，Pi为-1.若序列值为1时，则Pi为1.即: Pi=。数字视频水印的预处理过程：水印信号大致可分为无意义的水印信号和有意义的水印信号两种。由于无意义水印与有意义水印相比安全性更差，所以本文所采用的水印均为有意义的水印信号。有意义的水印信号在使用之前，一般要先对其进行预处理，主要的预处理方法有使用 m 序列对水印

52、进行扩频、对水印信号进行位分解、利用图像置乱技术等。通过对水印图像进行置乱预处理能有效增强水印信息的安全性和鲁棒性，提高算法抵抗攻击的能力，图像置乱技术从本质上说也是图像加密技术的一种。置乱的方法有很多种，常用的有：Arnold变换、Hilbert曲线、幻方、环面自同构置乱。在数字水印生成过程中有两个问题需要指出，一个是水印图片是如何置乱的，一个是如何由二维变为一维的。对于第一个问题，我们平常在算法中进行置乱处理时，一定要注意到以下两点：1)计算起来比较简单易行，耗费时间少；2)乱的程度越大越好。Arnold算法计算简单，变换的频次可以作为水印系统中对提取水印破解的密钥，此举使得整个系统更

53、加的安全和隐秘，并且此算法弥补了其他算法的缺点，即具有周期性，所以本文选择Arnold来对水印做前期的处理工作。设Arnold变换在等边长方形上有个点( x , y )，对点( x , y )的变换如下所示: （3-4) 对静止图像进行Arnold变换处理一般需要两个步骤，首先需要变换某个Pixel在图像中位置坐标，通过大量Pixel位置的修改进而影响整幅图像的Pixel布局。从本质上说，猫脸变换是图像中像素位置的改变，并且变换的程度与变换了多少次是有关系的。二值水印可以用矩阵形式表现出来，通过处理就能够使得水印信息无法识别，若是不断地处理，最后肯定会发现产生了与原始的二值图像相同的画面，这就

54、是说此变换是具有周期性质的。在水印预处理时利用Arnold变换将水印图像置乱M次，之后嵌入宿主图像，待到需要检测水印时，先提取出置乱后的水印图像，再对其置乱M次就可以得到Arnold变换处理之前的水印图像。包括置乱前的图片和置乱后的图片：图3-2 Arnold变换处理的水印图像对于第二个问题如何由二维变为一维的，比如你的水印二维图像的每一个像素如下所示：A1A2A3A4A5A6B1B2B3B4B5B6C1C2C3C4C5C6D1D2D3D4D5D6E1E2E3E4E5E6F1F2F3F4F5F6图3-3 水印二维图像像素分布然后将上述二维矩阵的每一个数据转换为二进制，最后将每一行前后连接，获

55、得如下一维的数据：A1bA2 bA3 bA4 bA5 bA6 bB1B2 bB3 bB4 bB5 bB6 b图3-4 转化为水印的一维分布3.3 本章小结第4章基于扩频的DCT视频水印方案水印信息嵌入到视频流I帧的色度的DCT的直流系数中，大大减少了运算的复杂度，提高了实时性。由于水印嵌入到DCT的直流系数中，所以在保证视频效果不失真的前提下，水印具有很强的鲁棒性。4.1视频水印算法在MPEG视频中，由于视频的I帧上色度的离散余弦变换DCT的直流系数DC是一个始终在视频流中存在而且很鲁棒的参数，我们将水印信息经m序列调制后加入到I帧的色度DCT的直流系数中，这样水印信息在不影响视频效果的

56、情况下一般是难以去除的，所以鲁棒性是足够的，这里我们采用了扩频的方法，以方便有效的检测水印，另外有效的抵抗各种攻击及干扰。下面分别给出水印嵌入和提取的算法:4.1.1 视频水印的嵌入算法本方案将视频码流部分解码后，再将水印信息经m序列调制后嵌入到视频I帧的色度DCT的直流系数中。水印的嵌入过程分为以下三步: 第一步:产生一个含有整数-1,1的PN序列，此图案与I画面有相同维数。用水印信号的信息位调制伪随机噪声图案得到扩频水印信号，并乘上一个大小合适的伸缩因子，再将扩频水印信号做DCT变换。第三步:将压缩的视频流中I画面做DCT变换提取系数。第三步:把每块水印信号的DCT直流分流加到与I画面

57、相同位置的块的DCT直流分量上。扩展频谱的方法就是说将水印信息位通过一个伪随机的扩展序列的调制来入到大量的视频I帧上色度DCT的直流系数DC中。具体见下面公式: Dct(x,y) =Dct(x,y)+Ai*Wi Dct1(x,y)表示己经嵌入水印的I帧上色度DC丁的直流系数DC值; Dct（x,y)表示该块的色度分量 DCT 直流系数一原始视频的I帧上色度DCT的直流系数DC值; Ai表示为了考虑掩蔽效果而用来调整水印强度所使用的系数; Wi表示水印信号的值，Wi=Bi*Pi4.1.2 视频水印的提取算法水印提取为水印嵌入的逆过程，步骤如下： (1）对含水印的视频码流进行部分解码，得到 I 帧色度分量 DCT 变换后的系数矩阵； (2)将上一步得到的每个块的直流系数与修改前的直流系数进行比较，从而确定水印信号的像素值，若 Dct1(

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数字视频水印和相关理论基础

文档简介

温馨提示

最新文档

评论

数字视频水印和相关理论基础

文档简介

温馨提示

最新文档

评论

相关文档