




已阅读5页,还剩50页未读, 继续免费阅读
(信号与信息处理专业论文)基于系数分布特性与颜色相关性的jpeg图像隐写分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海大学硕士学位论文 摘要 数字隐写是将秘密信息隐藏在载体内容中,以实现隐蔽通信的目的。该技术 可用于保护信息安全,但该技术也可能被用于非法活动,成为社会安定的隐患, 因此隐写的对抗技术隐写分析具有重要意义。隐写分析的目的是检测载体中 秘密信息的存在性,一旦分析成功,便可中止隐蔽通信并缉捕发送者。j p e g 图 像是互联网中常见的图像格式,本文围绕以j p e g 图像为载体的隐写分析展开研 究,针对现有隐写方法的安全漏洞提出了新的隐写分析方法,主要研究成果如下。 针对基于模型的隐写方法( m b ) 进行分析并提出新的隐写分析方法。m b 隐写可以保证含密图像d c t 系数依然满足原始的分布模型,具有较好的统计隐 蔽性。本文指出:m b 隐写还会使含密图像平坦区域和纹理区域的d c t 系数分 布趋于相似。针对这一安全漏洞,本文提出一种新的隐写分析方法,通过分析纹 理较丰富的内容中的d c t 系数直方图与全局d c t 系数直方图之间的差异情况判 断图像是否经过m b 隐写,该分析方法可有效击破m b 隐写。 提出了一种高效的通用隐写分析方法,该方法应用三类统计特征:通过比较 图像d c t 系数分布模型与实际系数分布之间的差异,在无需构造参考图像情况 下提出d c t 系数分布模型背离度特征;基于隐写会破坏图像空域平坦性的性质, 提出衡量图像子块边缘和子块内部平坦性的空域相关性特征;突破现有方法分别 处理不同颜色空间的局限,通过描述不同颜色空间中图像子块之间的平坦性关 系,提出颜色空间相关性特征。这些特征向量计算简单,维数较低,在利用支持 向量机进行隐写分析时同时保证了运算效率和分析准确率。 本文所提出的隐写分析方法兼顾了原有图像的系数分布特点和颜色空间相 关性信息,具有很好的分析能力,在一定意义上有力推动了以j p e g 图像为载体 的隐写分析的发展。 本文得到国家高技术研究发展计划( 2 0 0 7 a a 0 1 2 4 7 7 ) 、国家自然科学基金 ( 6 0 5 0 2 0 3 9 、6 0 7 7 3 0 7 9 ) 、上海市青年科技启明星计划( 0 6 q a l 4 0 2 2 ) 资助。 关键词:隐写分析j p e g 图像基于模型隐写通用隐写分析 上海大学硕士学位论文 a b s t r a c t w h i l ed i g i t a ls t e g a n o g r a p h ya i m st oe m b e ds e c r e tm e s s a g e su n d e rt h ec o v e r o fc a r t i e rs i g n a lf o rc o v e r tc o m m u n i c a t i o n , t h ep r i m a r yg o a lo fa t t a c ko n s t e g a n o g r a p h i cs y s t e m s ,t e r m e ds t e g a n a l y s i s ,i st od e t e c tt h ep r e s e n c eo fh i d d e n d a t a t h et h e s i sf o c u s e so nt h es t e g a n a l y s i so fj p e gi m a g e s a f t e ra n a l y z i n gt h e w e a k n e s so fs o m ee x i s t i n gs t e g a n o g r a p h i cm e t h o d s ,w ep r o p o s es e v e r a ln o v e l s t e g a n a l y t i cm e t h o d st od e t e c tt h ee x i s t e n c eo fs e c r e ti n f o r m a t i o ne f f e c t i v e l y t h e r e s e a r c ha c h i e v e m e n t so ft h i st h e s i sa r ec l a s s i f i e di n t ot h ef o l l o w i n gt w o c a t e g o r i e s t h ef i r s ti sa s t e g a n a l y t i ca p p r o a c ha g a i n s tm o d e l - b a s e d ( m b ) s t e g a n o g r a p h y m bs t e g a n o g r a p h yk e e p st h eh i s t o g r a mo fd c tc o e f f i c i e n t s a l m o s tu n c h a n g e dw h e ne m b e d d i n gs e c r e tm e s s a g ei n t oc o v e ri m a g e si nj p e g f o r m a t ,l e a d i n gt oac a p a b i l i t yo fw i t h s t a n d i n gt h ep r e v i o u ss t e g a n a l y t i cm e t h o d s h o w e v e r , al o o p h o l es t i l le x i s t s m bs t e g a n o g r a p h yw i l lm a k ed c tc o e f f i c i e n t d i s t r i b u t i o n si np l a i na r e aa n dt e x t u r ea r e an ol o n g e rv e r yd i f f e r e n t t h e n ,b y c o m p a r i n g t h ea v e r a g ed i f f e r e n c eb e t w e e nt h ed c tc o e f f i c i e n th i s t o g r a m so ft h e t e x t u r eb l o c k sa n dt h ew h o l ei m a g e ,w ec a ne f f e c t i v e l yd e t e c tt h ep r e s e n c eo f s e c r e ti n f o r m a t i o nh i d d e nb ym b s t e g a n o g r a p h y t h es e c o n di st h er e s e a r c ho nt h eu n i v e r s a ls t e g a n a l y s i sa n dp r e s e n t san e w m e t h o dw i t hh i g he f f i c i e n c y t h i sm e t h o du s e st h r e ek i n d so ff e a t u r e s t h ef i r s t k i n di su s e dt om e a s u r et h ed e g r e eo fd c tc o e f f i c i e n td i s t r i b u t i o n sd e v i a t i o n , w h i c hc a nb eo b t a i n e db yc o m p a r i n gt h ec o e f f i c i e n td i s t r i b u t i o no ft h ei m a g e i t s e l fa n dt h ec o e f f i c i e n td i s t r i b u t i o no ft h ei m a g e b a s e dm o d e l s i n c e s t e g a n o g r a p h yw i l ld e s t r o yt h ec o r r e l a t i o no fa d j a c e n tp i x e l s ,w ep r o d u c et h e s e c o n dk i n do ff e a t u r e st h a ti su s e dt om e a s u r et h ec o r r e l a t i o no fi m a g eb l o c k s e d g ea n dt h eb l o c ki t s e l f t h i r d l y , t h i st h e s i sp r e s e n t sat y p eo fn o v e lf e a t u r e s b a s e do nc o m p a r i s o nb e t w e e nt h ec o n s i s t e n c i e so fb l o c k st e x t u r ed e g r e ei n n d i l j c h e n tc o l o rc h a n n e l s t h e s ef e a t u r e s m e a s u r et h ec o r r e l a t i o no fd a t ai n d i i j 6 打e n tc h a r m d s t h eo b t a i n e df e a t u r ev e c t o r sa r ee a s yt oc a l c u l a t e d ,h a v i n g l o w e rd i m e n s i o n ,a n dw o r kw i t hh i g he f f i c i e n c y w h e nu s i n gt h es v mt o d i s t i n g u i s ht h es t e g o - i m g e sf r o mt h eo r i g i n a lo n e s t h es t e g a n a l y t i cm e t h o d sp r e s e n t e di nt h i s t h e s i st a k ed c tc o e f f i c i e n t d i s t r i b u t i o na n dc o r r e l a t i o no fd i f f e r e n tc o l o rd o m a i ni n t oc o n s i d e r a t i o n ,a n da l e t h e r e f o r ec a p a b l eo fe f f e c t i v e l yd e t e c t i n gt h ep r e s e n c eo fs e c r e t i n f o r m a t i o n h i d d e ni nc o v e ri m a g e s t h i st h e s i sp r o m o t e st h ed e v e l o p m e n to fs t e g a n a l y s i s t e c h n i q u ef o rj p e gi m a g e st os o m ee x t e n t k e y w o r d s :s t e g a n a l y s i s ,j p e gi m a g e s ,m o d e l - b a s e ds t e g a n o g r a p h y , u n i v e r s a l s t e g n a n l y s i s i i i 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表 或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即:学 校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 上海大学硕士学位论文 互联网技术的快速发展显著地提高了信息传输效率和信息分享范围,人们越 来越多地从互联网上获得所需要的各种信息。在同一时期,数字多媒体技术的崛 起给人们的信息表达方式提供了新的选择。大量的数字多媒体信号通过互联网传 输,给人们的生活带来巨大的便利。但是这些新技术在给人们带来便利的同时也 引发了新的问题,如个人隐私、商业机密、军事情报和国家安全等各种重要机密 信息都可能以数字媒体信号的形式通过互联网传输。这些重要信号都可能被敌对 势力窃取或篡改,造成信息所有者的严重损失。在这样的背景下,信息安全领域 中的一项新兴技术信息隐藏应运而生,并得到迅速发展。 1 1 信息隐藏简介 一直以来,密码学方法是保护数字信号的常用方法。密码学方法是通过加密 技术把将需要传输的重要信息转换成密文,通过公共信道传输,接受方需要使用 相应的解密方法才能将此密文转换为正常信息,解读此信息。然而有些加密后的 密文无法通过某些网络节点,这就破坏了信息传输的可行性。此外,用加密技术 生成的密文暗示了重要信息存在的可能,从而引起破解者的注意,因此密文容易 遭到截获或破译等攻击。因此对于许多应用来说,仅仅对重要信息加密是不够的。 由于密码学方法的这些局限,所以一种新的隐秘通信技术应运而生。1 9 9 6 年5 月,英国剑桥召开了国际第一届信息隐藏学术研讨会( f i r s ti n t e r n a t i o n a l w o r k s h o po ni n f o r m a t i o nh i d i n g ) ,标志着一门新兴的交叉学科信息隐藏学的 正式诞生【1 1 。信息隐藏可分为如下几个分支:数字水印( d i 西t a lw a t e r m a r k i n g ) 、 隐写( s t e g a n o g r a p h y ) 、匿名等【2 】,信息隐藏、数字水印、密写与信息安全的关系 3 上海大学硕士学位论文 如图1 1 所示。 图1 1 信息安全与信息隐藏 十几年来的研究使信息隐藏技术得到了飞速地发展。信息隐藏是利用人类感 觉器官的不敏感性( 感觉冗余) ,以及多媒体数字信号本身存在的冗余( 数据特性冗 余) ,将信息隐藏到一个载体信号中,通过公共信道进行传输而不被察觉、不引 起任何怀疑,掩饰真正通信的目的和正在发生通信的事实。图1 2 给出了信息隐 藏的通用模型。 图1 2 信息隐藏模型 载体信息( c o v e r m e s s a g e ) 为原始的不含密信号,可以是图像、视频、文本或 音频等信号;秘密信息( s e c r e tm e s s a g e ) 为待隐藏的信息,它可以是版权信息或是 待隐藏的秘密数据。信息隐藏一般由密钥( k e y ) 来控制,通过嵌入算法( e m b e d d i n g a l g o r i t h m ) 将秘密信息隐藏于载体中,而含密信号( 隐藏有秘密信息的公开信号) 则通过信道( c o m m u n i c a t i o nc h a n n e l ) 传递,然后检测器( d e t e c t o r ) 利用密钥从含密 信号中恢复或检测秘密信息。 信息隐藏虽有不同的分支,但各个分支具有许多共有特征,具体特征有如下 4 上海大学硕士学位论文 几个: 1 不可感知性 对信息隐藏技术的一个最重要的要求是隐藏信息的不可感知性,它是信息隐 藏技术的必要条件。如果在信息隐藏过程给图像的质量带来了可视性的下降,就 会破坏隐藏信息的安全性。 2 鲁棒性 数字水印鲁棒性的最基本的要求是能够抵抗一些基本的图像处理和操作;从 反向说,研究数字水印的攻击及其对策,能够促进数字水印系统朝着更高的鲁棒 性方向发展。隐写的鲁棒性较低。 3 嵌入容量 在保证不可感知性和载体信号不变的前提下,如果希望在载体中传送更多的 信息,就意味着隐藏信息的嵌入率要高。隐写对嵌入容量的要求较高,否则隐蔽 通信的价值将大大降低。 4 安全性和密钥 在大多数应用中,要确保隐藏信息的保密性,通常要考虑安全性。如果严格 要求保密性,那么隐藏和提取隐藏信息的过程都要使用密钥,这也遵循密码学中 保密原则。隐写对安全性的要求是第一位的,如果检测出隐蔽通信正在发生,那 么隐写就是失败的。 可见信息隐藏的各个分支之间有非常密切的联系,它们都是将秘密信息隐藏 在公开信号中,在秘密信息的隐藏和提取过程、秘密信息隐藏的方式与策略上都 有很多相同的地方。理论上来说,我们可以用类似的方法对信息隐藏各个分支研 究,本文只讨论图像隐写技术。 1 2 图像隐写与隐写分析现状 图像本身存在很大的冗余,所以将某些信息隐藏到图像中进行秘密传输是完 全可行的,而且不会影响图像本身的传输和使用。又因为互联网的普及使数字图 像得到了广泛应用,因此图像的隐写技术成为该研究领域的重点。 上海大学硕士学位论文 1 2 1 图像隐写 数字图像隐写就是将秘密信息以类似噪声形式加入载体图像,尽可能不引起 第三方怀疑地通过公共信道发送出去,达到秘密信息的传输目的。根据隐写方法 的不同作用域,数字图像隐写方法可大致分为两类:空间域隐写方法和变换域隐 写方法。下面简单介绍下这两种方法。 1 空间域隐写方法 空间域隐写方法是通过直接修改图像像素值,将秘密信息嵌入载体图像。视 觉特性表明,图像中灰度或颜色的微小变化在视觉中无明显的差异,即入眼具有 视觉冗余特性。 最具代表性的空间域隐写算法为l s b ( l e a s ts i g n i f i c a n tb i t ) 算法【3 1 。其原理就 是通过修改表示数字图像的颜色( 或颜色分量) 对感知不重要的比特( 最低比特位) 来嵌入秘密信息。l s b 算法的主要优点是简单易行,隐藏容量较大,隐蔽性较好。 但是由于含密图像中每个像素的最低比特位就是所隐藏的秘密信息,因此该方法 的安全性不好。 总体上来看,空间域的隐写有嵌入方法简单、计算速度快、信息隐藏量大的 优点,在信息隐藏的初期发展阶段占据着主导地位,但空域隐写方法的统计隐蔽 性和鲁棒性较差。 2 变换域隐写方法 变换域隐写方法是对载体图像做某种正交变换,将秘密信息隐藏到变换系数 中,使秘密信息的能量有选择地分布于数字媒体的不同变换域分量中。其原理如 下: a 对载体图像f ( x ,y ) 进行正交变换t :f ( x ,y ) 与f ( 蹦,1 ,) ; b 用隐写方法h 将秘密信息嵌入变换域系数中h :f ( u ,v ) 与f ( “,v ) ; c 对改变后的变换域系数进行反变换t - 1 :f ( “,y ) j 专厂( 石,y ) 于是,秘 密信息被嵌入到含密图像f 木( x ,y ) 中。 由于变换域的隐写考虑到人眼对于不同空间频率的敏感性,选择适当的秘密 信息隐藏位置和嵌入强度,使含密图像具有较好的鲁棒性和隐蔽性。 与空间域的隐写方法相比,变换域的隐写方法具有如下特点: 6 上海大学硕士学位论文 a 在变换域中秘密信息的能量可以散布到空间域所有像素上,有利于保证 秘密信息的隐蔽性; b 在变换域,人类视觉系统的某些特性( 如频率掩蔽效应) 可以更方便地结 合到秘密信息嵌入过程中; c 变换域的方法可与国际数据压缩标准兼容,从而实现压缩域内的隐藏算 法,同时也能抵抗相应的有损压缩,有较好的鲁棒性。 1 2 2 图像的隐写分析 隐写可用于确保重要信息在公共信道传输中的安全性,但是它也可能被犯罪 分子、恐怖组织用来传输策划犯罪活动、恐怖袭击的计划文件,成为社会安定的 潜在威胁。早在2 0 0 1 年,9 1 1 恐怖袭击发生之前,今日美国就曾报道以本拉 登为首的恐怖组织可能利用某些网站上的数字图像来秘密传递与恐怖活动相关 的信息,如指令、地图、攻击目标等【4 】。9 1 1 事件后,这种猜测进一步升级,一 些著名网站如e b a y 和a m a z o n 等都被怀疑为传播秘密信息的公共渠道,一些研 究者对e b a y 上百万幅图像进行检测,试图找到秘密信息的存在性【5 l 。尽管这个 努力并没有找到证据证明这些图像中藏有秘密信息,但是这种尝试推动了隐写和 隐写分析的深入研究,引起各国政府和研究人员的广泛关注【6 】。 隐写分析的目的在于检测秘密信息的存在性,一旦检测成功,便可破坏隐蔽 通信并缉捕发送者。因此隐写分析具有重要的意义:首先,随着隐写的不断发展 和广泛应用,通过对可疑数字媒体的统计分析,判断是否存在隐藏信息,可对互 联网信息交流进行有效的监控,减少隐写用于非法信息传播的情况。其次,在一 些对通信的安全性和保密性方面要求很高的场合,隐写可以与传统的加密技术相 结合,提供更高层次的信息安全保障。对隐写本身的安全性进行研究,也可以从 嵌入方法等方面进一步地改进隐写方法。从这一点上看,隐写分析和隐写就如同 密码分析和密码一样,互相促进着彼此的发展。 以最具代表性的l s b 隐写分析为例说明。l s b 隐写方法最早出现,现在已 经有大量方法可以对l s b 进行有效分析,并且可以准确地估算出隐写的嵌入量 【7 8 】。w e s t f e l d 等人提出了p o v s ( p a i ro f v a l e s ) l 拘直方图分析法,利用信息嵌入后的 每一像素对的灰度分布趋于均匀的特性设计了# 检验,该方法能有效判断载体 7 上海大学硕士学位论文 是否被嵌入秘密消息,并能有效估计顺序嵌入情况下秘密消息的长度【7 1 。f r i d r i c h 等人提出了r s 分析方法改进了p o v s 方法。该方法利用图像空间相关性提出灵 敏的双重统计量,他们指出,图像的最低比特位( l s b ) 可以在一定程度上通过其 他位平面来预测,在l s b 上嵌入秘密信息会破坏这种可预测性。r s 方法能够有 效分析l s b 隐写,并可靠的估算出嵌入的秘密信息长度【8 】。然而,只需对l s b 隐写进行很小的改动,如将最低比特位的简单替换改为加1 或减1 运算就会大大 增加隐写分析的难度f 9 】o 此外,将编码方法和隐写技术相结合也会加大隐写分 析的难度。 对图像隐写分析来说,首要任务是能准确有效区分载体图像和含密图像。因 此我们可以将其归为一个对两类情况分类的问题,即对于任一待检测图像,判断 其属于载体图像还是属于含密图像集合。一般来说,衡量隐写分析的指标有: 1 实时性:该分析方法是否能够迅速检测出隐藏信息的存在性,这一点对 于建立网上的实用隐写分析系统是非常重要的。 2 准确性:该分析方法是否能够准确检测出载体信号含有秘密信息。 3 适用性:该分析方法是否对不同隐写方法都有效。如果分析方法指对一 种特定的隐写方法有效,则该检测方法的适用性较低;如果分析方法对多种隐写 方法有效,则该分析方法的适用性高。 1 2 3 隐写和隐写分析的难点 虽然隐写方面的研究正在蓬勃发展,但它仍只是一门新兴学科,它的理论还 不成熟,许多理论模型仍然需要我们去探索研究。 在隐写方法的研究中还存在一些关键问题难以解决,比如:如何处理隐写的 鲁棒性、隐蔽性、以及所嵌入的信息嵌入量等要求之间的关系;隐写隐蔽性的评 价理论也缺乏系统性的理论基础和公平统一的性能测试与评价体系。有必要建立 一种与人类视觉特性相匹配的客观标准。然而,由于缺少对人类视觉特性应用的 定性或定量描述,建立这样一种标准并不是件容易的工作。其他一些隐写的理论 基础,也大都是纯理论性的,很少给出直观的概念,因此隐写技术发展受到一定 限制。 隐写分析也存在着很多难点,如:分析者不知道用于隐藏秘密信息的载体信 8 上海大学硕士学位论文 号;不知道秘密信息的嵌入量大i x 不知道嵌入方法及嵌入方法中的一些参数等。 对于数字图像而言,分析者甚至无法建立一个令人信服的自然图像的统计模型。 现在的隐写工具与隐写方法大都采用了加密的隐写机制,这又进一步地增加了研 究者分析难度。 研究人员不断提出新的隐写方法,这些方法又被研究者证明为可检测的,这 个结果又推动研究人员再次改进隐写方法。这种交替更新促进了隐写的发展,也 决定了隐写分析滞后于隐写,对隐写的成功分析要比隐写本身困难。总的说来, 隐写和隐写分析都有许多难点亟待解决。但是隐写分析和国家安全有着紧密的联 系,为了应付日益尖锐复杂的信息战争,这一重要领域的研究力度在近年得到明 显加强,相信该领域在今后将得到更好的发展。 1 3 本文工作及意义 本文主要进行了以下两方面的研究工作: 一基于直方图差异的m b 隐写分析 m b 隐写是把d c t 系数分布作为一种模型,在隐写过程中保持该模型不变, 因此有很好的统计隐蔽性,使常用分析方法无法有效检测出图像是否经过m b 隐 写。 本文找到了m b 隐写方法的安全漏洞:对于载体图像来说,平坦区域和纹理 区域的d c t 系数分布通常有较大差别,但是m b 隐写会使含密图像的平坦区域 和纹理区域具有相似的d c t 系数分布。针对该安全漏洞,本文提出了通过考察 纹理较丰富的内容中的d c t 系数直方图与全局d c t 系数直方图之间的差异,来 分析图像是否经过m b 隐写的分析方法,该分析方法可以准确地检测出图像是否 经过m b 隐写。 二彩色j p e g 图像的通用隐写分析 通用分析能够在不知道图像隐写方法的情况下,判断图像是否经过隐写。它 通过从图像中提取对隐写敏感的特征向量,使用机器学习的方法对从大量样本中 提取出的特征向量训练,从而达到准确判断图像是否经过隐写处理的目的。 本文提出了一种新的高效通用隐写分析方法,该方法使用三类通用隐写分析 特征。通过比较图像d c t 系数模型与实际系数分布之间是否相似,提出了d c t 9 上海大学硕士学位论文 系数分布模型背离度特征,该特征提取方法不需构造参考图像,降低了运算复杂 度;考虑到隐写会破坏图像空域平坦性的特点,提出了衡量图像空域相关性的特 征,该特征衡量图像子块边缘以及子块内部像素的空域相关性;考虑到隐写会破 坏图像不同颜色空间平坦一致性的特点,提出描述颜色空间相关性的特征,改善 了现有方法独立处理不同颜色空间的不足。这些特征向量计算简单,维数较低, 在利用支持向量机进行机器学习时,保证了运算效率和分析准确度。 隐写分析随着隐写的发展也在不断更新。本文在对隐写分析的研究中,力求 找到一种算法简单,运算时间开销小,同时可以对多种隐写方法都有效的隐写分 析方法。希望这样能有助于使隐写分析发展地更完善,并在未来的信息战中发挥 作用。 1 0 上海大学硕士学位论文 第二章j p e g 图像中的隐写与隐写分析 本章提要: j p e g 图像简介:d c t 变换、j p e g 格式转换 j p e g 图像隐写:j s t e g 隐写、o u t g u e s s 隐写 令针对特定隐写的隐写分析简介 令通用隐写分析简介 j p e g 图像是一种广泛使用的数字图像格式,目前已出现多种把j p e g 图像 作为载体的隐写方法。现有的大多数隐写方法都是在不改变原始图像量化表的条 件下将秘密信息嵌入d c t 系数,但这些方法往往会改变载体图像的一些统计特 性,给隐写分析者提供了线索,目前已有几种隐写分析方法可对进行有效检测。 2 1j p e g 图像简介 图像信号往往有庞大的数据量,不便于存储和传输,必须采用合适的方法对 其进行压缩,因此有必要对图像压缩编码标准进行研究。在众多的图像编码标准 中,j p e g ( 联合图像专家小组,j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 标准是一个适用 范围很广的静态图像压缩标准,在数字图像压缩领域得到了广泛应用。 一d c t 变换介绍 d c t 变换的全称是离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ) ,是指将一组 光强数据转换成频率数据,以便得知强度变化的情形。d c t 变换是j p e g 压缩编 码的核心,它较好的利用了人类视觉系统的特点,在保持图像质量的前提下,较 好的实现了对图像的压缩。 一维d c t 定义为: m ) - 口。萎m ) c o s 警 0 p 3 时,使用矩阵编码的隐写嵌入方法如下: 嵌入秘密信息时首先将原始数据的序号按二进制编码: f = ,。6 f 。一。6 f ,1 ) 2 , 1 i 2 一1 ( 2 2 8 ) 其中b i ,的取值为0 或1 。计算 c 2 0 , l , 这里,x l 、娩、溉是欲嵌入的秘密信息。令 1 6 9,、l ,、l ,j 、 七 0 的情 况,令: j l l 五。的大小在隐写前后保持不变。令: 1 7 ( 2 3 1 ) 上海大学硕士学位论文 g = 与竽 ( 2 3 2 ) 图像中共有2 h 2 】f * 个值为2 i 或2 i + 1 的d c t 系数,若所有d c t 系数都负载了 1 比特秘密信息,那么d c t 系数值为2 i 或2 i + 1 的概率都为0 5 ,当2 h 2 i * 的值较 面h 2 i - h 2 i + l5 话 ( o ,1 ) ( 2 3 3 ) 其中,“ ( 0 ,1 ) ”表示近似标准正态分布。因此, ,:圭蛙盟 川 服从f 分布。其中后等于h 2 f 、h 2 什l 所组成数字对的数量,那些2 h 2 i * 为0 的情况 不计在内。,越小表示载体含有秘密信息的可能性越大。结合f 分布的密度函数 叫一嘲1 盹) f 争出 ( 2 - 3 5 ) p 即载体被隐写的可能性,如果p 接近于1 则说明待检测图像中含有秘密信 w e s t f e l d 等人首先引入z 检验【1 4 】来检测采用j s t e g 隐写方法连续嵌入一定量 使用移动窗口来计算d c t 系数频度【15 1 ,可以比较准确地检验出j s t e g 类的隐写 f r i d r i c h 等人提出了一种可以有效分析f 5 隐写的方法【1 6 】。该方法通过解压 1 8 t 海太学顾学位论文 图像进行d c t 变换,再使用待检测图像的量化表对之量化此时可得待检测图 像的参考图像。参考图像的d c t 系数直方图即为原始图像直方图的估计。比较 待检测图像的d c t 系数直方图和参考图像d c t 系数直方图,如果两个直方图存 在明显差异,我们就可以认为该图像经过f 5 隐写。图22 ( a ) 是大小为5 1 2 5 1 2 , 质量因子为7 0 的载体图像b a b o o n ,图2 2 抽) 是与图2 2 ( a ) 相应得原始直方图、 由上面办法生成的参考图像的直方图和f 5 隐写后的直方图( 每个非0 系数上都 隐藏了i 比特信息) 。从图2 2 ( b ) 可以看出,原始直方图与估计直方图很接近, 而隐写后的直方图与这两者差距较大,因此可以通过直方图比较的方法鉴别出含 密图像。 o d o n t i z 自v a l u e so f o c tc o e c e n t s 3 ( a ) 载体图像( b ) 原始、估计和f 5 隐写后直方图 图22 原始j p e g 图像及其相应的原始、估计和f 5 隐写后直方图 综上所述,针对性的隐写分析具有很好的检测准确性,但是它的通用性较差, 如果用在实际的系统应用中,可能需要遍历或穷举大量的隐写分析方法这样做 会加大检测时间开销,降低检测效率。为了提高隐写分析的通用性,研究者就发 展出了通用隐写分析方法。 通用隐写分析方法可咀分析不同图像格式的多种隐写方法。该方法通过考察 隐写对载体图像产生的影响,找出对隐写敏感的低阶或高阶统计量,通过训练学 ) 建立分类模型,从而实现对新的待检测图像的有效检测,判断其中是否存在秘 密信息。 通用隐写分析包括了空间域和变换域的隐写分析,主要围绕嵌入秘密消息前 上海大学硕士学位论文 后待测图像的总体、局部、相关等特征值及具有训练模式的判别方法进行研究。 f a r i d 等人【1 7 】最早涉足该领域,他们采用基于图像正交镜像滤波( q f m ) i 拘方 法分析图像小波域系数及其预测误差的高阶统计量,再分别采用f i s h e r 线性判别 式、线性与非线性支持向量机【1 8 】来判别和归类的方法,。该方法对d c t 域隐写术 和以自然图像为载体的隐写方法的分析效果较好。f a r i d t ”】和f r i d r i c h t l 9 1 等人的研 究表明,通用隐写分析有很好的通用性,但是该方法一般使用较多的统计特征向 量,而且特征向量本身的表征意义并不明确,因此难以挑选和定位真正对隐写方 法敏感的特征向量来提高隐写分析方法的检测效率与检测性能。 2 4 本章小结 本章首先介绍了几种代表性的j p e g 图像的隐写方法及相应的隐写分析方 法。尽管现有的隐写分析方法可以有效地分析出这几种隐写,但是j p e g 图像的 隐写方法也在不断进步,原有的隐写分析方法无法分析新出现的一些具有更高统 计安全性的隐写方法,如m b 隐写方法。此外,为了提高隐写分析方法的通用性, 研究人员提出通用隐写分析,该研究在近年逐渐得到重视,成为隐写分析领域里 一个新的研究重点。 2 0 上海大学硕士学位论文 第三章针对m b 方法的隐写分析 本章提要: m o d e lb a s e d 隐写简介 夺m b 隐写的安全漏洞:平坦区域和纹理区域的系数分布趋于相同 夺隐写分析:纹理丰富区域系数分布与全局系数分布是否接近 夺实验结果 基于模型的隐写方法( m b ,m o d e l b a s e ds t e g a n o g r a p h y ) 2 0 2 1 1 可以在j p e g 图 像中嵌入大量秘密信息并保持良好的统计隐蔽性。然而,m b 隐写方法仍然存在 安全漏洞:对于原始图像来说,平坦区域和纹理区域的d c t 系数分布通常有较 大差别,但是m b 隐写会使含密图像的平坦区域和纹理区域具有相似的d c t 系 数分布。因此通过考察纹理较丰富的内容中的d c t 系数直方图与全局d c t 系数 直方图之间的差异情况,就可以分析图像是否经过m b 隐写。同时对d c t 系数 模型估计的思想,也能够帮助分析者找到一个新的衡量隐写方法是否足够隐蔽的 方法。 3 1m o d e lb a s e d 隐写 m b 隐写的主要思想就是用一定的统计模型刻画原始j p e g 载体图像的d c t 系数的实际分布,并且在信息隐藏过程中保证图像d c t 系数分布依然服从此模 型,在此情况下图像d c t 系数直方图几乎不发生变化,因此可以抵抗现有的基 于直方图的隐写分析方法,具有较好的统计隐蔽性 2 1 1 。广义柯西分布模型适用 于j p e g 图像的d c t 系数分布,其显著特点是d c t 系数的绝对值越大,其出现 次数越低,即对应于直方图中的值就越小;而且随着d c t 系数绝对值的升高, 其出现次数下降的幅度减小。 一、m b 隐写方法 1 首先得到原始图像每个大小为8 x 8 的小块的d c t 系数,对6 3 个非直流 系数位置分别统计d c t 系数直方图,用j l l f “口) 表示( f ,力位置上值为a 的d c t 系 2 1 上海大学硕士学位论文 数个数,这里1 t 8 且i + 1 。将d c t 系数的取值范围划分为许多“取值 对 :在正值范围内把2 扛l 与2 k 作为一对;在负值范围内把2 抖1 与2 足作为一 对;而0 则不属于任何取值对。 合并每个取值对中的d c t 系数个数得到较为粗糙的直方图坼又幼, 阮( 2 k 1 ) + j l i i ,( 2 七) ,k 0 x u ( k ) = b ( 七) ,k = 0 ( 3 1 1 ) 【( 2 七+ 1 ) + ( 2 k ) ,k o 时计算 咖) = 赫m ,( 2 k - 1 ) = 1 - p ,, j ( 3 1 3 ) 当k 翥 ( 3 2 4 o 2 竺塑 o 3 。ro 7 o 时 d f ,( 尼) = q ,( 尼) = 当k 等器竽 h i , ( 2 k ) 一哗差铲,h ;, j ( 2 k - 1 ) _ 警象掣 ,h i , ( 2 k - 1 ) 警糍掣 ( 4 2 5 ) 3 7 上海大学硕士学位论文 d i c :f ( 七) = ( 后) = lh i , ( 2 k + 1 ) 一竺型! 铲,7 i f ,( 2 k + 1 ) 至堕! 铲 ih i j ( 2 k ) 一 h f j ( 2 k 鬲+ 1 ) xh 矿 , j ( 2 k ) ,懈+ 1 ) 警铲 仁 = 薹一 用一、最来总体衡量d c t 系数的实际系数分布与模型的背离度,局、局分别为 d i x k ) f f 4 cf 义助的均值。f l 用以衡量图像实际系数分布与模型的差异,对载体图 像来说,l 的值应接近于0 ,而含密图像的 值较大;f 2 用以描述图像实际系 数分布与模型差异的分类情况,对载体图像来说,足的值应接近于o 5 ,而含密 图像的r 值较大或接近0 。式( 4 2 4 ) 意味着落于此对的d c t 系数个数要满足一 定数量,以减少d c t 系数的随机性对特征向量的影响。 4 2 2 空域相关性的特征 j p e g 图像的隐写通常是通过改变图像d c t 系数完成,这种改动d c t 系数 的操作也会不同程度的改变图像空域像素值,改变图像的平坦性特点,载体图像 的平坦区域在隐写后可能变得不再平坦。这种图像空域平坦性的变化就给通用隐 写分析带来了线索。本文从如下两个方面讨论隐写给图像空域带来的影响: 1 考虑到隐写会削弱图像8x8 的图像子块边界的相关性,使图像子块边界 变得不平滑。统计图像子块边界像素的平滑情况,然后与图像子块内相邻像素的 平滑情况作比较,如果两者相差较远,就可以认为图像有被隐写的可能。 2 考虑到隐写会削弱图像8 8 的图像子块内部的相关性,使图像子块内部 变得不平滑。统计图像子块内部像素的平坦情况,如果图像子块非常不平坦,图 像就可能被隐写。 本节提出的特征向量提取方法要点如下:首先将图像从d c t 系数转换到空 域像素值,然后按照j p e g 图像的分块规则,将图像分成8 x 8 的子块,考察如 下两种图像特点:1 统计图像子块边缘差异与子块内部差异的区别,以此作为 上海大学硕士学位论文 衡量子块边缘相关性的特征向量;2 用奇异值分析的方法衡量图像子块的平坦 情况,以此作为衡量子块内部相关性的特征向量。 首先说明对j p e g 图像d c t 系数的变化也会改变图像空域的像素值。j p e g 图像压缩时,将原始图像分成8 8 的像素子块,对这些子块做d c t 变换、量化 等操作得到每块的d c t 系数。j p e g 图像的隐写通常通过改变图像的d c t 系数 来完成,乘以量化表的d c t 系数通过i d c t 运算再转换为像素值,对二维i d c t , 令原始信号为f ( p ,g ) ,f ( p ,g ) 的二维i d c t 为: 厂( x ,y ) = 砉薹彳( p ) 彳( g ) f ( p , q ) c o s ! 三 兰圭旦至c 。s 紫 r 一 ( 4 2 7 ) a ( p ) :j 1 4 2p 20 1 1p = 1 ,2 ,7 由式( 4 2 6 ) 可知,改变像素子块中某个d c t 系数会不同程度地改变该像素 子块里所有像素的像素值,因此隐写会削弱图像子块边缘的相关性以及图像子块 内部的相关性。在此基础上,本章提出了基于空域相关性的特征向量。 基于空域相关性的特征向量提取的具体步骤如下: 1 将j p e g 图像从d c t 系数转换为像素值,设图像大小为m n ,用p s ( i d f ) ( s y c b ,c ,) ,l f m ,l 对n ) 来表示在s 空f i l l ( i j ) 位置上的像素值。 2 比较图像8 x8 子块边界相邻像素的差值和8 8 子块内部4 x 4 子块相邻 像素的差值的大小。如图4 4 所示,图中实线表示8 8 的图像子块,图中虚线 表示8 x 8 图像子块中4 x 4 的图像子块。为了计算方便,统计除图像周围一圈8 8 的图像子块外( 图中灰色部分) ,其他所有8 8 子块边缘相邻像素的差值与该 子块内部4 4 子块边缘相邻像素差值的商, 影粉缪弼黔嬲笏獬溺 鬓 : 霪 ! 赫龋积锄施戮女i k 巍i 0 。霭
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论