




已阅读5页,还剩74页未读, 继续免费阅读
(计算机软件与理论专业论文)基于机器学习的音频盲水印方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西华大学硕士学位论文 基于机器学习的音频盲水印方法研究 计算机软件与理论 研究生许晓娟指导教师彭宏,何承源 摘要 随着计算机网络和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取 信息的重要来源,并成为人们生活的重要组成部分。因而,作为数字媒体产品 知识产权宣告及保护的有效工具,数字水印技术自1 9 9 3 年第一次提出以来已经 引起了人们极大的关注,同时,如何保护多媒体信息的安全成为国际上研究的 热门课题。特别是音频信号的数字水印技术已经成为近年来研究的热点之一。 信息安全技术中采取的密码学技术因仅能控制信息的传播过程,而对于解码后 的媒体数据却难以控制,因而无法阻止盗版者的非法拷贝和传播。作为解决上 述问题的一种有效途径,数字水印技术开始引起人们的普遍关注。它通过在原 始数据中嵌入秘密信息来证实数据的所有权或完整性,以此来抑制对数字作品 的盗版或篡改。 数字音频水印技术就是向载体数据( 如音频信号) 中嵌入秘密信息以达到版 权宣告及保护的目的。数字水印技术的关键就是工作域和嵌入策略的选取,从 某种程度上说,工作域和嵌入策略选取的好坏从根本上决定了整个数字水印系 统的优劣。而近年发展起来的小波变换是一种新型的时频分析方法,具有很多 良好的性质,特别适合于音频信号的处理。本文正是将小波变换应用到音频信 号的数字水印系统中,提出一种小波域上基于机器学习方法的新的数字音频盲 水印算法,使其能在水印的鲁棒性和不可感知性之间寻找到合理的平衡点,从 而具有更良好透明性和鲁棒性,并在音频作品的版权保护中能有一定的实用性。 本文的主要贡献如下: ( 1 ) 提出一种基于支持向量回归机( s u p p o av e c t o rr e g r e s s i o n ,s v r ) 的鲁棒数 字音频水印算法。算法的基本思想是先对整段音频信号进行分抽样处理,然后对 所有的子音频分别进行小波变换,水印信号则嵌入到其中一个子音频信号的小 西华大学硕士学位论文 波变换后的低频系数中,水印提取时不需要原始音频信号。由于不同子音频信 号之间的高度相关性,相应的d w t 分解后的各小波低频系数分布也具有相似 性。利用这种高度相关性,在嵌入和提取的过程应用s v r 具有的非线性逼近能 力,建立待嵌入的子音频信号与其他子音频信号之间的对应模板关系,再利用 训练好的s v r 提取水印,实现盲检测。 ( 2 ) 针对数字音频水印的鲁棒性和不可感知性两者之间是相互制约问题,提 出一种采用遗传算法( g e n e t i ca l g o r i t h m s ,g a ) 来解决最优嵌入能量的优化水印方 案。遗传算法是通过群体进化来随机搜索目标函数的最优化问题,对于前述基 于支持向量回归机的小波域数字音频盲水印算法,进一步地探讨采用遗传算在 嵌入强度集合中搜索对抗攻击能力适应度较高的个体,从而得到最佳嵌入强度 的一个优化方案,以实现自适应策略,也使本算法能在水印的鲁棒性和不可感 知性之问寻找到合理的平衡点,从而具有更良好透明性和鲁棒性。 仿真实验结果表明,两种方法都具有较强的鲁棒性和不可感知性,水印嵌 入容量的自适应性,提取水印时不需要原始音频信号的参与,且对包括m p 3 有 损压缩、低通滤波、重采样重量化等多种攻击性试验具有较强的稳健性,是可 行的数字音频水印算法。可以根据具体需求,用于数字音频作品的版权保护。 关键词:信息隐藏;数字音频水印;小波变换;版权保护:支持向量回归 机;遗传算法;盲检测 i l b l i n da u d i ow a t e r m a r k i n ga l g o r i t h mb a s e d o n m a c h i n el e a r n i n g m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y m a s t e rc a n d i d a t e :x i a o j u a nx us u p e r v i s o r :p r o f h o n gp e n g ,p r o f c h e n g y u a nh e a b s t r a c t t h ed i g i t a lm e d i ah a sb e c o m eam a i nw a yf o ri n f o r m a t i o nc o m m u n i c a t i o na l o n g w i t ht h er a p i dd e v e l o p m e n to fd i g i t a lt e c h n o l o g ya n dc o m p u t e r n e t w o r k s a sau s e t u l t o o lf o rt h ec o p y r i g h tp r o t e c t i o na n dj u d g m e n t ,d i g i t a lw a t e r m a r k i n gt e c h n i q u eh a s g a i n e dm o r ea 1 1 dm o r ec o n c e r n si nm a n yw a y s s i n c ei ta p p e a r e di n19 9 3 ,m e a n w h i l e , p r o t e c t i o no fd i g i t a lm u l t i m e d i ai n f o r m a t i o nh a sb e c o m ea ni n c r e a s i n g l yi m p o r t a n t i s s u e e s p e c i a l l ya u d i od i g i t a lw a t e r m a r k i n gt e c h n i q u eh a sb e e no n e o ft h er e s e a r c h h o t s p o t si nr e c e n ty e a r s t r a d i t i o n a li n f o r m a t i o ns e c u r i t ys y s t e mc a no n l ys a f e g u a r d i n f o 吼a t i o n 仃a n s m i r i n gp r o c e s s ,b u tw h i c h c a n tc o n t r o lt h ed e c o d e dm e d i ad a t a s o i tc a n tp r e v e n tt h ei l l e g a lc o p yo ft h ep i r a t e a sa n o v e lw a yt os o l v et h e s ep r o b l e m s , d i g i t a lw a t e r m a r k i n gt e c h n o l o g yb e g i n s t ob ep o p u l a r l yr e s e a r c h e da n du s e d b y e m b e d d i n gs o m es e c r e tw a t e r m a r ki n f o r m a t i o ni nt h e h o s tm u l t i m e d i as i g n a l s ,i t p r o v i d e ss o l u t i o n st oc o p y r i g h tp r o t e c t i o na n d c o n t e n tv e r i f i c a t i o n 斫曲纳ed i g i t a la u d i ow a t e r m a r k i n gt e c h n i q u ew e c a ne m b e ds e c r e ti n f o r m a t i o n i n t od i g i t a la u d i os i g n a l ,s oa st oa r r i v ea tt h ep u r p o s eo fc o p y r i g h tp r o t e c t i o na n d i u d g m e n t t h ec h o s e o ft h ew o r kf i e l da n dt h ee m b e dm e t h o db e c o m e sm o r e n e c e s s a r y w a v e l e tt r a n s f o r m ,a san e wp o w e r f u lt o o lo ft i m e f r e q u e n c y a n a l y s i s , p r o v i d e s s e v e r a l g o o d c h a r a c t e r st h a tm a k e i t a p p r o p r i a t e t oa u d i o s i g n a l w a t e r m a d 【i n g s o ,an o v e lm a c h i n el e a r n i n gb a s e dd i g i t a lb l i n da u d i ow a t e r m a r k i n g s c h e m ei nt h ew a v e l e td o m a i ni sp r o p o s e di n t h i sp a p e r , w h i c h c o u l df i n da r e a s o n a b l eb a l a n c eb e t w e e nt h er o b u s t n e s sa n di n a u d i b i l i t yo ft h ew a t e r m a r k ,t h e n h a v em eb e r e rr o b u s t n e s sa n di n a u d i b i l i t y a n dt h ep r o p o s e dw a t e r m a r k i n gm e t h o d i i i 西华大学硕士学位论文 w h i c hd o e s n tr e q u i r et h eu s eo ft h eo r i g i n a la u d i os i g n a lf o rw a t e r m a r ke x t r a c t i o n a l s oc a np r o v i d ea g o o dc o p y r i g h tp r o t e c t i o ns c h e m e t h em a i nc o n t r i b u t i o no ft h i sp a p e ri sa sf o l l o w s : ( 1 ) t h i sp a p e rf o c u s e sm a i n l y o nan o v e ls u p p o r tv e c t o rr e g r e s s i o n ( s v r ) b a s e d d i g i t a la u d i ow a t e r m a r k i n gs c h e m ei nt h ew a v e l e td o m a i nw h i c hu s i n gs u b s a m p l i n g t h ea u d i os i g n a li ss u b s a m p l e df i r s t l ya n da l lt h es u b - a u d i o sa r ed e c o m p o s e di n t ot h e w a v e l e td o m a i nr e s p e c t i v e l y t h e nt h ew a t e r m a r ki n f o r m a t i o ni se m b e d d e di n t ot h e l o w f r e q u e n c yr e g i o no fr a n d o mo n es u b a u d i o w i t ht h eh i g hc o r r e l a t i o na m o n g t h e s u b a u d i o s ,a c c o r d i n g l y , t h ed i s t r i b u t i n gr u l eo fd i f f e r e n ts u b - a u d i o si n t h ew a v e l e t d o m a i ni ss i m i l a rt oe a c ho t h e r , s v rc a l lb eu s e dt ol e a r nt h ec h a r a c t e r i s t i c so f t h e m u s i n gt h ei n f o r m a t i o no fu n m o d i f i e dt e m p l a t ep o s i t i o n si nt h el o w - f r e q u e n c yr e g i o n o ft h ew a v e l e td o m a i n ,t h es v rc a nb et r a i n e dw e l l t h a n k st ot h eg o o dl e a r n i n g a b i l i t yo fs v r , t h ew a t e r m a r kc a nb ec o r r e c t l ye x t r a c t e du n d e rs e v e r a ld i f f e r e n t a t t a c k s ,a n dt h ep r o p o s e dw a t e r m a r k i n gm e t h o dw h i c hd o e s n tr e q u i r et h eu s eo f t h e o r i g i n a la u d i os i g n a l ( 2 ) a i m i n ga tt h ep r o b l e mw h i c hi st h er o b u s t n e s sa n di n a u d i b i l i t yo f t h ed i g i t a l a u d i ow a t e r m a r ki sl i m i t e df o re a c ho t h e r ,s oa no p t i m i z a t i o nw a t e r m a r k i n gm e t h o d b a s e do ng e n e t i ca l g o r i t h m ( g e n e t i ca l g o r i t h m s ,g a ) w h i c ht oc o m p u t et h eb e s t e n e r g yq u i c k l yi sp r o p o s e di nt h i sp a p e r b e c a u s e t h eg e n e t i ca l g o r i t h m sc o u l ds e a r c h t h eo p t i m i z a t i o no fo b je c t i v ef u n c t i o nr a n d o m l y , w h i c hv i am ee v o l u t i o no fg r o u p s , o u rw o r ki sb a s e do nt h ee m b e d d i n g d e t e c t i n gw a yo f ”d w t - b a s e da u d i o w a t e r m a r k i n gu s i n gs u p p o r tv e c t o rr e g r e s s i o na n ds u b s a m p l i n g ”a n dt h i sm e t h o d p r o v i d e s ap r e l i m i n a r yd i s c u s s i o no nt h ea p p l i c a t i o no fg a ,w h i c hs e a r c h i n gt h e i n d i v i d u a lw i t ht h el l i 曲e s tf i t n e s so fa t t a c k r e s i s t a n c ei nt h ea g g r e g a t eo ft h eo p t i m a l e m b e d d i n gs t r e n g t h a sa no p t i m i z a t i o ns o l u t i o no fo b t a i n i n gt h eo p t i m a le m b e d d i n g s t r e n g t h ,i tc o u l da c h i e v ea na d a p t i v ep o l i c y , a n df i n dar e a s o n a b l eb a l a n c eb e t w e e n t h er o b u s t n e s sa n di n a u d i b i l i t yo ft h ew a t e r m a r k ,j u s tf o rt h eb e t t e rr o b u s t n e s sa n d i n a u d i b i l i t yi nt h ea l g o r i t h m t h ee x p e r i m e n t a lr e s u l t ss h o wt h et w op r a c t i c a la l g o r i t h m s c a l l p r e s e r v e i n a u d i b i l i t ya n dt h e ya r e r o b u s te n o u g h i v t oa g a i n s tt h ed i f f e r e n ts i g n a lp r o c e s s i n g 西华大学硕士学位论文 o p e r a t i o n s i na d d i t i o n ,t h ew a t e r m a r k i n gi n f o r m a t i o nc a nb ee m b e d d e di n t o t h e o r i g i n a la u d i os i g n a la d a p t i v e l y , w h i c ha l s od o e s n tr e q u i r et h eu s eo ft h eo r i g i n a l a u d i os i g n a lf o rd e t e c t i o n f u r t h e r m o r e ,i tc a nr e s i s tt h ed i f f e r e n ta t t a c k s ,s u c ha s l o s s yc o m p r e s s i o n ( m p 3 ) ,f i l t e r i n g ,r e s a m p l i n ga n dr e q u a n t i z i n g ,e t c s oi tc a nb e u s e df o rc o p y r i g h tp r o t e c t i o no f d i g i t a la u d i op r o d u c t i o n s k e yw o r d s :i n f o r m a t i o nh i d i n g ;d i g i t a la u d i ow a t e r m a r k i n g ;d w t ;c o p y r i g h t p r o t e c t i o n ;s u p p o r tv e c t o rr e g r e s s i o n ;g e n e t i ca l g o r i t h m s ;b l i n dd e t e c t i o n v 西华大学硕士学位论文 声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得西华大学或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论 文中作了明确的说明并表示谢意。 本学位论文成果是本人在西华大学读书期间在导师指导下取得的,论文成 果归西华大学所有,特此声明。 作者虢坼蒯矽眸相形日 新躲锣加绸 西华大学硕士学位论文 第一章绪论 1 1 课题研究的背景和意义 伴随着网络技术与多媒体技术的迅猛发展,多媒体数据( 音频,静态图像 等) 的数字化为多媒体信息的存储和传输提供了极大的便利,也极大提高了信 息表达的效率和准确性。与此同时,这种便利性也使得数字化的多媒体信息极 易被无限制任意复制与散播,而这一系列数字化技术本身的可复制性和广泛传 播性所带来的负面效应,已成为影响信息产业持续发展的一大障碍。目前,包 括版权保护,内容认证等在内的多媒体信息安全问题已变得日益突出,且已成 为数字世界中一个非常重要和紧迫的议题。 多媒体信息安全技术主要包括两方面内容:多媒体加密技术和多媒体数字 水印技术。其中,传统的加解密系统是将多媒体数据加密后再进行传送,虽然 这使得只有被授权持有解密密钥的人才可以存取信息,但这不仅限制了多媒体 数据信息的交流,且数据一旦被解密,就完全置于解密人的控制之下,这将会 在一定程度上制约着数字多媒体的广泛应用。因此,多媒体加密技术只能解决 数字信息内容的保密,却不能很好解决多媒体信息的版权保护等问题,换言之, 密码学只能保护传输中的内容,而内容一旦解密就不再有保护作用了。因此, 数字水印技术的研究就是在这种应用要求下迅速发展起来的。 随着数字化音像制品和音乐制品的大量制作和发行,数字音频水印技术有 着广泛的应用前景。一方面,可以用音频水印技术实现音频作品的知识产权保 护,这是水印技术最初的出发点,也是其最主要应用所在。它的目的是通过在 音频载体中嵌入水印信息,即版权所有者信息以及其来源信息,从而来辨识音 频数据的版权所有和合法使用者,防止非法拷贝、再次传播和盗用。另一方面, 可以用于音频作品的内容认证。音频信号在传输,存储过程中不可避免地会受 到音频信号处理操作,使用者关心的问题则是音频的内容是否被篡改或者替换。 所以,它的目的是根据提取水印的状态来检测音频内容是否受到篡改或被替换, 主要用于音频内容的完整性保护。另外,在对音频素材进行查找和检索的应用 领域,可以用水印技术实现元数据( 描述数据的数据) 的传输,就是用兼容的 隐藏的带内方式来传送描述性信息。 数字水印技术还处在不断发展之中,从中可以看出的是,对数字音频水印 西华大学硕士学位论文 技术的研究,不仅具有现实的学术意义,而且具有长远的经济效益和社会价值。 1 2国内外研究现状 数字水印技术是作为保护多媒体信息版权而发展起来的一项新兴技术,其 基本思想源于古代的隐写术( s t e g a n o g r a p h y ) ,概念是在1 9 9 4 年提出来的,早 期主要用于数字图像水印领域,此后,研究人员将数字水印的概念扩展到音频 和视频等领域。自诞生至今也不过十几年的时间,其理论体系和方法还较不完 善,到目前为止,尚有很多无法解决的技术难题和未知领域,其安全保护措施 可能在某些方面还不如传统方法有效,所以,不断完善数字水印理论框架体系, 并大力发展实用的数字水印技术,促使数字水印技术向质变发展,是目前亟需 解决的问题和关键。 1 2 1国外研究现状 在国外学术界上,大量有关数字水印的文章和专题相继发表,几个有影响 的国际会议( 如i e e ei c i p , i e e ei c a s s p , a c mm u l t i m e d i a 等) 以及一些国际权 威杂志( 如p r o c e e d i n g so fi e e es i g n a lp r o c e s s i n g i e e ej o u r n a lo fs e l e c t e da r e a s o nc o m m u n i c a t i o n ,c o m m u n i c a t i o no f a c m 等) 相继出版了数字水印的专辑。1 9 9 6 年5 月3 0 日至6 月1 日在英国剑桥大学第一次正式召开了“信息隐藏专题讨论 会”( 即“f i r s ti n f o r m a t i o nh i d i n gw o r k s h o p ”) ,标志着数字水印技术得到了全世界 的公认与瞩目。 国际上在数字水印方面的研究时间虽然不长,但由于它表现出作为多媒体 数据保护问题有效手段的良好应用前景,引起了国外一些科研机构及大公司的 密切关注,包括英国剑桥大学,m 、微软等,且有些公司还推出了数字水印软 件,如a d o b e p h o t o s h o p 4 0 ,m p 3 s t e g o ,软件等,而数字水印在音频中的应用则包 括m p 4 ,超级d v d 等等。其中,m p 4 较之m p 3 等以往的音乐格式,内置数字 水印,支持版权保护功能,且具有文件更小,音质更好的特点。 相对图像水印的研究而言,数字音频水印的研究虽起步较晚,但由于不同 媒体自身结构与性质的不同,导致在水印嵌入时有较大的差异性,其中以音频 为载体的水印技术在近年来已成为人们关注的焦点之一,而现今对数字音频水 印技术的大多数研究集中在算法的研究上,最早始于1 9 9 6 年。b e n d e r l 2 1 等提出 2 西华大学硕士学位论文 了l s b 编码、回声编码、扩频编码和相位编码等四种算法,b o n e y 等1 3 1 将c o x 方案应用到音频信号中,取得了很好的实验结果。其后,又有研究者对上述几 种算法进行了改进和完善,但现有技术与真正能有效保护知识产权的目标仍有 距离。从综合性能上讲,变换域方法更加优越一些,是今后发展的主研方向。 1 2 2 国内研究现状 国内的研究虽然较国外起步晚,但随着技术交流的不断加快和学术界的共 同努力,我国学术界对数字水印技术的反应也非常快,已经、有相当一批有实 力的科研机构投入到这一领域的研究中来。从总体上看,我国相关的研究与世 界水平同步,而且有自己独特的研究思路,但这些研究大多处在应用基础理论 研究和应用技术开发阶段,尚无成熟的技术和商业化的产品推向市场。 为了促进数字水印及其他信息隐藏技术的研究和应用,1 9 9 9 年1 2 月,我 国信息安全领域的何德全院士、周仲义院士、蔡吉人院士与有关应用研究单位 联合发起召开了我国第一届信息隐藏学术研讨会。2 0 0 0 年1 月,由国家”8 6 3 ” 智能机专家组和中科院自动化所模式识别国家重点实验室组织召开了数字水印 学术研讨会,来自国家自然科学基金委员会、国家信息安全测评认证中心、中 国科学院、清华大学、上海交通大学、北京大学等单位的专家学者和研究人员 深入讨论了数字水印的关键技术,报告了各自的研究成果。 1 3 当前研究存在的问题 数字水印是一项新兴学科,而数字音频水印技术则是数字水印技术的一个 重要领域。与图像和视频数据相比,音频信号在每个时间间隔内采样的点数要 少得多,这意味着嵌入的水印信息量、水印的鲁棒性都会比视觉媒体水印算法 要小得多。另外一个问题是人的听觉系统要比其视觉系统敏感得多,因而要使 嵌入的水印听不见也相对较为困难。因此与静止图像相比,数字音频水印具有 更大的挑战性,如,仍有以下许多方面的问题有待深入研究: ( 1 ) 现有大部分的音频水印算法,都不同程度存在水印容量小、提取水印需 要原始音频信号( 非盲检测) 、算法计算量大以及未充分考虑人类听觉系统 ( h a s ) 特性等一系列不足之处,因此,如何更充分利用h a s ,改善水印隐蔽 性与稳健性,增大嵌入强度仍是目前音频水印算法的重要发展方向; 西华大学硕士学位论文 ( 2 ) 从现实的角度看,水印系统必然要在算法的鲁棒性、水印的嵌入信息量 以及不可觉察性之间达到一个平衡,这涉及鲁棒算法的原理性设计、水印的构 造模型、水印能量和容量的理论估计、水印嵌入算法和检测算法的理论研究等 方面。如何确定平衡点仍是一个难题,目前大多数水印算法均利用经验而不是 从理论上解决此问题; ( 3 ) 对现有的音频水印算法进行总结,给出评价数字音频水印算法性能的统 一标准( 如信噪比与不可感知性之间的定量关系、归一化相关函数值与可靠检测 之间的定量关系等) 是一个有待解决的问题 ( 4 ) 寻找与新一代压缩标准m p 3 等相适应的音频水印算法,比如利用变换域 算法的优越性,使其具有满意的数据嵌入量和鲁棒性,这对音频水印技术的广 泛应用有着重要意义; ( 5 ) 未来的水印嵌入算法应该能够达到自适应控制。如结合h a s 对原始宿主 音频的预处理和分析,采用白适应策略,选择最佳的嵌入位置、嵌入算法及嵌 入强度等。 ( 6 ) 音频水印的解决方案还不完善,目前国内外的工作尚未能对这些有内在 联系的不同算法中的共性问题进行高度提炼和深入的理论研究,因而缺乏对数 字水印作进一步研究具有指导意义的理论结果。 1 4 小波理论发展背景及主要应用场合 小波分析( w a v e l e ta n a l y s i s ) 是当前数学理论中迅速发展着的一个新领域,它 具备理论深刻和应用广泛的双重意义。8 0 年代后期,法国数学家y m e y e r , 地质 学家j m o r l e t 以及理论物理学家a g r o s s m a n d 共同构架起了比较系统的小波理 论,随后法国学者l d a u b e c h i e s 撰写了极具指导和普及意义的小波理论巨著”t e n l e c t u r e so nw a v e l e t s ,而s m a l l a t 则把多分辨率分析( m r a ) 思想融入小波分析, 从此,小波便以其独特的性能、强大的功能开创了一个崭新的信息处理时代。 与传统的f o u f i e r 变换等工具相比,小波变换是时间和频率的局域变换,它 通过有限宽度基函数的伸缩和平移,达到对特定函数或信号的多尺度细化分析, 从而可以有效地从该函数或信号中提取信息,消除了传统变换存在的诸多问题。 目前,在计算机图形学、计算机分类、音频信号处理、地震勘探等诸多方面, 小波变换已经成为一种极为重要的分析工具。 4 西华大学硕士学位论文 1 5 支持向量机发展背景及在数字水印中的主要应用场合 s v m ( s u p p o r tv e c t o rm a c h i n e ) 【4 j 【5 】是基于v a p n i k 提出的小样本情况下的统 计学习理论一种机器学习方法。v a p n i k 指出传统的机器学习方法包括神经网络 在内都是基于学习样本数目趋于无穷大时的渐近理论纯最小化经验风险并不能 保证期望风险最小,因此,于1 9 9 8 年提出了结构风险最小化( s t r u c t u r a lr i s k m i n i m i z a t i o n ,s r m ) 原则,给出v c ( v a p n i ka n dc h e r v o n e n k i s ) 维概念,指出必 须同时最小化经验风险原则和v c 维才能保证期望风险最小。s v m 是统计学习理 论中最新的内容,也是最实用的部分,能较好地解决神经网络过学习问题,可 用于回归估计、函数逼近等方面,已成为当前人工智能领域研究的热点。 近几年,由于机器学习领域的深入研究及其优势的突显,将机器学习方法 ( 如:神经网络,支持向量机,遗传算法等) 应用于数字水印技术中已成为了 可能。 数字水印技术主要包括水印嵌入、水印检测与攻击检测几个部分,支持向 量机在数字水印中潜在的应用场合主要有以下几种方式: ( 1 ) 支持向量机在数字水印嵌入过程中的应用。 s v m 模拟人眼视觉特性 6 l 。 通过s v m 获取邻域像素关系,进行空间域上水印嵌入操作【7 1 。 s v m 用于变换域上的水印嵌入操作,与空间域上嵌入水印相似,s v m 也 可以用于变换域上的水印嵌入操作8 】。 ( 2 ) 支持向量机在数字水印提取过程中的应用。 伪随机数序列加载在d c t 系数上实现数字水印信息的嵌入,则水印提取的 过程实际上可以描述成一个由经过调制的d c t 系数到伪随机数序列的非线性映 射。支持向量机可以用来模拟这个非线性映射关系。 ( 3 ) 支持向量机在数字水印的攻击检测中的应用。 数字水印攻击检测过程可以看作是一个多类识别过程,即比较提取出的已 经受到攻击的水印与原始水印信息,获得不同的攻击方法产生的不同特征信息。 由此可见,由于支持向量机建立了一套有限样本下机器学习的理论框架和 方法,能较好地解决小样本、非线性等情况下的分类问题,已经被用于网页识 别、人脸识别等许多方面,它在数字音频水印,多媒体信息安全中的应用也将 会越来越广泛。 西华大学硕士学位论文 1 6 本文的主要研究内容 本课题拟重点研究鲁棒( 版权保护机制) 数字音频盲水印技术,通过对已 有算法的研究和分析,针对现存的一些问题,结合应用背景,提出两种变换域 上基于机器学习方法的新的数字音频盲水印算法,使其能在水印的鲁棒性和不 可感知性之间寻找到合理的平衡点,从而具有良好透明性和鲁棒性,并在音频 作品的版权保护中能有一定的实用性。 本论文拟在以下三方面问题进行着重探讨:第一,对于数据量较大的非平 稳音频信号,在考虑信号时变特性的前提下,如何用分段处理方法来解决段与 段之间的关系问题;第二,为了在水印的不可感知性和鲁棒性之间折中,如何 利用变换域算法的优越性来选择嵌入位置,有利于保证水印的不可感知性和安 全性。第三,如何将机器学习方法( 如:支持向量机、遗传算法等) 应用到水 印的嵌入和提取算法当中,在保证良好鲁棒性和算法计算量不大的前提下,来 实现水印盲检测。最后将三方面有机结合起来实现了两种新的数字音频盲水印 技术。 具体内容安排如下,本文分为五章: 第一章首先介绍了本课题的研究背景,发展现状,数字音频水印技术当前 研究所存在的问题,以及支持向量机在其中的主要应用。 第二章介绍了数字音频水印技术的基础知识。阐述了人类听觉特性,音频 数字水印的原理及要求,对音频水印技术进行回顾与分类总结,对比、分析现 有的音频水印算法和技术,建立音频数字水印技术相关理论的知识框架。 第三章重点研究支持向量回归机在数字音频水印中的应用,提出一种变换 域上基于支持向量机的新的数字音频盲水印算法,使其能在水印的鲁棒性和不 可感知性之间寻找到合理的平衡点,主要包括整个系统的基本结构、数字水印 的嵌入和提取等,这是本课题主要的解决难点问题,同时对算法进行了仿真实 验以及性能评价分析。 第四章研究遗传算法在数字音频水印中的应用,在嵌入提取方式设计完毕 之后,提出一种采用遗传算法在嵌入强度集合中搜索对抗攻击能力适应度较高 的个体,从而得到嵌入强度( 或嵌入位置) 的一个优化方案,以实现自适应策 略,并给出了仿真实验和结果分析。 第五章总结全文,指出下一步将研究的方向,并展望了数字水印的未来。 6 西华大学硕士学位论文 第二章数字音频水印技术的理论基础 2 1 数字水印的基本原理 2 1 1 数字水印的基本原理及模型 水印的基本原理是嵌入某些标识数据到载体数据中作为水印,使得水印在 载体数据中不可感知并足够安全。 水印可由多种模型构成,如随机数字序列、数字标识以及图像等。从鲁棒 性和安全性考虑,常常需要对水印进行随机化和加密处理。 设i 为原始信息,w 为水印信号,k 为密码,那么处理后的水印w 由函数 f 定义如下: w = f ( i ,w ,k )( 2 1 ) 如果水印所有者不希望水印被其他人知道,那么函数f 应该满足非可逆、 单向、非对称性。为此,应将水印算法原理设计成非对称的,或者和加密算法 相结合。二者的目的都是为了提高水印的安全性。 在水印的嵌入过程( 图2 1 ) 中,设有嵌入函数e ,原始信息i 和水印w ,那 么嵌入水印后的载体信息i ,可表示如下: i = e ( i ,)( 2 - 2 ) 其中形由式( 2 1 ) 定义。 若将水印提取过程定义为提取函数d ,那么输出的可以是一个判定水印存在 与否的o 1 决策( 图2 2 ) ,也可是包含各种信息的数据流,如图像( 图2 3 ) 。己知 原始载体信息i 和嵌入水印后的载体信息i ,则: w = d ( i 矽,)( 2 3 ) 或 c ( 哪凡加 l = 盯纽 ( 2 4 ) 其中形为提取出的水印,k 为密码,c 函数用于相关检测,万为决策阈值。 7 西华大学硕士学位论文 臣了_ f 。r 。,i 。_ r , “一r ”4 ”r “。+ “” | 琢纷往密 ; 糍入务缓 一匆农绨霸均赁息 一r 一 f 缴弼一 ,i 2 1t h et t l t l 臻e t i c o f _ te r m r ke l m b e d d i 珥 酝1 水印的嵌 篡法 _ t e r n m r kd 毫t c t i n e 豳2 2 水印的检溺篁法 _ i t m r 曩tr t c ti n 露2 3 水印的提取篁法 其中,图2 2 ,2 3 中虚线框部分表示在提取或判断水印信号时原始信息、 不是必需的。 2 1 2数字水印的基本特征及分类 一般来说,数字水印所应具有的特征随具体应用的不同而有所区别,由于 本课题主要讨论用于版权保护机制的数字水印,它是一种健壮性要求很高的水 印。因此,一般认为具有版权保护功能的数字水印必须具有如下特征 9 】【i 叫:( 1 ) 不 可感知性;( 2 ) 鲁棒性( r o b u s t ) ;( 3 ) 安全性;( 4 ) 确定性;( 5 ) 自恢复性;( 6 ) 计算复杂度。 数字水印的分类方法也有很多种,分类的出发点不同导致了分类的不同, 它们间既有联系又有区别。图2 4 的分类只是一种表示方法,各类数字水印并不 是独立不相关的,而是相互联系又相互包含的。 西华大学硕士学位论文 f i 醇4t h ec l a s s i f i c a t i o no f d i g i t a lw a t e r m a r k i n g 图2 4 数字水印的分类 2 2 数字音频水印的一般原理 2 2 1数字音频信号特征分析 2 2 1 1 音频信号的传送环境 实践中,声音信号从编码到解码过程有多种可能的传播途径。最普通的有 以下四种情况,如图2 5 所示。 第一种情况是数字端到数字端的传输。 第二种情况是数字状态下的重采样。 第三种情况是信号被转换为模拟形式,通过模拟线路进行传播,在接收端 被重采样恢复为数字信号。 第四种情况是信号在空气中传播,经过麦克风重新采样恢复为数字信号。 西华大学硕士学位论文 撕数宁化辫体 d i ;豳d 汹 司时绪号堑疑梯 锄确脚代- 搦糊 匦戮飞、广遥圜 币略搂缀俊邋 孵翻懒曲铀岫 匦卜却炉圈 俩垒哩佟擅 椭- 静怕纠咽咖 f i g 2 5t r a n s m i s s i o nc i r c u m s t a n c eo fa u d i os i g n a l 图2 5 音频信号的传送环境 2 2 1 2 心理声学模型 一些声学科学家对人类的听觉特性进行深入的研究和探索,提出了心理声 学模型的概念1 1 2 】- 【1 6 】。心理声学模型的一个最基本的概念是听觉系统中存在一个 听觉阈值电平,低于此电平的信号就听不到,一个人能否听到声音取决于声音 的频率,以及声音的幅度是否高于这种频率下的听觉阈值。心理声学模型的另 一个概念是听觉掩蔽特性,意思是听觉阈值电平是自适应的,即听觉阈值电平 会随着听到的频率不同的声音而发生变化。 2 2 1 2 1 人类听觉模型 心理声学模型是人类听觉系统掩蔽行为的一个数学模型。生理学实验表明, 一个纯音可以被以它为中心频率,并且具有一定频带宽度的连续噪音所掩蔽, 如果在这一频带内噪声的功率等于该纯音的功率,这时该纯音处于刚能被听到 的临界状态,这一带宽即为临界带宽。临界频带是一种频域心理声学或音质测 度,反映了人耳的频率选择性。单位是巴克( b a r k ) ,表示一种非线性频率尺度, 与耳蜗基底膜中的一段物理距离相联系,表达了可分辨被掩蔽音频信号的最小 带宽。临界频带的分类情况见附录a 。 1 0 西华大学硕士学位论文 2 2 1 2 2 人类听觉特性 ( 1 ) 人的听觉具有掩蔽效应。掩蔽效应是指当两个响度不等的声音作用于人 耳时,响度较高的频率成分的存在会影响到响度较低的频率成分的感受,使其 变得不易察觉。利用掩蔽效应可以用有用声音信号掩蔽的无用声音信号。一般 来说,低音容易掩蔽高音,而高音掩蔽低音较难。掩蔽会造成因一个声音的存 在,而使另一个声音的听觉阈值上升。图2 6 为人耳听觉掩蔽曲线,由于a 频带 音频信号的能量远大于相邻频带的音频信号,因此在掩蔽曲线之下的其它频带 信号都被掩蔽起来,即使其能量己超越人耳绝对阈值曲线仍然无法被人耳察觉。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5《自己的事情自己做》 教学设计-2024-2025学年心理健康(1、2年级)粤教版
- 23月迹(教学设计)-2024-2025学年统编版语文五年级上册
- 九年级化学上册 3.2 溶液组成的定量表示教学设计1 (新版)鲁教版
- 2023六年级英语下册 Unit 3 Who's That Man第1课时教学设计 陕旅版(三起)
- 2023九年级数学上册 第2章 一元二次方程2.1 一元二次方程教学设计 (新版)湘教版
- 18 文言文二则 囊萤夜读(教学设计)-2023-2024学年统编版语文四年级下册
- 清洁安全培训
- Unit 4 school days further study教学设计 -2024-2025学年译林版七年级英语上册
- Unit 5 The colourful world Part A Letters and sounds大单元整体教学设计表格式-2024-2025学年人教PEP版(2024)英语三年级上册
- 《第三单元 欣赏 春江花月夜》教学设计 -2023-2024学年初中音乐人教版七年级下册
- 《明清家居家具设计》课件
- 2-山东工业技师学院申报国家级高技能人才培训基地项目申报书
- GA/T 2144-2024法庭科学涉火案件常见助燃剂及其残留物检验技术导则
- 常用消毒剂的分类、配制及使用课件演示幻灯片
- GB 45069-2024悬崖秋千安全技术要求
- 员工反恐怖协议
- 《合规管理培训》课件
- 2021年4月17日江苏事业单位考试《综合知识和能力素质》(管理岗客观题)
- 计算与人工智能概论(湖南大学)知到智慧树章节答案
- 《临床技术操作规范-放射医学检查技术分册》
- 骨盆骨折治疗新进展
评论
0/150
提交评论