(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf_第1页
(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf_第2页
(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf_第3页
(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf_第4页
(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(信号与信息处理专业论文)基于qr分解的数字音频水印方法研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 随着数字网络化及多媒体技术的迅速发展和广泛应用,i n t e m e t 逐渐成为人们获取 多媒体信息的重要来源。如何实施网络环境下的版权保护和信息安全,已经成为数字通 信中亟待解决的问题之一。数字水印技术作为解决这一问题的有效途径开始引起人们的 普遍关注,它通过在原始数据中嵌入能够标识作者身份的信息来证实数据的所有权或完 整性。随着数字音频压缩技术的成熟,以m p 3 为代表的音乐制品在网络上广泛传播, 数字音频水印技术也随之发展起来。数字音频水印技术通过将代表作者信息的图像、签 名或者是作品的序列号等信息嵌入到音乐制品中,达到了版权保护的目的。 本论文针对数字音频产品的版权保护、内容完整性认证等问题展开研究,给出了三 种基于q r 分解的数字音频水印方法。首先,阐述了课题提出的意义和研究背景,分析 了相关概念及特性,回顾了几种典型的方法。其次,介绍了本论文中用到的基本理论知 识。最后,针对不同目的,利用q r 分解过程的稳定性,给出了三种基于q r 分解的数 字音频水印方法。首先,以独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 算法为 基础,给出了一种基于q r 分解和提升小波的数字音频水印方法。其次,针对目前许多 领域中需要同时对数字媒体进行版权保护和内容完整性认证的需求,给出了一种基于 q r 分解和i c a 的多目的数字音频水印方法。该方法解决了多数多目的水印算法中需要 考虑水印嵌入和提取顺序的问题,并且鲁棒水印信息为多比特信息;脆弱水印可以实现一 内容完整性认证。最后,针对采用瞬时混合模型进行水印嵌入的方法需要保留密钥长的 问题,提出了一种基于q r 分解和抖动量化的数字音频水印方法,该方法对常规信号处 理攻击具有较好的鲁棒性。 实验结果表明,三种方法均能满足音频水印技术对透明性、鲁棒性和安全性的要求; 从隐秘音频信号中分离水印信号时不需要宿主信号的参与;鲁棒水印都属于多比特水 印,结果直观可信。 关键词:数字音频水印;q r 分解;独立分量分析;抖动量化 大连理工大学硕士学位论文 s t u d ya n di m p l e m e n t a t i o no fd i g i t a la u d i o w a t e r m a r km e t h o db a s e do n q rd e c o m p o s i t i o n a b s t r a c t a st h ed e v e l o p m e n ta n da p p l i c a t i o no fc o m p u t e r sa n di m e m e t ,m u l t i m e d i ad a t ah a s b e c o m ea ni m p o r t a n tw a yf o ri n f o r m a t i o na c q u i r e m e n t h o wt oc a r r yo u tc o p y r i g h tp r o t e c t i o n a n de n s u r et h es e c u r i t yo ft h ei n f o r m a t i o nh a sb e c o m eo n eo ft h eu r g e n tp r o b l e m st ob es o l v e d i nd i g i t a lc o m m u n i c a t i o n a sa ne f f e c t i v ew a yt os o l v et h i sp r o b l e m ,d i g i t a lw a t e r m a r k t e c h n i q u eh a sa t t r a c t e dm a n ya t t e n t i o n s d i g i t a lw a t e r m a r k i n gi sas c h e m et oi n s e r ts o m e i n f o r m a t i o nt h a tc a nr e p r e s e n tt h ea u t h o r si d e n t i t yi n t ot h eo r i g i n a ld a t a , t ov e r i f yt h e p r o p e r t yo rt h ei n t e g r i t yo ft h e m a sd i g i t a la u d i oc o m p r e s s i o nt e c h n i q u ei sm o r ea n dm o r e m a t u r e m u s i cp r o d u c t sl i k em p 3i sw i d e l ys p r e a do nt h ei n t e m e t d i g i t a la u d i ow a t e r m a r k e m b e d si m a g ew h i c hi so nb e h a l fo ft h ea u t h o r s i n f o r m a t i o n , s i g n a t u r ea n di do fp r o d u c t s i n t om u s i cp r o d u c t st of u l f i l lc o p y r i g h tp r o t e c t i o n i nt h i sp a p e r ,t h r e ek i n d so fa u d i ow a t e r m a r kt e c h n i q u e sb a s e do nq rd e c o m p o s i t i o na r e d i s c u s s e d f i r s t l y 。t h em e a n i n go ft h et a s k ,t h er e s e a r c hb a c k g r o u n d ,a n dt h e r e l a t e dc o n e 印t s a n dc h a r a c t e r i s t i c sa r ei n t r o d u c e d s o m et y p i c a lm e t h o d sa r er e v i e w e da sw e l l s e c o n d l y , b a s i cb a c k g r o u n dk n o w l e d g er e l a t e di si n t r o d u c e d a f t e rt h a t ,c o n s i d e r i n gt h es t a b i l i t yo fq r d e c o m p o s i t i o n , t h r e e k i n d so fd i g i t a la u d i ow a t e r m a r k i n gm e t h o d s b a s e do nq r d e c o m p o s i t i o na r ep r o p o s e d 卫1 ei d e ao fi n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) i su t i l i z e d t or e a l i z eal i 衔n gw a v e l e td o m a i nm u l t i b i tr o b u s tw a t e r m a r k i n gs c h e m ei nt h ef i r s tm e t h o d a i ma tt h er e q u i r e m e n tf o rt h ea p p l i c a t i o nt h a tn e e d st op r o t e c tt h ec o p y r i g h ta n dc o n t e n t a u t h e n t i c a t i o no ft h em u l t i m e d i as i m u l t a n e o u s l y ,觚i c am u l t i p u r p o s ew a t e r m a r k i n gs c h e m e b a s e do nq rd e c o m p o s i t i o ni sg i v e ni nt h es e c o n dm e t h o d t h ee m b e d d i n go r d e ro fd i f f e r e n t w a t e r m a r k si sn ol o n g e ra ni s s u et ob ec o n s i d e r e d t h er o b u s tw a t e r m a r ki sm u l t i - b i ta n dt h e f r a g i l ew a t e r m a r kc a ng i v et h ea u t h e n t i c a t i o nr e s u l ta sw e l la st h et a m p e r e da r e a s 1 1 1 e t h i r d m e t h o d aw a t e r m a r k i n gs c h e m eb a s e do nb s s ,g i v e sas o l u t i o nt oo v e r c o m et h el e n g t h p r o b l e mo ft h ek e y a na u d i ow a t e r m a r k i n gs c h e m eb a s e do nq ra n dd i t h e rq u a n t i z a t i o ni s p r o p o s e d t 1 l i sm e t h o di sr o b u s ta g a i n s tc o m m o ns i g n a lp r o c e s s i n go p e r a t i o n s e x p e r i m e n t a lr e s u l t ss h o wt h a t ,a l lo ft h et h r e em e t h o d sc a ns a t i s f yt h er e q u i r e m e n t so f t r a n s p a r e n c y 。r o b u s t n e s sa n ds e c u r i t y ;舭w a t e r m a r ks i g n a l c a l lb ee x t r a c t e db l i n d l y ; a c c o r d i n gt ot h es t a b i l i z a t i o no fs i n g u l a rv a l u ed e c o m p o s i t i o nq rd e c o m p o s i t i o n 一i i i 基于q r 分解的数字音频水印方法研究与实现 k e yw o r d s :d i g i t a la u d i ow a t e r m a r k ;q rd e c o m p o s i t i o n ;i n d e p e n d e n tc o m p o n e n t a n a l y s i s ;d i t h e rq u a n t i z a t i o n i v 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 量盈凼扭鳖至翌逸查耸墨蓬丛盈蔓塞鲨 : 作者签名:兰丛逊鎏k 日期:型壁年j 三月j l 日 导师签名:羔堕z 垃 。 日期:篁年也月l 日 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目盔盔逊旦壑垦至堕查兰牢至丛盈亟室鲨 作者签名:盈猛鉴日期:丛年上月j l 日 大连理工大学硕士学位论文 1绪论 1 1 研究背景和选题意义 随着计算机多媒体技术的迅猛发展,人们可以方便地利用数字设备制作、处理和存 储图像、语音、文本和视频等信息媒体。与此同时,数字网络通信正在飞速地发展,使 得信息的发布和传输实现了“数字化和“网络化 。因此,数字媒体很容易借助i n t e m e t 被复制、处理、传播和公开。如何在网络环境中实施有效的版权保护1 1 ( c o p y r i g h t p r o t e c t i o n ) 和信息安全【2 捌( i i 怕m a t i o ns e c u r i t y ) 手段,已经引起了学术界和企业界的广泛 关注,数字水印技术在这种情况下应运而生。数字水印技术按照应用的载体大致分为图 像水印、视频水印和音频水印三大类,本文主要研究数字音频水印技术。 随着数字音频压缩技术的成熟,以m p 3 为代表的音乐制品在网络上广泛传播,数 字音频水印技术也随之发展起来并越来越为人们所重视;其应用也越来越广泛,主要包 括以下几个方面【4 】:版权保护渊、认证或篡改检钡l j 9 钔】、广播监控【1 4 1 、指纹鉴另l j 1 5 , 1 6 l 、 拷贝控制【1 7 】、标注以及隐秘通信【1 5 , 1 9 。 1 2 数字音频水印技术概述 1 2 1 数字音频水印技术的概念 数字音频水印技术是指在不影响原始音频质量的前提下,利用一定的算法向其中嵌 入用于版权保护或内容完整性检验的一些标志性信息。这些信息可以是具有特定意义的 信息,如:作者的序列号、公司标志或有特殊意义的文本等,可以用来识别音乐制品的 来源、版本、原作者、发行者、所有者以及合法使用者对数字音频产品的所有权:也可 以是不具有任何特定含义的字符串或随机数,用来证实待检测音频产品中水印的存在性 或完整性。 1 2 2 数字音频水印技术的基本模型 通常,数字音频水印技术【4 】包含三方面的内容:水印信息的生成、水印嵌入和水印 提取或检测。在实际应用中,水印信息的生成和水印嵌入通常作为一个部分,尤其是对 于水印的嵌入强度或水印的内容与宿主信号相关的情况。因此,不同的音频水印嵌入算 法之间的区别在于:水印信息的生成算法不同,或者水印嵌入或提取检测算法不同。图 1 1 示出了一般的数字音频水印系统的基本模型示意图。 基于q r 分解的数字音频水印方法研究与实现 图1 1 数字音频水印处理系统通用模型描述 f i g 1 1 t h ed e s c r i p t i o no fc o m m o nm o d e lo fd i g i t a la u d i ow a t e r m a r k i n gp r o c e s s i n gs y s t e m 1 2 3 数字音频水印技术的基本要求 对音频水印技术的要求 2 0 1 和其它水印系统类似,主要包括透明性、鲁棒性、安全性、 信息容量、复杂性及提取水印信号的错误率。 透明性是指含水印的音频制品与原始音频制品之间不存在感知上的差异,并且二者 经过相同的信号处理操作后也不应该存在感知差异;鲁棒性是指经过信号处理操作后, 仍能检测出水印信号的存在,除非该操作严重降低了载体音频作品的品质;安全性是指 建立在密钥管理的基础上,只有拥有密钥的用户才能够提取到正确的水印;信息容量是 指原始音频信号中可能嵌入的最大信息量;漏警概率是指水印明明存在,却检测不到水 印存在的概率;虚警概率是指水印根本不存在,却检测到水印存在的概率。 由上述讨论可知,随着应用环境的不同,对音频水印系统的要求也不同,通常需要 在各个要求之间相互折中,因此,水印设计者不应该仅仅局限于某个要求提出不切实际 的要求,而应该根据实际应用环境寻找合理的方案。 1 2 4 数字音频水印技术的分类 数字音频水印技术按照不同的标准可以分成很多种类别,具体的说,可进行如下所 述的分类:( 1 ) 按照嵌入信息的容量划分:1 比特水印和多比特水印;( 2 ) 按照水印嵌入的 位置划分:时域水印和变换域水印 2 1 - 2 5 】;( 3 ) 按照水印的嵌入过程是否可逆划分:对称水 印和非对称水印;( 4 ) 按照水印检测的方式划分:盲水印和非盲水印;( 5 ) 按照水印抗攻 击的能力划分:脆弱水印【9 。1 3 】、鲁棒水印【1 9 - 2 7 。 1 2 5 数字音频水印技术的评价标准 一般来讲,对数字音频水印技术评价标准【2 8 】大致分为主观和客观评价标准两类。 大连理工大学硕士学位论文 ( 1 ) 主观评价标准 主观评价法即主观测试法。最常用的主观测试法是主观平均判分m o s ( m e a n o p i n i o ns c o r e ,m o s ) 法,该方法需要招集若干实验者,由他们对隐秘音频信号的质量进 行评分,求出平均分数作为其评价结果。现在比较通用的标准是5 分制,各档次评分标 准如表1 1 所示。但是由于主观评价会受到测试者的背景知识、观测环境等其它因素的 限制和影响,评价结果的一致性较差,而且费时费力,因此在研究和开发阶段并不实用。 表1 1 音频信号质量评价标准 t a b 1 1 q u a l i t ye v a l u a t i o ns t a n d a r d sf o ra u d i os i g n a l ( 2 ) 客观评价标准 客观评价法即客观测度法。客观测度作为一个可以定量评价数字音频水印的标准, 在性能评价中占有十分重要的地位。通常情况下,可以对不同嵌入机制的音频水印算法 采用不同的客观度量方法,常用的客观评价方法有: 信噪比( s i 鲫l t o - n o i s er a t i o ,s n r ) 假设原始音频信号即宿主音频信号为s ( 刀) ,嵌入水印的音频信号即隐秘音频信号为 瓯( 玎) ,则信噪比( 单位为d b ) 表示为 s n r = 1 0 1 0 9 l o f 麓 其中,以为音频信号的采样点数,三为音频信号的总长度,且,l = l ,2 ,l 。 峰值信噪比( p e a ks i g n a l - t o - n o i s er a t i o ,p s n r ) 在宿主信号中嵌入水印信号之后,通过观察其峰值信噪比也可以定量地评价隐秘信 号的透明性。峰值信噪比的计算公式为: 一3 一 基于q r 分解的数字音频水印方法研究与实现 p s n r = 1 0 l o g l ( 1 2 ) 归一化相关系数( n o r m a l i z e dc o r r e l a t i o nc o e f f i c i e n t ,n c c ) 为了检验提取的水印信号与嵌入的水印信号之间的相似性,可以通过计算它们的归 化相关系数来判定。假设w ( m ,行) 与访( 册,以) 分别表示嵌入的水印信号和提取的水印信 号,m ,分别为水印信号的行数与列数,归一化相关系数的计算公式为 n c c = mn w ( m ,聆) 访( 朋,玎) ( 1 3 ) 归一化汉明距离( n o r m a l i z e dh a m m i n gd i s t a n c e ,n h d ) 对于水印信号为二进制序列的情况,也可以通过计算提取的水印信号与嵌入的水印 信号之间的归一化汉明距离来检测其相似性。计算公式为 彻= l - w ( 聊,甩) o 协( 聊,即) (14)m x n 鲁智、叫 、叫r 7 其中,“o 表示异或操作。 误码率( b i te r r o rr a t e ,b e r ) 为了检测提取的水印信号与嵌入的水印信号之间的错误率,可以通过计算它们的误 码率来判定。其中,b e r 单位为百分比( ) 。 + 脚= 竽警川。 n 5 , 1 2 6 数字音频水印技术的发展概况 数字音频水印技术是2 0 世纪9 0 年代发展起来的一门新兴技术,至今已经历了十几年 的发展,出现了多种算法。下面将从时域和变换域两个角度,分别介绍典型的时域水印 算法一回声隐藏法和频域水印算法一相位法。 一4 一 一炉 心吖一 聆一翻(一 2 一 盟脚 鉴一“盟 丁脚 大连理工大学硕士学位论文 ( 1 ) 回声隐藏算法 回声隐藏法【2 9 1 是一种有效的水印嵌入方法,它通过在宿主音频信号的时域中加入回 声来嵌入水印信息,利用回声的不同延时表示水印不同的比特信息。该方法有许多显著 的优点:第一,嵌入操作简单,易于实现;第二,一般不会引起明显的噪声;第三,可 以实现粗糙同步;第四,可以实现盲检测。 同时,该方法也存在一些缺点:由于自然界中许多声音本身就带有回声,这会大大 地增加虚警概率。另外,该方法在检测时利用了倒谱技术,检测过程的计算量较大。最 早提出的回声隐藏方法的核心表达式为: 厅( 刀) = 万( 刀) + 口艿( 拧一d ) ( 1 6 ) y ( n ) = 办( 刀) x ( 刀) ( 1 7 ) 其中,x ( 玎) 代表宿主音频信号,y ( 行) 代表隐秘音频信号,代表卷积操作,d 代表 回声延时的偏移量,其大小必须经过反复实验获得,以期获得更好的透明性。一般的回 声掩蔽方法如图1 2 所示。 ( 2 ) 相位法 相位法 3 0 1 利用了人类听觉系统对声音的绝对相位不敏感以及对相对相位敏感的特 性,使用代表水印信息的参考相位替换原始音频段的绝对相位,并对其它的音频段进行 调整,以保持各段之间的相对相位不变。 相位编码的过程按照如下步骤进行: 步骤l ;将音频序列分割成等长度小段; 步骤2 :提取出第一段,对它作d f t ,计算相位值; 步骤3 :根据水印序列修改相位; 步骤4 :进行i d f t 生成含有水印的音频信号。 解码时,首先要获得含水印音频信号的同步信息,信号段的长度、d f t 变换点数都 应该为解码方所了解。具体说来,解码过程分以下三步骤: 步骤1 :在已知发送方信号段长度的情况下,将接收到的音频信号分段; 步骤2 :提取出第一段,对它作d f t ,计算相位值; 步骤3 :根据相应的阈值,对相位值进行检测,得n o 或1 ,构成水印序列。 基于q r 分解的数字音频水印方法研究与实现 原始音频信号 t i m e 图1 2 一般的回声隐藏方法示意图 f i g 1 2 s k e t c hm a pf o rr e g u l a rm e t h o df o re c h o h i d i n g d f t 的相位成分比振幅成分对人类的感知有更大的影响,因此,若在相位成分中引 入带有较高冗余度的水印,为了移去水印,恶意的攻击者将会给音频信号的质量带来令 人无法接受的破坏。相位法的缺点是对绝大多数音频压缩算法敏感。 1 3 本论文的主要研究内容和章节安排 本论文针对数字音频产品的版权保护和内容完整性认证等问题展开研究,给出了三 种基于q r 分解的数字音频水印方法。具体章节安排如下: 第1 章对数字音频水印技术进行了概述。 第2 章介绍了文中涉及的一些基础知识和基本原理。首先,简要地介绍了音频信号 的特点,人耳听觉系统的感知特性。其次,简要地介绍了盲源分离的基本思想,以及解 决盲源分离问题的常用算法:独立分量分析。最后,对离散小波变换、提升小波及q r 分解进行了简要介绍。 第3 章给出了一种基于q r 分解和提升小波的数字音频水印方法。该方法利用盲源 分离的理论实现了盲提取,并实现了版权的目的。同时给出了一组第一代小波与第二代 小波的对比实验。 第4 章一种基于q r 分解和i c a 的多目的数字音频水印方法。该方法利用q r 分解 生成脆弱水印,并利用脆弱水印加密鲁棒水印。通过在音频信号中同时嵌入鲁棒和脆弱 水印来实现音频信号的版权保护和内容完整性认证。 第5 章给出了一种基于q r 分解和抖动量化的数字音频水印方法。该方法抖动量化 r 分量最大值,利用最小距离判决实现水印提取,同时给出了一组抖动量化s v d 最大 奇异值与抖动量化r 分量最大值的对比实验。 第6 章对全文进行了总结并对数字音频水印技术今后的发展前景进行了展望。 大连理工大学硕士学位论文 2 基础知识和基本原理概述 2 1 数字音频信号的表示 与图像水印技术相比,音频水印技术难度较大,这主要是因为人类听觉系统与视觉 系用相比,具有更高的灵敏度。人类听觉系统能感知到的动态范围大于1 5 0 d b ,而听觉 能够感知到音频信号中低于周围环境8 0 d b 的扰动。虽然听觉系统的动态范围很大,但 是利用听觉系统的其他特性,仍能在音频信号中嵌入水印,例如,利用听觉系统的掩蔽 效应、绝对相位不敏感等特性来嵌入水印。 对大多数的数字音频信号表示有两个重要参数:采样量化精度和瞬态采样率。采样 精度位数的大小影响到声音质量,位数越多,音频质量越高,而需要的存储空间也越多: 位数越少,音频质量越低,需要的存储空间越少。采样率是指声音信号在从模拟信号转 换成数字信号过程中单位时间内采样的次数。 高质量的数字音频信号最流行的描述样本格式是1 6 b i t s 线性量化,如w i n d o w s 可视 音频格式( w i n d o w sa u d i ov i s u a l ,w a v ) 和音频交换文件格式( a u d i oi n t e r c h a n g ef i l e f o r m a t ,a i f f ) 。对较低质量音频信号格式是采用8 b i t s “律或a 律的非线性量化方式。 这些量化方法使信号产生了一些畸变,在8 b i t s g 律中显得更为明显。 音频信号的采样率一般为8 k h z 、9 6 k h z 、1 0 k h z 、1 2 k h z 、1 6 k h z 、2 2 0 5 k h z 和4 4 1 k h z 。 采样率影响数据隐藏量,因为它给出了可用频谱的上限,假设信号的采样频率为8 k h z , 则引入的修改分量的频率不会超过4 k h z 。 本文实现的数字音频水印方法将数字水印嵌入在w a v 文件的p c m 数据中。 2 2 盲源分离及独立分量分析简介 2 2 1 盲源分离简介 近年来,盲源分离已经成为信号处理学界和神经网络学界共同感兴趣的研究热点, 并获得了迅速的发展。 盲源分离【3 l 】需要解决的问题是在源信号和混合矩阵均为未知的情况下,仅依靠观测 信号提供的信息确定一个变换,以恢复出各路源信号。盲源分离的核心问题是分离( 解 混合) 矩阵的学习算法,它属于无监督学习,基本思想是抽取统计独立的特征作为输入, 而又不会丢失信息。当混合模型为非线性时,一般无法从混合数据中恢复出源信号,除 非对信号和混合模型有进一步的先验知识可以利用。因此,本论文中只讨论线性混合模 型的情况。盲源分离可以用如下混合方程描述 基于q r 分解的数字音频水印方法研究与实现 x = a s ( 2 1 ) 式( 2 1 ) 所描述的内容是刀维源向量s = 【置,屯,】1 经过一个所聆维的混合矩阵a 进行线性变换,得到肌维观测向量x = h ,x 2 ,】1 。盲源分离的目的是要在a 和s 均 为未知的情况下确定一个解混合矩阵w ,使得 y = w x( 2 2 ) 其中,y 为源信号s 的估计值,并且y 中的各个分量咒均尽可能相互独立。 实现盲源分离的算法可以分为三大类: ( 1 ) 信号经过变换后,使不同信号分量之间的相依性最小化,这种方法称为独立分 量分析【3 2 1 ,由c o m o n 于1 9 9 5 年提出。 ( 2 ) 利用非线性传递函数对输出进行变换,使输出分布包含在一个有限的超立方体 中,然后熵的最大化将迫使输出尽可能在超立方体中均匀散布,这类方法称为熵最大化 方法【3 3 1 。 ( 3 ) 非线性主分量分析【3 4 1 ,它是线性主分量分析方法的推广。 在本文中,使用独立分量分析作为解决盲源分离问题的算法,来实现数字音频水印 技术中水印的盲检测和盲提取。 2 2 2 独立分量分析简介 i c a 是用来解决盲源分离问题的常用方法,其关键问题是对向量y 要确定一个对比 函数,选用不同的对比函数可以得到不同的i c a 算法。下面列出了几种典型的i c a 算 法:随机梯度算法【3 4 1 ,自然梯度算法【3 5 1 ,借助独立性等变化的自适应分离算法【3 6 】和固 定点算法【3 7 】等。其中前三种算法只适合于亚高斯信号或超高斯信号单独存在的情况,而 在本文中有待分离的音频信号为超高斯信号,水印信号为亚高斯信号,故本文采用固定 点算法。 固定点算法册( 也称为f a s t l c a 算法) 是一种离线算法,在无需自适应分离的情况下, 它是一种快速的、数值稳定的算法。该算法的对比函数为 j g ( w ) = e g ( w t x ) - e g ( v ) 玎 ( 2 3 ) 其中,g ( - ) 是一任意非二次型函数,是服从( o ,1 ) 分布的高斯随机变量,w 为一 权向量,函数g ( ) 有三种选择 大连理工大学硕士学位论文 ( 2 4 一a ) ( 2 4 - b ) 卜) = 三矿( 2 4 - c ) i 9 3u ) - - - - u 3 一 其中,当亚高斯信号和超高斯信号并存时选用g 。( ) ;当独立的源信号为峰度值很 大的超高斯信号或数值稳定性非常重要时一般选用g :( ) ;分离亚高斯信号时选用 1 3 ,( ) 。本文中需要分离亚高斯信号和超高斯信号,因此,对比函数选用g ,( ) 。这里, 解混合矩阵w 的求解可以转化为式( 2 5 ) 描述的优化问题 目标函数: 一阻s = l ( w ,) ) ( 2 5 - a ) j 约束条件: e ) 伸t ) = 甄= 三拦 ( 2 s - b ) 为了减少迭代过程的计算量,需要先将观测向量x 进行白化处理,即令e 酲t = i 。 然后,按照下列步骤进行迭代,依次求出解混合矩阵w 的各个分量: ( 1 ) 按照下列迭代算法求出第一个独立的分量 j w := e x l _ j x ) ) 一e x g ( w j x ) w - ( 2 6 ) 【w = w :l l w + i | 一 一9 一 s、j s d 卧 ,h哪辽 k h。一q叫 = 引 垆卜 g & 2 甜 2 吨v ,ji 2“呸 一 。一吒却吒唧 = 钆 沪卜 o 0 2g & 基于q r 分解的数字音频水印方法研究与实现 w := w l - 川, u i y e g ( w 坍加胙 x g ,( w 阱明 ( 2 7 ) 【w := w 圳w :| 0 一 其中,= e w j x g ( w t x ) 。在改进算法中,当= 1 时,它等同于式( 2 6 ) ,为牛顿 最优化算法;当 1 时,对应于梯度下降法。按照式( 2 6 ) 或式( 2 7 ) 进行迭代计算达到收 敛后,即得到了解混合矩阵w 中的第一个独立分量w ,; ( 2 ) 用不同的初值按照步骤的方法迭代计算,得到第二个独立分量w 2 ,并且对w , 和w :进行去相关运算 ( 3 ) 最后,按照下列迭代公式计算出所有独立分量,并且一一进行去相关运算 ( 2 9 ) 该算法的核心是式( 2 9 ) 中执行的压缩映射,在i c a 算法中运用压缩映射技术逐个分 离信号的思想最早由文献p 2 给出。在求出解混合矩阵w 之后,利用式( 2 2 ) 即可求出源 向量的估计值。 综上所述,i c a 算法可以在完全统计学意义下由一个多维的观测信号估计出具有相 互独立成分的信号,其目的是以最少的源信号和混合矩阵的知识来获得解混合矩阵,从 而恢复出源信号所有的独立分量。 2 3 离散小波变换 小波变换是一种新型的信号处理技术,尤其适用于对音频这样的非平稳信号进行分 析和处理。与短时傅立叶变换( s t f t ) 对所有频率提供均匀的时间分辨率不同,小波变换 有效地克服了s t f t 在处理非平稳信号时的这种局限性,提供了很好的局部化特性,它 既可在时域,也可在频域局部化定位观测,对高频提供高的时间分辨率和低的频率分辨 率,对低频提供低的时间分辨率和高的频率分辨率,这种方式与人耳的听觉分辨特性很 类似。 一l o 一 鬻一 2 2 w w = = 2 z w w ,【 ww 一 计 t 川 一一 w p p艺一厄一 胪 肚 w w = = 肿 “ w w 大连理工大学硕士学位论文 一维离散小波变换将信号分解为逼近分量( 低频分量) 和细节分量( 高频分量) ,逼近 分量又进一步被分解为逼近分量和细节分量。具体分解层数k ,视信号长度三和具体应 用而定。 应用m a l l a t 塔式算法,小波分解可以表示为 工 x k + l ( 以) = 瞄,( 2 n z ) ( 2 1 0 ) i = 1 d “1 ( 以) = 砰工( 2 刀一,) ( 2 11 ) i - ! 其中,露= 1 ,2 ,k ,矿( 刀) 为小波逼近分量系数,d ( 刀) 为小波细节分量系数, 妒( 玎) = x ( 甩) ,瑶和硝分别为高通和低通滤波器系数。每个子带包含的样本数是其父带 样本数的一半。小波变换后信号的能量主要集中在逼近分量,细节分量所占的能量很少。 小波重构是分解的逆过程,可以用式( 2 1 2 ) 来表达 i i x k - i ( 刀) = 爵x 毒( 2 0 一z ) + g ;d k ( 2 n 一7 ) ( 2 1 2 ) i = 11 = 1 小波分解具有多种可以选择的小波基,几种常用的基本小波【3 8 】包括:( 1 ) m o r l e t 小波; ( 2 ) m a r r 小波;( 3 ) d o g 小波;( 4 ) h a a r 小波:( 5 ) 样条小波;( 6 ) d a u b e c h i e s 小波。 2 4 提升小波变换 , 第一代小波是通过对一个固定的母小波进行伸缩和平移构造小波和尺度的函数,提 升格式的出现为小波和尺度构造的研究提供了一个崭新的角度,摒弃第一代小波构造依 靠f o u r i e r 变换的特点,直接从空间的结构上来构造时变精确的重构滤波器组。基于提 升格式的小波变换称为第二代小波变换。 提升小波变换【3 9 j 的基本思想是基于欧几里德算法,将小波变换分解成提升的形式, 并通过对每一步提升所产生的浮点数取整,实现整型变换。小波提升分解过程如图2 1 所示,它包括三个步骤:分裂( s p l i 0 、预;澳t j ( p r e d i c t ) 和更新( u p d a t e ) 。 分裂,是将原始信号按不同的采样格式分为两个序列;预测,是利用偶数序列预测 奇数序列;更新,是利用预测的残差值去更新原始的偶数序列。提升方法的重构过程是 分解过程的逆过程。 基于q r 分解的数字音频水印方法研究与实现 图2 1 小波提升分解过程 f i g 2 1 t h ew a v e l e tl i f t i n gd e c o m p o s ep r o c e d u r e 2 5q r 分解 q r 分解h 四是一种线性代数工具。一个非奇异矩阵a c 揪”( 所行) 的q r 分解可以 表示为 a :q r :q i r 2 2 f 吒l 嘞 ( 2 1 3 ) 其中,q c 删m 为正交矩阵,即q h q = i 册,r c 为上三角矩阵。且分解唯一, 由于正交矩阵是性态最好的矩阵。因此,q r 分解具有数值稳定性。 打 开 晰; 大连理工大学硕士学位论文 3 基于q r 分解和提升小波的数字音频水印方法 3 1引言 目前,对于小波变换的研究已经成为热点,随着第二代小波【4 1 】的发展。将提升小波 与数字水印技术的融合也越来越受到关注。大多数的文献中利用提升小波实现内容的真 实性验证,将提升小波与水印技术相结合,达到内容完整性认真的目的。 本文给出一种利用提升小波实现版权保护的鲁棒音频水印技术,借助q r 分解的稳 定性,以及提升小波计算速度快等的优良特性,给出一种基于q r 分解和提升小波变换 的盲鲁棒数字音频水印方法,从而实现版权保护的目的。为了保护原始二值水印图像的 安全,利用混沌序列对其进行扩频,生成了待嵌入的水印信号。利用线性瞬时混合模型 进行嵌入水印,对原始宿主音频信号升维后进行q r 分解,对r 分量第一行进行提升小 波分解,将得到的逼近分量作为选定的另一路源信号。水印提取时,利用i c a 实现盲提 取。 提升小波是第二代小波,为了说明本文方法有较强的鲁棒性,另外给出了一种基于 q r 分解和离散小波的第一代小波数字音频水印方法。实验结果表明,本文方法不仅能 够实现水印的盲提取,且第二代小波优于第一代小波具有较高的鲁棒性。 3 2 水印信号生成及嵌入 基于q r 分解和提升小波的鲁棒音频水印方法嵌入原理框图如图3 1 所示。它由嵌 入水印信号生成、系数选取和水印信号的嵌入三个模块组成。 _ 线性 提升 砷 瞬时 斗小波 灌合 重构 呻 缸弘 _ 1 l ! 挲_ 水印信号嵌川 水印信号生成 k e y , 图3 1 水印嵌入原理框图 f i g 3 1 t h eb l o c kd i a g r a mo f w a t e r m a r ke m b e d d i n g 基于q r 分解的数字音频水印方法研究与实现 3 2 1 水印信号生成 为了保护原始二值水印图像的安全,文中采用混沌序列对其进行扩频处理。 混沌现象是在非线性动力系统中出现的确定性的和类似随机的过程,这种过程既非 周期又不收敛。一类非常简单却被广泛研究的动力系统是l o g i s t i c 映射b 引,定义如下 龟+ 1 = q ( 1 - c k ) ,靠( o ,1 ) ,j ( 0 , 4 】 ( 3 1 ) 其中,j 为控制参数,c 0 为初值。当混沌映射参数满足3 5 6 9 9 4 5 6 z 4 时,该映 射工作于混沌状态。混沌序列具有对参数和敏感的特点。 设原始二值水印图像为w = w ( m ,刀) ,m = l ,2 ,m ;n = l ,2 ,n ,其中w ( m ,刀) 表 示第m 行、第刀列像素的灰度值,m 和分别为水印图像的行数和列数。在进行水印 嵌入之前对原始水印图像进行如下预处理,生成待嵌入的水印信号。 首先,将对原始水印图像降维为一维序列,并将其元素的值映射为 一l ,1 序列。然 后,利用式( 3 1 ) 生成一个与该序列等长的混沌序列,以它自身均值为阈值将其映射为j 个f 一1 ,l 序列。最后,用该序列对降维后的一维图像序列利用扩频技术进行加密处理, 即可以生成待嵌入的水印信号丽= 品( 后) ,k = 1 ,2 ,m n 。生成混沌序列的初值c 0 作 为密钥慨保留。 3 2 2 系数选取 考虑到q r 分解具有良好的稳定性,本文选取系数方法与以往不同,是建立在q r 分解基础之上。 对宿主音频信号升维后进行q r 分解,利用r 分量是上三角矩阵且第一行为非零元 素的特点,选定r 分量的第一行做进一步的操作,对其进行提升小波分解,选择分解之 后得到的逼近分量,即得到了待嵌入的系数作为一路源信号。最后,利用线性瞬时混合 模型进行水印信号的嵌入。 设宿主音频信号为s = s ( 七) ,k = 1 ,2 ,l ,其中l 表示宿主音频信号的长度,则系 数选取的详细过程如下所示。 首先,将一维宿主音频信号s 升维,得到如下所示的二维信号 s 2 = 是( f ,j f ) ,忙l ,2 ,m 2 ;j = l ,2 ,2 ( 3 2 ) 其中,鸩和2 的计算如式( 3 3 ) 所示 大连理工大学硕士学位论文 , 三 朋,= 2 2 n 2 = m x n x 2 。 其中,表示提升小波分解的级数。 其次,将得到的二维信号s :进行q r 分解,如式( 3 4 ) s 2 ,( 鸩,) 2q ( m 2 捣) 。r ( 也,奶) ( 3 3 一a ) ( 3 3 一” ( 3 4 ) 其中,q ( m ,虬) 表示一个大小为m 2 x m 2 的正交矩阵,r m ) 表示一个大小为 鸠2 的上三角矩阵。 最后,选择r ( m 2 , n 2 ) 矩阵的第一行进行,级提升小波分解,选用h a m 小波。可得到 一个逼近分量和一个细节分量,本文选用逼近分量作为待嵌入水印的小波系数,记为 蚕= ;( 七) ,k = l 州2 一,三 。 3 2 3 水印信号嵌入 将选定的小波系数季和待嵌入的水印信号丽利用线性瞬时混合模型进行水印信号 的嵌入,嵌入过程如下式所示 ( s w z s w l ) = s w = a s = ( a a n 跚割 5 , 其中,a 为满秩的混合矩阵。为了保证隐秘音频信号的透明性,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论