音频数字水印技术_第1页
音频数字水印技术_第2页
音频数字水印技术_第3页
音频数字水印技术_第4页
音频数字水印技术_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

音频数字水印技术第一页,共一百零八页,编辑于2023年,星期四6.1概述

6.1.1音频信号的数字化音频信号的数字化是指对模拟的声音信号进行A/D转换,使其转化为数字信号。这个过程有两个重要的参数:量化精度和瞬态采样频率。第二页,共一百零八页,编辑于2023年,星期四对高质量音频的量化方式最流行的格式是16bit线性量化,如Windows可视音频格式(WAV)和音频交换文件格式(AIFF)。另一种较低质量音频的量化方式一般采用8bitμ律量化。这些量化方法会使信号产生一些畸变,在8bitμ律量化中显得更为明显。第三页,共一百零八页,编辑于2023年,星期四

6.1.2音频信号传送环境在实践中,含有水印的音频信号从编码到解码之间有多种可能的传播途径。这里,我们仅考虑最普通的四种情形。第一种情形是声音文件从一个机器拷贝到另一个机器,其中没有任何形式的改变。第二种情形是信号仍然保持数字的形式,但采样率发生变化。第四页,共一百零八页,编辑于2023年,星期四第三种情形是信号被转换为模拟形式,通过模拟线路进行传播,在终端被重新采样。第五页,共一百零八页,编辑于2023年,星期四

6.1.3对音频数字水印的要求要想成功地在数字音频媒体中隐藏水印,必须注意以下几方面的要求。

1.对数据变换处理操作的稳健性要求水印本身应能经受得住各种有意无意的攻击。典型的攻击有添加噪声、数据压缩、滤波、重采样、A/D-D/A转换、统计攻击等。第六页,共一百零八页,编辑于2023年,星期四

2.听觉相似性数字水印是在音频载体对象中嵌入一定数量的掩蔽信息,为使得第三方不易察觉这种嵌入信息,需谨慎选择嵌入方法,使嵌入信息前后不产生听觉可感知的变化。

3.是否需要原始数据进行信息提取根据数据嵌入和提取方案的不同设计,有些方案可以不需要借助于原始数据进行信息提取,这一性能将影响方案的用途和性能。第七页,共一百零八页,编辑于2023年,星期四

4.数据提取误码率数据提取误码率也是音频水印方案中的一个重要技术指标,因为一方面存在来自物理空间的干扰,另一方面信道中传输的信号会发生衰减和畸变,再加上人为的数据变换和攻击,都会使数据提取的误码率增加。

5.嵌入数据量指标根据用途的不同,在有些应用场合中必须保证一定的嵌入数据量,如利用音频载体进行隐蔽通信。第八页,共一百零八页,编辑于2023年,星期四

6.1.4数字音频水印系统的典型应用随着音频素材在互联网上的指数级增加,数字音频水印技术有着广泛的应用前景:

(1)为了便于对音频素材进行查找和检索,可以用水印技术实现元数据(描述数据的数据)的传输,就是用兼容的隐藏的带内方式传送描述性信息。第九页,共一百零八页,编辑于2023年,星期四

(2)在广播领域中,可以用水印技术执行自动的任务,比如广播节目类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等。其优点是不依赖于特定的频段。

(3)用水印技术实现知识产权的保护,包括所有权的证明、访问控制、追踪非法拷贝等。这也是水印技术最初的出发点。第十页,共一百零八页,编辑于2023年,星期四6.2人类听觉特性频域掩蔽算法的具体实现步骤如下:

(1)计算频谱。对每16ms的信号s(n),其采样点数N=512,用Hamming窗h(n)进行加窗处理(6-1)第十一页,共一百零八页,编辑于2023年,星期四s(n)的功率谱由下式得到(6-2)第十二页,共一百零八页,编辑于2023年,星期四

(2)确定纯音和噪音成分。这样做是因为纯音和噪音的掩蔽模型不同。如果某个频谱成分的局部极大值(S(k)>S(k+1)且S(k)≥S(k-1)),满足下式:

S(k)-S(k+j)≥7dB

j∈{-2,+2},if2<k<63

j∈{-3,-2,+2,+3},if63≤k<127(6-3)j∈{-6,-5,…,-2,+2,…,+5,+6},if127≤k≤250

则该成分是纯音。(6-4)第十三页,共一百零八页,编辑于2023年,星期四

(3)去除被掩蔽成分,分为以下两步:①根据如图6-1所示的绝对听阈曲线,把在绝对听阈以下的纯音和噪音成分去除。②对相互间隔小于0.5Bark的多个纯音成分只保留其中有最大值的那一个。第十四页,共一百零八页,编辑于2023年,星期四图6-1绝对听阈曲线图第十五页,共一百零八页,编辑于2023年,星期四

(4)计算局部掩蔽阈值与整体掩蔽阈值。对原始的N/2(即256)个频域采样点(用k代表),只有其中的一部分采样点(用i代表)被用来计算整体掩蔽阈值。层Ⅰ和层Ⅱ所用到的采样点不同。层Ⅰ:频带被划分为30个子带,最低频6个子带中所有采样点都用到,接下来的6个子带的采样点每2个用到1个,余下的18个子带的采样点每4个用到1个。第十六页,共一百零八页,编辑于2023年,星期四层Ⅱ:频带被划分为30个子带,最低频3个子带的所有采样点都用到,接下来的3个子带的采样点每2个用到1个,接下来的6个子带的采样点每4个用到1个,余下的18个子带的采样点每8个用到1个。共用到采样点132个。第十七页,共一百零八页,编辑于2023年,星期四

(5)掩蔽是可以叠加的,因而在z(i)处具有的总掩蔽阈值LTg(i)为z(i)处的安静时阈值LTq(i)和所有临

(6-8)第十八页,共一百零八页,编辑于2023年,星期四6.3时域音频水印算法

6.3.1最不重要位方法最不重要位方法是一种最简单的水印嵌入方法。任何形式的水印都可以转换成一串二进制码流,而音频文件的每一个采样数据也是用二进制数来表示。这样,可以将每一个采样值的最不重要位(多数情况下为最低位)用代表水印的二进制位替换,以达到在音频信号中嵌入水印的目的。第十九页,共一百零八页,编辑于2023年,星期四

6.3.2基于回声的水印算法利用回声嵌入水印的算法是一种经典的音频水印算法。它利用了人类听觉系统的另一特性:音频信号在时域的向后屏蔽作用,即弱信号在强信号消失之后变得无法听见。弱信号可以在强信号消失之后50~200ms的作用而不被人耳察觉。第二十页,共一百零八页,编辑于2023年,星期四设音频序列S={s(n),0≤n<N},按下式即可得到含有回声的音频序列Y:

y(n)=s(n),

0≤n<ms(n)+λs(n-m),m≤n<N(6-9)第二十一页,共一百零八页,编辑于2023年,星期四图6-2回声编码水印嵌入流程图第二十二页,共一百零八页,编辑于2023年,星期四在实际的应用中,为了提高水印嵌入的效率,Gruhl采取的方法如下:

(1)假设要嵌入的水印比特为“1011001”,先将整个音频信号分成如图6-3所示的7段。

(2)分别使用式(6-9),得到延时分别为m0和m1的两个含有回声的信号,如图6-4所示。

(3)构造“1”混合信号和“0”混合信号,如图6-5所示。第二十三页,共一百零八页,编辑于2023年,星期四图6-3将原始信号分为小段以嵌入数据第二十四页,共一百零八页,编辑于2023年,星期四图6-4产生“1”和“0”回声信号(用虚线表示)第二十五页,共一百零八页,编辑于2023年,星期四图6-5构造混合信号第二十六页,共一百零八页,编辑于2023年,星期四

(4)将延时为m0的信号和“0”

混合信号相乘,延时为m1的信号和“1”

混合信号相乘,最后将两个信号相加得到含水印信号。第二十七页,共一百零八页,编辑于2023年,星期四图6-6回声编码水印提取流程图第二十八页,共一百零八页,编辑于2023年,星期四回声水印的嵌入过程也可以看作音频信号和一个回声内核进行卷积,回声内核如图6-7所示。图中m是回声延时,λ是回声的衰减系数。第二十九页,共一百零八页,编辑于2023年,星期四图6-7回声内核第三十页,共一百零八页,编辑于2023年,星期四

6.3.3其他的时域水印方法虽然最不重要位方法有一些局限性,但由于时域水印算法运算速度快,因此除了对回声算法进行研究外,一些学者对时域的其他算法进行了深入研究,提出了一些新的算法。第三十一页,共一百零八页,编辑于2023年,星期四

Kim等认为将水印信号嵌入时域中每一个样点会使人耳产生感知,他们每间隔一定的距离(3~5个样点),通过修改样点的幅度值而嵌入水印。在水印检测时不需要原始音频信号,而是根据嵌入水印的样点附近的样点值估计该点的原始值,进而获得嵌入的水印。第三十二页,共一百零八页,编辑于2023年,星期四

Lie等提出的方法与Kim的方法类似,不同处是将每个比特的水印信号嵌入到一段音频信号中。具体算法如下所述。水印嵌入算法:将音频信号f(x)分段,每段长度为L。将任意相连的三段分别记为sec_1、sec_2和sec_3。每段的能量定义为:(6-10)第三十三页,共一百零八页,编辑于2023年,星期四其中xi表示sec_1的起始样点。将三段的能量按从大到小进行排列,重新表示为Emax、Emid和Emin。计算它们的能量差:

A=Emax-EmidB=Emid-Emin(6-11)第三十四页,共一百零八页,编辑于2023年,星期四

(1)当水印比特为1时,如果

A-B=Emax-2Emid+Emin≥(Emax+2Emid+Emin)·d,则不对信号修改;否则增加Emax或减小Emid,直至

A-B≥(Emax+2Emid+Emin)·d。

(2)当水印比特为0时,如果

B-A=2Emid-Emin-Emax≥(Emax+2Emid+Emin)·d,则不对信号修改;否则增加Emid或减小Emin,直至

B-A≥(Emax+2Emid+Emin)·d。第三十五页,共一百零八页,编辑于2023年,星期四图6-8使用三个相邻的样点段以嵌入水印示意图第三十六页,共一百零八页,编辑于2023年,星期四图6-9段边界处的渐变加权曲线第三十七页,共一百零八页,编辑于2023年,星期四6.4变换域音频水印算法

6.4.1相位水印算法相位水印算法利用人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印数据的参考相位替换原始音频段的绝对相位,并对其他的音频段进行调整,以保持各段之间的相对相位不变。相位编码的具体步骤如下:第三十八页,共一百零八页,编辑于2023年,星期四(1)设原始音频序列为

S={s(i),0≤i<L}

(6-13)将S分割成N个等长的小段

sn={sn(i),0≤n<N,0≤i<K}

(6-14)其中K=L/N。第三十九页,共一百零八页,编辑于2023年,星期四

(2)对第n段sn(i)进行K点的离散傅里叶变换(DFT)。生成相位矩阵φn(ωk)和幅度矩阵An(ωk)(0≤k<K)。

(3)计算并存储相邻段对应频点的相位差

Δφn+1(ωk)=φn+1(ωk)-φn(ωk)

(6-15)

其中0≤n≤N-1,0≤k<K。第四十页,共一百零八页,编辑于2023年,星期四

(4)设水印序列W={wk,0≤k<K),wk∈{0,1}。用下式定义wk所代表的相位值ifwk=1ifwk=0

(6-16)第四十一页,共一百零八页,编辑于2023年,星期四(5)对0<n<N,利用相位差重新产生相位矩阵:(6-17)第四十二页,共一百零八页,编辑于2023年,星期四

(6)利用修改的相位矩阵φ′n(ωk)和原始幅度矩阵An(ωk)(其中0≤n<N,0≤k<K)进行IDFT,生成含水印的音频信号。

第四十三页,共一百零八页,编辑于2023年,星期四水印解码时,首先要获得含水印音频信号的同步信息,信号段的长度、DFT变换点数都应该为解码方所了解。具体说来,解码过程分以下三步:

(1)在已知发送方信号段长度的情况下,将接收到的音频信号分段。

(2)提取出第一段,对它做DFT,计算相位值。

(3)根据相应的阈值,对相位值进行检测,得到0或1值,构成水印序列。第四十四页,共一百零八页,编辑于2023年,星期四

6.4.2扩频水印在通常的通信信道中,为保持有效的带宽和降低能量,总是需要把信息集中在尽可能窄的频谱范围内。另一方面,基本的频谱扩展技术是将编码数据分布到尽可能多的频谱中去,以便对信息流进行编码。第四十五页,共一百零八页,编辑于2023年,星期四使用DSSS方法的音频数字水印的例子,水印嵌入的步骤如下:

(1)设水印序列为P,其长度为L:P={pi,0<i≤L},pi∈{-1,+1}。

(2)设切普速率(ChipRate,扩频倍数)为cr,使用cr=C对P进行比特重复(过采样),形成调制信号:ck=pi,其中(i-1)·C+1≤k≤i·C。第四十六页,共一百零八页,编辑于2023年,星期四

(3)设有一个伪随机m序列,将m序列的元素由{0,1}映射为{+1,-1},得到新的序列M={mk,0<k≤L·C},mk∈{-1,+1},使用mk对调制信号ck扩频,生成扩频水印信号wk:wk=ck·mk,其中0<k≤L·C。

(4)设待嵌入水印的音频信号为S,其长度为L·C:S={sk,0<k≤L·C},利用下式得到嵌入水印后的信号:第四十七页,共一百零八页,编辑于2023年,星期四

6.4.3离散傅里叶变换域(DFT)方法

Tilki和Beex提出了一种DFT变换域音频水印嵌入算法,这种变换的频谱范围是0~8kHz。首先对音频信息进行DFT,然后选择其中频率范围为2.4~6.4kHz的DFT系数进行水印嵌入,并用表示水印序列的频谱分量来替换相应的DFT系数。第四十八页,共一百零八页,编辑于2023年,星期四

6.4.4离散余弦变换域(DCT)方法

YeWang[14]提出了在时域对信号进行序列变换,在频域加入水印的方法。他首先根据伪随机序列重新排列音频采样信号,然后对序列进行修正离散余弦变换(MDCT,ModifiedDiscreteCosineTransform),通过对MDCT的系数进行改变以嵌入水印,然后再进行逆变换得到嵌入水印后的音频序列。使用的MDCT公式为

(6-18)第四十九页,共一百零八页,编辑于2023年,星期四逆变换为

(6-19)第五十页,共一百零八页,编辑于2023年,星期四

1.线性移位寄存器如图6-10所示的n级线性移位寄存器电路,每级寄存器可取0或1这两个状态之一,各级寄存器抽头,即乘法器系数ci=0或ci=1,但cn=1。设移位寄存器的初始状态为(an-1,an-2,…,a1,a0),它对应的十进制数为s1,当加上一个移位脉冲时,每一级的内容右移给下一级,最末一级即第n级的内容a0就是输出,同时n个寄存器中的内容按图中的连线送至模2加法器中,运算后反馈到第一级中去,第五十一页,共一百零八页,编辑于2023年,星期四于是经过一次移位以后移位寄存器的内容变为(an,an-1,…,a2,a1),它对应的十进制数为s2,其中an满足关系式

(6-20)第五十二页,共一百零八页,编辑于2023年,星期四图6-10n级线性移位寄存器第五十三页,共一百零八页,编辑于2023年,星期四

2.水印的嵌入

(1)对原始语音信号x(n)进行DCT变换。设每帧语音信号长度为N,由下式得到DCT域的序列y(k):(k=0,1,2,…,N-1)

(6-21)第五十四页,共一百零八页,编辑于2023年,星期四

(2)选取序列y(k)的前m个值(不包括y(0))作为添加水印的位置,同时应满足m=2n,其中n为整数。

(3)利用伪随机序列发生器,产生一均值为0,方差为1的正态分布随机序列w(n),n=1,2,…,m。

(4)将序列重置,还原成,用下式进行IDCT变换,得到时域中嵌入水印的音频信号,即n=0,1,2,…,N-1

(6-23)第五十五页,共一百零八页,编辑于2023年,星期四

3.水印的检测对待检测信号(n),重复上述步骤(1)、(2)得到DCT域序列(sn),利用原始信号的y(sn),得到(n),即

(6-24)(6-25)第五十六页,共一百零八页,编辑于2023年,星期四

4.仿真实验及结果采用一段长度1.024s,采样频率8kHz,量化为线性16bit,内容为“坐飞机去广州”的语音信号进行实验。进行DCT变换时,每帧信号长度取为2048个样点。水印是长度为512且具有正态分布N(0,1)的随机实数序列,将水印分别嵌入各帧语音信号中。原始语音波形和嵌入水印后的语音波形分别如图6-11、图6-12所示。第五十七页,共一百零八页,编辑于2023年,星期四图6-11原始语音信号波形第五十八页,共一百零八页,编辑于2023年,星期四图6-12嵌入水印后语音信号波形第五十九页,共一百零八页,编辑于2023年,星期四

(1)低通滤波。采用长度为6阶,截止频率为2kHz的巴特沃兹低通滤波器。检测结果见表6-1。表6-1信号经低通滤波后的检测结果第六十页,共一百零八页,编辑于2023年,星期四

(2)噪声干扰。对信号在时域中加入高斯白噪声。信噪比取为26dB。检测结果见表6-2。表6-2信号加入白噪声后的检测结果第六十一页,共一百零八页,编辑于2023年,星期四

(3)重新采样。对信号进行一次插值和一次抽取处理,插值与抽取的倍数为3。检测结果见表6-3。表6-3信号重新采样后的检测结果第六十二页,共一百零八页,编辑于2023年,星期四

(4)重新量化。先将信号从16bit量化成为8bit,再量化为16bit。检测结果见表6-4。表6-4信号重新量化后的检测结果第六十三页,共一百零八页,编辑于2023年,星期四

(5)语音压缩编码。对信号采用G.729进行编码和解码。检测结果见表6-5。表6-5信号压缩编码后的检测结果第六十四页,共一百零八页,编辑于2023年,星期四

6.4.5离散小波变换域(DWT)方法

对于水印的添加而言,小波变换的类型、水印的种类、水印添加的位置以及水印的强度,这四大要素决定了水印添加算法的类型。其中水印的类型一般是预先就确定的,狭义来说,决定算法类型的是水印添加的位置和水印的强度两大要素,同时它们也决定了算法的性能。而在水印的提取过程中,要求上述各要素与添加的过程保持一致,否则就无法将水印提取出来。在音频水印中,将水印嵌入到小波域系数中可以获得较好的稳健性。第六十五页,共一百零八页,编辑于2023年,星期四在图6-13中,(a)是原始水印图像,(b)是信号未经处理直接提取的水印图像,(c)是信号经低通滤波后提取的水印图像,(d)是信号加入白噪声后提取的水印图像,(e)是信号改变采样率后提取的水印图像,(f)是对信号采用MP3编码标准,在80kb/s的比特率下进行编码,解码后水印检测结果。第六十六页,共一百零八页,编辑于2023年,星期四图6-13使用小波变换算法中的水印图像第六十七页,共一百零八页,编辑于2023年,星期四6.5其他类型的水印算法

6.5.1比特流水印前面介绍的音频水印算法中,音频载体嵌入水印后得到的输出信号是未压缩的音频内容。比特流水印系统完全工作在比特流域,输入和输出信号都是经过压缩编码的音频信号。图6-14是基于比特流的水印嵌入方案框图。第六十八页,共一百零八页,编辑于2023年,星期四图6-14基于比特流的水印嵌入方案框图第六十九页,共一百零八页,编辑于2023年,星期四

6.5.2压缩水印压缩水印系统输入的是未压缩的音频信号,输出的是嵌入水印的音频比特流。图6-15是Siebenhaar等[19]提出的一种压缩水印系统方案框图。这一方案的优点是在压缩参数和水印参数之间可以实现最佳的匹配;可一步处理(同时实现音频压缩和水印嵌入),联合优化;计算复杂度较低。第七十页,共一百零八页,编辑于2023年,星期四图6-15压缩水印系统方案框图第七十一页,共一百零八页,编辑于2023年,星期四为了对嵌入的水印信号的能量进行更加精确的控制,可以采用分析合成法实现频域加权过程,充分考虑量化模块的影响。分析合成法在语音编码(比如CELP)和感知音频编码(比如MP3和AAC)中有着广泛的应用。图6-16是求取水印权重的分析合成迭代循环的示意图。第七十二页,共一百零八页,编辑于2023年,星期四图6-16求取水印权重的分析合成迭代循环示意图第七十三页,共一百零八页,编辑于2023年,星期四

6.5.3扰动调制水印

1.量化索引调制扰动调制是量化索引调制(QIM)的一种具体实现。QIM是基于一组量化器工作的,每一个样值用哪种量化器进行量化取决于嵌入信息,换句话说就是用嵌入信息来调制量化器。量化索引调制的嵌入函数为:

s(x;m)≈x,m(6-26)第七十四页,共一百零八页,编辑于2023年,星期四图6-17量化索引调制原理图第七十五页,共一百零八页,编辑于2023年,星期四图6-17是量化索引调制的原理图。假定每样点嵌入1比特信息,因此m∈{0,1,需要两种量化器,图中分别以实心和空心圆表示。第七十六页,共一百零八页,编辑于2023年,星期四量化单元的大小和形状决定了引入的量化误差大小,即失真程度。各量化器之间的最小距离dmin决定了该系统的稳健性。dmin定义为(6-27)第七十七页,共一百零八页,编辑于2023年,星期四

2.扰动调制为了易于实现,以扰动量化器来实现QIM中的一组量化器。所谓扰动量化器,即先给宿主信号加上随机扰动信号,然后再进行线性量化。这种量化索引调制被称为扰动调制(DitherModulation)。扰动调制中的扰动量化器有两种结构可以选择,即非减(或有偏)扰动量化器:

Qdm(x;m)=q[

x+dm](6-28)

和减性(无偏)扰动量化器:

Qdm(x;m)=q[

x+dm]-dm(6-29)第七十八页,共一百零八页,编辑于2023年,星期四图6-18两种扰动量化器结构图第七十九页,共一百零八页,编辑于2023年,星期四

3.扰动调制在音频域中的实现不同于以往在空域中应用扰动调制对静止图像嵌入水印,这里结合人耳听觉特性给出在频域中进行扰动调制的数字音频水印方案。取出2~4kHz频段内的DFT系数,计算相应的幅度值序列A,设序列长度为N。为了便于进一步的处理,对序列A进行归一化处理,即将序列中每个元素都除以A中的最大值Amax。

(6-30)第八十页,共一百零八页,编辑于2023年,星期四

1)水印嵌入的步骤第一步:将水印信息转化为长度为Nw的二进制码流。第二步:将宿主信号分为Nc个长度为L=1/Rm的数据单元,每一数据单元嵌入1比特信息(0或1)。

2)水印提取的步骤本方案在水印提取时不需要用到原始音频信号,因此是一种公有水印方案。第八十一页,共一百零八页,编辑于2023年,星期四6.6音频水印的评估标准和攻击

6.6.1IFPI水印稳健性标准

IFPI(国际留声机工业联盟)在1997年对音频水印技术提出的稳健性要求,可以看作为该技术的最早标准。IFPI提出这一要求的目的是寻求一种能够生成反盗版行为的证据,跟踪传播者和其他人对音频媒体的使用,以及控制音频记录复制的标记方案。它要求水印标记满足以下的要求:第八十二页,共一百零八页,编辑于2023年,星期四

(1)水印标记不能影响唱片的声音品质。

(2)使用任何方法都不能删除或改变嵌入的信息,除非声音质量差到不能用的地步。

(3)水印经过以下变换之后必须能够恢复:各种滤波和信号处理操作(包括两个连续的D/A和A/D转换);稳态压缩或10%的时间扩张;压缩变换(比如图像MPEG的数据压缩和多频带非线性振幅压缩);添加加性或乘性噪声;使用同一系统加入另一个标记信号;使低音和中高音频段产生群时延失真或高达15dB的频率响应失真;群时延失真和陷波滤波等。第八十三页,共一百零八页,编辑于2023年,星期四

(4)如果提供20dB或更高的信噪比,嵌入标记的数据信道应能在纠错之后还有20b/s的带宽,且与信号的电平和类型(如古典音乐、流行乐或话音)无关。第八十四页,共一百零八页,编辑于2023年,星期四

6.6.2StirMark标准音频水印攻击

StirMark不仅在图像水印攻击方面进行了研究,同样对音频水印技术的测试标准和攻击也进行了深入的研究。StirMark的目标是通过第三方获得对一种水印算法的评价;只有这样才可以提供对水印评估问题的客观解决。这也是构建下一代StirMark标准的目标。第八十五页,共一百零八页,编辑于2023年,星期四

·

简单化:为便于测试被广泛地接受,对现有的水印库,该服务有简单的界面(用户只需提供三个必须的函数)。

·

用户定制:对每一种水印算法,StirMark试图使用不同的评价描述,而不用对应用工具进行再编译。

·

模块化和测试选择:在较大系统设计中使用水印算法以完成某项目的(如阻止非法拷贝和图像交易)。第八十六页,共一百零八页,编辑于2023年,星期四

·

感知性:对由水印算法本身引入的失真量进行定性估计。StirMark允许附加的或使用者自己定义的度量矩阵,广泛使用的最简单度量是PSNR。

·

算法容量:可以隐藏的信息数量。在多数应用中,它是系统稳健性的约束,因而稳健性测试可以在随机给定有效载荷大小的情况下进行测试。

·

稳健性:通过测定水印的检测概率或比特错误概率来进行评定。

·速度:它对应用的类型(软件应用或硬件应用)有很大依赖性。第八十七页,共一百零八页,编辑于2023年,星期四图6-19建立在一组音频模块之上的对CD

信号播放的攻击(以有线传输为例)第八十八页,共一百零八页,编辑于2023年,星期四

1.StirMark音频攻击分类为评估水印算法的弱点,StirMark建立了一组基于修改的攻击方法。根据攻击模式,可以进行以下的攻击分类:动态改变:修改音频信号的响度级。增加或降低信号幅度是最基本的攻击。滤波:滤波器滤除或增加选定部分的频谱。第八十九页,共一百零八页,编辑于2023年,星期四回响:最普通的效果是延时和混响,根据延时和混响效果品质的不同,StirMark提供了许多参数。转换:音频信号经常受到格式变化的影响。第九十页,共一百零八页,编辑于2023年,星期四

2.StirMark音频攻击测试测试的主要目的有两个:找到可以破坏嵌入在音频信号中水印的方法;在各种攻击下音频信号的品质是否改变。根据测试目的,测试共包括三个阶段:

(1)确定攻击方式:使用音频编辑软件和自己的攻击算法对音频数据进行修改。

(2)水印攻击:根据步骤(1)中确定的攻击方式对不同的水印算法进行攻击。第九十一页,共一百零八页,编辑于2023年,星期四

(3)主观测试:使用双盲三刺激(doubleblindtriplestimulustest)方法对前两步中的最佳攻击进行多个对象的测试。第九十二页,共一百零八页,编辑于2023年,星期四使用以下6个不同性质的信号对攻击进行评估:·

“SerenadedesAbschieds”:高品质记录的一首诗的朗读。·

“Menuetto”:莫扎特的古典音乐,由小提琴演奏,十分平缓。·

“I'mready”:流行音乐,含有观众噪声。·

“Timein”:爵士乐,吉它演奏。·

“Endorphinmachin”:非常响的摇滚乐。·

“City”:城市中的录音,含有卡车发动的声音。第九十三页,共一百零八页,编辑于2023年,星期四

1)动态改变幅度压缩:使用压缩算法可以降低音频信号中的信号强度范围,使信号的峰值限制在一定范围内,而不产生失真。使用如下设置:攻击时间为1ms,释放时间为500ms,输出增益为0dB,确定门限为-50dB,压缩比率为1∶1.1。这是非常快而且几乎听不到的设置,对所有信号放大的改变大于门限值。第九十四页,共一百零八页,编辑于2023年,星期四

2)滤波高通滤波:将选定门限之下的频率成分抹去,试验中设定为50Hz。低通滤波:将选定门限之上的频率成分抹去,试验中设定为1.5kHz。均衡:使用均衡器可以降低每个频带的能量,范围是48dB。左右声道分离:对立体声声道,一个声道的频率降低,相应另一个声道会增加。第九十五页,共一百零八页,编辑于2023年,星期四

3)回响延时:将原始信号的延时拷贝叠加到原始信号之上,用于对空旷空间的仿真。

4)转换重采样:改变信号的采样率。典型的降低采样频率是在CD制作中从48kHz降到44.1kHz。

5)添加噪声随机噪声:对信号添加随机噪声,通过与原始信号比较给出相应的随机噪声的大小。第九十六页,共一百零八页,编辑于2023年,星期四

6)调制和声:使用不同的时延、调制强度和元音数量,对信号增加一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论