基于主成分分析的并行特征融合JPEG隐写检测_第1页
基于主成分分析的并行特征融合JPEG隐写检测_第2页
基于主成分分析的并行特征融合JPEG隐写检测_第3页
基于主成分分析的并行特征融合JPEG隐写检测_第4页
基于主成分分析的并行特征融合JPEG隐写检测_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 42 卷 第 3 期福州大学学报( 自然科学版)Vol 42 No 3 2014 年 6 月Journal of Fuzhou University( Natural Science Edition)Jun 2014 DOI: 10 7631 / issn 1000 2243 2014 03 0341文章编号: 1000 2243( 2014) 03 0341 05基于主成分分析的并行特征融合 JPEG 隐写检测何凤英,钟尚平,杨 健( 福州大学数学与计算机科学学院,福建 福州 )摘要: 针对目前 JPEG 隐写检测方法的特征选取缺乏理论依据,特征冗余度高的问题,提出一种基于主成分分 析进

2、行并行特征融合的 JPEG 隐写分析方法 首先分析所选特征之间的互补性,然后用主成分分析进行特征变 换,去除冗余信息,最后将特征并行融合 实验结果表明,和串行特征融合相比,本文方法具有更高的 JPEG 隐写图像检测率和更快的分类速度关键词: 隐写检测; 并行特征融合; 主成分分析; 特征互补; JPEG 图像中图分类号: TP391文献标识码: AJPEG steganalysis based on parallel feature fusion by principal component analysisHE Feng ying,ZHONG Shang ping,YANG Jian( Co

3、llege of Mathematics and Computer Science,Fuzhou University,Fuzhou,Fujian ,China) Abstract: Aiming to the problems in the existing JPEG steganalysis schemes,such as high redundan- cy in features and feature selection lacking of theoretical basis,this study proposes a JPEG steganalysis approach based

4、 on feature fusion by the principal component analysis ( PCA) and analysis of the com- plementarity among features The study fuses complementary features and isolates redundant compo- nents by PCA,and finally uses BaggSVM classifier for classification Experimental results show thatthis scheme effect

5、ively improves the detection rate of steganalysis in JPEG images and achieves faster speed of image classificationKeywords: steganalysis; parallel feature fusion; principal component analysis; complementary fea- ture; JPEG image0引言隐写检测是对截获信号进行分析以判断其中是否含有秘密信息的隐写分析方法 JPEG 图像作为一种 最常见的图像格式,其隐写检测已成为近年来研究

6、的重点 特征融合1是将原始特征数据源采用某种方 法进行融合,产生新的特征集,以期能比原始特征数据包含更多综合性分类信息的方法,和单一特征相 比,融合特征具有更好的综合信息表现能力 近年来,特征融合在图像隐写检测方面有不少研究成果 Pevny 等2改进 Fridrich 等3和 Shi 等4的成果,分别得到 193 维 DCT 扩展特征和 81 维的 Markov 降维特 征,并进行串行融合,得到 274 维的融合特征 Kodovsky 等采用 CC PEV 和 SPAM 特征进行串行融合5, Fridrich 等采用 high dimensional rich model 在随机子空间上进行特

7、征融合分类6上述方法虽然在隐写分析正确率上有一定的提高,但他们是将两组特征首尾相连进行串联形成新的 特征矢量,不仅存在大量的冗余信息,而且容易引起“维数灾难”问题,此外,上述方法选取融合特征具有 很强的主观随意性,没有考虑特征间的关系,所提取的特征未必有利于分类基于以上分析,本研究提出一种基于主成分分析( principal component analysis,PCA) 进行并行特征融 合的 JPEG 隐写检测方法 该方法首先选取当前分类准确度较高,并具有互补性的特征,然后采用 PCA 对收稿日期: 2012 08 27通讯作者: 何凤英( 1979 ) ,讲师,主要从事信息隐藏、图像处理研

8、究,hfy fzu edu cn基金项目: 福建省教育厅科研资助项目( JB09003)342福州大学学报( 自然科学版)第 42 卷特征进行变换,去除特征中的冗余信息,最后对变换后的特征进行并行融合 实验结果表明,和串行特征 融合方法相比,本文提出的特征融合方法具有更好的检测效果和更快的分类速度1隐写特征及互补性分析选取两类经典的 JPEG 隐写特征MPB 特征4和 PEV 特征7进行检测分类MPB 特征的提取方法4如下: 按 4 个方向( 水平、垂直、主对角和副对角) 对 JPEG 量化系数矩阵求 差,得到 4 个差值矩阵,然后对各个差值矩阵计算一阶 TPM,最后得到 4( 2T + 1)

9、 2 维特征向量stPEV 特征的提取方法7如下: 首先,计算 7 种特征,分别为 AC 系数直方图矩阵 h; 共生矩阵 C; DCT系数直方图矩阵 H( 亮度部分) ; 双直方图矩阵 gd ; 方差 V; 块内分块特性 B ; 基于 Markov 模型的转移概率ija矩阵 Mm,n ,组合上述特征得到特征 Fr 然后,利用图像校准技术对图像最外层四周各裁剪 4 行 4 列后进行JPEG 压缩,重新提取、组合以上 7 种特征得到特征 Fc 最后,将 Fr ,Fc 的串行特征称为 PEV 特征MPB 特征将 JPEG 量化系数差值视为一阶 Markov 过程,而 PEV 特征则基于校准技术组合了

10、 7 种特 征,因此它们具有不同的特征分布模型 在不同的模型下,隐写行为对特征具有不同的改变程度,很难做 到即要兼顾不同的分布模型,又使得每个模型下的扰动量达到最小8 因此,融合不同模型的特征,可以 较容易的检测特征的改变,因而具有互补性2基于 PCA 并行特征融合的 JPEG 隐写检测2 1PCA 方法主成分分析9( PCA) 又称 K L 变换,是寻求有效的线性变换的经典方法之一,其主要目的是降维, 将原来具有一定相关性的变量通过线性变换重新组合成一组新的互不相关的几个主成分,有效去除冗余 信息T令 X = x1 ,x2 ,xm ,为 m 维输入样本向量,每个向量 xi 有 n 个特征,即

11、 xi = ( xi,1 ,xi,2 ,xi,n ) PCA 的目的是生成 m 个新特征向量 Y = ( y1 ,y2 ,ym )T ,它们满足 Y = UT X,其中 U 为转换矩阵,是协方差矩阵 C = XXT 的特征向量,U = ( u ,u ,u ) T ,且 C= = diagu ,u ,u 12ny12n经过变换后,Y 中的各列按方差降序排列,称此时的 y1 ,y2 ,ym 为第 1,2,m 个主分量2 2并行特征融合TT文献10给出了并行特征融合策略的思想: 假设 , 为同一样本的两组特征向量,则用复向量 = + i ( i 为虚数单位) 来表示样本的并行组合特征 注意,复向量并

12、行融合要求两组融合特征的维 数必须一致,若维数不等,那么低维的特征向量用零补足例如, = ( a1 ,a2 ,a3 )T, = ( b1 ,b2 ),则 = ( a1 + ib1 ,a2 + ib2 ,a3 + i0)表示组合以后的特征向量 显然,复向量空间的特征维数为两组融合特征维数的最大值2 3 算法描述JPEG 检测方法如图 1 所示,具体算法由如下 4 步骤组成 步骤 1特征提取及预处理 对于训练集 X = x1 ,x2 ,xn 提取 PEV 和 MPB 特征矩阵,xi 为样本 PEV 特征矩 阵 P = p1 ,p2 ,pa 为 n 行 a 列,其中: pi 为 n 个不同 的训练样

13、本第 i 维特征值组成的向量,pi = pi,1 ,pi,2 ,Tpi,n ; MPB 特征矩阵 M = m1 ,m2 ,mb 为 n 行 b 列,其中: mi 为 n 个不同的训练样本第 i 维特征值组成的向量,Tmi = mi,1 ,mi,2 ,mi,b 一化处理,得到 P 和 M,并对特征矩阵 P、M 进行归图 1基于 PCA 并行特征融合的 JPEG 检测框架步骤 2特征变换 分别对特征矩阵 P 和 M 进行 PCA 处理 根据协方差矩阵求得转换矩阵 U,将 P 转换到变换Fig 1Framework of JPEG parallel features fusionbased on P

14、CA第 3 期何凤英,等: 基于主成分分析进行并行特征融合的 JPEG 隐写检测343域上,得到矩阵 H = PU,H 为 n 行 a 列,特征 P 转换为主成分 h = h1 ,h2 ,ha 对 M 进行类 似的处理,得到矩阵 G = MB,G 为 n 行 b 列步骤 3特征降维 H 和 G 中的各列按方差降序排列,分别提取 H 和 G 的前 d 维主成分,组成 n 行d 列的矩阵 H 和 G,其中,d 通过交叉验证确定步骤 4特征融合 利用复向量对所提取的特征 H 和 G 进行并行融合,得到特征集 K 为本文的分类 特征3仿真实验结果与分析3 1实验数据从 USC SIPI 图像库11和我

15、们自己采集的图像库( 图像主题包括人物、风景、建筑、动植物等) 中随 机选取 3 000 幅规格为 640 px 480 px 的 JPEG 图像进行实验 使用 F5、Outguess、MB、Steghide 四种隐写 算法分别以 0 25、0 5、0 75 和 1 bac 1 的嵌入率对图像进行隐写实验过程中,针对不同嵌入容量的不同隐写算法,任选 1 500 幅原图及其对应的 1 500 幅隐写图片作 为训练样本,剩余的 1 500 幅原图及其对应的 1 500 幅隐写图片作为检测样本 并用 C 支持向量分类机( C SVC) 进行分类验证,核函数采用 BF 核,采用十折交叉验证法根据数据集

16、特征自动选取训练参数 g 和 C3 2实验结果及对比分析实验一验证所提方法在四种常见隐写算法下进行 JEPG 隐写检测的有效性 分别针对单一 MPB 特征、 单一 PEV 特征、串行融合特征、并行融合特征、PCA 降维串行融合特征( 降维至原始特征 1 /3) 、PCA 降维并 行融合特征( 降维至原始特征 1 /3) 以及文献8等 7 种不同的方法做了对比实验 实验结果列于表 1隐写嵌入率 /算法bac 1表 1不同方法的检测率比较Tab 1Comparison of the detection rate of different methods检测率 / %MPBPEV串行融合并行融合降维

17、串行融合 降维并行融合文献8方法F5OutguessMBSteghide0 2578 6086 5387 8092 2390 2092 3390 600 5087 5091 9092 1092 0093 2094 3393 900 7590 1792 5090 6395 0096 9397 1097 001 0090 7095 3395 6797 0097 0097 6797 470 2588 0088 9089 2090 7393 9395 1093 300 5087 1789 6090 1791 3794 4095 7795 600 7591 0391 4092 4091 5395 509

18、7 2796 331 0093 4094 5393 3095 4797 0798 2097 070 2587 7087 3391 7793 4097 1097 3795 600 5090 5389 3393 3094 0797 2799 0097 270 7595 0095 5395 5395 7097 40100 0097 201 0096 6397 2097 3398 5799 6099 7098 000 2588 5091 5792 1792 9096 6398 9396 700 5093 9393 0795 2096 1098 5099 2398 300 7593 0795 9797

19、3397 5799 4799 8399 331 0095 2095 0099 4399 63100 00100 00100 00实验结果表明: 总体而言,在不同隐写率下,融合后的特征,不管是串行还是并行,在不同隐写方 法下的检测效果都比单一特征好,仿真实验证明了单一特征之间存在优势互补的特性,所融合的特征矢 量能包含更多的分类信息,从而增强分类器的识别能力; 在相同情况下,并行融合的方式其检测性能 总体上优于串行融合的方式,而经过 PCA 降维后的并行融合检测率提高幅度更大,和降维前的并行融合 相比,检测率有 2% 6% 的提升,和降维后的串行融合相比,检测率约有 2% 3% 的提升; 文献8

20、的 思想是串行融合特征后进行 PCA 降维,本文方法则先对特征降维,然后再并行融合,与文献8相比,本344福州大学学报( 自然科学版)第 42 卷文方法具有更高的检测性能,特别在 MB 算法下,检测率约有 2% 的提升实验二 分析 PCA 降维对本文方法检测率的影响 总体而 言,分类的平均准确率随着 PCA 的主成分累计贡献率 的减小 呈现一种先上升后下降的趋势 以 Steghide 隐写算法为例,平 均检测性能随 取值的变化情况如图 2 所示从图 2 可以看出,随着 的取值逐渐减小,融合特征中的 冗余信息被去除的力度逐渐加大,平均检测率逐渐上升,当 = 92% 时,平均检测率达到最高; 但当

21、 的取值继续减小时, 不仅去除了特征中的冗余信息,也去除了特征中的有效信息,平均检测率不再继续上升,其总趋势是逐渐下降的,但波动比 较平缓,说明经过并行融合,PCA 降维对特征准确率的影响趋 于平和实验三分析特征的互补性 借鉴文献12的思想,用典图 2 Steghide 隐写算法中 对平均检测率的影响Fig 2 Effect of on the average detection accuracy of Steghide型变量的相关系数来衡量特征间的互补性 相关度越高,两组特征就越相似,相关度越低,则越可能表现 图像不同方面的特征,其互补性就越强 为说明问题,对 MPB、PEV、Liu13三组

22、特征进行互补性的比较, 给出 3 种特征两两组合在不同隐写算法下的特征间相关系数分布,取前 20 维典型变量的相关系数进行分 析,结果如图 3 所示( a) F5( b) Outguess( c) MB( d) Steghide图 3 三种特征组合的相关系数分布示意图Fig 3 Schematic diagram of distribution coefficients of three kinds of combination feature在图 3( a) 和 3( b) 中,MPB 特征与 PEV 特征的相关度系数值都是从 0 78 左右下降到 0 4 到 0 5 之 间,低于其它两种组

23、合特征,在图 3( c) 和 3( d) 中,MPB 特征与 PEV 特征的相关度从一开始就处于较低 的值,相关度系数从 0 4 左右开始缓慢下降到 0 2 与 0 3 之间 图 3 结果说明 MPB 特征与 PEV 特征具有 较强的互补性,这和第 1 节的分析相符实验四 并行融合算法和串行融合算法耗时比较 表 2 给出了 PCA 降维至原始特征 1 /3 时的耗时 ( 指在 Intel Xeon E5300 2 60GHz 和 4GB 内存硬件环境下统计得到的不同嵌入率下的平均运行时间) 从 表中可以看出,降维后并行融合的时间明显比降维前少,这主要是因为融合特征在经过 PCA 变换后,特 征

24、的维数得到了有效的降低,特征中的大量冗余信息被去除第 3 期何凤英,等: 基于主成分分析进行并行特征融合的 JPEG 隐写检测345表 2两种算法的耗时比较Tab 2Comparison of time of two algorithms( unit: s)隐写算法串行并行降维串行降维并行F5OutGuess MBSteghide86 41899 97097 97692 06369 31073 50475 11372 1459 78210 2238 9618 6535 8515 9795 8455 6624结语提出一种基于 PCA 进行并行特征融合的 JPEG 隐写检测方法,从现有的各种隐写特

25、征中选择 2 种具 有互补性质的特征,通过 PCA 进行特征的转换、降维,消除冗余信息,并将它们并行组合在一起得到含 有有效成分的融合特征 实验结果表明,该方法不仅能够有效提高 JPEG 图像的分类精度,而且能够明显 提高分类速度参考文献:1 Mangai U G,Samanta S,Das S,et al A survey of decision fusion and feature fusion strategies for pattern classificationJ IETE Technical eview,2010,27( 4) : 293 3072 Pevny T,Fridric

26、h J Merging Markov and DCT features for multi class JPEG steganalysisC/ / Proceedings of Security,Steg- anography,and Watermarking of Multimedia Contents IX,SPIE 6505 Washington D C: SPIE Press,2007: 1 133 Fridrich J Feature based steganalysis for JPEG images and its implications for future design o

27、f steganographic schemesC/ / Information Hiding s l : Springer Berlin Heidelberg,2005: 67 814 Shi Y Q,Chen C,Chen W A Markov process based approach to effective attacking JPEG steganographyC/ / Information Hiding s l : Springer Berlin Heidelberg,2007: 249 2645 Kodovsky J,Pevny T,Fridrich J Modern steganalysis can detect YASSC/ / Proceedings of SPIE 2010

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论