面向信息隐藏的文本特征值性质_第1页
面向信息隐藏的文本特征值性质_第2页
面向信息隐藏的文本特征值性质_第3页
面向信息隐藏的文本特征值性质_第4页
面向信息隐藏的文本特征值性质_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面向信息隐藏的文本特征值性质研究

申请者:戴祖旭

工作单位:武汉工程大学

电子邮件:

申请日期:2009/11/29

2009-11-291第一届中国(杭州)安全电子商务学术会议摘要文本作为一种重要的信息传输载体,文本信息隐藏研究在信息安全等领域应用价值极高。目前对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、安全性等)去研究携带秘密信息的特征值的性质并评价相应算法的工作还很缺乏。本项目采用数理统计方法研究基于词性标记串序关系、语法结构关系以及其他统计特性的载体特征值的概率分布与冗余性质;对词性标记串按文本编辑相互转化关系分类,研究特征值在文本编辑下的变换性质,将这些变换性质作为信息隐藏的噪声,建立不同类型特征值的信道模型,估计容量,设计信道编码方法。本研究为基于词性标记工作域的文本信息隐藏技术提供理论基础。2009-11-292第一届中国(杭州)安全电子商务学术会议1.研究意义及国内外研究工作现状

信息隐藏是以多媒体信号作为宿主载体,利用多媒体数据的冗余特性和人类感知觉的冗余特性来隐藏秘密信息的技术。在开放式网络环境中,信息隐藏技术主要用于:(1)隐秘通信;(2)数字作品完整性与版权保护。作为一种重要的信息存储与传输媒体,文本载体信息隐藏理论与技术的研究是信息隐藏学科的一个重要分支。2009-11-293第一届中国(杭州)安全电子商务学术会议

基于格式的方法:将文本解释为二值或灰度图像,通过调整行间距或单词和字符间距、修改字符轮廓与拓扑结构、调整字符亮度或颜色,以及格式化文本的脚本控制符来隐藏信息。选择行(字)间距、字符结构、字符亮度等物理量作为载体特征值来携带秘密信息,利用人类视觉保真度量模型计算特征值调整幅度,隐藏过程不改变人眼对文本外观的感知效果。这类方法有科学的人类视觉模型做基础,易于实现自动化,在信息隐藏技术出现的初期发展较快,缺点是隐藏容量较小,抵抗文本重新录入、复印等再生操作的鲁棒性较差。2.文本信息隐藏的代表性方法2009-11-294第一届中国(杭州)安全电子商务学术会议

基于内容的方法:建立在文本内容理解的基础上,主要通过修改自然语言语句来隐藏信息,利用同义词替换,可选择同义词、同义词频率、同义词语义歧义等特征值携带秘密信息;利用语句结构的变化,可选择句法分析树和词性标记串等特征值携带秘密信息。更高级的是利用文法来生成含密文本。2009-11-295第一届中国(杭州)安全电子商务学术会议例:汉语语句“风景优美的房间请给我。”部分改写实例(1)风景优美的房间请给我。(2)请把风景优美的房间给我。(3)我想要风景优美的房间。(4)请给我风景优美的房间。(5)房间请给我风景优美的。(6)把风景优美的房间给我。(7)风景优美的房间给我。(8)风景优美的房间我要。(9)我要风景优美的房间。(10)给我风景优美的房间。2009-11-296第一届中国(杭州)安全电子商务学术会议

我们可以有10种改写方式(或许还有更多的其它方式),10个句子的语法都正确,意思也相似。因此,采用定长编码方法,一个句子用句法分析树可携带3比特信息。再考虑到用“优美”的同义词{美丽,漂亮,好看,悦目,美妙,幽美,优美}做替换,则可增加到70个改写句子,一个句子就可携带6比特信息。当然还可以进一步综合利用词性标记等其它特征值来携带信息以提高容量。

2009-11-297第一届中国(杭州)安全电子商务学术会议3.信息隐藏算法的两个基本要素秘密信息的隐藏空间与隐藏方式是信息隐藏算法的两个基本要素。隐藏空间称为嵌入工作域,人们总是利用工作域中的各类特征值来携带秘密信息。隐藏方式由数据嵌入方式实现,包括叠加嵌入和映射嵌入。叠加嵌入中,秘密信息作为弱信号用叠加的方式嵌入到宿主信号的特征值中;映射嵌入中,宿主信号的系数被映射函数映射到由嵌入比特确定的特征值,嵌入方式直接受特征值性质制约。2009-11-298第一届中国(杭州)安全电子商务学术会议

目前的文本信息隐藏研究一般集中在寻找文本的各种特征值并设计相应的信息隐藏方法等较为基本的内容上,而对照信息隐藏的要求(数据有效载荷、不可感知性、鲁棒性、误判率、安全性、计算效率和成本等)去研究特征值的性质并评价相应信息隐藏算法的研究工作还很缺乏。2009-11-299第一届中国(杭州)安全电子商务学术会议4.补项目属研究货内容星、目究标文本念载体我信息腔隐藏愿过程检一般错包括马以下耍步骤令:秘格密信此息编秋码(情映射左)为各载体弊特征椅值(彼格式任参数糊、同语义词鸽、语滔法树躺、逆芬序数梳等)技;根拳据特泳征值庙修改阅载体齐得到赢含密嘱载体翼(受抖文本鸦不可鲁感知穗性条兆件约似束)外;公重开发依送含紫密载世体以能及文饼本编眼辑处发理等伶噪声衰干扰枝;接杰收方奔计算悄特征贤值并蓄译码梦提取露秘密恳信息侧。20事09顾-1夸1-低2910第一锈届中星国(窜杭州强)安帝全电怎子商鞭务学庸术会齿议设信届息隐捉藏函疯数为(1召)其中却分舞别表庸示秘侍密信荷息、杠原始众载体突、含篇密载袭体和串载体洁特征溪值,分别外表示夹编码裕密钥日和嵌需入密腰钥,追函数宾d表抛示不匙可感拌知性炉约束仗条件滔,ε访为常件数。另设相噪声兵干扰申为(2靠)其中帝是惧加噪践含密立载体机。20唉09泰-1培1-奥2911第一封届中提国(固杭州覆)安丛全电丝式子商停务学漂术会珠议项目晌组成霸员经载过多关年研萌究,拌找到梅了基周于词扇性标链记工赛作域展的部泊分特域征值逝,并峡据此肆提出接了若票干文都本信串息隐布藏新愤算法烘,在陶前期飞研究奶工作庆的基刊础上酱,本世项目纷将深捧入研蛮究如束下内鲜容:1)祝研竭究现亭有文阀本载兰体特径征值和的性伤质。公式刑(1虑)中蒜t是答载体兵特征愉值,忙是秘绍密信喉息的俗携带祝者,僚也是亏噪声课干扰桐的目短标。吩针对座文献针已提射出的该特征粒值,鄙比如税语法趋树、泪逆序救数、尽信息垦熵等岂,重却点研麻究t咽在常障规文驾本编丧辑(悟比如晚语句谢或语举句中闯词的脚增加滚、删免除与苦移位鹊等)处理下的钞变换半性质欲,它棵是进勺一步能评估升相关涂隐藏恒算法考鲁棒绝性、划安全淘性和肌计算同复杂抄性的普理论骗基础临;特挪征值浇t的守分布脏性质恼,它锤是设喇计秘表密信帐息编缎码函辱数f钻的基毅础,俭也是痰度量骨不可混感知缩慧性的升基本学因素调之一篇。20隆09死-1买1-驱2912第一框届中斯国(匀杭州娱)安汉全电衰子商保务学芝术会狭议2)举研究日文本党载体闻信息暂隐藏馒信道辜模型葛。信道狡模型猎是噪门声对售特征杆值的初作用下方式仓,是冒计算瘦信息宅隐藏荐容量双的基梦础。树公式累(2嚼)描抹述了志文本别编辑辅噪声狗对含促密文欠本的夕干扰恐作用间,这蔑种干稠扰作拿用传从递到谜不同店的特染征值车上会陈有不核同的蜓影响络。对脊于逆葛序数猛、语沈法树奶等来抬说,单干扰嫁导致葬离散诊状态厘之间恢的转欢换,镇对于宗信息鸣熵等吉取非李负实躺数的唱特征消值来广说,生干扰伙导致强熵值微的波驼动。订因此迷信道袜模型乒可能扬是状阳态转密移矩格阵,哄需要额具体汉研究股同一售类特氧征值调之间很的转俯移概屈率,代也可遍能是量具有磨加性壮或乘静性噪左声的健连续他信道叠,需般要建菜立噪振声分赴布函护数关新系式转。20牵09复-1孙1-银2913第一营届中窜国(现杭州底)安纳全电览子商类务学婚术会雄议5.粪本项扒目预梯期目负标1)茎针对输2-圣3种兽文本葡载体滥特征胁值建乒立文柱本编仓辑变涝换模嫌型,嗽据此准建立拿相应划的信幅道模梦型。2)盈针对名2-戴3种催文本腥载体透特征叶值建膊立统匹计模户型及储其相体关性线模型裁。20及09血-1纲1-融2914第一击届中锡国(监杭州匆)安晓全电尽子商雨务学膊术会第议6.采拟忌采取晒的研壁究方淋法和棉技术借路线本项剥目总款的研娃究方撇案是酸以词皱性标朋记工嘱作域脂上的扛特征端值为装中心矮,收绢集大宋容量纵的文拔本样业本,同将文恋本按眼文体狱分类到,首炉先研偏究各墓类特净征值客的分聪布规艳律与定冗余驶性质蜡,研芬究文撒本编草辑操首作对甩词性极标记登串的盒改变僵规律销,对普词性赢标记轨串按织文本腰编辑蹄相互扩转换录关系必进行油分类汤,根填据分任类情衫况研回究各军类特劝征值医的变遍换性久质,巧将这常些性剑质作粱为噪悟声,猛得到慨信道植模型块。20凑09寸-1甘1-钩2915第一陵届中绳国(井杭州页)安晶全电详子商女务学光术会悟议1)北关于裙数据乳统计春分析岩工作本项帐目的凑研究早内容璃涉及新大量叼不同俩类型禾数据揪的统氏计分嗽析工赞作,捏可以社利用涝成熟赛的数即理统言计方秋法,裳关键匙点在逆于合故理规斧划数麦据采嚼集、缘瑞存储舍与处胶理等选实验搅方案躺,科石学选惊择统吼计指午标与裹统计豪模型钩,保虎证数概据处迫理工曾作有钱序、吩高效锦且准愁确。20耗09畅-1掠1-厨2916第一纯届中油国(早杭州饶)安窗全电态子商乏务学壳术会病议研究毛载体着特征顺值概亩率分辛布模生型时宰,计水划将肆载体纷按文元体分派为小灵说、完散文京、新舰闻报显道、桑文史织哲类乱学术膊论文员四类乓,每挪类文裹体样京本量驰在1惩00芝0篇欧左右种,分特别对法词性密、词锐性标巧记串滨及其绑信息巷熵、般逆序致数等跳进行旷统计荷处理惨,分危门别坟类地伶建立收这些础特征批值的梢概率柄分布读类型搬与冗雁余模株型,丹测定奋各种毁分布错参数窝。把特昌征值悠理解促为一舟个句敢子固袖有的温属性苹,而叙这些减特征册值都豆具有冒随机俗性,狸因此嫂可以锄用特浑征值轿随机帖向量兽来描史述样涉本。20岛09扔-1鸦1-疏2917第一逢届中烂国(擦杭州林)安麻全电却子商敌务学场术会悉议设避是特谎征值斥构成止的随啄机向语量,其中表是统档计相昼关的绿,是联范合分译布。20虽09剪-1点1-查2918第一稻届中糖国(茄杭州徒)安犯全电壤子商仪务学兽术会幼议采集柏各特瞎征值理的样倚本,甘建立宴特征俯值的木一维增分布胶和高仔维联黑合分郑布。咸联合朵分布可由封样本轻统计朱得到坏,而栗相应滋低维愉分布茧就是淘边际仪分布恰,即=奋;20漫09考-1骑1-够2919第一澡届中悟国(腔杭州伯)安传全电缴子商半务学获术会染议分析林特征躁值之逮间的队相关肥关系电。由颂于各淡特征劫值统逮计上授是不莫独立扒的,书所以浮携带好秘密坊信息亲的主呜特征势值的悦分布评改变宝后,逗其它炎特征柳值的榨分布肝也会胁改变妻,因衫此我野们要弊知道柴其它色特征牛值的涨分布明的变眠化规份律,的这样贱才能静控制络其它菜特征魔值分夺布的属变化松。这捞个变话化规后律就舰是主宋特征赶值与片其它框特征企值的流相关貌关系伪,对呼于一咐个好蛾的信卧息隐膨藏系悟统来省说,简这种倾关系穿在信榆息隐需藏前仙后应趟该是争不变念的。摸可采意用两浅种方抱法表石示这敲种相奥关关管系。20封09滋-1铲1-安2920第一舍届中裙国(俊杭州尺)安背全电壶子商注务学膏术会母议例句“他匹/r颠买/语v了职/u劲一/折m把遍/q喝裁/庙v纸团/n匹的/炒u刀猾/n啊,/摊w”“他裤/r沫买/予v了灰/u飘一/落m把纱/q徐裁/是v纸净/n协刀/萄n,蒙/w指”,绢(去掉答“的浮”)则句糊法分远析树昌变了班,词侦性标丸记串去也由墙“/毫r/击v/齿u/疲m/劲q/士v/坚n/穷u/蒸n/喘w”油变为乱“/累r/屿v/贵u/李m/杏q/虚v/扁n/卸n/乔w”降,词性腔标记竿串的敌逆序音数也陪由偶数轨20淘变为槐奇数禾19(采卡用字芳典序妻)。20晶09术-1烤1-信2921第一喘届中研国(你杭州秧)安牌全电太子商絮务学催术会跪议一个图是函叫数关筝系,膜我们匀可以渣由采告集到块的样蛇本回归铸出械与咽的接函数插关系;20莲09水-1罚1-优2922第一构届中碗国(炮杭州转)安以全电捏子商源务学稼术会塞议另一秆个是客条件赢概率厕,比做如条筛件概执率反映曲了真皆实文由本中浊特征诞值子慕向量妹对的依债赖关旨系。20害09祸-1结1-坑2923第一浴届中村国(姨杭州诊)安胜全电茂子商斩务学禾术会魂议2)息关于贵信道尽建模府工作以词纸性标枝记串部逆序验数、垂逆序船数奇弦偶性荣、词扇性标刷记串身信息锡熵等谣特征船值来乘携带涌秘密喉信息品,文枪本编枪辑(盗语句锁增删谷与移拦位,票语句需中词衰的增稳删与勾移位值等)汇可能完引起峰特征渔值的环改变光,改孩变的第规律敌即为撕相应敞的信枣道模苗型。20译09漂-1间1-卵2924第一昌届中畅国(晕杭州京)安睬全电到子商辅务学测术会邮议设标眼记串盆集合危为览,翻文本栋编辑贡为公饶式(崖1)辩中映罚射廉,刚定义焰A上覆的关炕系即两悄个标雪记串腥具有金关系稠当霞且仅鞋当它黄们可晌以通淹过文妻本编耳辑相串互转陕换,觉显然租具骡有对解称性裁和传症递性律,可旁根据符对显A分鼠类。20格09收-1贿1-套2925第一塑届中咏国(贞杭州骗)安嚷全电哗子商桥务学具术会讨议设有扰共n散个划筝分块恨,设岔要计装算的夫特征学值类较型为支T,淘若T鸟为离盾散型盆,则忆根据墨T的涂值进葛一步嘉将蚁分若为闻共光个子妹块,菌每个突子块腾有相锐同的昂特征僻值。界由此亩可按哑如下菠方法勾定义涝子块党间特岛征值彻的转难移概南率20府09哈-1逃1-沃2926第一丢届中瞒国(镜杭州段)安辜全电兆子商致务学店术会舟议最后迫可通那过对妇划分兆块加逆权的愧方式经定义叔特征途值转嫂移概液率。请若为仰连续葛型,遭比如竹信息太熵,缠则划古分块负的基寺数可旷用于冲标记独串频搂数变悲化范熄围估恢计,貌据此修可对虹特征梦值波朽动做稳出误垄差估展计,毛采用宇误差乎分析秋理论惧建立慌信道作模型世。20西09检-1归1-交2927第一坊届中顾国(趋杭州从)安要全电戴子商蚕务学献术会塌议7.歪与本杠项目塌有关原的工代作条溜件项目糖组已咸购置肝了由乔北京骗大学脸计算格语言分学研债究所讨开发逢的汉干语自储动分攻词与磨词性躬标注男软件饶,现渡代汉泛语语嫩法信端息电熄子词闯典等裁自然园语言午处理口工具便,为耀项目斯实施萝提供航了计败算语讯言学挺方面页的技茶术支妻持。项目推依托目武汉未工程酿大学分理学可院信族息与享计算桌科学枪专业渴实验指室,刺具有榴高性把能计排算设熄备和铸科研茂团队与的支横持。20夜09宫-1眠1-毛2928第一胜届中榴国(症杭州途)安枪全电常子商罪务学标术会题议8.锹项目条申请止人简旗介戴祖匆旭,余男,葬博士丹,副愧教授池。2贤00搁8/固9—准20南09蠢/7扶在北瞒京大羊学计颗算语狂言学兰研究盼所作阻为期灯一年稻的访厌问学虎者,停在俞渠士汶卧教授督指导雀下从堵事文泻本信戚息隐增藏的冲有关阔基础山理论利研究毁工作污;2体00关7年载毕业劫于华沈中科董技大温学计棒算机发科学嘉与技永术学铃院,选获得才计算另机软灰件与达理论夺专业姐博士取学位乐,研强究方哗向为左信息桑隐藏严与数谎字水匀印;日19芒99冲年7课月毕念业于蔑大连抄理工考大学秘应用庸数学裕系,捉获得简应用箭数学花专业墨理学顾硕士布学位榜。20跃09碗-1之1-否2929第一池届中森国(筝杭州现)安闷全电该子商唯务学廊术会萝议项目递申请好人主疑持的痛相关钻科研昆项目废:湖北漫省教耽育厅晨科学凭技术赚研究路项目波(D础20肤08蝇15贩06予),济已结婚题。文该项贩目主霉要研境究了辟文本苍词性蝴标记烟的数沃学性政质,线寻找题适合眉携带悦秘密条信息辞的特娇征值漫(标斗记串估逆序覆数、吼信息滨熵等糖),眨在此闯基础愤上设争计了幅若干吧新的慈信息马隐藏闲算法嚷。20丝式09甚-1哪1-糕2930第一窃届中传国(古杭州放)安谅全电势子商成务学架术会能议发表习与本劲项目产相关胖的论秧文有球:[1贞]戴慎祖旭珍.高痒精度厦模拟潮函数距[J撕].糖数学怀的实略践与剥认识伍,2动00吹9,顺第一距届中桨国(艺杭州喘)安咏全电哨子商近务学物术会恭议录脑用论移文[2社]戴霉祖旭病.抵恩抗同最义词旱替换强攻击寇的文膏本信短息隐武藏算坚法[沾J]哈.四煌川大演学学射报(杰工程抓科学驴版)(E像I收长录),2轰00狐9,驻41自(4请):蛾18漠6-叫19归0[3灿]戴天祖旭说,洪四帆粥,崔该国华清.信克息熵帮方程衡求解般算法著及其倘应用呼[J煌].匙高校洗应用墓数学降学报料,2戒00育8,财23赞(3彻):糕27电7-锻28甩1[4倾]D添ai湾z争ux妙u,珠Ho螺ng因f峰an亦,Y粒an草g教mu绩xi咳an顺g.神Te锋xt财I约nf坏or茂ma猛ti评on蝴H泪id艰in包g排Ba背se考d挤on龄P待ar哨t塌of烈S侨pe坑ec句h葡Gr兵am扒ma啄r[尤C]托.I夹n讨Yu搬pi者ng配W证an等g,茶Qi赖ng沉fu广Z穿ha赤ng塑,H列ai傻li耍n轨Li引u,诊an恭d闯Xi延am翁u粱Ni危u(配ed休.)孤:2醉00近7扎In余te愤rn肠at拉io呆na罗l遣Co馋nf狸er肃en症ce青o窗n乌Co件mp抵ut镇at遥io辈na鼻l涛In馆te宪ll瞒ig撒en严ce衬a话nd晨S涨ec太ur撇it木y繁Wo况rk欣sh颂op程s,瓶2汁00作7:杆63诸2-伐63语5(E它I收桶录)[5级]Z逮ux惕u夏Da牌i,春Fa料n陶Ho卡ng浊.W卧at苏er五ma守rk鄙in务g参Te镰xt路D想oc晓um可en舟ts曲B彼as丝式ed识o颤n坟En落tr皮op问y袍of渐P稠ar津t绕of毕S足pe砌ec求h吗St牙ri行ng固[J轮].眉Jo素ur宽na鄙l朴of顽I嗓nf役or启ma匠ti础on贿&批C袭om至pu涝ta标ti补on询al优S绞ci这en陈ce枪,2恼00快7,淡4(宗1)胳:2荡1-仆25(E情I收趴录)20鸟09鲁-1吊1-叉2931第一总届中雷国(马杭州滥)安剩全电埋子商慰务学黎术会贴议[6兴]戴苍祖旭渡,洪贱帆,毛崔国娇华,走付敏勒.基木于词已性标孩记串黑统计投特性戒的文御

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论