7关于超文本标记语言_第1页
7关于超文本标记语言_第2页
7关于超文本标记语言_第3页
7关于超文本标记语言_第4页
7关于超文本标记语言_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于超文本标记语言考号:姓名:[内容摘要]:通过仔细分析html标签的各种性质,提出了几种新的基于标签的隐藏信息的方法。在此基础上,提出并实现了一个基于html标签的信息隐藏模型。该模型具有隐藏容量高、隐蔽性、鲁棒性和安全性较好,并且具有弹性,能自动调节隐藏算法的参数,使得在满足容量的前提下,尽量提高隐蔽性。

[关键词]:超文本标记语言;信息隐藏;数字水印;模型;标签;文本

随着电子图书版权保护、电子商务和电子政务中对电子公文的认证和保护的迫切需求,在文本中嵌入信息或水印的研究正受到重视。根据文本的作用,文本可分为:普通文本,如.txt文档、word文档或pdf文档等;特殊文本,如html中的标签、c语言源程序的语句。这些文本其作用是供浏览器解析或cpu执行的。目前针对word、pdf等普通文本,提出了很多隐藏信息或水印的方法,主要有:①替换法[1,2],如字符替换、单词替换、句子结构替换;②改变格式法[3~5],通过改变格式特征如字体、字号、颜色、字间距或行间距等进行信息隐藏;③基于语义的方法[6];④基于二值图像的方法[7];⑤插入空白符合法[8]等。利用www访问html网页是一种非常方便的获取信息的手段,而利用html网页隐藏信息进行秘密通信,或对html网页嵌入水印用于保护网页的知识版权或网站的认证,这方面的研究却很少见[10]。

1基于html超文本的信息隐藏方法

1.1html文件结构简介

超文本文档分文档头和文档体两部分。其基本结构是:

QhtmlRQheadR头部信息Q/headRQbodyR文档主体,正文部分Q/bodyRQ/htmlR

超文本文件不同于一般的纯文本文件,它是由标签和数据两部分组成。标签是用于控制数据显示格式和效果的,由浏览器解析执行的命令,相当于程序的指令;数据即是文件中包含的能够在浏览器上显示出来的文字、图片和动画等多媒体资料。标签用“Q”和“R”括起来,有单标签和双标签两种类型。单标签只需单独使用,格式是:Q标签名称R,如QbrR标签表示换行的意思;双标签必须是起始标签和结束标签成对出现,格式是:Q标签R内容Q/标签R,如QhtmlR――Q/htmlR标签。大部分标签还可以具有属性和属性值,带属性的标签的格式是:Q标签名称属性名称=“属性值”R。

1.2基于html文件的信息隐藏方法

根据超文本文件的结构便知道,在超文本文件中隐藏信息主要有两种策略,即在数据元素中隐藏信息和在标签中隐藏信息。在数据元素中隐藏信息的方法依赖于数据的类型是文字、图像、声音、脚本语言程序等而不同。如果元素类型是文本的话,则可应用基于普通纯文本的隐藏方法,如替换法。标签虽然是纯文本,但由于是程序指令,有固定的诸多语法规则和约束,不能随便照搬基于普通纯文本的隐藏方法,而是需要特殊考虑。标签只是控制数据在浏览器上的表现形式,而不会显示出来。如果能够基于标签隐藏信息,其隐蔽性将会比较好。

目前已提出的基于超文本文件的隐藏方法有[9,10]:①在网页结束标记Q/htmlR后或者在每行的行尾插入空格或tab键隐藏信息,插入一个空格代表0,插入一个tab代表1。像著名的水印软件wbstego、stegano、invisiblesecret等都是利用这种方法。之所以可以这样隐藏信息,是因为浏览器会对html文件中多余的空格忽略掉,从而插入空格或tab后不改变显示的结果。可以通过连续插入任意多个符号使得隐藏的容量可以任意大,这是其优点;其缺点是每插入一个字节的信息,文件大小需增加八个字节;另外,虽然隐藏信息后的文件浏览的结果不会改变,用记事本这样的编辑软件打开也不容易看出差别(但仔细看还是能看出这些不必要的空白符号的存在),但是当文件以二进制格式打开时其多余的空格符号一览无遗,同时,这种方法也经不起“网页减肥茶”之类的软件处理[12]。②修改标记名称字符的大小写,用大写表示1,小写表示0来隐藏信息。例如以大写标记名称QhtmlR代表1,以小写的标记名称QhtmlR代表0。这样,一个标记可隐藏1bit信息。方法2克服了方法1的缺点,具有较好的隐蔽性和抗攻击性[10]。

2几种新的基于超文本的信息隐藏方法

2.1隐藏方法

前面的基于修改标签名称字母大小写的方法虽然克服了方法①的缺点,具有较好的隐蔽性和抗攻击性。但是,其隐藏容量比较小,不能满足隐藏长文本,特别是隐藏图像的需求。

通过仔细分析html超文本标记语言的语法规则后,发现还有以下一些资源可以用于隐藏信息。

(1)标记属性名称像标记名称一样对字母大小写不敏感。可以通过修改标记属性名称的大小写来隐藏信息。比如,用标记属性名称字母全部大写代表1,全部小写代表0。例如Qdivalign="center"R代表1,Qdivalign="center"R代表0。这样,一个属性名称可隐藏1bit信息。

(2)标记属性可以赋值,而属性的值是用“”括起来的字符串,属性值字符串中的字母对大小写不敏感。可以通过修改属性值字符串的大小写来隐藏信息。比如用属性值字母的全部大写代表1,全部小写代表0。例如Qdivalign="center"R代表0,Qdivalign="center"R代表1。这样,一个字符串属性值可隐藏1bit信息。

(3)html中,属性值默认是用双引号括起来的,但是也可以用单引号括起来。可以将属性值外面的双引号“”用单引号‘’替换来隐藏信息。比如,用双引号时代表1,单引号时代表0。例如Qdivalign="center"R代表1,而Qdivalign=′center′R代表0。这样,一对属性值引号可隐藏1bit信息。ァ2.2隐藏性能分析

3.1信息隐藏模型

前面可以看到,基于html标签的隐藏方法,单一的隐藏方法容量是比较小的,只能隐藏少量的字符信息。为了满足实际的信息隐藏的需要,必须考虑综合采用多种隐藏方法,并采取其他一些措施在安全性、容量、隐蔽性和鲁棒性之间取得折中。基于此,本文建立了一个基于html标签的信息隐藏模型,如图1所示。该模型包括秘密信息的嵌入和秘密信息的提取两部分,考虑了隐蔽性、鲁棒性、安全性和容量要求。

信息在嵌入之前必须进行预处理,预处理的主要目的是进行压缩、加密和纠错编码处理。

这里,笔者采用的是无损压缩方法。一种广泛运用的无损压缩方法是huffman编码,它是基于信源字符统计分布的不均匀性,对出现概率大的字符分配较短的码字,而对很少出现的字符

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论