




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章XML语法,本章学习目标,1、了解XML文档结构2、掌握编写格式正确的XML文档的基本技术,2.1XML文档结构,一般地,一个格式正确的(Well-Formed)XML文档由三个部分组成:可选的序言(Prolog)文档的主体(Body)可选的尾声(Epilog),2.1.1文档的序言,序言的组成包括:一个可选的XML声明,可能紧跟着还有注释、处理指令PI、文档类型声明DTD等。由于这些内容都是可选的,所以序言可以被省略,但W3C推荐将XML声明作为XML文档的第一行。,1.“”表示处理指令结束,文档类型声明DTD,DTD用于确定XML的合法性。文档类型定义是以的结构在XML文档中出现。DTD可以直接在XML文件中声明,也可以将DTD的声明放在别处,然后在XML文件中指明其所在.,DTD文件类型声明示例,PG洗发液宝洁公司samsung显示器韩国三星公司,DTD文件类型声明,2.1.2文档的主体,文档的主体(body)由一个或多个元素组成,是文档的核心及内容所在的地方,XML文档中所有可以被应用程序使用的信息都存放在此。,树状结构,DTD中定义的元素,还可以包含其他元素,这说明,XML文档从根元素开始有类似树状的结构,每个子元素都包含在它的父元素之中。,销售商品,商品,商品,品牌,名称,厂商,2.1.3文档的尾声,尾声的内容可以包括:注释、处理指令PI(ProcessingInstruction)和/或紧跟元素树后面的空白。,2.2元素和标记,元素是XML文档内容的基本单位,元素使用标记(Tag)进行分隔。2.2.1元素的基本形式元素内容创建XML元素规则:a)一份xml文档中至少要有一个元素。b)一份xml文档有且只有一个根元素。,2.2.2标记XML标记和HTML标记形式上大体相同,包含标记名和零个或多个属性:XML对于标记的语法规定很严格,它要求:1.标记必不可少2.大小写有所区分3.要有正确的结束标记4.XML严格要求标记配对5.标记要正确嵌套6.标记命名要合法7.有效使用属性,标记名命名规则,以字母或下划线“_”开头,后面跟0个或多个字母、数字、句号“.”、冒号“:”、下划线“_”或连字符“-”。不能以数字开头。不能以字母串“xml”(或“XML”或“Xml”)开头。不能包含空格不能包含“/”尽量避免使用“-”、“.”和“:”,2.2.3元素内容1.字符数据:可以是任何合法的Unicode字符。但不能包含被预留做特殊用途的字符,如“”为避免把字符数据和标记中需要用到的特殊符号相混淆,XML提供了预定义实体来代替特殊符号。p24,2、嵌套类型:元素中还可以再嵌套别的元素。通常将一个包含一个或多个元素的元素称为父元素;一个直接包含在父元素之下的元素称为该父元素的子元素。XML规范中规定:任何格式正确的XML文档都必须由形成一个简单的层次树的元素组成,层次树的根元素就是文档元素,文档中其他所有元素都嵌套在文档元素中。,3.CDATA段:包含除字符串“”以外的任意字符的文本块。解析器不对CDATA段的内容做处理。4.处理指令:XML文档中,用来给处理它的应用程序提供信息的元素。5.注释:对XML文档内容的补充说明。,2.3属性,属性是对标记的进一步描述和说明,一个标记可以有多个属性。XML文档中标记的属性需满足下列规则:1.属性必须有值。2.属性值必须用引号括起来。,属性和元素之间的使用区别数据既可以存储在子元素中也可以存储在属性中。一般,尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。属性存在如下问题:1.属性不能包含多个值(子元素可以)2.属性不容易扩展3.属性不能够描述结构(子元素可以)4.属性很难被程序代码处理5.属性值很难通过DTD进行测试,2.4实体,XML实体(Entity)与程序设计语言中的符号常量相似。使用实体的好处:1.可以避免重复输入。2.提高维护效率3.可将多个不同文件的数据并入同一XML文档中。,2.4.1实体的两种类型,一般实体(GeneralEntity)包含了可以用在文档元素内的XML文字或非文字数据,可在XML文档中引用。定义格式:,参数实体(ParameterEntity)包含了被安插在DTD中的文字,可在DTD文件中引用。定义格式:,2.4.2实体的使用方法,1.实体声明具体数据内容,2.实体引用引用形式:实体引用注意:1.在引用之前,必须先声明2.在一个实体中可以再引用其他实体,但不能出现循环引用3.实体引用不能在DOCTYPE声明中出现4.实体引用的文本必须是格式正确的XML,2.5注释,注释是为了便于阅读和理解,在XML文档中添加解释说明的字符数据,这些字符数据不会被浏览器显示,或被XML处理程序处理。语法形式:,注释须注意的几点:注释不能在XML声明前;注释不允许出现在标签中;注释不能嵌套和重叠使用。,注释示例,2.6CDATA段,CharacterDATA字符数据用于需要把整个文本解释为纯字符数据的情况。在XML文档中,所有文本都会被解析器解析,只有在CDATA内部的文本会被解析器忽略。语法:,2.7处理指令(PI),处理指令(ProcessInstrument)是XML分析必须扫描的指令PI含有应用程序所使用的标记信息PI的命令格式以”结束,2.8空白问题,空白是指没有可视外观,但对文档的格式化有影响的字符(空格、制表、换行、回车)对空白的处理由其在XML中的位置决定:空白在标记内,所有空白等效于单个空格空白字符;将所有空白至单个空格的转换称空白规范化;内容中的空白可通过使用xml:space属性控制这一点:属性值设为preserves时所有空白未加改变地传递给应用程序属性值为default时将该元素及其以下元素的空白规范化,空白处理示例,2.9创建格式良好的XML文档,2.9.1格式良好的XML文档XML除了标准定义之外,几乎任何标记的设置都可以自定义在自由设置的条件下,XML提供一些特定的规则,XML文件只有符合这些规则,解析器才会处理.符合符号和结构规则的XML文件,称为Well-formed格式良好是创建一个可用XML文档的基本要求。,XML语法-八条规则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第2.6讲 指数与指数函数(解析版)-2024年高考数学一轮复习精讲精练宝典(新高考专用)
- 浙教版2023小学信息技术六年级上册《算法的多样性》教学设计及反思
- (一模)萍乡市2025年高三第一次模拟考试历史试卷(含答案解析)
- 2025年B2B营销业务 AI提示词手册
- 陶瓷拦水带施工方案
- 高楼地铁隧道施工方案
- 砂浆基础知识培训课件
- 2025年山东聊城高三一模高考数学试卷试题(含答案详解)
- 2025年药具科技工作培训标准教案
- 写赠予房产合同范例
- 2024-2025学年第二学期天域全国名校协作体高三3月联考 地理试卷(含答案)
- 修理木桥施工合同范本
- 学校2025年每日两小时体育活动方案-阳光体育活力四溢
- 锤击式PHC预应力混凝土管桩贯入度的控制
- 新教科版一年级科学下册第一单元第6课《哪个流动得快》课件
- 屋面种植土垂直施工方案
- 2025年新人教PEP版英语三年级下册全册课时练习
- 《爱耳日课件》课件
- 2024年安徽中医药高等专科学校高职单招职业适应性测试历年参考题库含答案解析
- GB/T 45107-2024表土剥离及其再利用技术要求
- 2025年保密工作计划(3篇)
评论
0/150
提交评论