CESA-2019-2-001《流式文档格式》团体标准(征求意见稿)_第1页
CESA-2019-2-001《流式文档格式》团体标准(征求意见稿)_第2页
CESA-2019-2-001《流式文档格式》团体标准(征求意见稿)_第3页
CESA-2019-2-001《流式文档格式》团体标准(征求意见稿)_第4页
CESA-2019-2-001《流式文档格式》团体标准(征求意见稿)_第5页
已阅读5页,还剩1587页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.20

CSSL76

团体标准

T/CESAXXXX—2021

流式文档格式

Re-flowabledocumentformat

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

2021-XX-XX发布2021-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX—2020

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

本文件由中国电子技术标准化研究院提出。

本文件由中国电子技术标准化研究院、中国电子工业标准化技术协会归口。

本文件起草单位:。

本文件主要起草人:。

IV

T/CESAXXXX—2021

流式文档格式

1范围

本文件规定了电子文件存储与交换的流式文档格式,包括文字处理、电子表格处理和演示文档三种

主要应用的文档结构。

本文件适用于流式文档处理与交换。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T2659-2000世界各国和地区名称代码((epvISO3166-1:1997)

GB/T4880.1-2005语种名称代码第1部分:2字母代码(ISO639-1:2002,MOD)

GB13000-2010信息技术通用多八位编码字符集(UCS)(idtISO/IEC10646/2003)

GB18030-2005信息技术中文编码字符集

GB/T18793-2002信息技术可扩展置标语言(XML)1.0

3术语和定义

下列术语和定义适用于本文件。

3.1

锚点anchor

文档中用于定位浮动内容的元素和属性。

3.2

区域area

文档中的一段连续内容。在文字处理文档中,区域由段落或句构成;在电子表格文档中,区域由若

干单元格构成。

3.3

书签bookmark

标识文档的某个位置,以便快速定位的标识。

1

T/CESAXXXX—2020

3.4

图表chart

为直观展现数据,在工作表中用图形方式显示出来的数据表现形式。

3.5

配色方案colorscheme

幻灯片设计模板中预先确定的一套颜色,分别应用于背景、文本和线条、阴影、标题文本、填充、

强调和超链接等部分。

3.6

域field

文档中自动计算的内容区域。

3.7

流式文档flowdocument

用于编辑的文档,在显现时采用流式灌排的方式动态计算版面。

3.8

图graph

文档中的图示内容,包括所有预定义和自定义的图形,但不包括图表。

3.9

布局layout

演示文稿中幻灯片内容的组织方式,一般通过枚举方式供选择使用。

3.10

句run

文字处理文档中的最小排版单元。

3.11

母版master

2

T/CESAXXXX—2021

演示文稿中为方便制作幻灯片所预先设定的模板,包括式样和布局等内容。

3.12

节section

文字处理文档中最大的排版单元。

3.13

文字表table

文字处理文档中定义的表格。

3.14

用户数据使用限制rdefineddata

文档中,用户通过XML大纲引入的数据,该数据可以被抽取出来形成符合大纲的实例

4符号和缩略语

下列缩略语适用于本文件。

API应用程序编程接口(ApplicationProgrammingInterface)

HTML超文本标记语言(HypertextMarkupLanguage)

UOF统一办公文档格式(UniformOfficeFormat)

URI通用资源标识符(UniversalResourceIdentifier)

URL统一资源定位符(UniformResourceLocator)

UTF-8针对Unicode的可变长度字符编码(8-bitUnicodeTransformationFormat)

VBAVisualBasic的一种宏语言(VisualBasicforApplications)

XML可扩展置标语言(ExtensibleMarkupLanguage)

5标准结构

本文件由以下内容组成:

——打包存储格式,即物理存储文件的基本结构。

——Schema描述,对XMLSchema表达的文档的结构进行说明,包括各个元素和属性的说明。所用编

码字符集至少遵循GB18030强制部分,必要时应与GB13000的相应部分建立映射关系,并应采用国家标

准和行业标准规定的字型。XML描述遵循GB/T18793-2002。

6打包存储格式

6.1目录结构

3

T/CESAXXXX—2020

流式文档格式采用多文件(目录)的结构存储文档,文件结构见表1。

表1文件结构

目录内容说明

根目录。

uof.xml记录文档的顶层信息(必选)。

记录文字处理、电子表格和演示文稿文档的内容

content.xml

(必选)。

styles.xml记录式样信息(可选)。

rules.xml记录公用处理规则(可选)。

themes.xml记录主题集(可选)。

定义文字处理和电子表格的区域集,包括书签集,

/areas.xml非限制编辑区集,命名区域集以及内容控件集(可

选)。

comments.xml记录批注数据(可选)。

equations.xml记录公式信息(可选)。

hyperlinks.xml记录超级链接信息(可选)。

objectdata.xml记录各种对象信息(可选)。

operations.xml记录文档操作信息(可选)。

sharedStrings.xml记录电子表格文本数据(可选)。

thumbnail.png文档的缩略图(可选)。

工作表目录。

sheet%d/content.xml记录工作表数据(必选)。

sheet%d/graphics.xml记录工作表里对象的数据(可选)。

slicers/caches/slicercache%d.xml记录切片器数据源缓存记录(可选)。

slicers/datas/slicer%d.xml记录切片器展示结构和数据(可选)。

worksheetspivottables/caches/definition%d.xml记录数据透视表数据源缓存定义(可选)。

pivottables/caches/record%d.xml记录数据透视表数据源缓存记录(可选)。

pivottables/data/pivotTable%d.xml记录数据透视表展示数据(可选)。

tableviews/tableView%d.xml记录数据表结构(可选)。

retrievedTables/retrievedtable%d.xml记录查询表结构(可选)。

元数据目录。

meta.xml记录元数据信息(必选)。

/_meta

图表目录。

chart%d.xml记录图表信息(可选)。

/chartschartstyle%d.xml记录图表式样(可选)。

chartgraphic%d.xml记录图表上的对象信息(可选)。

演示文稿对象目录。

graphics

graphics%d.xml记录演示文稿每页幻灯片上对象的数据(可选)。

4

T/CESAXXXX—2021

表1文件结构(续)

目录内容说明

配置目录。

shortcuts.xml记录自定义的快捷键(可选)。

uottparts.xml记录文档部件信息(可选)。

/config

dataconnections.xml记录数据连接信息(可选)。

externallink.xml记录跨book数据、外部链接数据(可选)。

xmlmaps.xml记录XMLMap数据(可选)。

应用程序相关数据的目录,包括用户定义的XML和嵌

入的其他内容。本目录下文件名和文件数量不固定。

注:电子公文用的用户定义数据文件建议命名为:

/app/userdata.xml。

记录app目录下所有文件的信息,包括厂商、版本号、

/appmanifest.xml

类型信息(可选)。

记录各厂商自定义文件,命名extend.xml,记录扩

展信息(可选)。

/xxx

注:宏数据文件建议命名为:

/app/xxx/macrodata.bin。

放置外挂多媒体对象(如图片)。本目录下文件数量

不固定,但文件按标识符命名,例如:0001.jpg、

/data0002.wav、0003.mpg等。在XML实例中引用时,路

径相应地表示为:/data/0001.jpg、/data/0002.wav、

/data/0003.mpeg等。

墨迹目录。

/ink

ink%d.xml记录墨迹数据(可选)。

智能图形目录。

/smartGraphicslayout%d.xml记录智能图形排版布局信息,可选

data%d.xml记录智能图形节点数据信息,可选

放置内嵌字体文件,嵌入的字体文件应使用

/font

OpenType格式(可选)。

安全目录。

security.xml记录权限控制,加密、安全等信息(可选)。

/security

encryptedData.bin整个zip压缩包加密之后的二进制数据(可选)。

encryption.xml记录加解密相关的信息(可选)。

出于提高效率的考虑,根目、元数据目录和安全目录下的文件名称是固定的,但是如果没有用到,

上述标为可选的文件可以不出现。

6.2文件的打包

UOF采用ZIP打包方案形成可交换的单一文件。本文件要求使用ZIP规范中默认的Deflate压缩方法。

多文件的数据组织方式采用ZIP规范6.2.0。

5

T/CESAXXXX—2020

a)打包后的UOF文件的后缀可以是:

——.uof3:表示一般的UOF文件,可以是任意的文字处理、电子表格或演示文稿文档。

——.uot3:表示UOF格式的文字处理文档。某些用户可能需要从文件后缀上区别出是文字处理文档;

——.uos3:表示UOF格式的电子表格文档。某些用户可能需要从文件后缀上区别出是电子表格文档;

——.uop3:表示UOF格式的演示文稿文档。某些用户可能需要从文件后缀上区别出是演示文稿文档。

b)除上述后缀外,UOF还有一套为模板文件保留的后缀,分别是:

——.uott3:表示文字处理文档模板;

——.uost3:表示电子表格文档模板;

——.uopt3:表示演示文稿文档模板。

7schema描述

7.1命名空间

本文件采用下述命名空间来描述文档格式,见表2。

表2:命名空间

命名空间URI前缀Schema文件实例文件说明

/uof3/zh-cnuof公共类型.xsd记录公共类型数据。

/2021/uof

/uof3/zh-cn安全安全.xsd/security/关于安全相关的(如

/2021/securitysecurity.xml权限控制、加密和签

名)元素结构(可

选)。

/uof3/zh-cn表表.xsd/worksheets/主要用于电子表格

/2021/spreadsheetsheet%d/content.xml应用的元素结构。

/cn/2009/op操作操作集.xsdoperations.xml关于文档操作的元

erations素结构(可选)。

/uof3/zh-cn对象对象数据集.xsdobjectdata.xml记录各种对象信息

/2021/objects(可选)。

/uof3/zh-cn公式公式集.xsdcontent.xml关于公式的元素结

/2021/equations构(可选)。

/uof3/zh-cn规则公用处理规则.xsdrules.xml关于公用处理规则

/2021/rules的元素结构。

/uof3/zh-cn快捷键快捷键.xsd/config/记录自定义的快捷

/2021/customshortcutsshortcuts.xml键(可选)。

/uof3/zh-cn超链链接集.xsdhyperlinks.xml关于超级链接的元

/2021/hyperlinks素结构(可选)。

/uof3/zh-cn批注批注集.xsdcomments.xml记录批注数据(可

/2021/comments选)。

/uof3/zh-cn清单清单.xsdmanifest.xml记录清单数据(可

/2021/manifest选)。

6

T/CESAXXXX—2021

表2:命名空间(续)

命名空间URI前缀Schema文件实例文件说明

/uof3/zh-cn区域区域集.xsdareas.xml定义文字处理和电

/2021/areas子表格的区域集,包

括书签集,非限制编

辑区集,命名区域集

以及内容控件集(可

选)。

/uof3/zh-cn式样式样集.xsdstyles.xml关于公用处理式样

/2021/styles的元素结构。

/uof3/zh-cn图图.xsdcontent.xml;关于绘图的元素结

/2021/graph/worksheets/构(可选)。

sheet%d/

graphics.xml;

/graphics/

graphics%d.xml;

/uof3/zh-cn图表图表集.xsdchart%d.xml关于图表的元素结

/2021/chartchartstyle%d.xml构(可选)。

chartgraphic%d.xml

/uof3/zh-cn图形图形集.xsdgraphics%d.xml关于图形的元素结

/2021/graphics构(可选)。

/uof3/zh-cn演演.xsdcontent.xml主要用于演示文稿

/2021/presentation应用的元素结构。

/uof3/zh-cn数据用户数据集.xsduserdata.xml文档的用户数据集

/2021/uds结构(可选)。

/uof3/zh-cn元数据元数据.xsd/_meta/meta.xml文档的元数据元素

/2021/metadata结构。

/uof3/zh-cn主题主题集.xsdthemes.xml记录主题集(可选)。

/2021/themes

/uof3/zh-cn字字.xsdcontent.xml主要用于文字处理

/2021/wordproc应用的元素结构。

7.2UOF

7

T/CESAXXXX—2020

元素UOF_0000

层次结构

特性内容复杂

属性名称类型使用限制默认值固定值

mime类型_0001继承于:xsd:string必选

language_0002继承于:xsd:string必选

version_0003xsd:string必选3.0

文档标识_0004xsd:ID可选

基文档引用_0005xsd:string

属性UOF_0000/@mime类型_0001

类型约束xsd:string

特性使用限制必选

刻面种类取值

枚举值vnd.uof.text

枚举值vnd.uof.spreadsheet

枚举值vnd.uof.presentation

属性UOF_0000/@language_0002

类型约束xsd:string

特性使用限制必选

属性UOF_0000/@version_0003

类型xsd:string

特性使用限制必选

fixed3.0

属性UOF_0000/@文档标识_0004

类型xsd:ID

特性使用限制可选

属性UOF_0000/@基文档引用_0005

类型xsd:string

8

T/CESAXXXX—2021

7.3元数据

元素元数据_5200

层次结构

特性内容复杂

子元素元:标题_5201元:主题_5202元:创建者_5203元:作者_5204元:最后作者_5205元:摘要_5206元:创建日

期_5207元:编辑次数_5208元:编辑时间_5209元:创建应用程序_520A元:创建应用程序版本号_521C元:

分类_520B元:文档模板_520C元:关键字集_520D元:自定义元数据集_520F元:单位名称_5213元:页数

_5215元:字数_5216元:英文字符数_5217元:中文字符数_5218元:行数_5219元:段落数_521A元:对象

数_521B元:最后打印时间_521D元:最后修改时间_521E元:幻灯片数_521F元:备注数_5220元:隐藏幻灯

片数_5221元:多媒体总数_5222元:含空格字符数_5223

9

T/CESAXXXX—2020

元素元数据_5200/标题_5201

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/主题_5202

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/创建者_5203

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/作者_5204

层次结构

类型listofxsd:string

特性最小出现次数0

最大出现次数1

内容简单

10

T/CESAXXXX—2021

元素元数据_5200/最后作者_5205

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/摘要_5206

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/创建日期_5207

层次结构

类型扩展xsd:dateTime

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/编辑次数_5208

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/编辑时间_5209

层次结构

类型扩展xsd:duration

11

T/CESAXXXX—2020

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/创建应用程序_520A

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/创建应用程序版本号_521C

层次结构

类型xsd:string

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/分类_520B

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/文档模板_520C

层次结构

类型xsd:string

特性最小出现次数0

最大出现次数1

内容简单

12

T/CESAXXXX—2021

元素元数据_5200/关键字集_520D

层次结构

特性最小出现次数0

最大出现次数1

内容复杂

子元素元:关键字_520E

元素元数据_5200/关键字集_520D/关键字_520E

层次结构

类型扩展xsd:string

特性最小出现次数1

最大出现次数无限制

内容复杂

元素元数据_5200/自定义元数据集_520F

层次结构

特性最小出现次数0

最大出现次数1

内容复杂

子元素元:自定义元数据_5210

元素元数据_5200/自定义元数据集_520F/自定义元数据_5210

层次结构

类型扩展xsd:string

特性最小出现次数1

最大出现次数无限制

内容复杂

13

T/CESAXXXX—2020

属性名称类型使用限制默认值固定值

名称_5211xsd:string可选

类型_5212继承于:必选

xsd:string

属性元数据_5200/自定义元数据集_520F/自定义元数据_5210/@名称_5211

类型xsd:string

使用限制可选

特性

属性元数据_5200/自定义元数据集_520F/自定义元数据_5210/@类型_5212

类型约束xsd:string

使用限制必选

特性

刻面种类取值

枚举值array

枚举值blob

枚举值bool

枚举值bstr

枚举值cf

枚举值cy

枚举值date

枚举值decimal

枚举值empty

枚举值error

枚举值filetime

枚举值i1

枚举值i2

枚举值i4

枚举值i8

枚举值int

枚举值lpstr

枚举值lpwstr

枚举值null

枚举值oblob

枚举值ostorage

枚举值ostream

枚举值r4

枚举值r8

枚举值storage

枚举值stream

枚举值ui1

14

T/CESAXXXX—2021

枚举值ui2

枚举值ui4

枚举值ui8

枚举值uint

枚举值vector

枚举值vstream

元素元数据_5200/单位名称_5213

层次结构

类型扩展xsd:string

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/页数_5215

层次结构

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/字数_5216

层次结构

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/英文字符数_5217

层次结构

15

T/CESAXXXX—2020

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/中文字符数_5218

层次结构

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/行数_5219

层次结构

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/段落数_521A

层次结构

类型扩展xsd:long

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/对象数_521B

层次结构

类型扩展xsd:long

16

T/CESAXXXX—2021

特性最小出现次数0

最大出现次数1

内容复杂

元素元数据_5200/最后打印时间_521D

层次结构

类型xsd:dateTime

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/最后修改时间_521E

层次结构

类型xsd:dateTime

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/幻灯片数_521F

层次结构

类型xsd:int

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/备注数_5220

层次结构

类型xsd:int

特性最小出现次数0

最大出现次数1

内容简单

17

T/CESAXXXX—2020

元素元数据_5200/隐藏幻灯片数_5221

层次结构

类型xsd:int

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/多媒体总数_5222

层次结构

类型xsd:int

特性最小出现次数0

最大出现次数1

内容简单

元素元数据_5200/含空格字符数_5223

层次结构

类型xsd:int

特性最小出现次数0

最大出现次数1

内容简单

7.4公共类型

元素图片数据引用_8037

层次结构

类型uof:图片数据引用类型

内容复杂

特性

18

T/CESAXXXX—2021

子元素uof:嵌入图片数据引用_C671uof:链接图片数据引用_C672

复杂类型图形类型图片填充类型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论