(高清版)GB∕T 37688-2019 信息技术 流式文档互操作性的度量_第1页
(高清版)GB∕T 37688-2019 信息技术 流式文档互操作性的度量_第2页
(高清版)GB∕T 37688-2019 信息技术 流式文档互操作性的度量_第3页
(高清版)GB∕T 37688-2019 信息技术 流式文档互操作性的度量_第4页
(高清版)GB∕T 37688-2019 信息技术 流式文档互操作性的度量_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.20GB/T37688—2019信息技术流式文档互操作性的度量国家市场监督管理总局中国国家标准化管理委员会GB/T37688—2019 I 2术语和定义、缩略语 6互操作性度量的应用 6附录A(资料性附录)模型应用的例子 7 IGB/T37688—2019本标准按照GB/T1.1—2009给出的规则起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。1GB/T37688—2019信息技术流式文档互操作性的度量本标准规定了度量流式文档互操作性所使用的模型结构和方法。本标准适用于流式文档的编写者和使用者在文档生存周期中对文档的创建、编辑、修改和评阅等2.1.12.1.22.1.3文档内容与显现式样的组织形式。2.1.42.1.5由若干功能点组成的系统。2.1.6功能点的重要度degreeofimportance功能点在文档使用中的重要程度。2.1.7功能点的可转换度degreeoftranslation功能点从一种文档格式描述转换为另一种文档格式描述的难易程度。2.1.8一种文档系统从一种文档格式描述转换为另一种文档格式描述的能力。下列缩略语适用于本文件。2GB/T37688—2019DI:功能点的重要度(DegreeofImportance)DT:功能点的可转换度(DegreeofTransformability)ODF:面向办公应用的开放文档格式(OpenDocumentFormatforOfficeApplications)OOXML:开放办公文档XML格式(OfficeOpenXMLFileFormats)UOF:统一办公文档格式(UniformOfficeDocumentFormat)3文档互操作性分类性时一定与文档格式相关。功能点从一种文档格式A转换到文档格式B的互操作性并不一定等同于文档互操作性是以所涉及的功能点的互操作性为基础的,其实质是一个功能点集合从一个文档格式转换到另一种文档格式的能力。为文档格式的互操作性和文档实例的互操作性。目前已经发布了多种流式文档格式标准,例如UOF、00XML、ODF等。这些文档格式标准中定义的功能点和文档结构都不完全相同,因此两个标准之间不能形成100%的功能点映射。文档格式间的互操作性主要是指一种文档格式的所有功能点转换到另外一种格式上的能力,是对一个文档实例只包含若干功能点,即由一个功能点集合构成。文档实例可以采用不同的文档格式文档实例间的互操作性是指一个采用特定文档格式描述的文档实例转换到另一种文档格式描述的能力。文档实例的互操作性是由其功能点集合决定的。由于每个功能点在不同格式间的映射能力不4互操作性度量模型互操作性度量模型包含概念层和参数层,具体说明见5.2和5.3。概念层描述文档中功能点的概念如图1所示。3GB/T37688—2019标题标题元数据文档章节—整体-部分作者段落概念层UOFOO参数层1概念层中的概念体系表示为节点和边构成的树型结构。节点为文档功能点。例如,段落(Paragraph)和句(Run)。边表示概念之间的关联,一般为整体-部分(whole-part)关联。例如,图1中数据”包含子功能点“题目”(Title)和“作者”(Author)等;功能点“章节”包含子功能点“段落”参数层描述用于度量文档互操作性的信息。模型中只为概念层中树的叶节点指定资源信息。参数按照其描述信息的用途分为两类:a)映射参数:描述概念层中底层功能点与具体文档格式的映射关系。详细说明见4.3.2。4GB/T37688—2019——所属类型(Type):表示特定的文档格式,如Type=“UOF”、Type=“OOXML”或Type=“ODF”。——位置(Location):表示该功能点在所指定的文档格式中所处的物理文件。对于文档格式不支——值(Value):表示功能点在所处的物理文件中所映射的元素或属性的具体位置。对于采用XML描述的文档格式而言,参数值宜用XPath来描述,即功能点所对应元素(或属性)的XPath。大多数文档格式都采用了打包的形式,即一个文档由若干物理文件组成。此时,“位置”用来指定功能点对应的元素(或属性)所属物理文件在包中的相对位置及文件名。例如,对于图1中功能点“作者”,明该功能点在UOF格式中,位于物理文件“mtea.xml”,功能点对应元素的XPath为“/元:元数据_5200/元:作者_5204”。对于仅采用单文件而不采用打包形式的文档格式而言,Location=“.”。4.3.3功能点的重要度功能点的重要度(DI)的赋值方法应采用如下三种方法之一:a)基于人工评价的三级由领域专家对功能点的重要度进行评价,分为三级,其中:——3级:指流式文档必备的功能点,量化为数值1;——2级:指流式文档常用的功能点,量化为数值0.6;——1级:指流式文档中很少用到的功能点,量化为数值0.3。例如,表A.1中“DI(fi)”列即采用三级赋值的方法。b)基于大量的文档实例进行统计,利用功能点的使用频度来评价DI值,使用频度越高的功能点DI值越大。设文档集合为D,共包含N个文档实例。功能点f;的DI值为该功能点在所有样本文档中出现的总次数与样本文档中所有功能点出现的总次数之和的比值。具体描述如式(1)。此方法评估出的DI值反映的是功能点使用频率的整体情况。其中,N;(fi)表示功能点f;在样本文档d;中出现的次数。c)基于一个特定的文档实例,利用功能点的使用频度来评价DI值。在一个特定的文档实例中,某个功能点的使用情况可能会与方法b)得出的DI值存在矛盾。例如,对于功能点f₁和f₂,利用式(1)得出的结果为p(f₁)>p(f₂),即功能点fi的重要度比f₂高。但是在文档实例d₁中,f₁并没有被用到,而f₂出现了很多次。很显然,针对文档d₁,通过方法b)获得的DI值并不能体现功能点在d₁中的重要度。此时,宜采用公式(2)的方法计算DI值。即功能点f:在特定文档d;中的重要度为:该功能点在d;中出现的次数与d;中所有功能点出现次数总和之比。…………(2)在方法b)和方法c)中,功能点的重要度(DI)根据该功能点的使用频度确定。重要度DI的取值在[0,1]区间之内,其中——[0,0.3]区间内表示该功能点很少使用;——(0.3,0.6)区间内表示常用功能点;——[0.6,1.0]区间内表示必备的功能点。5GB/T37688—20194.3.4功能点的可转换度功能点的可转换度(DT)使用类型和值两个属性来描述:——类型(Type):形式是“A2B”,表示由格式A转换到格式B;——值(Value):取值为范围为[0,1]。其中,[0,0.3]表示该功能点无法转换或很难转换,(0.3,0.6)表示转换难度中等,(0.6,1.0)表示容易转换。功能点的可转换度体现的是功能点的互操作性,是文档格式和文档实例互操作性的基础。功能点的可转换度主要由领域专家进行评价,分为三级:——容易转换:一个功能点从格式A转换到格式B时,信息可以完全保留;——中等难度:一个功能点从格式A转换到格式B时,信息可以保留大部分;——难以转换:一个功能点从格式A转换到格式B时,信息难以保留或无法映射。为了便于互操作度量的量化评价,将容易转换、中等难度和难以转换分别标记为数值1、0.6和0.3,用于描述功能点的DT值。例如,表A.1中“DTooxML₂oDF(f;)”列给出的是功能点从OOXML转换到ODF的可转换度。5互操作性度量方法5.1互操作性的分级度量文档系统互操作性采用分级的方式进行度量,分为三个级别:a)互操作性良好当文档系统从格式A转换到格式B时,文档系统中的所有或绝大部分功能点在A中的描述都在B中都存在相应的描述,使得文档的内容和式样信息在转换的过程中不会或基本不会产生损失,认为该文档系统的互操作性良好。此类文档系统中,很多的功能点在A中的描述都能在B中存在简单的一对一映射或一对多映射。b)互操作性一般当文档系统从格式A转换到格式B时,文档系统中的功能点在两种格式中都有类似地描述,使得文档的内容和式样信息在转换的过程中产生部分损失,或者信息虽然能够保留但是映射关系复杂,此时认为该文档系统的互操作性一般。此类文档系统中,功能点不能简单地进行一对一映射或一对多映射,会存在A中的n个功能点与B中的m个功能点映射的情况,转换方式较为复杂。c)互操作性差当文档系统从格式A转换到格式B时,存在部分功能点难以转换,导致转换后丢失的信息量较多,认为该文档系统的互操作性差。此类文档系统中,最差的情况是A中支持的功能点在B中不支持。5.2互操作性的量化度量根据度量模型中的参数,一个文档系统从格式A转换到格式B的互操作性可通过量化的方式进行度量。量化评价互操作性时,应综合考虑文档系统涉及的功能点集合,对其中所有功能点的重要度DI和可转换度DT之积求和,然后除以功能点的总数,以这个均值来衡量该文档系统的互操作性。互操作性度量见式(3):6GB/T37688—2019——tAi是TA的第i个功能点;——DI(tA)为4.3.3中所述功能点tA;的重要度;在无法直接度量两个文档实例(如A,C)的互操作性时,可以度量经由中间格式的互操作性。即,将TA替换成文档格式标准A涉及的所有功能点集合时,式(3)可以计算两种文档格式标准之间的互操作性。6互操作性度量的应用文档应用中可以根据需要设定互操作性的阈值。当互操作性小于阈值时,应该调整文档实例中互操作性差的功能点,代之以互操作性较好的功能点,以提高文档整体的互操作性。附录A给出了2个使用互操作度量模型的应用案例。7GB/T37688—2019(资料性附录)模型应用的例子A.1初始格式为00XML的模型应用的例子本部分给出一个例子,说明如何使用互操作度量模型。假设用户用00XML格式写一个文档(如图A.1所示),其他用户使用支持ODF格式的文档编辑器打开它。实际上,用户可以使用0OXML中的不同功能点集合来设计一些看起来相同的文档。但这些文档从0OXML到ODF的互操作性却不尽通知请于2016年12月1日14:00参加年终汇报会。图A.1一个实例文档的视图假设已建立好一个文档互操作性度量模型。基于该度量模型,用户可以根据度量结果从多个备选方案中选择互操作性高的文档。例如,用户设计了两个文档,分别称为实例1和实例2,它们使用的功能点集合不同,如表A.1所列类似,指明实例2中是否使用了该功能点。——“DTooxML₂oDr(fi)”列:给出功能点从格式0OXML转换到格式ODF时,功能点f;使用式(1)分别度量文档实例1和实例2的互操作性,Interop(OOXML,ODF)值的计算结果为:实例1为0.907,实例2为0.926。由此可知,实例2的互操作性较高。其主要差异在于,对于“通知”下面8GB/T37688—2019的横线,实例1使用功能点“句边框”而实例2使用功能点“段落边框”,(段落边框)>序号功能点f实例1实例21元数据——摘要1111112元数据——字符数111113元数据——创建日期114元数据——创建应用1115元数据——编辑时间1111116元数据——编辑次数1111117元数据——关键词1111181111119元数据——页数1111元数据——主题11111元数据——标题lllll1元数据——词数1111元数据——段落数1111段落首行缩进值111111段落自动行高值0111段落固定行高值11111段后绝对值11111段后相对值0101段落边框11101段落缩进绝对值11111段前绝对值1111段前相对值10111页面上边距11111页面下边距111111页面右边距11111页面左边距111句边框010段落文本对齐11110段落文本加黑111111A.2初始格式为UOF的模型应用的例子本部分的例子用于说明互操作度量模型的应用。假设用户用UOF格式生成一个实例文档(如图9GB/T37688—2019A.2所示),对该文档抽取功能点集合,然后分别计算该文档是从UOF到00XML的互操性Sim(UOF,0OXML)和从UOF到ODF的互操性Sim(UOF,ODF)。其度量方法和过程与A.1类似,经过 Sim(UOF,ODF)=0.84图A.2一个UOF实例文档的视图从互操性度量结果可以得出该实例文档到另外两种格式的互操性存在差异。为了分析互操性差异,本部分给出一些关于互操性参数的统计数据。本实例文档中涉及的功能点个数为41个,关于DI值和DT值的统计数据如表A.2和表A.3所示。表A.2文档实例中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论