2023语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)_第1页
2023语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)_第2页
2023语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)_第3页
2023语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)_第4页
2023语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11(MQI)II目 次范围 1规性用件 1术和义 1数标语的象范 33量记言特点 3模型 3量记言(QML_as)抽语法 4量记言(QML_cs)其集具语法 5数标语(QML_csx)于XML的体法 55带ID前的签称 5<MQI>属规范 6本素型属规范 6接型属规范 7QML_csx说明 7数标语(QML_cst)于TEI的体法 9量记言(QML_cst)具语法 9QML_cst说明 10附录A(料录)带多例的QML_csx说明 13附录B(料录)可量量息正式句 15附录C(料录)单表示 16参考文献 17PAGEPAGE10语言资源管理语义标注框架(SemAF)第11部分可度量数量信息(MQI)范围(NLP)注:ISO24617-12处理量化和数量信息的更一般和理论问题。本文件还涉及ISO24617-1中讨论的时间持续时间,以及在ISO24617-7中处理的距离等空间度量,同时使它们与其他度量类型进行互操作。它还包括ISO24617-6:20168.3中引入的度量或数量的处理。(ISO2612LALangugeesorceManement-LngusticAnnotationFramework(LAF)下列术语和定义适用于本文件。量qulity可度量对象的特性,涉及其大小或数量。[来源:ISO/IECGuide99:2007,1.1,已修改]基本量basequantity在给定量制中约定选取的子集中的量(3.1),其中子集中的任何量均不能用该子集中的其他量表示。注:量的种类包括国际量制(ISO)中定义的七种基本量。[来源:ISO/IECGuide99:2007,1.4,已修改]导出量derivedquantity量制中由基本量(3.2)定义的量(3.1)。示例:速度是由长度(距离)随时间变化(LT-1)定义的导出量,其中长度(L)和时间(T)属于基本量。[来源:ISO/IECGuide99:2009,1.5,已修改]数量信息thenumberofinformation,QI与可度量对象的量(3.1)相关的测量。可度量数量信息measurablequantityinformation,MQI可用统一数字术语表示的数量信息(3.4)可度量数量信息标记语言measurablequantityinformationmarkuplanguage,QML可度量数量信息的标记语言数量标记语言可从文本或其他媒介类型语言中提取的可度量数量信息(3.5)标注的规范语言。测量单位unitofmeasure计量单位themeasuringunit单位通过乘以以实数表示的量值,根据约定定义和采用的测量对象的标量。注:量中使用的表达,如“米”、“升”和“毫摩尔每千克”,是上述所给定义的单位。在“两瓶牛奶”、“一盒苹果”和“两杯咖啡”中,“瓶”、“盒”或“两杯”等数量表达有时不能被视为单位,但如果它们在某些社区按约定或被同意接受为单位,则也可以被视为单位。ISO24617语义标注框架(SemAF)第12部分:量化将这些数量表达式视为真单位。[来源:ISO/IECGuide99:2007,1.9,已修改]基本单位basicunit对于基本量(3.2),约定采用的测量单位(3.7)。注:国际单位制(SI)选择了与七个国际量制基本量相关的七个基本单位,用于测量量,如表1所示。表1基本单位单位制基本单位(单位符号)相关国际量制基本量(基本量符号)米(m)长度(L)千克(kg)质量(M)秒(s)时间(T)安培(A)电流(I)开(K)热力学温度(È)摩尔(mol)物质数量(N)坎(cd)发光强度(J)[来源:ISO/IECGuide99:2007,1.10,已修改]导出单位derivedunits导出量(3.3)的测量单位(3.7)。示例:单位“牛顿”(N)是导出量“力”(F)的导出单位,定义为“质量乘以加速度”(MLT-2),其中量“加速度”是由“速度除以时间”(VT-1)定义的导出量,而“速度”定义为“长度(距离)除以时间”(LT-1)。注:表2举例说明了一些导出单位。[来源:ISO/IECGuide99:2007,1.11]表2导出单位导出单位(单位符号)相关导出量公里/分钟(km/min)速度=长度(L)/时间(T)克/立方米(gram/m3)密度=质量(M)/体积(L3)千克米/平方秒(kgxm/s2)力=质量(M)x长度(L)/时间(T2)流明/平方米(lm/m2)照度=发光强度(J)/面积(M2)概述(QML)(3.6)4.24.3QML_as(作为QMLcsQML_as4.44.5QML_csQML_csxTEIQML_cst,56注:在单个抽象语法上可以定义许多等效的具体语法。数量标记语言的特点数量标记语言应具有如下特点:,“BMI10-20kg/m2fpg>=100mg/dla1c不低于5,8%。”(hba1c)<正常上限的1,15倍”。元模型可度量数量信息的总体结构由图1中的元模型表示。图1可度量数量信息的元模型该元模型应由七个类组件组成,如图1中的方框所示:“@quantity示例1:我们在德国高速公路上以每小时200多公里的速度行驶。200200元素“度量”表示实体的可度量量,包括三个属性:量、单位和类型。示例2:汉拿山高1950米。度量应包括数字表达式“1950”和单位“米”所指的量。其适用于地理对象“汉拿山”的“高度”量。与标记符相关联的元素“关系符”,如“等于”、“大于”、“小于等于”“之间”或“至少”等,只有一个涉及两个或多个度量的功能状态。示例3:一磅等于16盎司。它表示两个度量之间的特性的关系符,“一磅”和“16盎司”。示例4:1英尺小于1米,因为它正好等于30.48厘米。“比较”类型的链接应将度量与另一个或更多度量相关联。这种链接通常由一个元素“比较”触发。数量标记语言(QML_as)的抽象语法QML_asB)R)@BRB@ty@ypCAT。示例:“山”的实体属于“地理”类型,“约翰”的实体属于“人”类型。实体的@quantity值是CDATA,可能包括高度、宽度或重量等值。@unit和@type@numeric@unit@type(QML_cs),QML_as(QML_cs)56:QML_csxQML_csf。QML_csxQML_csfQML_asXMLISO24612ISO2461724617-1、ISO24617-7ISO24617-6,QML_csx(结QML_csf(QML_cstTEIP5XML(QML_csx)XML概述5.2QML_csxIDXML5.45.5注:XML中引入根标签,以将XML元素列表嵌入到单个结构中。IDQML_csx的每个基本元素类型和链接类型都带有一个惟一的标签和ID前缀,如表3所示。3QML_csxID标签ID前缀备注根<MQI>mqiXML根标签基本元素类型实体<entity>x度量适用的对象度量<measure>me仅限统一数值量标签ID前缀备注关系符<relator>c触发链接相关度量链接类型度量链接<mLink>mL将度量和实体相关联并由度量触发。比较链接<cLink>cL将一个度量与另一个或更多度量相关联。注:XML中每个ID的属性名称为xml:id,每个值都是一个ID前缀,后跟一个正整数,例如<entityxml:id=“x25”/>。根<MQI列表1:扩展BNF中<MQI>的属性列表(Backus-Naur形式)attributes=identifier,target,[lang],[mediumType],[source];{*Attributesinsquarebracketsareoptional;otherwise,theyarerequired.*}identifier=mqi+positiveinteger;target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsindatasourcesorsuchasegmentsequencedirectlyquoted*};lang=CDATA;{*referstoISO639standardonlanguagecodes*}mediumType=CDATA;{*text,video,image,etc.*}source=CDATA.{*referstothesourceofthedata*}列表2:扩展BNF中<entity>的属性列表attributes=identifier,target,type,[comment];identifier=x+positiveinteger;target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsindatasourcesoramarkable*}type=CDATA;{*someontologicaltypessuchas“person”,“vehicle”,etc.*}comment=CDATA.列表3:扩展BNF中<measure>的属性列表attributes=identifier,target,num,[unit],type,[comment];identifier=me+positiveinteger;target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsindatasourcesoramarkable*}num=realnumbers;unit=CDATA;{*Theattribute@unitisnotspecifiedwhenameasureisassociatedwiththedegreeofefficiencysuchasJohn’sscoreis95orsomegraderangefrom0to1.*}type=CDATA;{*L-dimensionaltypesincludelength,width,height,breadth,area,andvolume,etc.*}comment=CDATA.列表4:扩展BNF中<relator>的属性列表attributes=identifier,target,type,[comment];identifier=r+positiveinteger;target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsindatasourcesoramarkable*}type=CDATA;{*mathematicaloperatorforcaseslike“greaterthan”,orrelationforcaseslike“between”*}comment=CDATA.链接类型的属性规范ISO24617-6<η,E,ρη为Eρ注:实体结构是一对<m,s>,其中m表示标记符,s表示标注在m上的语义信息。XMLQML_csx<mLink>和<cLink56在QML_csx中,实体结构命名为η@measureID,实体结构为E@appliedTo集,用于度量链接<mLink>,以及关系为ρ@relType。列表5:扩展BNF中<entity>的属性列表attributes=identifier,measureID,appliedTo,relType,[comment];identifier=mL+positiveinteger;measureID=IDREF;{*IDof<measure>*}appliedTo=IDREFS;{*IDsof<entity>stowhichthevalueof<measure>applies*}relType=“measures”;{*followsthespecificationofISO24617-1:2012ISO-TimeML*}comment=CDATA.列表6:扩展BNF中<cLink>的属性列表attributes=identifier,measure1,measure2,relType,[comment];identifier=cL+positiveinteger;measure1=IDREF;{*IDof<measure>*}measure2=IDREFS;{*IDsof<measure>*}relType=CDATA;{*typeofalinkthatcomparesonemeasuretoanothermeasureorothermeasures*}comment=CDATA.QML_csx概述本条说明了QML_csx如何表示文本中可度量数量信息的标注。为了进行说明,标注了以下示例数据:<textxml:id=“t1”>Miais165cmtall.</text><textxml:id=“t2”>Johnismorethantwometrestall.</text><textxml:id=“t3”>hba1cbetween7,5-9%.</text>概述在进行详细说明之前,使用5.6.2提供的示例数据对可度量数量信息标注的每个步骤进行说明。在将QML_csx的语义标注应用于某些特定的语言数据之前,需要对数据进行预处理,例如通过分词。示例数据t1的分词用如下所示的内联元素表示。(1)<wordSegxml:id=”ws1”target=”#t1”lang=”en”><wxml:id=”w1”>Mia</w><wxml:id=”w2”>is</w><wxml:id=”w3”>165</w><wxml:id=”w4”>cm</w><wxml:id=”w5”>tall</w><punctxml:id=”p1”>.</punct></wordSeg>也可以用更简单的方式表示:(2)<wordSegxml:id=”ws1”target=”#t1”lang=”en”>Mia_w1is_w2165_w3cm_w4tall_w5._p1</wordSeg>根据分词数据,如(1)或(2),选择标记符,并分配一个适当的实体类型,如下所示。Mia_x1is[165cmtall]_me1.然后,使用可度量数量信息标注分词和锚定数据,如下所示。<wordSegxml:id=”ws1”target=”#t1”lang=”en”>Mia_w1is_w2165_w3cm_w4tall_w5._p1</wordSeg><MQIxml:id=”qi1”target=”#ws1”lang=”EN”><entityxml:id=“x1"target=“#w1"type=“person"/><measurexml:id=“me1"target=“#w3,#w4,#w5""num=“165"unit=“cm"type=“height“/><mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/></MQI>标注对于示例数据t2,一个标签为<relator>的数量关系触发一个标签为<cLink>的比较关系,该比较关系将一个度量与另一个或更多度量相关联。<wordSegxml:id=”ws2”target=”#t2”lang=”EN”>John_w1is_w2more_w3than_w4two_w5metres_w6tall_w7._p1</wordSeg><MQIxml:id=”qi2”target=”#ws2”><entityxml:id=“x1"target=“#w1"type=“person"/><measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>{*The<measurexml:id=“me1">isanon-consumingtagthatisunderstoodasbeinganchoredtoanemptysequenceoftextualstrings*}<measurexml:id=“me2"target=“#w5,#w6,#w7”num=“2"unit=“metres"type=“height”/><relatorxml:id=“c1”target=“#w3,#w4”type=“greaterThanOrEqual”><cLink xml:id=“cL1" measure1=“#me1” measure2=“#me2" relType=“greaterThanOrEqual”/><mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/></MQI>2t3注:更多标注示例,请参见附录A。<wordSegxml:id=”ws3”target=”#t3”lang=”en”>hba1c_w1between_w27,5_w3-_w49_w5%_w6._p1</wordSeg><MQIxml:id=”qi3”target=”#ws3”><entityxml:id=“x1"target=“#w1"type=“medicalConcept"/><measurexml:id=“me1"target=“”num=“”unit=“”type=“”/><measurexml:id=“me2"target=“#w3,#w6”num=“7.5"unit=“%”type=“testValue”/><measurexml:id=“me3"target=“#w5,#w6”num=“9"unit=“%"type=“testValue”/><relatorxml:id=“c1”target=“#w2,#w4”type=“between”><cLink xml:id=“cL1" measure1=“#me1” measure2=“#me2" relType=“greaterThanOrEqual”/><cLinkxml:id=“cL2"measure1=“#me1”measure2=“#me3"relType=“lowerThanOrEqual”/><mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/></MQI>(QML_cst)TEI(QML_cst)概述基于TEIQML_cst6.1.2QML_cstID第二步是为RB(4.4)。IDTEIP5,QML_cstID表4。表4QML_cst的标签和ID前缀列表标签ID前缀备注根<MQI>mqiXML根标签基本元素类型ObjectType<ObjectType>obj描述所述对象的类型度量<measure>me是指对象的量关系符<relator>re触发链接相关度量链接类型度量链接<link type=“measure”>mL将度量和实体相关联并由度量触发。比较链接<link type=“comparison”>cL将一个度量与另一个或更多度量相关联。注:与QML_csx相同,ID作为全局属性,是进行统一表示的,每个值都是一个ID前缀,后跟一个正整数,在XML中为xml:id,例如,<ObjectTypexml:id=“obj3”/>。7BNF<ObjectTypeCDATA.列表8:扩展BNF中<measure>的属性列表attributes=identifier,quantity,unit,type,[comment];identifier=me+positiveinteger;quantity=realnumbers;unit=CDATA;type=CDATA;{*L-dimensionaltypesincludelength,width,height,breadth,area,andvolume,etc.*}comment=CDATA.列表9:扩展BNF中<relator>的属性列表attributes=identifier,type,name,[comment];identifier=re+positiveinteger;type=“relation”;name=CDATA;{*mathematicaloperatorforcaseslike“greaterthan”,orrelationforcaseslike“between”*}comment=CDATA.TEIQML_cstlinktype=“measure”>和<linktype=“comparison”>。它们的属性如列表10和列表11所示。TEIP5ηE@targetof<linktype=“measure”>和@targetof<linktype=“comparisonρ@type@subtype10BNFattributes=identifier,type,target,[subtype],[comment];identifier=mL+positiveinteger;type=“measure”;target=IDREFS;{*IDof<measure>andIDsof<entity>stowhichthevalueof<measure>applies*}subtype=“measures”;{*followsthespecificationofISO24617-1:2012ISO-TimeML*}comment=CDATA.列表11:扩展BNF中比较链接的属性列表attributes=identifier,type,target,[subtype],[comment];identifier=cL+positiveinteger;type=“comparison”;target=IDREFS;{*IDsof<measure>s*}subtype=CDATA;{*typeofarelationthatcomparesonemeasuretoanothermeasureorothermeasures*}comment=CDATA.QML_cst概述本条说明了QML_csx如何表示文本中可度量数量信息的标注为了进行说明,标注了以下示例数据:<textxml:id=“t9”>TheLaboratoryisabout120m<sup>2</sup></text><textxml:id=“t10”>Thebuildingishigherthan80m.</text><textxml:id=“t11”>Oxygensaturationbetween90-95%.</text>TEIA:<textxml:id=“t9”><sxml:id=“s1”><phrxml:id=“phr1”><w>The</w><w>Laboratory</w></phr><w>is</w><w>about</w><phrxml:id=“phr2”><w>120</w><w>m<sup>2</sup></w></phr><c>.</c></s></text>B:<objectTypexml:id=“obj1”><measurexml:id=“me1”type="area"quantity="120"unit="<sup>2</sup>"><linkGrp>(referstofeaturestructurerepresentation)<linktarget="#phr1#obj1"/>#linkedtextelementswithfeaturestructures<linktarget="#phr2#me1"/>#linkedtextelementswithfeaturestructures<linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/>#definedbyQML</linkGrp></objectType>A:<textxml:id=“t10”><sxml:id=“s1”><phrxml:id=“phr1”><w>The</w><w>building</w></phr><w>is</w><phrxml:id=“phr2”><w>higher</w><w>than</w></phr><phrxml:id=“phr3”><w>80</w><w>m</w></phr><c>.</c></s></text>B:<objectTypexml:id=“obj1”><measurexml:id=“me1”type=""quantity=""unit=""><measurexml:id=“me2”type="height"quantity="80"unit="m"><linkGrp>(referstofeaturestructurerepresentation)<linktarget="#phr1#obj1"/>#linkedtextelementswithfeaturestructures<linktarget="#phr2#re1"/>#linkedtextelementswithfeaturestructures<linktarget="#phr3#me1"/>#linkedtextelementswithfeaturestructures<linktype=“comparison”xml:id=“cL1"target=“#me1#me2”subtype=“greaterThan”/><linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/></linkGrp></objectType>A:<textxml:id=“t11”><sxml:id=“s1”><phrxml:id=“phr1”><w>Oxygen</w><w>saturation</w></phr><wxml:id=“wd1”>between</w><phrxml:id=“phr2”><w>90</w><c>-</c><w>95</w><c>%</c></phr></s></text>B:<objectTypexml:id=“obj1”><measurexml:id=“me1”type=""quantity=""unit=""><measurexml:id=“me2”type="testValue"quantity="90"unit="%"><measurexml:id=“me3”type="testValue"quantity="95"unit="%"><linkGrp>(referstofeaturestructurerepresentation)<linktarget="#phr1#obj1"/>#linkedtextelementswithfeaturestructures<linktarget="#wd1#re1"/>#linkedtextelementswithfeaturestructures<linktarget="#phr2#me1"/>#linkedtextelementswithfeaturestructures<linktype=“comparison”xml:id=“cL1"target=“#me1#me2”subtype=“greaterThan”/><linktype=“comparison”xml:id=“cL1"target=“#me1#me3”subtype=“lowerThan”/><linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/></linkGrp></objectType>附录A(资料性附录)带更多示例的QML_csx的说明A.1示例数据为了对QML_csx进行说明,除了5.6.2之外,还标注了以下示例数据。<textxml:id=“t4”>Whitebloodcellcount>14,0X109/L.</text><textxml:id=“t5”>fastingbloodsugarlevel>/=125mg/dlbut</=279mg/dl.</text><textxml:id=“t6”>theareaofasoccerpitchvarieswithinalimitof90-120minlengthand45-90minwidth.</text><textxml:id=“t7”>threepeopleintheroom,allhigherthan180cm.</text>使用QML_csx进行标注a.<wordSegxml:id=”ws4”target=”#t4”lang=”en”>White_w1blood_w2cell_w3count_w4>_w514.0_w6X_w7109_w8/_w9L_w10._p1</wordSeg>b.<MQIxml:id=”qi4”target=”#ws4”><entityxml:id=“x1"target=“#w1,#w2,#w3"type=“medicalConcept"/><measurexml:id=“me1"target=“”num=“”unit=“”type=“”/><measurexml:id=“me2"target=“#w4,#w6,#w7,#w8,#w9,#w10”num=“14,0X109"unit=“L"type=“count”/><relatorxml:id=“c1”target=“#w5”type=“greaterThanOrEqua/”><cLink xml:id=“cL1" measure1=“#me1” measure2=“#me2" relType=“greaterThanOrEqual”/><mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/></MQI>a.<wordSegxml:id=”ws5”target=”#t5”lang=”en”>fasting_w1blood_w2sugar_w3level_w4>/=_w5125_w6mg/dl_w7but_w8</=_w9279_w10mg/dl_w11._p1</wordSeg>b.<MQIxml:id=”qi5”target=”#ws5”><entityxml:id=“x1"target=“#w1,#w2,#w3"type=“medicalConcept"/><measurexml:id=“me1"target=“”num=“”unit=“”type=“”/><measurexml:id=“me2"target=“#w4,#w6,#w7”num=“125"unit=“mg/dl"type=“level”/><measurexml:id=“me3"target=“#w4,#w10,#w11”num=“279"unit=“mg/dl"type=“level”/><relatorxml:id=“c1”target=“#w5”type=“greaterThanOrEqual”><cLinkxml:id=“cL1"measure1=“#me1” measure2=“#me2"relType=“greaterThanOrEqual”/><relatorxml:id=“c2”target=“#w9”type=“lowerThanOrEqual”><cLinkxml:id=“cL2"measure1=“#me1” measure2=“#me3"relType=“lowerThanOrEqual”/><mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/></MQI>a.<wordSegxml:id=”ws6”target=”#t6”lang=”en”>the_w1area_w2of_w3a_w4soccer_w5pitch_w6varies_w7within_w8a_w9limit_w10of_w1190_w12-_w13120_w14m_w15in_w16length_w17and_w1845_w19-_w2090_w21m_w22in_w23width_w24._p1</wordSeg>b.<MQIxml:id=”qi6”target=”#ws6”><entityxml:id=“x1"target=“#w4,#w5,#w6"type=“sportFacilite"/><measurexml:id=“me1"target=“”num=“”unit=“”type=“”/><measurexml:id=“me2"target=“#w12,#w17”num=“90"unit=“m"type=“length”/><measurexml:id=“me3"target=“#w14,#w17”num=“120"unit=“m"type=“length”/><measurexml:id=“me4"target=“”num=“”unit=“”type=“”/><measurexml:id=“me5"target=“#w19,#w24”num=“45"unit=“m"type=“width”/><measurexml:id=“me6"target=“#w21,#w24”num=“90"unit=“m"type=“width”/><relatorxml:id=“c1”target=“#w8,#w13”type=“between”>

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论