特种设备管理办法[1]_第1页
特种设备管理办法[1]_第2页
特种设备管理办法[1]_第3页
特种设备管理办法[1]_第4页
特种设备管理办法[1]_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、乎所冇的中文系统和国际化的软件都支持的中文字符集,这也是垠棊木的中文字符集。 h编码范围是高位oxaloxfe,低位也是oxal-oxfe;汉字从oxboal开始,结朿于0xf7fe。gb2312将代码表分为94个区,对应笫一字节(oxal-oxfe);每个区94个位(oxal-oxfe), 对应第二字节,两个字节的值分别为区号值和位号值加32(2oh),因此也称为区位码。()1()9 区为符号、数字区,1687区为汉字区(0xb0-0xf7), 1()15区、88-94 |x是有待进一步标准 化的空口区。gb2312将收录的汉字分成两级:第一级是常用汉字计3755个,宜于16-55 区,按汉

2、语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区, 按部首/笔画顺序排列。故而gb2312®多能表示6763个汉字。gb2312的编码范围为2121h-777eh,与ascii有重叠,通行方法是将gb码两个字节 的最高位置1以示区别。0x00k?节0x7eoxfe0x7easc【区 (ox2lox21)0xa!图1:gb2312编码图图屮位于ascii区屮的虚线区域即为原gb2312编码区域,右下角实线区域为平移后的 gb2312编码区域。二、gb2312-80 的扩展gbk是gb2312-80的扩展,是向上兼容的。它包含了 20902个汉字,其编码范围

3、是 0x8140-0xfcfc,剔除高位0x80的字位。其所冇字符都可以一对一映射到unicodc2.0ogb18030-2000(gbk2k)在gbk的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的 字形。gbk2k从根本上解决了字位不够,字形不足的问题。它有儿个特点: 它并没有确定所有的字形,只是规定了编码范围,留待以后扩充。 编码是变长的,其二字节部分与gbk兼容;四字节部分是扩充的字形、字位,其编 码范围是首字节0x81-0xfe、二字节0x30-0x39、三字节0x81-0xfe、四字节 0x30-0x39。 它的推广是分阶段的,首先要求实现的是能够完全映射到unicodes 0标

4、准的所有 字形。 它是国家标准,是强制性的。 现在还没有任何一个操作系统或软件实现了 gbk2k的支持,这是现阶段和将來汉化 的工作内容。三、unicode编码国际标准组织于1984年4刀成立iso/iecjtc1/sc2/wg2工作组,针对各国文字、符 号进行统一性编码。1991年美国跨国公司成立unicodeconsortium,并于1991年10月与 wg2达成协议,采用同一编码字集。目前unicode是采用16位编码体系,其字符集内容与 iso 10646 的 bmp (basicmultilingualplanc)相同。unicode 于 1992 年 6 月通过 dis (draf

5、lnternationalstandard),目前版木v2.0于1996公布,内容包含符号6811个,汉字20902 个,韩文拼音11172个,造字区6400个,保留20249个,共计65534个。随着国际互联网的迅速发展,耍求进行数据交换的需求越来越大,不同的编码体系越来 越成为信息交换的障碍,而且多种语言共存的文档不断增多,单靠代码页已很难解决这些问 题,于是unicode应运而生。unicode有双重含义,首先unicode是对国际标准iso/iec10646编码的一种称谓 (iso/iec10646是一个国际标准,亦称大字符集,它是iso于1993年颁布的一项重要国际 标准,其宗旨是全

6、球所有文种统一编码),另外它又是由美国的hp、microsoft、ibm、apple 等人企业组成的联盟集团的名称,成立该集团的宗旨就是要推进多文种的统一编码。unicode同现在流行的代码页最显著不同点在于:unicode是两字节的全编码,对 于ascii字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ascii字符, 还是汉字的高字节。如果发生数据损坏,某处内容破坏,则会引起其后汉字的混乱o unicode 则一律使用两个字节表示一个字符,最明显的好处是它简化了汉字的处理过程。unicode使用平而來描述编码空间,每个平而分为256行,256列,相对于两字节编 码的高低两个字节

7、。unicode的第一个平面,称为basicmultilingualplane (基本多文种平面),简称bmp, 由于bmp仅用两个字节表示,所以倍受青睐。00a-zone3334cjk extoisioq a4d4db5 f4e.jk.a0abcjk9fas-hylmc6 _mac皿08ofhvvi.dza1一二fcl s-zokebrutf-lfihxxxmoo celsf8om oommommbom mb ob ob mm mb mw mm mm mm om om mm mm mm mb ob ob ob mm mb mb mm ff r-zobe图三:ucs的基本多文种平面阳icmul

8、tilmgurfsm) bmp chart0033344d4e:a-zone拼音文字see detailed chartcjk unified ideographs extension a (新)中日韩统一汉字扩充集acjk unified ideographs9faoa5abacd£dfeof8f9fafbfcfdfeff中日韩统一汉字yi syuables (a000-a48f) & yi radicals (a490-a4bf)彝文音节字和字根(新)o-zonehangul extended 韩文(新)s-zone (for use in utf-16 only) (新

9、)private use areacjk compatibility ideographs alphabetic presentationformsarabic presentation forms-acomb. halfmykscjkcompat.f,mssmall form vars.arabic presentation forms-bhalfwidth and fullwidth formsspecial=not graphic characters=reserved far future standardization=hangul extended| =utf-16图2:bmp的最

10、新概貌图其中a_zone为拼音文字编码区,拉丁文、阿拉伯文、日文的平假名及片假名等都在 此区编码。cjkextensiona和cjk为汉字区域共计27487个汉字。y1即彝文,位于o-zone 保留待将來使用。hangul即韩文。eudc为用户私有区,卅户可以根据需要白己定义此区 的编码。r-zone为限制使用区,-些兼容字符、特姝字符均放在此区。unicode 定义 bmp 中的 d8oo-dfff 为代理区(surrogatczonc),其中 d8oo-d8ff 为 高半代理(highsuirogate), dcoo-dfff为低半代理(lowsurrogate) 0从两个区域分别取一 个

11、编码,组成一个4字节的代理对來表示一个编码字符,此即为utf-16o利用utf16机 制,unicode扩充了 1024*1024个字符,相应于oo-of平面,并且将02平面分配给了cjkextensionbo microsoft 在 windows2000 已实现 了 utf-16。unicode编码布局0000.007f;basiclatin()()8().(x)ff;latin-lsupplement0100.017f;latinextcndcd-a0180. .024f;latinextended-b0250.02af;ipaextensions02b0.02ff;spacingmod

12、ifierletters0300.036f;combiningdiacriticalmarks0370.03ff;grcckandcoptic0400.04ff;cyrillico5oo.o52f;cyrillicsupplementary0530.058f;armenian0590.05ff;hebrew0600.06ff; arabic0700.074f;syriac0780.07bf;thaana0900.097f;devanagario98o.o9ff;bengali0a00.0a7f;gurmukhi0a80.0aff;gujaratioboo.ob7f;oriya0b80.0bff

13、;tamil0c()0.0c7f;telugu0c80.0cff;kannada0d00.0d7f;malayalam0d80.0dff;sinhala0e00.0e7f;thai0e80.0eff;lao0f00. .0fff;tibcta n1000. 109f;myanmar10a0. 10ff;geogia n1100. 11ff;hanguljamo1200. 137f;ethiopic13a0.3ff;chcrokcc1400. 167f;u nifiedcanadianaboriginalsyllabics1680. 169f;ogham16a0.16ff runic1700.

14、171f;tagalog1720. 173f;hanunoo1740. 175f;buhid1760. 177f;tagbanwa1780. 17ff;khmer1800. 18af;mongolia n1 e00.1 eff;latinextendedadditional1 f00.1 fff;greekex tended2000. 206f;generalpunctuation2070. 209f;superscriptsandsubscripts20a0.20cf;currencysymbols20d0.20ff;combiningdiacriticalmarksforsymbols21

15、00. 214f;letterlikesymbols2150. 218f;numberforms2190. 2 iff; arrows2200. 22ff;mathcmaticalopcrators2300. 23ff;miscellaneoustechnical2400. 243f;controlpictures2440. 245f;opticalcharacterrecognition2460. 24ff;enclosedalphanumerics2500. 257f;boxdrawing2580. 259f;blockelements25a0.25ff;geometricshapes26

16、00. 26ff;miscellaneoussymbols2700. 27bf;dingbats27c0.27ef;misccllancousmathcitiaticalsymbols-a27f0.27ff;supplemental arrows-a2800. 28ff;braillepatterns2900. 297f;supplementalarrows-b2980. 29ff;miscellaneousmathematicalsymbols-b2a00.2aff;supplcmcntalmathcmaticalopcrators2e80.2eff;cjkradicalssupplemen

17、t2f00.2fdf;kangxiradicals2ff0.2fff;ideographicdescriptioncharacters3000. 303f;cjksymbolsandpunctuation3040. 309f;hiragana3oao.3off;katakana3100. 312f;bopomofo3130. 318f;hangulcompatibilityjamo3190. 319f;kanbun31 ao.31 bf;bopomofoextcndcd31fo.31 ff; katakanaphoneticex tensions3200. 32ff;enclosedcjkle

18、ttersandmonths3300. 33ff;cjkcompatibility3400. 4dbf;cjkunifiedideographsextensiona4e00.9fff;cjkunifiedideographsa000.a48f;yisyllablcsa490.a4cf;yiradicalsac00.d7af;hangulsyllablesd800.db7f;highsurrogatesdb80.dbff;highprivateusesurrogatesdcoo.dfff;lowsurrogatese000.f8ff;privateuseareaf9()0.faff;cjkcom

19、patibilityideographsfb00.fb4f;alphabeticpresentationformsfb50.fdff;arabicpresentationforms-afeoo.feof; variationselectorsfe20.fe2f;combininghalfmarksfe30.fe4f;cjkcompatibilityformsfe50.fe6f;smallform variantsfe70.feff;arabicpresentationforms-bffoo.ffef;halfwidthandfullwidthformsfffo.ffff;specials103

20、00. .1032f;olditalic10330.034f;gothic10400. 1044f ;deseret1 d000.1 doff;byzantinemusicalsymbols1d100.1d1 ff;musicalsymbols1d400. 1 d7ff;mathematicalalphanumericsymbols20000. 2a6df;cjkunificdidcographsextcnsionb2f800.2fa 1 f;cjkcompatibilityideographssupplemente0000.e007f;tagsf0000.fffff;supplementar

21、yprivateusearea-a1 ()()()()(). 10ffff;supplementaryprivateusearea-b0000.007f;basiclatin0080.00ff;latin-1 supplement0100.017f;latinextended-a0180.024f;latinextended-b0250. .02af;ipaextensions02b0.02ff;spacingmodificrlcttcrs0300.036f;combiningdiacriticalmarks0370.03ff;greekandcoptic0400.04ff;cyrillic0

22、50().052f;cyrillicsupplementary0530.058f;armenian0590.05ff;hebrew0600. .06ff; arabic0700.074f;syriac0780.07bf;thaana0900. .097f;devanagari0980.09ff;bcngali0a00.0a7f;gurmukhi0a80.0aff;gujaratioboo.ob7f;oriya0b80.0bff;tamil0c00.0c7f;telugu0c80.0cff;kannada0d00.0d7f;malayalam0d80.0dff;sinhala0e00.0e7f;

23、thai0e80.0eff;laoofoo.offf;tibetan1 ()()(). 109f;myanmar1oao.off;gcorgian1100. 1 lff;hanguljamo1200. 137f;ethiopic13a0.13ff;cherokee1400. 167f;unifiedcanadianaboriginalsyllabics1680. 169f;ogham16a0.16ff;runic1700. 171f;tagalog1720. 173f;hanunoo1740. 175f;buhid1760. 177f;tagbanwa1780. 17ff;khmer1800.

24、 18af;mongolian1 e00.1 eff;latinextendedadditional1 f00.1 fff;greekextended2000. 206f;gcncralpunctuation2070. 209f;superscriptsandsubscripts20a0.20cf;currencysymbols20d0.20ff;combiningdiacriticalmarksforsymbols2100. 214f;letterlikesymbols2150. .218f;numbcrforms2190. 2 iff; arrows2200. 22ff;mathemati

25、caloperators2300. 23ff;miscellaneoustechnical2400. 243f;controlpictures2440. 245f;opticalcharactcrrccognition2460. .24ff;enclosed alphanumerics2500. 257f;boxdrawing2580. 259f;blockelements25a0.25ff;geometricshapes2600. .26ff;miscellaneoussymbols2700. 27bf;dingbats27c0.27ef;miscellaneousmathematicals

26、ymbols-a27f0.27ff;supplementalarrows-a2800. 28ff;braillepattems2900. 297f;supplementalarrows-b2980. 29ff;miscellaneousmathematicalsymbols-b2a00.2aff;supplementalmathematicaloperators2e80.2eff;cjkradicalssupplement2f00.2fdf;kangxiradicals2ff0.2fff;ideographicdescriptioncharacters3000. 303f;cjksymbols

27、andpunctuation3040. 309f;hiragana3() ao. 30ff; katakana3100. 312f;bopomofo3130. 318f;hangulcompatibilityjamo3190. 319f;kanbun31 ao.31 bf;bopomofoextended31 f0.31 ff;katakanaphoneticextensions3200. 32ff;enclosedcjklettersandmonths3300. 33ff;cjkcompatibility3400. 4dbf;cjkunifiedideographsextensiona4e0

28、0.9fff;cjkunifiedideographsa000.a48f;yisy hablesa490.a4cf;yiradicalsac00.d7af;hangulsyllablesd800.db7f;highsurrogatesdb80.dbff;highprivateusesurrogates dc()().dfff;lowsurrosateseooo. f8 ff;pri vatcu scarcaf900.faff;cjkcompatibilityideographsfb00.fb4f;alphabeticpresentationformsfb50.fdff;arabicpresen

29、tationforms-afe()().fe()f;variationselectorsfe20.fe2f;combininghalfmarksfe30.fe4f;cj kcompatibilityformsfe50.fe6f;smallformvariantsfe70.feff;arabicpresentationforms-bff()().ffef;halfwidthandfullwidthformsfffo.ffff;spccials10300. 1032f;01ditalic10330. 1034f;gothic10400. 1044f;deseretld000.1d0ff;byzan

30、tinemusicalsymbols1d100. 1d1 ff;musicalsymbols1 d400.1 d7ff;mathcmaticalalphanumcricsynibois20000. 2a6df;cjkunifiedideographsextensionb2f800.2fa 1 f;cjkcompatibilityideographssupplemente0000.e007f;tagsfoooo.fffff;supplementaryprivateusearea-a0. 1 offff;supplementarypi*ivateusearea-b四、大五码(big5)如不去考虑特

31、殊符号,及后来的七个扩充字,tw-b1g5的排序方式如下。将所冇的字 分成两人群:常川字区与次常川字区,每一个字区分别川笔画來排序,同一个笔画的字,依 部首來排。tw-big5每个字由两个字节组成,其第一字节编码范围为oxal0xf9,第二字 节编码范围为0x400x7e与oxaloxfe,总计收入13868个字(包括5401个常用字、7652 个次常用字、7个扩充字、以及808个各式符号),其中可以大致划分为以下几个字区:1第一字节|第二字节字区制定|a1.a240.7e, a1.fe各种符号区|1984a34o.7e,a1.bf各种符号区(包括标点符号、ascii全角符号、注音符 号等)|

32、1984a3el欧元符号|cp950a4.c54o.7e,a1.fe常用字区1984c640.7e常用字区 |1984c6a1.fe罕用符号区|倚天c7|40.7e, a1.fe罕用符号区(包括日文、俄文等) 倚天c840.7e, a1.d3罕用符号区(包括俄文、输入法特殊符号等)|倚天c9.f840.7e, a1.fe次常用字区1984f940.7e, a1.d5次常用字区|1984f9d6.dc七个扩充字|倚天f9dd.fe表格符号区table 1. big5字区与编码范围扩充字big5 码unicode 码big5_1984的同义字碁j0xf9d6ox88cf棋锈joxf9d70x92b

33、9锈里oxf9d80x7ca7里墙0xf9d9ox58bb墙恒0xf9da0x6052恒妆0xf9db0x7881妆娴0xf9dc0x5afa娴table 2.七个扩充字编码第一个字节第一个字节第二个字节第四个字节gb2312oxbo - 0xf7oxao - oxfe编码第一个字节第一个字节第二个字节第四个字节gbk0x81 oxfe0x40 oxfegb 18030的双字节0x81 ()xfe0x40 - ()x7e 0x80 oxfegb18030的四字节0x81 oxfe0x30 - 0x390x81 oxfe0x30 - 0x39table 3. gb的汉字编码规则五、如何判断一个汉字是big5或是gb大陆电脑中的汉字多以gb2312标准进行编码,简称gb码或国标码,共定义6763汉 字,编码如下:第一字节,行码0xa1-0xfe,第二节字,列码0xa1-0xfe,每行94个汉字。其屮, 1-15w1-af)全角字母、符号;1655行(bocf)以拼音为序的一级汉字3755字;56-87 行(d0-f7)以部首为序的二级汉字3008字。例如:gb码16行1列表示“啊”字,编码为 0xb0a1 o港台电脑中的汉字则多以big5编码 共定义了 13053汉字,汉字部分均以部首为序, 编码如下:第一节字,行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论