标准解读

《GB/T 13000-2010 信息技术 通用多八位编码字符集(UCS)》作为《GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面》的更新版本,主要在以下几个方面进行了调整和增补:

  1. 标准名称与范围调整:新标准简化了名称,去除了“第一部分”的提法,同时覆盖内容更为广泛,不仅包括了基本多文种平面(BMP)的定义,还可能涉及到了UCS更全面的体系结构和编码规则。

  2. 编码字符集扩展:随着Unicode和ISO/IEC 10646标准的不断演进,GB/T 13000-2010纳入了更多字符,特别是增补了许多增补平面(Supplementary Planes)中的字符,如CJK统一汉字扩充A区、B区等,以适应更多语言文字的编码需求。

  3. 编码规则和映射方式更新:标准可能对字符编码规则进行了优化或明确,确保与国际标准保持一致,包括字符在UCS中的位置、编码空间的分配以及与Unicode的同步更新。

  4. 字符属性和分类细化:新标准可能更加详细地规定了字符的属性,如字形、语义分类、双向文本显示规则等,这对于文本处理软件的正确实现至关重要。

  5. 标准化信息更新:考虑到技术进步和实际应用的需求,标准中关于数据交换、字节顺序标记(BOM)的使用、以及与其它字符编码标准如UTF-8、UTF-16的兼容性指导等方面的信息可能得到了更新和完善。

  6. 参考文献和术语定义:为保持标准的现代性和准确性,GB/T 13000-2010更新了引用的国际标准和文献,同时可能修订或新增了一些专业术语的定义,以适应技术发展和标准化实践的变化。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2011-01-10 颁布
  • 2011-11-01 实施
©正版授权
GB/T 13000-2010信息技术通用多八位编码字符集(UCS)_第1页
GB/T 13000-2010信息技术通用多八位编码字符集(UCS)_第2页
GB/T 13000-2010信息技术通用多八位编码字符集(UCS)_第3页
GB/T 13000-2010信息技术通用多八位编码字符集(UCS)_第4页
GB/T 13000-2010信息技术通用多八位编码字符集(UCS)_第5页
已阅读5页,还剩1471页未读 继续免费阅读

下载本文档

免费下载试读页

文档简介

ICS35040

L71.

中华人民共和国国家标准

GB13000—2010/ISO/IEC106462003

代替:

GB13000.1—1993

信息技术通用多八位编码字符集UCS

()

Informationtechnolo—Universalmultile-octetcodedcharactersetUCS

gyp()

(ISO/IEC10646:2003,IDT)

自2017年3月23日起本标准转为推荐性

,

标准编号改为GBT130002010

,/—。

2011-01-10发布2011-11-01实施

中华人民共和国国家质量监督检验检疫总局发布

中国国家标准化管理委员会

中华人民共和国

国家标准

信息技术通用多八位编码字符集UCS

()

GB13000—2010/ISO/IEC10646:2003

*

中国标准出版社出版发行

北京复兴门外三里河北街号

16

邮政编码

:100045

网址

:

服务热线

/p>

年月第一版

20117

*

书号

:155066·1-42160

版权专有侵权必究

GB13000—2010/ISO/IEC106462003

:

目次

前言…………………………

引言…………………………

范围………………………

11

符合性……………………

21

规范性引用文件…………………………

32

术语和定义………………

42

的总体结构…………………………

5UCS6

基本结构及术语…………………………

67

的总体要求………………………

7UCS10

基本多文种平面…………………………

810

辅助平面…………………

911

专用平面和专用区……………………

1011

的修订与更新……………………

11UCS11

子集……………………

1212

的编码表示形式…………………

13UCS12

实现的级别……………

1412

控制功能与的联合使用………………………

15UCS13

标识特征的声明………………………

1613

代码表与字符名称清单的结构………………………

1714

块名称…………………

1815

双向语境中的字符……………………

1915

特殊字符………………

2016

字符的显现形式………………………

2122

兼容字符………………

2222

字符的顺序……………

2322

规范化形式……………

2422

组合用字符……………

2523

个别文字的特性………………………

2624

汉字的字源参考…………………

27CJK25

字符名称及注释………………………

2828

基本多文种平面的结构………………

2930

用于文字和符号编码的辅助多文种平面结构………

3032

辅助表意文字平面的结构……………

3133

辅助特殊用途平面的结构……………

3234

代码表和字符名称清单………………

3334

附录规范性附录用于子集的图形字符的汇集…………………

A()1353

附录规范性附录组合字符清单…………………

B()1373

附录规范性附录组个平面的转换格式………

C()0016(UTF-16)1388

GB13000—2010/ISO/IEC106462003

:

附录规范性附录转换格式……………………

D()UCS8(UTF-8)1392

附录资料性附录双向语境中的镜像字符………

E()1397

附录资料性附录替代格式字符…………………

F()1403

附录资料性附录按字母排序的字符名称清单…………………

G()1410

附录资料性附录使用标记标识………

H()“”UCS1411

附录资料性附录对具有内部存储器的接收始发组合设备的建议……………

J()/1412

附录资料性附录八位值表示的标记法…………

K()1413

附录资料性附录字符命名导则…………………

L()1414

附录资料性附录字符来源………………………

M()1417

附录资料性附录对字符字汇的外部参考………

N()1422

附录资料性附录字符的附加信息………………

P()1424

附录资料性附录朝鲜文代码映射表……………

Q()1428

附录资料性附录朝鲜文名称……………………

R()1429

附录资料性附录汉字的认同和排序规则…………………

S()CJK1454

附录资料性附录使用标签字符的语言标记法…………………

T()1467

附录资料性附录音乐符号的使用………………

U()1469

GB13000—2010/ISO/IEC106462003

:

前言

本标准的体系结构与基本多文种平面部分是强制性的其余为推荐性的

,。

本标准等同采用国际标准信息技术通用多八位编码字符集英文

ISO/IEC10646:2003《(UCS)》(

版为便于读者理解本标准在第章增加了脚注在附录资料性附录的最后增加了对

)。,1,S()“S.4‘CJK

汉字认同和排序规则的补充说明

’”。

本标准代替信息技术通用多八位编码字符集第一部分体系结构

GB13000.1—1993《(UCS):

与基本多文种平面

》。

本次修订对年版的主要变动如下

1993:

朝鲜文及其补充从基本多文种平面的移至基本多文种平面的原

a)3400~4DFFAC00~D7FF(

区即第一版的保留区空出的代码位置分配给新增的统一汉字扩充

O,),CJKA;

增加收录多种我国少数民族文字及其他文字字符如藏文蒙古文彝文等

b)、,、、;

新增用于的区代理区代码位置是基本多文种平面的原区即

c)UTF-16S(),D800~DFFF(O,

第一版的保留区并有专门的附录对其进行说明

),;

增加了辅助平面包括组平面文字和符号辅助多文种平面组平面辅助表意

d),0001()、0002(

文字平面用于统一汉字扩充和兼容汉字补充和组平面辅助特殊用途

,CJKBCJK)000E(

平面

)。

本标准的附录附录附录和附录是规范性附录附录附录附录附录附录

A、B、CD,E、F、G、H、J、

附录附录附录附录附录附录附录附录附录和附录是资料性附录

K、L、M、N、P、Q、R、S、TU。

本标准由中华人民共和国工业和信息化部提出

本标准由全国信息技术标准化技术委员会归口

(SAC/TC28)。

本标准起草单位中国电子信息产业发展研究院中国电子技术标准化研究所教育部语言文字应

:、、

用研究所中国科学院软件研究所北京北大方正电子有限公司

、、。

本标准主要起草人张轴材陈壮王晓明吴健尹江红何正安

:、、、、、。

本标准于年首次发布本次为第一次修订

1993,。

GB13000—2010/ISO/IEC106462003

:

引言

本标准规定了通用多八位编码字符集它适用于世界上各种语言文字的书面形式以及

(UCS)。()

附加符号的表示传输交换处理存储输入及显现

、、、、、。

通过对多文种文本的编码的一致性的定义本标准使得数据的国际交换成为可能信息技术产业

,。

获得了数据的稳定性更强的全球可互操作性和数据可交换性转化为本国家标准的国际标准

,。ISO/

已经在新的互联网协议中广泛采用并被当今的操作系统和计算机语言所实现本标准收

IEC10646,。

纳了多个世界上多种文字的字符

95000。

本标准包含了一些电子化资料它们适用于使用机读格式数据的用户这些资料由下列可打印文

,。

件组成

:

———CJKU_SR.txt

———CJKC_SR.txt

———Allnames.txt

———HangulX.txt

———HangulSy.txt

用户可向本标准归口单位中国电子技术标准化研究所索取上述电子化资料

()。

地址北京市东城区安定门东大街号北京市信箱

:1(1101)

邮编

:100007

电话

:84043004

GB13000—2010/ISO/IEC106462003

:

信息技术通用多八位编码字符集UCS

()

1范围

本标准规定了通用多八位编码字符集

(UCS)。

本标准适用于世界上各种语言文字的书面形式以及附加符号的表示传输交换处理存储输

()、、、、、

入及显现

本标准

:

规定了的体系结构

———GB13000;

定义了中使用的术语

———GB13000;

描述了本编码字符集的总体结构

———;

规定了的基本多文种平面

———UCS(BMP);

规定了的若干个辅助平面辅助多文种平面辅助表意文字平面以及辅助

———UCS:(SMP)、(SIP),

特殊用途平面

(SSP);

定义了一个图形字符集用于世界各种语言的手写和书面形式

———,;

规定了的图形字符的名称及编码表示

———BMP、SMP、SIP、SSP;

规定了的肆八位位正则形式

———UCS(32):UCS-4;

规定了的双八位位形式

———UCS(16)BMP:UCS-2;

规定了控制功能的编码表示

———;

规定了未来对编码字符集进行增补的管理办法

———。

是一种与规定的编码体系不同的编码体系本标准规定了从

UCSGB/T2311。16.2GB/T2311

中指明的方法

UCS。

本标准中任意一个图形字符无论是在平面还是在辅助平面只分配唯一的一个码位1)

,BMP,。

注的版包括了与本标准等同的字符集名称和编码表示为了便于实现它还提供了字符

:UnicodeStandard4.0、。,

属性处理算法以及定义的细节

、。

2符合性

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论