字符编码和汉字编码_第1页
字符编码和汉字编码_第2页
字符编码和汉字编码_第3页
字符编码和汉字编码_第4页
字符编码和汉字编码_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

字符编码和汉字编码(一)计算机中的信息包括数据信息和控制信息,数据信息又可分为数值和非数值信息。非数值信息和控制信息包括了字母、各种控制符号、图形符号等,计算机内以二进制编码进行处理,这种对字母和符号进行编码的称为字符代码(CharacterCode)。常用的编码:一、ASCII码包含标准ASCII码和扩展ASCII码现在使用最普遍的编码是美国国家标准信息交换码即ASCII码(AmericanStandardCodeforInformationInterchange)。基本的ASCII字符集共有128个字符,(高位为0,27=128个,十进制0---127),标准ASCII码使用7个二进位对字符进行编码,对应的ISO标准为ISO646标准。例如:大写字母A,其ASCII码为01000001,即ASC(A)=65小写字母a,其ASCII码为01100001,即ASC(a)=97由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO2022标准,它规定了在保持与ISO646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。二、国标码ASCII码的提出,有效的解决了西文文字的信息化问题,但对于汉字字符却完全不适用。为了满足计算机中使用汉字的需要,中国国家标准总局于1980年发布《信息交换用汉字编码字符集基本集》,标准号为GB2312-1980,称为GB码或国标码。国标码:汉字信息交换的代码,也称交换码。GB2312-80标准采用区位码,将汉字编码分成94区与94位。用区码、位码表示,称为区位码。GB2312-80标准中共有汉字6763个:一级汉字3755个,按汉字拼音字母顺序排列;二级汉字3008个,按部首笔画汉字排列。

如第一个汉字“啊”出现在第16区的第01位上,其区位码为1601。汉字编码一个汉字点两个ASCII码,即2个字节。汉字编码在不同的处理阶段有不同的编码。汉字的输入:输入码输入码与内码的交换码:国标码汉字的机内表示:机内码

汉字的输出:字形码(输出码:汉字点阵字库)1.汉字输入码又称为外码如拼音输入法、五笔输入法、区位码等啊拼音码a五笔字型码kbsk区位码1601国标区位码:把GB2312-80分为94区、每区分94位;是国标码的一种变形。如:“啊”在第16区第01位,区位码为1601,请同学们配置区位码输入。注意:用区位码输入(注意用主键区)不能用数字键盘的数字。字符编码和汉字编码(二)区位码与国标码的换算:国标码高位=区位码高位+20H国标码低位=区位码低位+20H例1:“啊”的区位码1601,算出国标码步骤:(1)区码和位码分别转换成十六进制数表示;(2)(区位码的十六进制表示)+2022H=国标码;解:“啊”的区码16,位码是01,对应的十六进制的区码是10,位码是01,国标码为10+20=30H01+20=21H即3021H3、机内码:计算机系统内部标识汉字的编码。一个汉字由两个字节组成,为了与ASCII码区别,最高位均为“1”。国标码和机内码的换算:内码高位=国际码高位+80H内码低位=国际码低位+80H例1中啊的机内码3021+8080=B0A1UltraEdit软件显示知道十六进制的机内码,也就知道这个汉字在计算机的处理用的二进制编码。[例2]“大”字的区位码为2083,求该字的国标码和机内码分析方法步骤:(1)区码和位码分别转换成十六进制数表示(2)(区位码的十六进制表示)+2022H=国标码;(3)国标码+8080H=机内码解:1、该字的区号为20,位号为83,分别转换为十六进制表示为14H,53H2、1453H+2022H=3473H,得到国标码3473H3、3473H+8080H=B4F3H,得到机内码为B4F3H请同学们写出二进制编码1011010011110011汉字的区位码、国标码、内部码三者之间的转换关系:国标码=区位码+2022H内码=国标码+8080H内码=区位码+A0A0思考:用UltraEdit软件输入“你好”得到内码C4E3BAC3,请同学们算出国标码、区位码,并用区位码输入检验你计算的结果是否正确.你:3667好:26354.字形码:汉字字模信息码为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论