新编计算机导论 课件 3-4 信息的编码-2_第1页
新编计算机导论 课件 3-4 信息的编码-2_第2页
新编计算机导论 课件 3-4 信息的编码-2_第3页
新编计算机导论 课件 3-4 信息的编码-2_第4页
新编计算机导论 课件 3-4 信息的编码-2_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

新编计算机导论计算的基础4信息的编码(下)西文字符及多媒体的编码01汉字的编码02本节CAPACITY内容汉字编码汉字信息的处理涉及汉字的输入、汉字信息的转换、汉字信息在计算机内的存储、输出等,分别对应不同的编码。1)汉字输入码2)汉字交换码(国标码)3)汉字机内码4)汉字字形码5)汉字地址码汉字的编码汉字输入码为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。总体来说可分为音码、形码、音形结合码三大类。音码是根据汉字的拼音进行编码的,如全拼码、双拼码。形码是根据汉字的字形结构进行编码的,如五笔字型码、仓颉码。音形码则结合了两者,如自然码。汉字的编码汉字交换码(国标码)汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。1980年我国公布了《信息交换用汉字编码字符集——基本集》,GB2312-80编码,简称国标码。自国家标准GB2312-80公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码。每个汉字由两个字节构成。定义了6763个汉字,682个图形符号,共7445个字符。汉字的编码汉字交换码(国标码)区位码:94区*94位(区号、位号)1区—9区:非汉字图形符号10区—15区:空(可造字或其它符号)16区—55区:一级汉字,40*94-5=3755个,按拼音排,覆盖率99.9%56区—87区:二级汉字,32*94=3008个,按偏旁部首排一级二级共6763个,覆盖率99.99%国标码:每个汉字由两个字节构成第一字节:区号+20H;第二字节:位号+20H汉字的编码“中华人民共和国”7个汉字的区位码分别是:“中”—54区48位;“华”—27区10位;“人”—40区43位;“民”—35区81位;“共”—25区18位;“和”—26区45位;“国”—25区90位;汉字的编码汉字机内码汉字机内码,指汉字在计算机内存储和处理时所用的由0和1符号组成的编码。简称“内码”。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码。机内码是汉字最基本的编码,不管什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码。汉字在计算机内部,内码是唯一的。汉字的编码汉字机内码国标码和机内码的关系:将国标码的每个字节的最高位由“0”变为“1”,变换后的国标码即为汉字机内码。机内码:将国标码最高位置“1”

或国标码第一字节+80H,第二字节+80H西文字符:1个字节,高位为0汉字:2个字节,高位为1汉字的编码汉字机内码区位码国标码(区码、位码各加20H)机内码(每个字节各加80H)汉字的编码【例】汉字“中”区位码为5448区码36H,位码30H国标码为5650H内码为D6D0H汉字的编码汉字字形码为了汉字的输出显示和打印,需要描述汉字的字形,即对汉字的字形进行编码,称为汉字的字形码,也称为汉字字模。汉字是一种象形文字,每个字都可以看成是一个特殊的图形,所以汉字字形码通常有两种表示方式,点阵方式和矢量方式。汉字的编码汉字字形码点阵方式每一个汉字可以用一组点阵来表示。点阵的每个点位有两种状态:有点或无点(黑色或白色)。可用二进制代码0、1表示不同状态。用点阵表示字形时,汉字字形码指的就是这个汉字字形点阵的代码。汉字的编码汉字“中”的16×16点阵的字形、字形编码(a)16×16点阵字形表示(b)16×16点阵字形编码表示计算:占(16×16)/8=32字节汉字的编码汉字字形码点阵方式根据输出汉字的要求不同,点阵的大小也不同。汉字字型有16×16(简易型)、24×24(普通型)、32×32(提高型)、48×48、128×128点阵等。所有汉字和各种符号的点阵字形编码的集合称为“汉字字库”,也称汉字的“字模库”。不同的字体对应着不同的字库。汉字的编码汉字字形码矢量方式矢量表示方式存储的是描述汉字字形的轮廓特征,比如一个笔划的起始、终止坐标,半径、弧度等等。要输出显示、打印汉字时,要经过一系列的数学运算。Windows中使用的TrueType技术就是汉字的矢量表示方式。汉字的编码矢量方式矢量和点阵方式的区别:点阵汉字表示方法简单,容易实现,在放大时会失真。矢量汉字能不失真的随意放大,但需要有相应的算法来实现,其实现方法较复杂。汉字的编码汉字地址码汉字地址码是指汉字字模库(这里主要指整字形的点阵字模库)中存储各汉字字形信息的逻辑地址码。每个汉字字形码在汉字字库中的相对位移地址称为汉字地址码,即指汉字字型信息在汉字字模库中存放的首地址。每个汉字在字库中都占有一个固定大小的连续区域,其首地址即是该汉字的地址码。需要向输出设备输出汉字时,必须通过地址码,才能在汉字字库中取到所需的字形码,最终在输出设备上形成可见的汉字字形。汉字的编码几种汉字编码的关系汉字通过输入码输入计算机,由汉字系统的管理模块查表或计算,将输入码(外码)转换成机内码存入计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论