信息技术 第一册(五年制高职)教案 1.3.4 计算机中的信息编码-文档_第1页
信息技术 第一册(五年制高职)教案 1.3.4 计算机中的信息编码-文档_第2页
信息技术 第一册(五年制高职)教案 1.3.4 计算机中的信息编码-文档_第3页
信息技术 第一册(五年制高职)教案 1.3.4 计算机中的信息编码-文档_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.3.4计算机中的信息编码编码的概念在日常生活中随处可见,例如,学生证上的学号是一个编码,每张人民币纸币上都有一个编码。这两个编码中的前者是往往用十进制数表示,后者则是由十进制数和英文字母混合而成。下面详细介绍各种不同类型的信息在计算机中采用二进制进行编码的方法。西文字符的编码在微机中对字符进行编码,通常采用ASCII码和Unicode编码。(1)ASCII码ASCII码是AmericanStandardCodeforInformationInterchange(美国信息互换标准代码)的简称,已经被国际标准化组织(ISO)指定为国际标准,称为ISO646标准,适用于所有拉丁文字字母。标准ASCII码采用7位二进制数来表示所有的大写和小写字母、数字0到9、标点符号,以及在美式英语中使用的特殊控制字符等128个字符。这128个字符可以分为95个可显示/打印字符和33个控制字符两类。在8个二进制位中,ASCII采用了7位(b0~b6)编码,空闲最高位b7常用作奇偶校验位。ASCII码的字符编码表共有24=16行,23=8列。低4位编码b3b2b1b0用作行编码,而高3位b6b5b4用作列编码。标准ASCII码字符集见表1。表1标准ASCII码字符集低4位b3b2b1b0高3位b6b5b40000010100111001011101110000NULDLESP0@P`p0001SOHDC1!1AQaq0010STXDC2"2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQNAK%5EUeu0110ACKSYN&6FVfv0111BELETB'7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;K[k{1100FFFS,〈L\l|1101CRGS-=M]m}1110SORS.〉N^n~1111SIUS/?O_oDEL表1中的每个字符对应一个二进制编码,每个编码的数值称为ASCII码的值,例如,字母A的编码为1000001B,即65D或41H。由于ASCII码只有7位,在用一个字节保存一个字符的ASCII码时,占该字节的低7位,最高位补0。可以看出,数字0~9的ASCII码的值范围是48~59,大写字母的ASCII码的值范围是65~90,小写字母的ASCII码的值范围是97~122,其顺序与字母表中的顺序是一样的,并且同一个字母的大小写ASCII码的值相差32。(2)Unicode编码扩展的ASCII码所提供了256个字符,但用来表示世界各国的文字编码显然是远远不够的,还需要表示更多的字符和意义,因此又出现了Unicode编码。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode编码自1994年公布以来已得到普及,广泛应用于Windows操作系统、Office等软件中。汉字的编码汉字也是一种字符,也需要用二进制进行编码才能被计算机接受。汉字是象形文字,有近60,000个左右的汉字,常用汉字就达7,000个左右。汉字的编码处理较为复杂,需要对汉字信息进行转换处理,主要经历输入、处理和输出过程,具体处理的过程如图3-6所示。首先是通过汉字输入码输入汉字信息,计算机内部通过统一的编码将输入码转换为汉字的机内码进行存储和处理,最后通过字形码将汉字输出显示。因此,对汉字信息的处理过程实际上是各种汉字编码间的转换过程,主要包括:汉字输入码、汉字机内码、汉字地址码、汉字字形码。

图1汉字信息处理系统的流程模型(1)汉字输入码汉字输入码是能通过键盘的字母、数字等直接把汉字输入到计算机设计的编码,常见的输入编码方式有数字编码、拼音码、字形编码、混合编码。数字编码是用数字串代表一个汉字进行输入,常用的是国际区位码。区位码是由区号(即行号)和位号(即列号)构成,我们用4位十进制数字表示一个区位码,其中前2位表示区号,后2位表示位号。例如:“学”字的区号是49,位号是07,区位码就是4907,用2个字节的二进制表示为:0011000100000111。拼音码是以汉字拼音为基础,以汉字的汉语拼音或其一定规则的缩写形式为编码元素的汉字输入码。常用的有QQ输入法、搜狗拼音、智能全拼、微软拼音、紫光拼音等。字型码是用汉字的形状进行编码的汉字输入码。常见的有五笔输入法。现在,为了提升输入的速度,不断涌现出很多新的输入法,如语音输入、手写输入和扫描输入。(2)汉字机内码汉字机内码,我们又称为汉字存储码或者内码。当使用不同汉字输入码将汉字输入到计算机内时,需要将汉字转换为统一的汉字机内码进行存储、加工处理和传输。汉字机内码是汉字最基本的编码,都是由0和1表示的。常用的汉字机内码的编码方式有GB2312、BIG5、GBK、GB18030和国际标准字符集Unicode。(3)汉字地址码

汉字地址码是指汉字字库中存储汉字字形信息的逻辑地址码。在汉字库中,字形信息都是按一定顺序连续存放的(一般按照标准汉字国标码中汉字的排列顺序进行存放),因此汉字地址码绝大多数是连续有序的,且与汉字机内码有对应关系,这样汉字内码到汉字地址码的转换也相对比较简单。(4)汉字字形码汉字字形码又称为汉字字模,是存放汉字的字形信息的编码,它也与汉字内码一一对应,用于汉字的输出或显示。每个汉字的字形码都从预先存放在计算机的汉字库中寻找得到。

汉字字形的描述有点阵字形和矢量表示法两种。点阵字形法是把每个汉字都用一个16*16或24*24的点阵表示,通过每个排列的点的黑白颜色来描述一个汉字字型。矢量表示方式是通过曲线来描述汉字字形的轮廓特征,一般都采用数学方法描述汉字的轮廓曲线。数值编码前面介绍了不同进制之间的转换,对任何进制的数值,其绝对值都可以转换成二进制数,这样其他进制的数据就可以在计算机中表示了。在各种软件编程语言中,数值型数据按存储大小、表示形式与取值范围的不同,又分为多种不同类型,比如数值型,浮点型(单精度型,双精度型)和整型等。任何一个数在计算机内部都要被表示成二进制数,该二进制数叫作机器数,它是该数的真值。机器数有固定的位数,同时机器数是带符号的,通常用最高位表示符号,0表示正,1表示负。在计算机内部,机器数的表示方法有原码、反码和补码三种,最常用的是原码和补码两种,原码表示法比较直观,补码表示运算则比较简单,在计算机中数值都是以补码的方式存储的。(1)原码原码表示法是在数值前面增加了一位表示符号位,符号位为0表示该数为正,符号位为1表示该数为负,正数该位为0,负数该位为1,其余位表示该数值的绝对值。如:真值为85和-85,其原码为01010101和11010101。原码表示法能比较直观地表示机器数,但是原码不能直接参加运算。当用原码进行乘除操作时,可取其绝对值(尾数)直接运算,再按同号相乘除为正数,异号相乘除结果为负数的原则处理结果数的符号位即可,但对常用的加减运算操作,使用原码表示却极不方便,有可能会出错,需要借助于补码。(2)反码反码表示法是正数的反码是其原码本身,而负数的反码是在原码的基础上,符号位不变,其余各位取反。在计算机内部使用反码表示法可以化减为加,一般用于设置环境变量。真值为85和-85,其反码分别是01010101和10101010。(3)补码计算机内部,数值都是使用补码来表示和存储的。那什么是补码呢?补码表示法是正数的补码是其原码本身,而负数的补码是在原码的基础上,符号位不变,其余各位取反,最后末位+1,即“反码加1”。由此可以看出补码是通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论