第四讲 信息编码及其在计算机中表示_第1页
第四讲 信息编码及其在计算机中表示_第2页
第四讲 信息编码及其在计算机中表示_第3页
第四讲 信息编码及其在计算机中表示_第4页
第四讲 信息编码及其在计算机中表示_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲信息编码及其在计算机中的表示NAME:李晓鹏TEL-MAIL:lxp_tjut@126.com1信息的数字化编码信息是指对人们有用的数据。数据与信息的区别具体表现在:数据中包含着信息;数据处理之后产生结果为信息;信息具有相对性,时效性;因此,通常来说信息和数据是不加区分的。1信息的数字化编码信息处理(数据处理)计算机对数据的采集和输入、存储、处理、加工、转换、合并、分类、计算、统计、汇总、传送等操作的过程。信息处理目的是什么?向人们提供有用的信息;信息处理的本质即是数据处理,因此数据处理的主要目标是获取有用的信息。1信息的数字化编码计算机中处理的数据分为数值数据和非数值数据两大类,非数值数据包括西文字母、汉字、标点符号、图形、声音以及视频等。在计算机中无论是数值数据还是非数值数据都是以二进制的形式表示和处理的,数值数据直接转换为二进制,对于非数值数据则采用二进制编码的形式。1信息的数字化编码编码:是用来将信息从一种形式转变为另一种形式的符号系统,通常选用少量最简单的基本符号和一定的组合规则,以表示出大量复杂多样的信息。信息的数字化编码是指用“0”或“1”这种量最少、最简单的二进制数码,并选用一定的组合规则,来表示数据、文字、声音、图形和图像等各种复杂的信息。计算机中采用的是二进制数码2计算机的数制及其转换数制是指用一组固定的符号和一套统一的规则来表示数值的方法。期中,按照仅为方式计数的数制称为进位计数制。进位计数制包括三方面的要素:基数、位权和进位规则。2.计算机的数制及其转换(1)基数(Radix,简写为R

)基数就是在进位计数制中可使用的数字符号的个数,也就是符号集中数字的个数。通常用R表示基数。例如:十进制中可用0,1,2,3,4,5,6,7,8,9十个数;二进制中可用0,1两个数。

2计算机的数制及其转换(2)位权基数为R的进数制,其位权就是R的i次幂,表示为Ri。例如:二进制的位权就是2i;八进制的位权就是8i。2计算机的数制及其转换(3)进位规则进位计数制的就是逢“基”进一,这里的“基”也就是基数R,即逢R进一。例如:十进制数,基数为10,则其进位规则是逢十进一;二进制数,基数为2,进位规则是逢二进一。

2.1常用的进位计数制十进制数二进制数八进制数十六进制数

数码:0、1、……8、9 基:10(逢十进一,借一当十) 权:以10为底的幂 任何一个十进制数DnDn-1…D1D0D-1…,可以表示成按权展开的多项式: Dn×10n+Dn-1×10n-1+…+D1×101+D0×100+D-1×10-1+…+D-m×10-m

例如:1234.5的按权展开多项为:1234.5=1×103+2×102+

3×101+4×100+5×10-1

2.1.1十进制数(DecimalSystem)2.1.2二进制数(BinarySystem)数码:0和1基:2权:以2为底的幂 任何一个二进制数BnBn-1…B1B0B-1…B-m,可以表示成按权展开的多项式: Bn×2n+Bn-1×2n-1+…+B1×21+B0×20+B-1×2-1+…+B(-m+1)×2-(m-1)+B-m×2-m

例如:1101.01的按权展开多项为:1101.01=1×23+1×22+0×21+1×20+0×2-1+1×2-2

二进制数是计算机内部采用的计数方式,具有以下优点:(1)简单可行;(2)运算规则简单但是,二进制数的明显缺点表现在数字冗长,书写量过大,不便于阅读。2.1.2二进制数(BinarySystem)2.1.3八进制数(OctaveSystem)

数码:0、1、……6、7

基:8 权:以8为底的幂 八进制数的一般式可以表示为: On×8n+On-1×8n-1+…+O1×81+O0×80+O-1×8-1+…+O(-m+1)×8-(m-1)+O-m×8-m2.1.4十六进制数(HexadecimalSystem)

数码:0、1、……6、7

....A、B、C、D、E、F 基:16 权:以16为底的幂 十六进制数的一般式可以表示为:

Hn×16n+Hn-1×16n-1+…+H1×161+H0×160+H-1×16-1+…+H(-m+1)×16-(m-1)+H-m×16-m4种数制之间的转换可参照下表进行2.2不同数制的表示为了区分不同的数制的数,在书写时通常采用下面两种不同的方法:其一:将数字用括号括起来,在括号的右下角写上基数来表示不同数制。其二:在一个数的后面加上不同的字母表示进制,其中D表示十进制,B表示二进制,O表示八进制,H表示十六进制。例: 二进制数1011.0101及其对应的八进制数、 十进制数和十六进制数可以表示为:

1101.0111(2)=15.34(8)=13.4375(10)=E.7(16) 或:(1101.0111)2=(15.34)8=(13.4375)10=(E.7)16

或: 1101.0111B=15.34O=13.4375D=E.7H

2.2不同数制的表示⒈二进制数、八进制数、十六进制数转换为十进制数 各种进位计数制可统一表示为下式:式中:

R─某种进位计数制的基数; i─位序号; Ki─第i位上的一个数码为0~R-1中的任一个; Ri─则表示第i位上的权;

m,n

最低位和最高位的位序号。

用上式可将任何一个二进制数、八进制数、十六进制数直接转换为十进制数,这叫做按权展开法。

2.3

常用进位计数制间的相互转换

例:⑴二进制数转换为十进制数(1011.0101)2=1×23+0×22+1×21+1×20+0×2-1+1×2-2+0×2-3+1×2-4

=8+0+2+1+0+1/4+0+1/16=(11.3125)10⑵八进制数转换为十进制数(75.21)8=7×81+5×80+2×8-1+1×8-2 =56+5+2/8+1/64 =(45.20238)10⑶十六进制数转换为十进制数(175.FB)16=1×162+7×161+5×160+15×16-1+11×16-2=256+112+5+15/16+11/162=(373.98046875)102.3

常用进位计数制间的相互转换

课堂练习一:将1101101B,4BC7H转化为十进制数2.3

常用进位计数制间的相互转换

2.3

常用进位计数制间的相互转换

十进制数转换为非十进制数:转换原理为:整数部分十进制转换成R进制(非十进制)的规则是”除R逆取余法”;小数部分十进制转换成R进制(非十进制)的规则是“乘R顺取整法”十进制整数转换为二进制数

方法:除以2取余法。即逐次除以2,直至商为0,得出的余数即为二进制数各位的数码。

例把一个十进制数156转换为二进制数。结果:(156)10=(10011100)22.3

常用进位计数制间的相互转换

十进制小数转换为二进制数

方法:乘2取整法。即逐次乘以2,从每次乘积的整数部分得到二进制数各位的数码。例把十进制小数0.34375转换为二进制小数。 结果:(0.34375)10=(0.01011)2

2.3

常用进位计数制间的相互转换

课堂练习二:将38.24D转化为二进制数2.3

常用进位计数制间的相互转换

二进制数转换成八进制数方法:将二进制数从小数点开始分别向左(对二进制整数)或向右(对二进制小数)每三位组成一组,每一组有3位二进制数,转换成八进制数码中的1个数字,连接起来即可。不足3位的补0。例把二进制数(101100011.011100101)2转换为八进制数。 101100011.011100101 543.345 即有:(101100011.011100101)2=(543.345)82.3

常用进位计数制间的相互转换

八进制数转换成二进制数方法:将每1位八进制数写成相应的二进制3位数,顺序写好即成。例把八进制数(7351.65)8转换为二进制数。7351.65111011101001.110101即有:(7351.65)8=(111011101001.110101)22.3

常用进位计数制间的相互转换

二进制数转换成十六进制数方法:把十六进制数每位的数字与二进制数的4位数相对应。例把二进制数(110100110101)2转换为十六进制数。110100110101D35即有:(110100110101)2=(D35)162.3

常用进位计数制间的相互转换

十六进制数转换成二进制数方法:将每1位十六进制数写成相应的二进制4位数,顺序写好即成。例如:E8B111010001011即有:E8BH=111010001011B

对于十进制数转换为八进制数或十六进制数的问题,我们可以先把十进制数转换成二进制数,然后再转换为八进制数或十六进制数。2.3

常用进位计数制间的相互转换

课堂练习三:将101110011000111011B分别转化转化为八进制数和十六进制数;将563073O转化为二进制数;将2E638H转化为二进制数。2.3

常用进位计数制间的相互转换

3二进制的算术运算二进制的算术运算和十进制算术运算是一样的,也包括加、减、乘、除四则运算,但是运算更加的简单。在计算机内部二进制的加法是基本的运算,其他的运算都是可以通过加法的移位来实现,这样可以使计算机的运算器结构变得简单、稳定性好。3二进制的算术运算(1)二进制的加法二进制加法的运算规则如下:0+0=00+1=11+0=11+1=10(向高位进位)(2)二进制的减法二进制减法的运算规则如下:0-0=01-0=11-1=00-1=1(向高位借位)4二进制的逻辑运算二进制的逻辑运算包括“与”、“或”、“异或”、“非”(1)“与”运算“与”运算又称为逻辑乘,用符号&表示,运算规则如下:

0&0=00&1=01&0=01&1=14二进制的逻辑运算(2)“或”运算“或”运算又称为逻辑加,用符号|表示,运算规则如下:

0|0=00|1=11|0=11|1=14二进制的逻辑运算(3)“异或”运算“异或”运算用符号⊕表示,运算规则如下:

0⊕0=00⊕1=11⊕0=11⊕1=04二进制的逻辑运算(4)“非”运算“非”运算用符号!表示,运算规则如下:

!0=1

!1=05计算机中的信息编码(1)数值编码数值数据在计算机内保存时,除了进行进制转换,还有一个需要解决的问题,那就是数字的正负号和带小数部分的数值其小数点未知的处理。正负号也采用编码的方法,将二进制的最高位定义为符号位,0表示正数,1表示负数。这种表示方法成为原码表示,在计算机中带符号数还有反码和补码表示方法。5计算机中的信息编码正数的原码、反码、补码都是相通的;负数则不同,在求负数的反码时,符号位为“1”,其余各位按位取反,也就是“1”都换成“0”,“0”都换成“1”,负数的补码为反码加1。例:19D的二进制表示为010011,-19D原码为110011,反码为101100,补码为101101.在计算机中小数点有定点表示法和浮点表示法。5计算机中的信息编码(2)西文字符的编码在计算机中对字符进行编码,通常采用ASCII和Unicode编码。ASCII码是AmericanStandardCodeforInformationInterchange的简称,已经被国家标准化组织指定为国际标准,称为ISO646标准。5计算机中的信息编码标准的ASCII码采用7位二进制数来表示所有的大写和小写字母,数字0到9,标点符号,以及在美式英语中使用的特殊控制字符等128个字符。这128个字符可以分为95个可显示/可打印字符和33个控制字符两类。ASCII码字符编码表

5计算机中的信息编码Unicode编码Unicode编码是国际组织制定的可以容纳世界所有文字和符号的字符编码方案。它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。6汉字编码

计算机对汉字信息的处理过程实际上是各种汉字编码件的转换过程。这些编码主要包括汉字输入码、汉字内码、汉字字形码、汉字地址码和汉字信息交换码。6.1汉字的字符集

目前,在我国使用的计算机汉字操作平台中有三种汉字字符集:⑴

国标码字符集GB2312-1980:我国政府于1981年公布的《信息交换用汉字编码字符集--基本集》,简称交换码或者国标码,这是国家标准。在该字符集中收录了6763个常用汉字和各种符号682个,合计7445个。⑵

GBK汉字集:即汉字内码扩充规范。这是在1993年发布了GB13000以后,为了从GB2312向GB13000过渡而发布的。在此汉字集中一共收录了20900个汉字,它包容了GB2312-80的6763个常用汉字,台湾BIG5码的13000多个汉字。此扩充规范发布后,美国的Microsoft公司率先将GBK规范装入Windows95中。在Windows95简体中文版中,又增加了101个补充字,一共有21001个字。6.1汉字的字符集⑶

国标码GB18030字符集:即GB18030-2000《信息交换用汉字编码字符集基本集的扩充》新标准。该字符集共收录了27000多个汉字,总编码空间超过150万个码位,是真正的大汉字集。它在体系结构上延续了GB2311-1990《信息处理

七位和八位编码字符集代码扩充技术》编码体系,采用单/双/四字节混合编码,该标准还收录了藏文、蒙文、维吾尔等主要的少数民族文字,以及世界上几乎所有的语言文字,为中文信息在Internet上的传输与交换提供了保障。

6.2汉字编码汉字编码:机内码和机外码 机内码:是在计算机内部使用的用二进制代码 表示的汉字编码,用于在计算机内部存储、交 换、处理加工汉字信息;

机外码:是不在计算机内使用的汉字编码,主 要是指汉字输入码。此外还有供输出的汉字字形码。1.区位码

将GB2312字符集放置在一个94行、94列的方阵中,方阵的每一行称为汉字的一个“区”,区号范围为1-94,方阵的每一列称为汉字的一个“位”,位号范围为1-94.这样,汉字在方阵中的位置可以用它的区号和位号来确定,将区号和位号组合起来得到该汉字的区位码。2.国标码

国标码中用两个字节对汉子进行编码,先将汉字区位码中的十进制区号和位号转换成十六进制数字,然后再加上20H,就可得到该汉字的国标码。国家标准(GB2312-1980)汉字字符集示意图

国标码用两个字节的16进制数表示,例如“文”的国标码是“4E44H”,“中华人民共和国”的国标码分别是“5650H、3B2AH、484BH、4371H、3932H、3A4DH、397AH”。

3.汉字机内码

汉字机内码简称内码,是供计算机系统进行存储、加工处理和传输所使用的代码。ASCII码是一种西文机内码。在设计汉字机内码时,应遵循如下原则:⑴

汉字机内码的编码不能有二义性,否则和其他编码分不清,例如要能和ASCII码严格区分。为了解决这个问题,通常将汉字国标码两个字节的最高位都设置为1,也就是对国标码的两个字节都加上80H;⑵

代码的长度尽可能短,所能表示的汉字要尽可能多;⑶

应与国标码有相应的对应关系,以便于对汉字库的处理和对汉字的查找。

汉字区位码、国标码与机内码的关系 用十进制数输入的区码和位码先分别转换为十六进制数(各一个字节),再分别加上20H,就成了国标码;再在两个字节分别加上80H,就成为机内码。区位码:

区号

位号↓

↓十六进制数

十六进制数+20H+20H国标码:

高位字节

低位字节+80H+80H机内码:

高位字节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论