第2章 数据的机器层次表示(终)_第1页
第2章 数据的机器层次表示(终)_第2页
第2章 数据的机器层次表示(终)_第3页
第2章 数据的机器层次表示(终)_第4页
第2章 数据的机器层次表示(终)_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1蒋本珊蒋本珊 编著编著中国计算机学会“21世纪大学本科计算机专业系列教材”23 数据是计算机加工和处理的对象,数据是计算机加工和处理的对象,数据的机器层次表示将直接影响到计算数据的机器层次表示将直接影响到计算机的结构和性能。本章主要介绍无符号机的结构和性能。本章主要介绍无符号数和带符号数的表示方法、数的定点与数和带符号数的表示方法、数的定点与浮点表示方法、字符和汉字的编码方法、浮点表示方法、字符和汉字的编码方法、数据校验码等。熟悉和掌握本章的内容,数据校验码等。熟悉和掌握本章的内容,是学习计算机原理的最基本要求。是学习计算机原理的最基本要求。 4本章学习内容 2.1 数值数据的表示数值数据的

2、表示 2.2 机器数的定点表示和浮点表示机器数的定点表示和浮点表示 2.3 非数值数据的表示非数值数据的表示 2.4 十进制数和数串的表示十进制数和数串的表示 2.5 现代微型计算机中的数据表示举例现代微型计算机中的数据表示举例 2.6 数据校验码数据校验码5本章学习要求 了解:了解:无符号数与带符号数,真值和机器数等无符号数与带符号数,真值和机器数等概念概念 掌握:原码、补码、反码表示法以及三种码制掌握:原码、补码、反码表示法以及三种码制与真值之间的转换方法与真值之间的转换方法 掌握:定点数和浮点数的表示范围掌握:定点数和浮点数的表示范围 理解:浮点数阶码的移码理解:浮点数阶码的移码 了解了

3、解:IEEE754浮点数标准浮点数标准 掌握:常见的字符编码方法(掌握:常见的字符编码方法(ASCII码)、汉字码)、汉字国标码、区位码、机内码国标码、区位码、机内码 掌握:掌握:8241码、码、2421码和余码和余3码码 掌握:奇偶校验位及其形成方法掌握:奇偶校验位及其形成方法 了解:海明校验码和循环冗余校验码了解:海明校验码和循环冗余校验码 62.1 数值数据的表示 在计算机中,采用数字化方式来表在计算机中,采用数字化方式来表示数据,数据有无符号数和带符号数之示数据,数据有无符号数和带符号数之分,其中带符号数根据其编码的不同又分,其中带符号数根据其编码的不同又有原码、补码和反码有原码、补码

4、和反码3种形式。种形式。72.1.1 计算机中的数值数据 二进制数:后缀二进制数:后缀B 八进制数:后缀八进制数:后缀Q 十进制数:后缀十进制数:后缀D或省略后缀或省略后缀 十六进制数:后缀十六进制数:后缀H82.1.2 无符号数和带符号数 无符号数,就是整个机器字长的全无符号数,就是整个机器字长的全部二进制位均表示数值位(没有符号位),部二进制位均表示数值位(没有符号位),相当于数的绝对值。例如:相当于数的绝对值。例如: N1=01001 表示无符号数表示无符号数9 N2=11001 表示无符号数表示无符号数25 机器字长为机器字长为n+1位的无符号数的表位的无符号数的表示范围是示范围是0(

5、2n+1-1),此时二进制的最高此时二进制的最高位也是数值位,其权值等于位也是数值位,其权值等于2n。若字长为若字长为8位,则数的表示范围为位,则数的表示范围为0255。 92.1.2 无符号数和带符号数(续) 带符号数,即正、负数。在日常生带符号数,即正、负数。在日常生活中,我们用活中,我们用“+”、“-”号加绝对值来号加绝对值来表示数值的大小,用这种形式表示的数表示数值的大小,用这种形式表示的数值在计算机技术中称为值在计算机技术中称为“真值真值”。 在计算机中需要把数的符号数码化。在计算机中需要把数的符号数码化。通常,约定二进制数的最高位为符号位,通常,约定二进制数的最高位为符号位,“0”

6、表示正号,表示正号,“1”表示负号。这种在表示负号。这种在计算机中使用的表示数的形式称为计算机中使用的表示数的形式称为机器机器数数。102.1.2 无符号数和带符号数(续) 常见的机器数有原码、反码、补码常见的机器数有原码、反码、补码等等3种不同的表示形式。种不同的表示形式。 带符号数的最高位被用来表示符号带符号数的最高位被用来表示符号位,而不再表示数值位。前例中的位,而不再表示数值位。前例中的N1、N2 在这里的含义变为:在这里的含义变为: N1=01001 表示表示+9。 N2=11001 根据机器数的不同形根据机器数的不同形式表示不同的值,如是原码则表示式表示不同的值,如是原码则表示-9

7、,补码则表示补码则表示-7,反码则表示,反码则表示-6。 112.1.3 原码表示法 原码表示法是一种最简单的机器数原码表示法是一种最简单的机器数表示法,用最高位表示符号位,符号位表示法,用最高位表示符号位,符号位为为“0”表示该数为正,符号位为表示该数为正,符号位为“1”表示该数为负,数值部分与真值相同。表示该数为负,数值部分与真值相同。 设二进制纯小数的原码形式为设二进制纯小数的原码形式为Xs.X1X2Xn,字长字长n+1位,其中位,其中Xs表示表示符号位。符号位。 例例1:X1=0.0110, X1原原=0.0110 X2=-0.0110, X2原原=1.0110122.1.3 原码表示

8、法(续) 设二进制纯整数的原码形式为设二进制纯整数的原码形式为XsX1X2Xn,其中其中Xs表示符号位。表示符号位。 例例2: X1=1101, X1原原=01101 X2=-1101, X2原原=11101 在原码表示中,真值在原码表示中,真值0有两种不同有两种不同的表示形式:的表示形式: +0原原=00000 -0原原=10000132.1.4 补码表示法 1.模和同余模和同余 模模是指一个计量器的容量,可用是指一个计量器的容量,可用M表示。表示。例如:一个例如:一个4位的二进制计数器,当计数器从位的二进制计数器,当计数器从0计到计到15之后,再加之后,再加1,计数值又变为,计数值又变为0

9、。这个计。这个计数器的容量数器的容量M=24=16,即模为即模为16。由此可见,。由此可见,纯小数的模为纯小数的模为2,一个字长为,一个字长为n+1位的纯整数位的纯整数的模为的模为2n+1。 同余同余是指两整数是指两整数A、B除以同一正整数除以同一正整数M,所得余数相同,则称所得余数相同,则称A、B对对M同余,即同余,即A、B在以在以M为模时是相等的,可写作为模时是相等的,可写作 A=B (mod M) 14时钟正拨和倒拨 对钟表而言,对钟表而言,M=12。假设:时钟假设:时钟停在停在8点,而现在正确的时间是点,而现在正确的时间是6点,这点,这时拨准时钟的方法有两种:正拨和倒拨时拨准时钟的方法

10、有两种:正拨和倒拨。 分针倒着旋转分针倒着旋转2圈,等于分针正着圈,等于分针正着旋转旋转10圈。故有:圈。故有:-2=10 (mod 12) ,即即 -2和和10同余。同余。 8-2=8+10 (mod 12) 倒拨时钟倒拨时钟正拨时钟正拨时钟点击播放15 补码的符号位表示方法与原码相同,补码的符号位表示方法与原码相同,其数值部分的表示与数的正负有关:对于其数值部分的表示与数的正负有关:对于正数,数值部分与真值形式相同;对于负正数,数值部分与真值形式相同;对于负数,将真值的数值部分按位取反,且在最数,将真值的数值部分按位取反,且在最低位上加低位上加1。 若真值为纯小数,它的补码形式为若真值为纯

11、小数,它的补码形式为Xs.X1X2Xn,其中其中Xs表示符号位。表示符号位。 例例5:X1=0.0110, X1补补=0.0110 X2=-0.0110, X2补补=1.10102.补码表示16 若真值为纯整数,它的补码形式为若真值为纯整数,它的补码形式为XsX1X2Xn,其中其中Xs表示符号位。表示符号位。 例例6:X1=1101, X1补补=01101 X2=-1101, X2补补=10011 在补码表示中,真值在补码表示中,真值0的表示形式是的表示形式是唯一的:唯一的: +0补补=-0补补=000002.补码表示(续)17 当当X为正数时,为正数时,X补补=X原原=X 当当X为负数时,由

12、为负数时,由X原原转换为转换为X补补的的方法:方法: X原原除掉符号位外的各位取反加除掉符号位外的各位取反加“1”。 自低位向高位,尾数的第一个自低位向高位,尾数的第一个“1”及其右部的及其右部的“0”保持不变,左部的各位保持不变,左部的各位取反,符号位保持不变。取反,符号位保持不变。 例例7:X原原 =1.1110011000 X补补 =1.00011010003.由真值、原码转换为补码不变不变不变不变变反变反182.1.5 反码表示法 反码表示法与补码表示法有许多类反码表示法与补码表示法有许多类似之处,对于正数,数值部分与真值形似之处,对于正数,数值部分与真值形式相同;对于负数,将真值的数

13、值部分式相同;对于负数,将真值的数值部分按位取反。按位取反。 若真值为纯小数,它的反码形式为若真值为纯小数,它的反码形式为Xs.X1X2Xn,其中其中Xs表示符号位。表示符号位。 例例9:X1=0.0110, X1反反=0.0110 X2=-0.0110, X2反反=1.1001192.1.5 反码表示法(续) 若真值为纯整数,它的反码形式为若真值为纯整数,它的反码形式为XsX1X2Xn,其中其中Xs表示符号位。表示符号位。 例例10:X1=1101, X1补补=01101 X2=-1101, X2补补=10010 在反码表示中,真值在反码表示中,真值0也有两种不也有两种不同的表示形式:同的表

14、示形式: +0反反=00000 -0反反=1111120 1.比较比较 对于正数它们都等于真值本身,而对于负数各对于正数它们都等于真值本身,而对于负数各有不同的表示。有不同的表示。 最高位都表示符号位,补码和反码的符号位可最高位都表示符号位,补码和反码的符号位可作为数值位的一部分看待,和数值位一起参加作为数值位的一部分看待,和数值位一起参加运算;但原码的符号位不允许和数值位同等看运算;但原码的符号位不允许和数值位同等看待,必须分开进行处理。待,必须分开进行处理。 对于真值对于真值0,原码和反码各有两种不同的表示,原码和反码各有两种不同的表示形式,而补码只有唯一的一种表示形式。形式,而补码只有唯

15、一的一种表示形式。 原码、反码表示的正、负数范围相对零来说是原码、反码表示的正、负数范围相对零来说是对称的;但补码负数表示范围较正数表示范围对称的;但补码负数表示范围较正数表示范围宽,能多表示一个最负的数(绝对值最大的负宽,能多表示一个最负的数(绝对值最大的负数),其值等于数),其值等于-2n(纯整数)或纯整数)或-1(纯小数)。(纯小数)。2.1.6 三种码制的比较与转换21真值与3种机器数间的对照真值真值 X X 真值真值 X X 十进制十进制 二进制二进制 XX 原原XX 反反XX 补补 十进制十进制 二进制二进制 XX 原原 XX 反反 XX 补补 +0+0 +1+1 +2+2 +3+

16、3 +4+4 +5+5 +6+6 +7+7 +8+8 +000+000 +001+001 +010+010 +011+011 +100+100 +101+101 +110+110 +111+111 - - 00000000 00010001 00100010 00110011 01000100 01010101 01100110 01110111 - - - -0 0 - -1 1 - -2 2 - -3 3 - -4 4 - -5 5 - -6 6 - -7 7 - -8 8 - -000000 - -001001 - -010010 - -011011 - -100100 - -10110

17、1 - -110110 - -111111 - -10001000 10001000 10011001 10101010 10111011 11001100 11011101 11101110 11111111 - - 11111111 1111110 0 11110101 1101100 0 1 1011011 1011010 0 10100101 1001000 0 - - 00000000 1111111 1 11111010 1101101 1 1 11 10000 1011011 1 10101 10 0 1001001 1 10001000 222.转换 如果已知机器的字长,则机器

18、数的位数应如果已知机器的字长,则机器数的位数应补够相应的位。例如,设机器字长为补够相应的位。例如,设机器字长为8位,则:位,则: X1=1011 X2=-1011 X1原原=00001011 X2原原=10001011 X1补补=00001011 X2补补=11110101 X1反反=00001011 X2反反=11110100 X3=0.1011 X4=-0.1011 X3原原=0.1011000 X4原原=1.1011000 X3补补=0.1011000 X4补补=1.0101000 X3反反=0.1011000 X4反反=1.0100111232.2 机器数的定点表示与浮点表示 计算机在

19、进行算术运算时,需要指计算机在进行算术运算时,需要指出小数点的位置。根据小数点的位置是出小数点的位置。根据小数点的位置是否固定,在计算机中有两种数据格式:否固定,在计算机中有两种数据格式:定点表示和浮点表示。定点表示和浮点表示。242.2.1 定点表示法 在定点表示法中约定:所有数据的在定点表示法中约定:所有数据的小数点位置固定不变小数点位置固定不变。1.定点小数定点小数 小数点的位置固定在最高有效数位小数点的位置固定在最高有效数位之前,符号位之后之前,符号位之后,记作,记作Xs.X1X2Xn,这个数是一个纯小数。定点小数的小数这个数是一个纯小数。定点小数的小数点位置是隐含约定的,小数点并不需

20、要点位置是隐含约定的,小数点并不需要真正地占据一个二进制位。真正地占据一个二进制位。25定点小数表示范围图图2-2 定点小数格式定点小数格式 当当Xs=0,X1Xn=1时,时,X为最大正数。为最大正数。 X最大正数最大正数 =1-2-n 当当Xn=1,XsXn-1=0时,时,X为最小正数。为最小正数。 X最小正数最小正数 =2-nn位数值位数符小数点位置(隐含)XsX1Xn-1Xn26定点小数表示范围(续) 当当Xs=1,表示表示X为负数,此时情况要为负数,此时情况要稍微复杂一些,这是因为在计算机中带符稍微复杂一些,这是因为在计算机中带符号数可用补码表示,也可用原码表示。原号数可用补码表示,也

21、可用原码表示。原码和补码的表示范围有一些差别。码和补码的表示范围有一些差别。 若机器数为原码表示,当若机器数为原码表示,当XsXn均均等于等于1时,时,X为绝对值最大的负数。为绝对值最大的负数。 X绝对值最大负数绝对值最大负数=-(1-2-n) 若机器数为补码表示,当若机器数为补码表示,当Xs=1,X1Xn均等于均等于0时,时,X为绝对值最大的负数。为绝对值最大的负数。 X绝对值最大负数绝对值最大负数=-127 若机器字长有若机器字长有n+1位,则有:位,则有: 原码定点小数表示范围:原码定点小数表示范围: -(1-2-n)(1-2-n) 补码定点小数表示范围:补码定点小数表示范围: -1(1

22、-2-n) 若机器字长有若机器字长有8位,则有:位,则有: 原码定点小数表示范围:原码定点小数表示范围: - 补码定点小数表示范围:补码定点小数表示范围: -1定点小数表示范围(续)128127128127128127282.定点整数 定点整数即纯整数,定点整数即纯整数,小数点位置隐小数点位置隐含固定在最低有效数位之后含固定在最低有效数位之后,记作,记作XsX1X2Xn。图图2-3 定点整数格式定点整数格式XsX1Xn-1n位数值位数符小数点位置(隐含)Xn29若机器字长有若机器字长有n+1位,则有:位,则有:原码定点整数的表示范围:原码定点整数的表示范围: -(2n-1)(2n-1)补码定点

23、整数的表示范围:补码定点整数的表示范围: -2n (2n-1)若机器字长有若机器字长有8位,则有:位,则有:原码定点整数表示范围:原码定点整数表示范围: -127127补码定点整数表示范围:补码定点整数表示范围: -128127定点整数表示范围30 小数点的位置根据需要而浮动,这小数点的位置根据需要而浮动,这就是浮点数就是浮点数。例如:。例如: N=MrE 式中:式中:r为浮点数阶码的底,与尾数为浮点数阶码的底,与尾数的基数相同,通常的基数相同,通常r=2。E和和M都是带符号都是带符号数,数,E叫做阶码,叫做阶码,M叫做尾数。在大多数叫做尾数。在大多数计算机中,尾数为纯小数,常用原码或补计算机

24、中,尾数为纯小数,常用原码或补码表示;阶码为纯整数,常用移码或补码码表示;阶码为纯整数,常用移码或补码表示。表示。2.2.2 浮点表示法 31图图2-5 浮点数的一般格式浮点数的一般格式 浮点数的底是隐含的,在整个机器浮点数的底是隐含的,在整个机器数中不出现。阶码的符号位为数中不出现。阶码的符号位为es,阶码的阶码的大小反映了在数大小反映了在数N中小数点的实际位置;中小数点的实际位置;尾数的符号位为尾数的符号位为ms,它是整个浮点数的它是整个浮点数的符号位,表示了该浮点数的正负。符号位,表示了该浮点数的正负。浮点数的一般格式尾数部分M阶码部分Eesemsmk位n位1位1位321.浮点数的表示范

25、围 当当es=0,ms=0,阶码和尾数的数值阶码和尾数的数值位各位全为位各位全为1(即阶码和尾数都为最大正(即阶码和尾数都为最大正数)时,该浮点数为最大正数:数)时,该浮点数为最大正数: X最大正数最大正数=(1-2-n) 当当es=1,ms=0,尾数的最低位尾数的最低位mn=1,其余各位为其余各位为0(即阶码为绝对值(即阶码为绝对值最大的负数,尾数为最小正数)时,该最大的负数,尾数为最小正数)时,该浮点数为最小正数:浮点数为最小正数: X最小正数最小正数=2-n 122kk22331.浮点数的表示范围(续) 当当es=0,阶码的数值位为全阶码的数值位为全1;ms=1,尾数的数值位为全尾数的数

26、值位为全0(即阶码为最(即阶码为最大正数,尾数为绝对值最大的负数)时,大正数,尾数为绝对值最大的负数)时,该浮点数为绝对值最大负数:该浮点数为绝对值最大负数: X绝对值最大负数绝对值最大负数= -1 122 k34 为了提高运算的精度,需要充分地为了提高运算的精度,需要充分地利用尾数的有效数位,通常采取浮点数规利用尾数的有效数位,通常采取浮点数规格化形式,即规定格化形式,即规定尾数的最高数位必须是尾数的最高数位必须是一个有效值一个有效值。 1/2 |M| 12.规格化浮点数352.规格化浮点数(续) 在尾数用补码表示时,规格化浮点数在尾数用补码表示时,规格化浮点数应满足应满足尾数最高数位与符号

27、位不同尾数最高数位与符号位不同(ms m1 =1),),即当即当1/2M1时,应有时,应有0.1xxx形式,当形式,当-1M-1/2时,应有时,应有1.0 xxx形式。形式。 需要注意的是当需要注意的是当M=-1/2,对于原码对于原码来说,是规格化数,而对于补码来说,不来说,是规格化数,而对于补码来说,不是规格化数。是规格化数。362.规格化浮点数(续) 当当es=1,ms=0,尾数的最高位尾数的最高位m1=1,其余各位为其余各位为0时,该浮点数为规格化的最时,该浮点数为规格化的最小正数:小正数: X规格化的最小正数规格化的最小正数=2-1 规格化的最小正数大于非规格化的规格化的最小正数大于非

28、规格化的最小正数最小正数。k2237浮点数的典型值 382.2.3 移码表示法 移码就是在真值移码就是在真值X上加一个常数(偏置上加一个常数(偏置值),相当于值),相当于X在数轴上向正方向平移了一段距在数轴上向正方向平移了一段距离,这就是离,这就是“移码移码”一词的来由。一词的来由。 X移移=偏置值偏置值+X 对于字长对于字长8位的定点整数,偏置值为位的定点整数,偏置值为27。 例例11:X=1011101 X移移=27+X=10000000+1011101=11011101 X补补=01011101 例例12:X=-1011101 X移移= 27 +X=10000000-1011101=00

29、100011 X补补=1010001139偏置值为27的移码、补码和真值之间的关系 40偏置值为2n的移码的特点 在移码中,最高位为在移码中,最高位为“0”表示负表示负数,最高位为数,最高位为“1”表示正数。表示正数。 移码为全移码为全0时,它所对应的真值最时,它所对应的真值最小,为全小,为全1时,它所对应的真值最大。时,它所对应的真值最大。 真值真值0在移码中的表示形式是唯一在移码中的表示形式是唯一的,即的,即+0移移=-0移移=1000。 移码把真值映射到一个正数域,移码把真值映射到一个正数域,所以可将移码视为无符号数,直接按无符所以可将移码视为无符号数,直接按无符号数规则比较大小。号数规

30、则比较大小。 同一数值的移码和补码除最高位同一数值的移码和补码除最高位相反外,其他各位相同相反外,其他各位相同。41浮点数的阶码采用移码的原因 便于比较浮点数的大小。阶码大的,其对便于比较浮点数的大小。阶码大的,其对应的真值就大,阶码小的,对应的真值就应的真值就大,阶码小的,对应的真值就小。小。 简化机器中的判零电路。当阶码全为简化机器中的判零电路。当阶码全为0,尾数也全为尾数也全为0时,表示机器零。时,表示机器零。421.定点、浮点表示法的区别定点、浮点表示法的区别数值的表示范围数值的表示范围 假设定点数和浮点数的字长相同,假设定点数和浮点数的字长相同,浮点表示法所能表示的数值范围将远远大浮

31、点表示法所能表示的数值范围将远远大于定点数。于定点数。精度精度 对于字长相同的定点数和浮点数来对于字长相同的定点数和浮点数来说,浮点数虽然扩大了数的表示范围,但说,浮点数虽然扩大了数的表示范围,但这正是以降低精度为代价的,也就是数轴这正是以降低精度为代价的,也就是数轴上各点的排列更稀疏了。上各点的排列更稀疏了。2.2.4 定点、浮点表示法和定点、浮点计算机43数的运算数的运算 浮点运算要比定点运算复杂得多。浮点运算要比定点运算复杂得多。溢出处理溢出处理 在定点运算时,当运算结果超出数在定点运算时,当运算结果超出数的表示范围,就发生溢出。而在浮点运算的表示范围,就发生溢出。而在浮点运算时,运算结

32、果超出尾数的表示范围却并不时,运算结果超出尾数的表示范围却并不一定溢出,只有当阶码超出所能表示的范一定溢出,只有当阶码超出所能表示的范围时,才发生溢出。围时,才发生溢出。1.定点、浮点表示法的区别(续)442.定点机与浮点机通常可以将计算机分为几档:通常可以将计算机分为几档:定点机定点机 以定点运算为主,浮点运算是通过软以定点运算为主,浮点运算是通过软件来实现的。件来实现的。定点机浮点运算部件定点机浮点运算部件 浮点运算部件是专门用于对浮点数浮点运算部件是专门用于对浮点数进行运算的部件。进行运算的部件。浮点机浮点机 具有浮点运算指令和基本的浮点运具有浮点运算指令和基本的浮点运算器。算器。45图

33、图2-6 IEEE 754标准的浮点数格式标准的浮点数格式 2.2.6 实用浮点数举例类型类型 数符数符 m ms s 阶码阶码 E E 尾数尾数 m m 总位数总位数 偏偏置值置值 短浮点数短浮点数 1 1 8 8 2323 3232 7FH7FH 127127 长浮点数长浮点数 1 1 1111 5252 6464 3FFH3FFH 10231023 临时浮点数临时浮点数 1 1 1515 6464 8080 3FFFH3FFFH 1638316383 Emsm阶码部分,用移码表示尾符尾数数值位尾数部分,用原码表示46IEEE754标准的浮点数 以短浮点数为例讨论浮点代码与其以短浮点数为例

34、讨论浮点代码与其真值之间的关系。最高位为数符位;其后真值之间的关系。最高位为数符位;其后是是8位阶码,以位阶码,以2为底,阶码的偏置值为为底,阶码的偏置值为127;其余;其余23位是尾数。为了使尾数部分位是尾数。为了使尾数部分能表示更多一位的有效值,能表示更多一位的有效值,IEEE754采用采用隐含尾数最高数位隐含尾数最高数位1(即这一位(即这一位1不表示出不表示出来)的方法,因此尾数实际上是来)的方法,因此尾数实际上是24位。应位。应注意的是,注意的是,隐含的隐含的1是一位整数(即位权是一位整数(即位权为为20),在浮点格式中表示出来的,在浮点格式中表示出来的23位尾位尾数是纯小数,并用原码

35、表示。数是纯小数,并用原码表示。47IEEE754标准的浮点数(续) 例例13:将:将(100.25)10转换成短浮点数格式。转换成短浮点数格式。 十进制数十进制数二进制数二进制数 (100.25)10=(1100100.01)2 非规格化数非规格化数规格化数规格化数 1100100.01=1.1001000126 计算移码表示的阶码(偏置值阶码真值)计算移码表示的阶码(偏置值阶码真值) 1111111+110=10000101 以短浮点数格式存储该数。以短浮点数格式存储该数。 符号位符号位=0 阶码阶码=10000101 尾数尾数=1001000100000000000000048IEEE7

36、54标准的浮点数(续) 短浮点数代码为短浮点数代码为 0;100 0010 1;100 1000 1000 0000 0000 0000 表示为十六进制的代码:表示为十六进制的代码:42C88000H。例例14:把短浮点数:把短浮点数C1C90000H转换成为十进制数。转换成为十进制数。 十六进制十六进制二进制形式,并分离出符号位、阶二进制形式,并分离出符号位、阶码和尾数。码和尾数。 C1C90000H= 1;10000011;10010010000000000000000阶码阶码符号位符号位尾数尾数49IEEE754标准的浮点数(续) 计算出阶码真值(移码偏置值)计算出阶码真值(移码偏置值)

37、 10000011-1111111=100 以规格化二进制数形式写出此数以规格化二进制数形式写出此数 1.100100124 写成非规格化二进制数形式写成非规格化二进制数形式 11001.001 转换成十进制数,并加上符号位。转换成十进制数,并加上符号位。 (11001.001)2=(25.125)10 所以,该浮点数所以,该浮点数=-25.125502.3 非数值数据的表示 非数值数据,又称为字符数据,通常非数值数据,又称为字符数据,通常是指字符、字符串、图形符号和汉字等各是指字符、字符串、图形符号和汉字等各种数据,它们不用来表示数值的大小,一种数据,它们不用来表示数值的大小,一般情况下不对

38、它们进行算术运算。般情况下不对它们进行算术运算。512.3.1 字符和字符串的表示1.ASCII字符编码字符编码 常见的常见的ASCII码用七位二进制表示一个字码用七位二进制表示一个字符,它包括符,它包括10个十进制数字(个十进制数字(09)、)、52个英个英文大写和小写字母(文大写和小写字母(AZ,az)、)、34个专用个专用符号和符号和32个控制符号,共计个控制符号,共计128个字符。个字符。 在计算机中,通常用一个字节来存放一个在计算机中,通常用一个字节来存放一个字符。字符。 在在ASCII码表中,数字和英文字母都是按码表中,数字和英文字母都是按顺序排列的,只要知道其中一个的二进制代码,

39、顺序排列的,只要知道其中一个的二进制代码,不要查表就可以推导出其他数字或字母的二进不要查表就可以推导出其他数字或字母的二进制代码。制代码。52ASCII字符编码表532.字符串的存放 字符串是指一串连续的字符。例如,字符串是指一串连续的字符。例如,字符串字符串IF X0 THEN READ (C)。 向量存放法在存储器中占用一片连续向量存放法在存储器中占用一片连续的空间,每个字节存放一个字符代码,字的空间,每个字节存放一个字符代码,字符串的所有元素(字符)在物理上是邻接符串的所有元素(字符)在物理上是邻接的。在字长为的。在字长为32位的存储器,每一个主存位的存储器,每一个主存单元可存放单元可存

40、放4个字符,整个字符串需个字符,整个字符串需5个主个主存单元。在每个字节中实际存放的是相应存单元。在每个字节中实际存放的是相应字符的字符的ASCII码。码。54IFX0THENREA(C)D字符串的向量存放方案5449462020202030454541444852433E2928584E图图2-7 字符串的向量存放方案字符串的向量存放方案551.汉字国标码汉字国标码 汉字国标码亦可称为汉字交换码,汉字国标码亦可称为汉字交换码,主要用于汉字信息处理系统之间或者通信主要用于汉字信息处理系统之间或者通信系统之间交换信息使用,简称系统之间交换信息使用,简称GB码。该码。该标准共收集常用汉字标准共收集

41、常用汉字6 763个,另外还有个,另外还有各种图形符号各种图形符号682个,共计个,共计7 445个。个。 GB码规定每个汉字、图形符号都码规定每个汉字、图形符号都用两个字节表示,每个字节只使用低七位用两个字节表示,每个字节只使用低七位编码,因此最多能表示出编码,因此最多能表示出128128=16 384个汉字。个汉字。 2.3.2 汉字的表示56 区位码将汉字编码码中的区位码将汉字编码码中的6 763个汉个汉字分为字分为94个区,每个区中包含个区,每个区中包含94个汉字个汉字(位),区和位组成一个二维数组,每个(位),区和位组成一个二维数组,每个汉字在数组中对应一个唯一的区位码。汉汉字在数组

42、中对应一个唯一的区位码。汉字的区位码定长字的区位码定长4位,前位,前2位表示区号,后位表示区号,后2位表示位号,区号和位号用十进制数表位表示位号,区号和位号用十进制数表示,区号从示,区号从01到到94,位号也从,位号也从01到到94。例如,例如,“中中”字在字在54区的区的48位上,其区位上,其区位码为位码为“54-48”,“国国”字在字在25区的区的90位上,其区位码为位上,其区位码为“25-90”。 2.汉字区位码57 需要注意的是:汉字区位码并不等于汉字需要注意的是:汉字区位码并不等于汉字国标码,它们两者之间的关系可用以下公式表国标码,它们两者之间的关系可用以下公式表示:示: 国标码区位

43、码(十六进制)国标码区位码(十六进制)2020H 例例15:已知汉字:已知汉字“春春”的区位码为的区位码为“20-26”,计算它的国标码。计算它的国标码。 区位码:第区位码:第1字节字节 第第2字节字节 20 26 十进制十进制 14H 1AH 十六进制十六进制 +20H +20H 国标码:国标码: 34H 3AH2.汉字区位码(续)58 汉字在计算机内部其内码是唯一的。因为汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中汉字处理系统要保证中西文的兼容,当系统中同时存在同时存在ASCII码和汉字国标码时,将会产生二码和汉字国标码时,将会产生二义性。例如:有两个字节的

44、内容为义性。例如:有两个字节的内容为30H和和21H,它既可表示汉字它既可表示汉字“啊啊”的国标码,又可表示西的国标码,又可表示西文文“0”和和“!”的的ASCII码。为此,汉字机内码码。为此,汉字机内码应对国标码加以适当处理和变换。应对国标码加以适当处理和变换。 GB码的机内码为二字节长的代码,它是码的机内码为二字节长的代码,它是在相应在相应GB码的每个字节最高位上加码的每个字节最高位上加“1”,即,即 汉字机内码汉字国标码汉字机内码汉字国标码8080H 例如,上述例如,上述“啊啊”字的国标码是字的国标码是3021H,其汉字机内码则是其汉字机内码则是B0A1H。 3.汉字机内码 59 Uni

45、code的基本方法是用一个的基本方法是用一个16位位的数来表示每个符号,这种符号集可表示的数来表示每个符号,这种符号集可表示65536个不同的字符或符号。被称为基本个不同的字符或符号。被称为基本多语言平面(多语言平面(BMP)。)。这个空间已经非这个空间已经非常大了,但设计者考虑到将来某一天它可常大了,但设计者考虑到将来某一天它可能也会不够用,所以采用了一种可使这种能也会不够用,所以采用了一种可使这种表示法使用得更远的方法。表示法使用得更远的方法。2.3.3 统一代码60 当用两字节来表示当用两字节来表示Unicode字符时,字符时,使用的是使用的是UCS-2编码,但尽管如此,也允编码,但尽管

46、如此,也允许在许在UCS-2文本中插入一些文本中插入一些UCS-4字符。字符。为此,在为此,在BMP中,保留了两个大小为中,保留了两个大小为1024的块,这两个块中任何位置都不能的块,这两个块中任何位置都不能用来表示任何符号。用来表示任何符号。UCS-4的两个的两个16位字位字每个表示一个数,这个数是每个表示一个数,这个数是UCS-2 BMP中中1024个数值中的一个。这两个数的组个数值中的一个。这两个数的组合可以表示多达合可以表示多达100多万个自定义的多万个自定义的UCS-4字符。字符。2.3.3 统一代码(续)61PC机中表示符号的3种方法图图2-8 PC机中表示符号的机中表示符号的3种

47、方法种方法00071531扩展ASCII字符的表示方法Unicode(UCS-2)的表示方法Unicode(UCS-4)的表示方法622.4 十进制数和数串的表示 十进制是人们最常用的数据表示方十进制是人们最常用的数据表示方法,一些通用性较强的计算机上设有十进法,一些通用性较强的计算机上设有十进制数据的表示,可以直接对十进制数进行制数据的表示,可以直接对十进制数进行运算和处理。运算和处理。632.4.1 十进制数的编码 用四位二进制数来表示一位十进制用四位二进制数来表示一位十进制数,称为数,称为二进制编码的十进制数,简称二进制编码的十进制数,简称BCD码码。 四位二进制数可以组合出四位二进制数

48、可以组合出16种代码,种代码,能表示能表示16种不同的状态,我们只需要使用种不同的状态,我们只需要使用其中的其中的10种状态,就可以表示十进制数的种状态,就可以表示十进制数的09十个数码,而其他的六种状态为冗余十个数码,而其他的六种状态为冗余状态。由于可以取任意的状态。由于可以取任意的10种代码来表示种代码来表示十个数码,所以就可能产生多种十个数码,所以就可能产生多种BCD编码。编码。BCD编码既具有二进制数的形式,又保持编码既具有二进制数的形式,又保持了十进制数的特点。了十进制数的特点。64几种常见的BCD码十进制十进制84218421 码码24212421 码码余余 3 3 码码0 01

49、12 23 34 45 56 67 78 89 9000000000001000100100010001100110100010001010101011001100111011110001000100110010000000000010001001000100011001101000100101110111100110011011101111011101111111100110011010001000101010101100110011101111000100010011001101010101011101111001100651.8421码 8421码又称为码又称为NBCD码,其主要特点码,

50、其主要特点是:是: 它是一种有权码,四位二进制代它是一种有权码,四位二进制代码的位权从高到低分别为码的位权从高到低分别为8、4、2、1。 简单直观。每个代码与它所代表简单直观。每个代码与它所代表的十进制数之间符合二进制数和十进制数的十进制数之间符合二进制数和十进制数相互转换的规则。相互转换的规则。 不允许出现不允许出现10101111。这。这6个代个代码在码在8421码中是非法码。码中是非法码。662.2421码 2421码的主要特点是:码的主要特点是: 它也是一种有权码,四位二进制它也是一种有权码,四位二进制代码的位权从高到低分别为代码的位权从高到低分别为2、4、2、1。 它又是一种对它又是

51、一种对9的的自补码自补码。即某。即某数的数的2421码,只要自身按位取反,就能码,只要自身按位取反,就能得到该数对得到该数对9之补的之补的2421码。例如:码。例如: 3的的2421码是码是0011。3对对9之补是之补是6,而而6的的2421码是码是1100。 不允许出现不允许出现01011010。这。这6个个代码在代码在2421码中是非法码。码中是非法码。673.余3码 余余3码的主要特点是:码的主要特点是: 这是一种无权码,但也可看作这是一种无权码,但也可看作是一种特殊的有权码,即在是一种特殊的有权码,即在8421码的基码的基础上加础上加+3(+0011)形成的,故称余)形成的,故称余3码

52、。码。在这种编码中各位的在这种编码中各位的“1”不表示一个固不表示一个固定的十进制数值,因而不直观。定的十进制数值,因而不直观。 它也是一种对它也是一种对9的的自补码自补码。 不允许出现不允许出现00000010、11011111。这。这6个代码在余个代码在余3码中是非码中是非法码。法码。682.4.2 十进制数串1.非压缩的十进制数串非压缩的十进制数串 非压缩的十进制数串中一个字节存放一个非压缩的十进制数串中一个字节存放一个十进制数或符号的十进制数或符号的ASCII-7码。码。 非压缩的十进制数串又分成前分隔式数字非压缩的十进制数串又分成前分隔式数字串和后嵌入式数字串两种格式。在前分隔式数串

53、和后嵌入式数字串两种格式。在前分隔式数字串中,符号位占用单独一个字节,放在数值字串中,符号位占用单独一个字节,放在数值位之前,正号对应的位之前,正号对应的ASCII码为码为2BH,负号对应负号对应的的ASCII码为码为2DH。在后嵌入式数字串中,符号在后嵌入式数字串中,符号位不单独占用一个字节,而是嵌入到最低一位位不单独占用一个字节,而是嵌入到最低一位数字里边去。若数串为正,则最低一位数字数字里边去。若数串为正,则最低一位数字09的的ASCII码不变(码不变(30H39H););若数串为负,若数串为负,把负号变为把负号变为40H,并将其与最低数值位相加,此并将其与最低数值位相加,此时数字时数字

54、09的的ASCII码变为码变为70H79H。 692.压缩的十进制数串 压缩的十进制数串,一个字节可存压缩的十进制数串,一个字节可存放两位放两位BCD码表示的十进制数,既节省了码表示的十进制数,既节省了存储空间,又便于直接进行十进制算术运存储空间,又便于直接进行十进制算术运算。算。 在主存中,一个压缩的十进制数串在主存中,一个压缩的十进制数串占用连续的多个字节,每位数字仅占半个占用连续的多个字节,每位数字仅占半个字节,其值常用字节,其值常用8421码表示。符号位也占码表示。符号位也占半个字节,并存放在最低数值位之后,通半个字节,并存放在最低数值位之后,通常用常用CH表示正号,表示正号,DH表示

55、负号。在这种表示负号。在这种表示中,规定数字的个数加符号位之和必表示中,规定数字的个数加符号位之和必须为偶数;当和为奇数时,应在最高数值须为偶数;当和为奇数时,应在最高数值位之前补位之前补0H(即第一个字节的高半字节为即第一个字节的高半字节为“0000”)。)。 702.5 现代微机系统中的数据表示举例 现代的微机系统大多采用现代的微机系统大多采用Intel系列的系列的微处理器,微处理器,近年来近年来,Intel的微处理器有了的微处理器有了极大的发展,形成了极大的发展,形成了IA-32结构。结构。 IA-32结构的基本数据类型是字节、字、结构的基本数据类型是字节、字、双字双字、四字和双四字。四

56、字和双四字。 71070000字节字双字四字双四字低四字高四字低双字高双字低字高字低字节高字节15316312763643132151678NNNNNN+1N+2N+4N+8IA-32结构的基本数据类型图图2-9 IA-32结构的基本数据类型结构的基本数据类型721.无符号整数 无符号整数是包含字节、字、双字无符号整数是包含字节、字、双字和四字的无符号的二进制数。无符号整和四字的无符号的二进制数。无符号整数的范围,对于字节,从数的范围,对于字节,从0255;对于;对于字,从字,从065535;对于双字,从;对于双字,从0232 -1;对于四字,从;对于四字,从0264-1。 2.带符号整数带符

57、号整数 带符号整数是包含字节、字、双字带符号整数是包含字节、字、双字和四字的带符号的二进制定点整数。正和四字的带符号的二进制定点整数。正数的符号位为数的符号位为0,负数的符号位为,负数的符号位为1。对。对于字节,从于字节,从-128+127;对于字,从;对于字,从 -32768+32767;对于双字,从;对于双字,从-231+231-1;对于四字,从;对于四字,从-263+263-1。733.浮点数 与与IEEE 754标准所规定的格式直接标准所规定的格式直接对应。对应。4.指针数据指针数据 指针是主存单元的地址,指针是主存单元的地址,IA-32 结结构定义了两种类型的指针:近指针(构定义了两

58、种类型的指针:近指针(32位)和远指针(位)和远指针(48位)。位)。5.串数据串数据 包括位串、字节串、字串和双字串。包括位串、字节串、字串和双字串。一个串可以包含从一个字节到一个串可以包含从一个字节到4GB的内的内容。容。74 6.BCD数 IA-32 结构结构中所指的中所指的BCD码实际上码实际上是指是指8421码。码。BCD数又分成未拼装的数又分成未拼装的BCD(UBCD)数和拼装的数和拼装的BCD数两种。数两种。UBCD数的一个字节仅包含一位十进制数的一个字节仅包含一位十进制数,在数,在30位上;而经过拼装的位上;而经过拼装的BCD数,数,一个字节包含两位十进制数,其低位在一个字节包

59、含两位十进制数,其低位在30位上,高位在位上,高位在74位上。位上。 752.6 数据校验码 数据校验码是指那些能够发现错误数据校验码是指那些能够发现错误或能够自动纠正错误的数据编码,又称之或能够自动纠正错误的数据编码,又称之为为“检错纠错编码检错纠错编码”。任何一种编码都由。任何一种编码都由许多码字构成,任意两个码字之间最少变许多码字构成,任意两个码字之间最少变化的二进制位数,被称为数据校验码的码化的二进制位数,被称为数据校验码的码距。例如,用四位二进制表示距。例如,用四位二进制表示16种状态,种状态,则有则有16个不同的码字,此时码距为个不同的码字,此时码距为1,即,即两个码字之间最少仅有

60、一个二进制位不同两个码字之间最少仅有一个二进制位不同(如(如0000与与0001之间)。这种编码没有之间)。这种编码没有检错能力,因为当某一个合法码字中有一检错能力,因为当某一个合法码字中有一位或几位出错,就变成为另一个合法码字位或几位出错,就变成为另一个合法码字了。了。762.6.1 奇偶校验码1.奇偶校验概念奇偶校验概念 奇偶校验码是一种最简单的数据校奇偶校验码是一种最简单的数据校验码,它的码距等于验码,它的码距等于2,可以检测出一位,可以检测出一位错误(或奇数位错误),但不能确定出错错误(或奇数位错误),但不能确定出错的位置,也不能检测出偶数位错误。的位置,也不能检测出偶数位错误。 奇偶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论