大学计算机基础(进制和编码)_第1页
大学计算机基础(进制和编码)_第2页
大学计算机基础(进制和编码)_第3页
大学计算机基础(进制和编码)_第4页
大学计算机基础(进制和编码)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、合肥工业大学计算机学院1大学计算机基础第二章第二章 计算机中的信息表示计算机中的信息表示本章学习重点l 熟悉二进制的基本概念及二进制的运算熟悉二进制的基本概念及二进制的运算l 掌握各种进制的相互转换掌握各种进制的相互转换l 了解了解计算机中数据的表示和编码方法计算机中数据的表示和编码方法合肥工业大学计算机学院2大学计算机基础 计算机中处理的数据是多种多样的,如数值、文计算机中处理的数据是多种多样的,如数值、文字、图像、声音等等,根据冯字、图像、声音等等,根据冯诺依曼原理,在计算诺依曼原理,在计算机内部这些信息都是以二进制表示的。机内部这些信息都是以二进制表示的。 计算机中的数据计算机中的数据

2、为什么计算机要采用二进制:为什么计算机要采用二进制: (1)(1)二进制只有两个状态,稳定、二进制只有两个状态,稳定、可靠可靠、便于区分、便于区分。 (2)(2)硬件容易实现。硬件容易实现。具有两个稳定状态的物理器件具有两个稳定状态的物理器件很多,如:电压的高低、电流的有无、开关的闭合很多,如:电压的高低、电流的有无、开关的闭合等。等。(3)(3)运算规则简单,便于实现逻辑运算规则简单,便于实现逻辑 运算运算。 合肥工业大学计算机学院3大学计算机基础2.1 2.1 进制与进制转换进制与进制转换 数是客观事物的抽象的符号化表示。数是客观事物的抽象的符号化表示。用一组固定的用一组固定的数字符合和一

3、套统一的规则来表示数的方法称为数制。数字符合和一套统一的规则来表示数的方法称为数制。 数制是数的表示和计数方法。数制是数的表示和计数方法。计算机中常用二进制、计算机中常用二进制、十进制、八进制、十六进制。十进制、八进制、十六进制。 进制是按照进位方式计数的数制系统。进制是按照进位方式计数的数制系统。进位方式计进位方式计数含有基数和各数位的位权。数含有基数和各数位的位权。 基数基数指该进制中允许使用的基本数码的个数,如指该进制中允许使用的基本数码的个数,如十十进制有进制有0、1、29。一个数码处在不同的位置其代表。一个数码处在不同的位置其代表的值不同,每个数码代表的数值等于该数码乘以与其位的值不

4、同,每个数码代表的数值等于该数码乘以与其位置相关的一个常数,该常数称为置相关的一个常数,该常数称为位权位权,位权的大小是以,位权的大小是以基数为底、数码所在位置的序号为指数的整数次幂,如基数为底、数码所在位置的序号为指数的整数次幂,如100 、101 、102、103等。等。 合肥工业大学计算机学院4大学计算机基础.十进制的表示(采用位权表示法)十进制的表示(采用位权表示法)123.451 102 + 2 101 + 3 100 + 4 10-1 +5 10-2总结出以下原则:总结出以下原则:十进制有十进制有0 0、1 1、29 29 共共1010个数字符号,个数字符号, 每个符号表示每个符号

5、表示0 0之间的十个不同的值;之间的十个不同的值; 由十个符号组成的序列来表示任意数值,写成如下形式由十个符号组成的序列来表示任意数值,写成如下形式: : (X) (X)1010=K=Kn nK Kn-1n-1KK1 1K K0 0.K.K-1-1K K-2-2KK-m-m K KI I 0,1,29 0,1,29 (X)(X)10 10 = Kn10n+Kn-110n-1+K1101+K0100+K -110-1+K -m10-m1010I I称为第称为第i i位的权,位的权,1010为基。(按权展开式)为基。(按权展开式) 逢十进一逢十进一 ,借一当十。,借一当十。2.1.1 2.1.1

6、进制进制合肥工业大学计算机学院5大学计算机基础由此推广到任意进制计数方法由此推广到任意进制计数方法 (R(R进制表示进制表示) ):vR进制有进制有0、1、2R-1共共R个数字符号,每个数字个数字符号,每个数字符号各代表符号各代表0R-1之间之间一个固定的值;一个固定的值;v由由R个符号组成的序列来表示数值,写成如下形式个符号组成的序列来表示数值,写成如下形式:X=KnKn-1K1K0.K-1K-2K-m K 0,1,2R-1表示的值是表示的值是(采用位权表示法)(采用位权表示法) : X = KnRn+Kn-1Rn-1+K1R1+K0R0+K -1R-1+ -m-m每一位代表的值要由该符号所

7、代表的值乘一个与符每一位代表的值要由该符号所代表的值乘一个与符号位置相关的常数号位置相关的常数R Ri i来确定,来确定,R Ri i称为位权,称为位权,R R称为计数系称为计数系统的基。统的基。v逢逢R进一,借一当进一,借一当R。 进位计数制的要素:进位计数制的要素:1、数码的个数、数码的个数 2、进位的基数、进位的基数合肥工业大学计算机学院6大学计算机基础计算机中常用的几种数制数制数制基数基数基本数符基本数符进位原则进位原则位权位权十进制十进制100 1 2 3 4 5 6 7 8 9逢十进一逢十进一10 I二进制二进制20 1逢二进一逢二进一2 I八进制八进制80 1 2 3 4 5 6

8、 7逢八进一逢八进一8 I十六进制十六进制160 1 2 3 4 5 6 7 8 9 A B C D E F逢十六进一逢十六进一16 I合肥工业大学计算机学院7大学计算机基础二进制数的数码有两个符号二进制数的数码有两个符号0 0、1 1,由这两个符号,由这两个符号组成的序列可以表示任意数值,进位规则为组成的序列可以表示任意数值,进位规则为“逢二进逢二进一,借一当二一,借一当二”。如:二进制数如:二进制数101010.101可以写成如下形式;可以写成如下形式; (101010.101)2 =125 +024 +123 +022 +121 +020 +12-1 +02-2 +12-3 = 32 +

9、 8 + 2 + 0.5 + 0.125 = (42.625)10(2 2). .二进制二进制 由于二进制的位权最小,由于二进制的位权最小,所以表示同一个值的时所以表示同一个值的时候,符号序列较长。候,符号序列较长。如:如:(255)10=(11111111)2 。 为了表示的方便,计算机中常采用八进制和十六为了表示的方便,计算机中常采用八进制和十六进制。进制。合肥工业大学计算机学院8大学计算机基础(3).八进制 八进制数的数码为八进制数的数码为0、1、2、3、4、5、6、7共八个,进共八个,进位规则为位规则为“逢八进一,借一当八逢八进一,借一当八”。如:(327)8=382+281+780=

10、192+16+7=(215)10 (4).十六进制 十六进制数的数码为十六进制数的数码为0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F共十六个,其中数码共十六个,其中数码A、B、C、D、E、F分别分别代表十进制数中的代表十进制数中的10、11、12、13、14、15,进位规则为逢十,进位规则为逢十六进一,借一当十六。六进一,借一当十六。如:如:(327)16 = 3162 + 2161 + 7160 = 768 + 32 + 7 =(807)10 (15)10=(1111)2=(17)8=(F)1615D=1111B=17O=FH后缀法:后缀法:下标法:下标法:合肥工业大学计算

11、机学院9大学计算机基础2.1.2 2.1.2 不同进位计数制之间的转换不同进位计数制之间的转换(1 1). . 2/8/162/8/16进制转换为十进制进制转换为十进制 任意进制数转换为十进制数采用任意进制数转换为十进制数采用“按位权展开按位权展开求和求和”的方法即可。的方法即可。10101B = 1 24 + 0 23 + 1 22 + 0 21 + 1 20 = 21D101.11B = 1 22 + 0 21 + 1 20 + 1 2-1 + 1 2-2 = 5.75D101O= 1 82 + 0 81 + 1 80 = 65D101AH=1 16 3 + 0 16 2 + 1 16 1

12、 + 10 16 0 4106D合肥工业大学计算机学院10大学计算机基础原则:原则:整数部分:整数部分:除以基取余数,直到商为除以基取余数,直到商为0 0,余数从右到左排列。,余数从右到左排列。小数部分:小数部分:乘以基取整数,整数从左到右排列。乘以基取整数,整数从左到右排列。例例 100.345(D)=1100100.01011(B)100(D)=144(O)=64(H)100(D)=144(O)=64(H)=1100100(B)“试权法试权法”:215D=11010111B01002502 252122623210001011100812818044110016604616 0.7600.

13、34520.69021.3802 2 1.520 2 1.04(2 2). . 十进制转换为十进制转换为2/8/162/8/16进制进制合肥工业大学计算机学院11大学计算机基础(3 3). .二进制与八进制之间的转化二进制与八进制之间的转化64O: 6 4 110 100B (A) (A) 八进制转换成二进制八进制转换成二进制(每一位八进制数与三位二进制数相对应)(每一位八进制数与三位二进制数相对应) 转换原则:转换原则: 一分为三一分为三27.461O : 2 7 . 4 6 1 010 111 .100 110 001B (B) (B) 二进制转化成八进制二进制转化成八进制 原则:三位一组

14、,从小数点开始,原则:三位一组,从小数点开始, 整数部分:从右向左进行分组;整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足小数部分:从左向右进行分组,不足3位补零。位补零。 110 101 111 . 010 10 B=657.24O 6 5 7 2 4后边补一个零后边补一个零 1000合肥工业大学计算机学院12大学计算机基础64H: 6 4 0110 0100B(4 4) 二进制与十六进制之间的转化二进制与十六进制之间的转化 (A) (A) 十六进制转换成二进制十六进制转换成二进制 原则:原则: 一分为四一分为四每一个十六进制数对应二进制的四位。每一个十六进制数对应二进制的四

15、位。2C1DH : 2 C 1 D 0010 1100 0001 1101B (B) (B) 二进制转化成十六进制二进制转化成十六进制 原则:四位一组,从小数点开始,原则:四位一组,从小数点开始, 整数部分:从右向左进行分组;整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足小数部分:从左向右进行分组,不足4位补零。位补零。 11 0110 1110 . 1101 01 B=36E.D4H 3 6 E D 4后边补两个零后边补两个零 010000合肥工业大学计算机学院13大学计算机基础16以内的各种进制对照表十进制(十进制(D) 二进制(二进制(B) 八进制(八进制(O) 十六进制

16、(十六进制(H) 0 1 2 3 4 5 6 7 8 91011121314150000000100100011010001010110011110001001101010111100110111101111 0 1 2 3 4 5 6 71011121314151617 0 1 2 3 4 5 6 7 8 9 A B C D E F合肥工业大学计算机学院14大学计算机基础(1 1). .二进制的算术运算二进制的算术运算加法:加法: 0+0=0 1+0=1 0+1=1 1+1=100+0=0 1+0=1 0+1=1 1+1=10(进位)(进位)减法:减法: 0-0=0 1-0=1 1-0=1

17、0-1=10-0=0 1-0=1 1-0=1 0-1=1(借位)(借位)乘法:乘法: 0X0=0 0X1=0 1X0=0 1X1=10X0=0 0X1=0 1X0=0 1X1=1除法:除法: 0/0=0 0/1=0 1/1=10/0=0 0/1=0 1/1=1例:例:00101101 + 01011011 = 1 0 0 0 1 0 0 0 0 0 1 0 1 1 0 1 + 0 1 0 1 1 0 1 1 1 0 0 0 1 0 0 02.1.3 2.1.3 二进制数据的运算二进制数据的运算合肥工业大学计算机学院15大学计算机基础(2 2). .二进制的逻辑运算二进制的逻辑运算 具有逻辑性的

18、变量称为逻辑变量,逻辑变量之具有逻辑性的变量称为逻辑变量,逻辑变量之间的运算就是逻辑运算。用二进制的间的运算就是逻辑运算。用二进制的“1”1”与与“0”0”代表逻辑关系的真与假。以下是三种基本的逻辑运代表逻辑关系的真与假。以下是三种基本的逻辑运算:算:逻辑逻辑“与与”运算运算(AND) 01=0 10=0 00=0 11=1 sw1 sw2 sw1.AND.sw2 0 0 0 0 1 0 1 0 0 1 1 1合肥工业大学计算机学院16大学计算机基础逻辑逻辑“或或”运算运算(OR) 00=0 01=1 10=1 11=1 sw1 sw2 sw1.OR.sw2 0 0 0 0 1 1 1 0 1

19、 1 1 1逻辑逻辑“非非”运算运算(NOT)_ _0=1 1=0 sw .NOT.sw 0 1 1 0合肥工业大学计算机学院17大学计算机基础二进制的相关概念二进制的相关概念一位二进制称为一个比特(一位二进制称为一个比特(bit););八位二进制构成一个字节(八位二进制构成一个字节(Byte)。)。字节是存储的基本单元,字节是存储的基本单元,是计算机对数据操作的最小单位。是计算机对数据操作的最小单位。地址相关的概念:地址相关的概念:b7b6b5b4b3b2b1b0地址线的位数决定了可以访问内存单元的个数。每一地址线的位数决定了可以访问内存单元的个数。每一根地址线对应一位二进制。根地址线对应一

20、位二进制。10根地址线,可访问的单元数是:根地址线,可访问的单元数是: 210=1024 103=1K20根地址线,可访问的单元数是:根地址线,可访问的单元数是: 220=1024K 106=1M30根地址线,可访问的单元数是:根地址线,可访问的单元数是: 230=1024M 109=1G32根地址线可根地址线可以访问多大内存?以访问多大内存?“4GB”1K=1024B , 1M=1024K, 1G=1024M, 1T=1024G合肥工业大学计算机学院18大学计算机基础2.2.1 2.2.1 数值数据的表示数值数据的表示 计算机处理的数据分为数值型数据和非数值型数计算机处理的数据分为数值型数据

21、和非数值型数据。数值型数据用于表示数量特征;而非数值数据用据。数值型数据用于表示数量特征;而非数值数据用于表示特定的信息,如文字、图形、图像等。于表示特定的信息,如文字、图形、图像等。 计算机只能使用二进制,因此在计算机中,正号、计算机只能使用二进制,因此在计算机中,正号、负号、数值、字符和文字、图形等都必须用负号、数值、字符和文字、图形等都必须用0 0和和1 1的组的组合来实现,把利用合来实现,把利用0 0和和1 1的各种组合来表示信息的方法的各种组合来表示信息的方法统称为统称为编码编码。 数值型数据的表示需要描述三点:数值的绝对值、数值型数据的表示需要描述三点:数值的绝对值、小数点、符号小

22、数点、符号( (正负号正负号) )。2.22.2 计算机中数据的表示计算机中数据的表示合肥工业大学计算机学院19大学计算机基础数值的精度和范围数值的精度和范围 计算机是有模运算,即用有限的二进制位来表示计算机是有模运算,即用有限的二进制位来表示数值,超出有限的二进制位数最大值系统归零重新计数。数值,超出有限的二进制位数最大值系统归零重新计数。 2.无符号整数的表示无符号整数的表示 数值型数据分为有符号型和无符号型。数值型数据分为有符号型和无符号型。无符号整数指的是计数系统中只有大于等于无符号整数指的是计数系统中只有大于等于0的数,的数,没有负数没有负数 ,因此,不需要表示符号。,因此,不需要表

23、示符号。如用如用8位二进制表示位二进制表示一个无符号一个无符号整数,其范围是二进制整数,其范围是二进制从从0000 0000到到1111 1111,对应的十进制数从,对应的十进制数从0到到255。合肥工业大学计算机学院20大学计算机基础3.3.有符号整数的表示有符号整数的表示 对于有符号型的数值数据中有正、负数对于有符号型的数值数据中有正、负数和零,则必须通过编码的方式表示符号,在和零,则必须通过编码的方式表示符号,在计算机中,通常在二进制数据的绝对值前面计算机中,通常在二进制数据的绝对值前面加上一位二进制位作为符号位,符号位为加上一位二进制位作为符号位,符号位为0 0代代表此数为正数;符号位

24、为表此数为正数;符号位为1 1代表此数为负数;代表此数为负数;从而形成了数值型数据的机内表示形式。从而形成了数值型数据的机内表示形式。 为了方便运算,对有符号数常采用三种为了方便运算,对有符号数常采用三种表示形式,即表示形式,即原码、反码、补码原码、反码、补码。符号位数值位合肥工业大学计算机学院21大学计算机基础 正数的符号位为正数的符号位为0 0,负数的符号位为,负数的符号位为1 1,其它位用,其它位用此数的绝对值表示,得到的即为此数的原码。此数的绝对值表示,得到的即为此数的原码。正数:正数: 55D55D的的8 8位二进制表示为:位二进制表示为:0011011100110111, 其原码表

25、示为:其原码表示为:0011011100110111。负数:负数: -55D-55D的绝对值是:的绝对值是:0011011100110111, 其原码表示为:其原码表示为:1011011110110111。 (2 2)反码反码 正数的反码与原码相同,负数的反码的符号位为正数的反码与原码相同,负数的反码的符号位为1,其余各位对原码按位取反,得到的即为此数的其余各位对原码按位取反,得到的即为此数的反码反码。 66D的反码为:的反码为:01000010。 -66D的反码为:的反码为:10111101。 (1 1)原码)原码原码的原码的0:存在两个:存在两个0 00000000B、1000000B 在

26、运算时需要判断符号。在运算时需要判断符号。合肥工业大学计算机学院22大学计算机基础(3 3)补码)补码 有模计数系统当计数值超过系统的有模计数系统当计数值超过系统的“模模”时系时系统重新开始计数。统重新开始计数。 补码是利用有模运算表示数据的一种方式。补码是利用有模运算表示数据的一种方式。 X补补 = 2n +X( -2n-1 X 2n-1 ) 28 (1 00000000 )就是就是8位二进制计数系统的模。位二进制计数系统的模。 有模计数系统有如下性质:有模计数系统有如下性质:如:时钟从如:时钟从5点调整到点调整到2点有两种方法:点有两种方法:5- -3=25+9=12+2 12为计数系统的

27、模,为计数系统的模,3,9互为补数。互为补数。 有模计数系统可以将有模计数系统可以将减减一个数转化成一个数转化成加加该数的补该数的补数。也就是可以将减法运算转化成加法运算。数。也就是可以将减法运算转化成加法运算。如果用八位二进制表示一个数,系统的模是如果用八位二进制表示一个数,系统的模是28。100000000=00000000合肥工业大学计算机学院23大学计算机基础例例1 1:(:(+102+102)D D, 其原码其原码=01100110=01100110; 其反码其反码=01100110=01100110;其补码;其补码=01100110=01100110。 (-102-102)D, D

28、, 其原码其原码=11100110=11100110; 其反码其反码=10011001=10011001;其补码;其补码=10011010=10011010。例例2 2:(102 25)(102 25)补补 = =(102102)补补+ +(-25-25)补补 =01100110 + 11100111 =01100110 + 11100111 =01001101 =01001101 =(7777)补补 =(77)D=(77)D 正数的补码与原码相同;负数的补码的符号位为正数的补码与原码相同;负数的补码的符号位为1 1,其余各位为反码并在最低位加,其余各位为反码并在最低位加1 1,得到的即为此,

29、得到的即为此数的数的补码补码。计算机采用补码编码,从而简化运算。计算机采用补码编码,从而简化运算。补码有如下性质:补码有如下性质: X+Y 补补 = X补补+Y补补 X-Y 补补 = X补补+-Y补补0在补码系统中唯一。在补码系统中唯一。合肥工业大学计算机学院24大学计算机基础3.3.浮点数的表示浮点数的表示 如果数据有整数部分和小数部分,那么就必须表示如果数据有整数部分和小数部分,那么就必须表示小数点。小数点。现在计算机采用的是浮点数表示方法。现在计算机采用的是浮点数表示方法。 一个数的浮点数表示为:一个数的浮点数表示为:E = M2N M是二进制表示的纯小数,称为尾数,是二进制表示的纯小数

30、,称为尾数,N是二进制是二进制表示的纯整数,称为阶码。表示的纯整数,称为阶码。 单精度浮点数的标准规定用单精度浮点数的标准规定用32位二进制表示浮点数,位二进制表示浮点数,其中尾数其中尾数M占占23位,阶码位,阶码N占占8位。位。MsEMrb31 b30 b23 b22 b0数符 阶码 尾数 32 32位二进制的最高位位二进制的最高位b31b31表示数符,即尾数的表示数符,即尾数的符号,也就是整个数的符号;符号,也就是整个数的符号;b30b30到到b23b23一共一共8 8位采位采用补码方式表示阶码;用补码方式表示阶码;b22b22到到b0b0表示尾数。表示尾数。合肥工业大学计算机学院25大学

31、计算机基础 计算机处理的信息包括数值、文字、符计算机处理的信息包括数值、文字、符号、语音、图形、图象。在计算机内部各种号、语音、图形、图象。在计算机内部各种信息都必须以数字化的二进制编码形式传送、信息都必须以数字化的二进制编码形式传送、存储和加工,因此,所有的信息都应转化为存储和加工,因此,所有的信息都应转化为二进制编码。编码是以少量的二进制位,通二进制编码。编码是以少量的二进制位,通过一定的组合规则,表示出大量复杂多样的过一定的组合规则,表示出大量复杂多样的信息。信息。2.2.2 2.2.2 非数值数据表示非数值数据表示合肥工业大学计算机学院26大学计算机基础1. 英文信息的编码英文信息的编

32、码 (ASCII码)码) 英文是符号文字,只要通过二进制编码表示其英文是符号文字,只要通过二进制编码表示其基本元素基本元素(如字母如字母),即可实现英文文字的数字化表,即可实现英文文字的数字化表示。示。 目前,国际上使用的字母、数字和符号的信息目前,国际上使用的字母、数字和符号的信息编码系统是采用美国国家信息交换标准字符码(编码系统是采用美国国家信息交换标准字符码(American Standard Code for Information Interchange),简称为),简称为ASCII码。码。例如:大写字母例如:大写字母 A: A=(1 0 0 0 0 0 1)ASC=65 w7 w6

33、 w5 w4 w3 w2 w1 小写字母小写字母 a: a= ( 1 1 0 0 0 0 1)ASC=97 w7 w6 w5 w4 w3 w2 w1 合肥工业大学计算机学院27大学计算机基础Hello!的机内表示:010010000110010101101100011011000110111100100001合肥工业大学计算机学院28大学计算机基础 空格空格 00100000 20H 32 09 00110000 00111001 30H39H 4857 AZ 01000001 01011010 41H5AH 6590 a z 01100001 01111010 61H7AH 97122字符

34、二进制表示 十六进制表示 十进制表示 ASCII码码包括包括10个十进制数码、个十进制数码、52个英文大小写字母、个英文大小写字母、一些符号(如一些符号(如$、%、&、#等)和等)和32个控制符号,共计个控制符号,共计128个字符。个字符。编码采用一个字节,编码采用一个字节,8位二进制。标准的位二进制。标准的ASCII码码只用了其中只用了其中7位,最高一位为位,最高一位为0。 随着信息技术的发展和全球化的需要,新的随着信息技术的发展和全球化的需要,新的UnicodeUnicode编码标准随之产生。其编码采用两个字节,编码标准随之产生。其编码采用两个字节,1616位二进制,位二进制,可表

35、示可表示2 21616个符号,也就是个符号,也就是6553665536个符号,几乎可以涵盖世个符号,几乎可以涵盖世界上的各种文字和符号,该编码标准已经逐渐推广应用。界上的各种文字和符号,该编码标准已经逐渐推广应用。 合肥工业大学计算机学院29大学计算机基础键盘管理输入码输入码汉字处理汉字库内码内码打印模块显示模块字型码字型码 2 2中文信息的编码中文信息的编码 汉字的特点是象形文字、单字单音。由于汉字汉字的特点是象形文字、单字单音。由于汉字本身的特点,且汉字的输入输出必须利用现有的设本身的特点,且汉字的输入输出必须利用现有的设备,它在输入、输出、存储和处理过程中所使用的备,它在输入、输出、存储

36、和处理过程中所使用的汉字代码是不相同的,主要有用于信息交换的国标汉字代码是不相同的,主要有用于信息交换的国标码,用于计算机内部处理的内码,输入时的输入码码,用于计算机内部处理的内码,输入时的输入码和输出时的字形码等。和输出时的字形码等。合肥工业大学计算机学院30大学计算机基础(1 1)汉字信息交换码(国标码)汉字信息交换码(国标码) 我国颁布了我国颁布了信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集,即即GB2312-80GB2312-80,简称国标码。该标准收入了,简称国标码。该标准收入了67636763个常用汉字个常用汉字(其中一级汉字(其中一级汉字37553755个,二级汉

37、字个,二级汉字30083008个),以及英、俄、个),以及英、俄、日文字母与其他符号日文字母与其他符号687687个,共个,共70007000多个符号。多个符号。 国标码的编码规则是:每个汉字由一个国标码的编码规则是:每个汉字由一个2 2字节字节(16(16位二进位二进制制) )编码组成,每个字节的最高位置编码组成,每个字节的最高位置“0”0”,其余,其余7 7位用于组位用于组成各种不同的码值。为了不与成各种不同的码值。为了不与ASCIIASCII码的控制字符相同,每码的控制字符相同,每个字节剔除了个字节剔除了3434个个ASCIIASCII码的控制字符,每个字节还剩码的控制字符,每个字节还剩

38、9494个个编码。两个字节组成一个二维结构,前一个字节称编码。两个字节组成一个二维结构,前一个字节称“区区”,后一个字节称后一个字节称“位位”,所以国标码也称为区位码,一共可以,所以国标码也称为区位码,一共可以表示表示94949494个即个即88368836个汉字以及其他符号。个汉字以及其他符号。汉字分区,每个区汉字分区,每个区94个汉字。个汉字。 区号区中位置汉字汉字 国标码国标码 沪沪 2706(00011011 00000110) 久久 3035(00011110 00100011) 合肥工业大学计算机学院31大学计算机基础(2 2)汉字机内码)汉字机内码机内码是计算机内部存储和加工汉字

39、时所用的代码。机内码是计算机内部存储和加工汉字时所用的代码。不管用何种汉字输入码将汉字输入计算机,为存储和处理不管用何种汉字输入码将汉字输入计算机,为存储和处理方便,都需将各种输入码转换成长度一致的汉字内部码。方便,都需将各种输入码转换成长度一致的汉字内部码。 计算机既要处理汉字,也要处理西文。为了实现中、计算机既要处理汉字,也要处理西文。为了实现中、西文兼容,通常利用字节的最高位来区分某个码值是代表西文兼容,通常利用字节的最高位来区分某个码值是代表汉字或汉字或ASCIIASCII码字符。若最高位为码字符。若最高位为“1”1”视为汉字符,为视为汉字符,为“0”0”视为视为ASCIIASCII字

40、符。所以,汉字机内码在国标码的基础上,把字符。所以,汉字机内码在国标码的基础上,把2 2个字节的最高位一律由个字节的最高位一律由“0”0”改改“1”1”构成。构成。 汉字汉字 内码内码 沪沪 10011011 10000110B 久久 10011110 10100011B每个汉字占每个汉字占两个两个字节,国标码最高位为字节,国标码最高位为0,机内码最高位为,机内码最高位为1。合肥工业大学计算机学院32大学计算机基础(3 3)汉字输入码)汉字输入码汉字主要是利用现有的输入设备汉字主要是利用现有的输入设备( (如键盘如键盘) )来实现输入,来实现输入,由键盘输入汉字时是输入汉字的输入码,每个汉字都

41、对应一由键盘输入汉字时是输入汉字的输入码,每个汉字都对应一种汉字输入方法的一个输入码。种汉字输入方法的一个输入码。 汉字的输入方法种类繁多,输入方法不同,同一汉字的汉字的输入方法种类繁多,输入方法不同,同一汉字的输入码也不同。常用的汉字输入法有:拼音法,五笔字形输输入码也不同。常用的汉字输入法有:拼音法,五笔字形输入法,智能入法,智能ABCABC法,自然码等等。法,自然码等等。 在计算机中存入的是汉字的机内码,与所采用的输入法在计算机中存入的是汉字的机内码,与所采用的输入法无关。不管使用何种输入法,在输入码与机内码之间总是存无关。不管使用何种输入法,在输入码与机内码之间总是存在着一一对应的关系

42、,通过在着一一对应的关系,通过“键盘输入管理程序键盘输入管理程序”把输入码把输入码转换为机内码。转换为机内码。zhong 1.中中2.重重3.种种4.钟钟5.肿肿“中中”的输入码是:的输入码是:zhong1合肥工业大学计算机学院33大学计算机基础汉字输入方法汉字输入方法v音码音码拼音拼音v型码型码五笔字型五笔字型v音型码音型码汉字编码方案汉字编码方案音码:音码:根据汉字的发音规律对汉字进行编码。根据汉字的发音规律对汉字进行编码。 采用音码编码的输入法常见的有:智能拼采用音码编码的输入法常见的有:智能拼 音、全拼拼音、全拼双音、双拼双音等。音、全拼拼音、全拼双音、双拼双音等。形码:形码:根据汉字的字形结构特征对汉字进根据汉字的字形结构特征对汉字进 行编码。行编码。 采用形码编码的输入法常见的有:采用形码编码的输入法常见的有: 五笔字形。五笔字形。混合码:混合码:综合汉字的发音及字形结构对汉字综合汉字的发音及字形结构对汉字 进行编码。进行编码。 常见的有阴阳码等输入法。常见的有阴阳码等输入法。合肥工业大学计算机学院34大学计算机基础(4 4)汉字字形码)汉字字形码 汉字显示、打印输出的是汉字的字形,显示、打印是汉字显示、打印

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论