版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、合肥工业大学计算机学院1大学计算机基础第二讲第二讲 数制与编码数制与编码本章学习重点l 熟悉二进制及其运算熟悉二进制及其运算l 掌握各种进制的相互转换掌握各种进制的相互转换l 了解了解计算机中数据的表示和信息的编码计算机中数据的表示和信息的编码合肥工业大学计算机学院2大学计算机基础2.1 进制与进制转换进制与进制转换 数是客观事物的抽象的符号化表示。数是客观事物的抽象的符号化表示。用一组固定的用一组固定的数字符合和一套统一的规则来表示数的方法称为数制。数字符合和一套统一的规则来表示数的方法称为数制。 数制是数的表示和计数方法。数制是数的表示和计数方法。计算机中常用二进制、计算机中常用二进制、十
2、进制、八进制、十六进制。十进制、八进制、十六进制。 进制是按照进位方式计数的数制系统。进制是按照进位方式计数的数制系统。进位方式计进位方式计数含有基数和各数位的位权。数含有基数和各数位的位权。 基数指该进制中允许使用的基本数码的个数,如基数指该进制中允许使用的基本数码的个数,如0、1、29。一个数码处在不同的位置其代表的值不同,。一个数码处在不同的位置其代表的值不同,每个数码代表的数值等于该数码乘以与其位置相关的一每个数码代表的数值等于该数码乘以与其位置相关的一个常数,该常数称为位权,位权的大小是以基数为底、个常数,该常数称为位权,位权的大小是以基数为底、数码所在位置的序号为指数的整数次幂,如
3、数码所在位置的序号为指数的整数次幂,如100 、 101 、 102、103等。等。 合肥工业大学计算机学院3大学计算机基础.十进制的表示十进制的表示123.451 102 + 2 101 + 3 100 + 4 10-1 +5 10-2总结出以下原则:总结出以下原则:十进制有十进制有0 0、1 1、29 29 共共1010个数字符号,个数字符号, 每个符号表示每个符号表示0 0之间的十个不同的值;之间的十个不同的值; 由十个符号组成的序列来表示任意数值,写成如下形式由十个符号组成的序列来表示任意数值,写成如下形式: : (X) (X)1010=K=Kn nK Kn-1n-1KK1 1K K0
4、 0.K.K-1-1K K-2-2KK-m-m K KI I 0,1,29 0,1,29 (X)(X)10 10 = Kn10n+Kn-110n-1+K1101+K0100+K -110-1+K -m10-m1010I I称为第称为第i i位的权,位的权,1010为基。(按权展开式)为基。(按权展开式) 逢十进一逢十进一 ,借一当十。,借一当十。2.1.1 2.1.1 进制进制合肥工业大学计算机学院4大学计算机基础由此推广到任意进制计数方法由此推广到任意进制计数方法 (R(R进值表示进值表示) ):vR进制有进制有0、1、2R-1共共R个数字符号,每个数字个数字符号,每个数字符号各代表符号各代
5、表0R-1之间之间一个固定的值;一个固定的值;v由由R个符号组成的序列来表示数值,写成如下形式个符号组成的序列来表示数值,写成如下形式:X=KnKn-1K1K0.K-1K-2K-m K 0,1,2R-1表示的值是:表示的值是: X = KnRn+Kn-1Rn-1+K1R1+K0R0+K -1R-1+ -m-m每一位代表的值要由该符号所代表的值乘一个与符每一位代表的值要由该符号所代表的值乘一个与符号位置相关的常数号位置相关的常数R Ri i来确定,来确定,R Ri i称为位权,称为位权,R R称为计数系称为计数系统的基。统的基。v逢逢R进一,借一当进一,借一当R。 进位计数制的要素:进位计数制的
6、要素:1、数码的个数、数码的个数 2、进位的基数、进位的基数合肥工业大学计算机学院5大学计算机基础计算机中常用的几种数制数制数制基数基数基本数符基本数符进位原则进位原则位权位权十进制十进制100 1 2 3 4 5 6 7 8 9逢十进一逢十进一10 I二进制二进制20 1逢二进一逢二进一2 I八进制八进制80 1 2 3 4 5 6 7逢八进一逢八进一8 I十六进制十六进制160 1 2 3 4 5 6 7 8 9 A B C D E F逢十六进一逢十六进一16 I合肥工业大学计算机学院6大学计算机基础二进制数的数码有两个符号二进制数的数码有两个符号0 0、1 1,由这两个符号,由这两个符号
7、组成的序列可以表示任意数值,进位规则为组成的序列可以表示任意数值,进位规则为“逢二进逢二进一,借一当二一,借一当二”。如:二进制数如:二进制数101010.101可以写成如下形式;可以写成如下形式; (101010.101)2 =125 +024 +123 +022 +121 +020 +12-1 +02-2 +12-3 = 32 + 8 + 2 + 0.5 + 0.125 = (42.625)10(2 2). .二进制二进制 由于二进制的位权最小,由于二进制的位权最小,所以表示同一个值的时所以表示同一个值的时候,符号序列较长。候,符号序列较长。如:如:(255)10=(11111111)2
8、。 为了表示的方便,计算机中常采用八进制和十六为了表示的方便,计算机中常采用八进制和十六进制。进制。合肥工业大学计算机学院7大学计算机基础(3).八进制 八进制数的数码为八进制数的数码为0、1、2、3、4、5、6、7共八个,进共八个,进位规则为位规则为“逢八进一,借一当八逢八进一,借一当八”。如:(327)8=382+281+780=192+16+7=(215)10 (4).十六进制 十六进制数的数码为十六进制数的数码为0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F共十六个,其中数码共十六个,其中数码A、B、C、D、E、F分别分别代表十进制数中的代表十进制数中的10、11、12
9、、13、14、15,进位规则为逢十,进位规则为逢十六进一,借一当十六。六进一,借一当十六。如:如:(327)16 = 3162 + 2161 + 7160 = 768 + 32 + 7 =(807)10 (15)10=(1111)2=(17)8=(F)1615D=1111B=17O=FH后缀法:后缀法:下标法:下标法:合肥工业大学计算机学院8大学计算机基础2.1.2 2.1.2 不同进位计数制之间的转换不同进位计数制之间的转换(1 1). . 2/8/162/8/16进制转换为十进制进制转换为十进制 任意进制数转换为十进制数采用任意进制数转换为十进制数采用“按位权展开按位权展开求和求和”的方法
10、即可。的方法即可。10101B = 1 24 + 0 23 + 1 22 + 0 21 + 1 20 = 21D101.11B = 1 22 + 0 21 + 1 20 + 1 2-1 + 1 2-2 = 5.75D101O= 1 82 + 0 81 + 1 80 = 65D101AH=1 16 3 + 0 16 2 + 1 16 1 + 10 16 0 4106D合肥工业大学计算机学院9大学计算机基础原则:原则:整数部分:整数部分:除以基取余数,直到商为除以基取余数,直到商为0 0,余数从右到左排列。,余数从右到左排列。小数部分:小数部分:乘以基取整数,整数从左到右排列。乘以基取整数,整数从
11、左到右排列。例例 100.345(D)=1100100.01011(B)100(D)=144(O)=64(H)100(D)=144(O)=64(H)=1100100(B)01002502 252122623210001011100812818044110016604616 0.7600.34520.69021.3802 2 1.520 2 1.04(2 2). . 十进制转换为十进制转换为2/8/162/8/16进制进制合肥工业大学计算机学院10大学计算机基础(3 3). .二进制与八进制之间的转化二进制与八进制之间的转化64O: 6 4 110 100B (A) (A) 八进制转换成二进制八
12、进制转换成二进制 原则:原则: 一分为三一分为三每一个八进制数对应三位二进制。每一个八进制数对应三位二进制。27.461O : 2 7 . 4 6 1 010 111 100 110 001B (B) (B) 二进制转化成八进制二进制转化成八进制 原则:三位一组,从小数点开始,原则:三位一组,从小数点开始, 整数部分:从右向左进行分组;整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足小数部分:从左向右进行分组,不足3位补零。位补零。 110 101 111 . 010 10 B=657.24O 6 5 7 2 4后边补一个零后边补一个零 1000合肥工业大学计算机学院11大学计算
13、机基础64H: 6 4 0110 0100B(4 4) 二进制与十六进制之间的转化二进制与十六进制之间的转化 (A) (A) 十六进制转换成二进制十六进制转换成二进制 原则:原则: 一分为四一分为四每一个十六进制数对应二进制的四位。每一个十六进制数对应二进制的四位。2C1DH : 2 C 1 D 0010 1100 0001 1101B (B) (B) 二进制转化成十六进制二进制转化成十六进制 原则:四位一组,从小数点开始,原则:四位一组,从小数点开始, 整数部分:从右向左进行分组;整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足小数部分:从左向右进行分组,不足4位补零。位补零。
14、 11 0110 1110 . 1101 01 B=36E.D4H 3 6 E D 4后边补两个零后边补两个零 010000合肥工业大学计算机学院12大学计算机基础()16十六进制十六进制01234567二进制二进制0000 0001 0010 0011 0100 0101 0110 0111十六进制十六进制89ABCDEF二进制二进制1000 1001 1010 1011 1100 1101 11101111( 3 5 4 2 )8 = ( ? )16011101100010267()2合肥工业大学计算机学院13大学计算机基础16以内的各种进制对照表十进制(十进制(D) 二进制(二进制(B)
15、 八进制(八进制(O) 十六进制(十六进制(H) 0 1 2 3 4 5 6 7 8 91011121314150000000100100011010001010110011110001001101010111100110111101111 0 1 2 3 4 5 6 71011121314151617 0 1 2 3 4 5 6 7 8 9 A B C D E F合肥工业大学计算机学院14大学计算机基础(1 1). .二进制的算术运算二进制的算术运算加法:加法: 0+0=0 1+0=1 0+1=1 1+1=100+0=0 1+0=1 0+1=1 1+1=10(进位)(进位)减法:减法: 0-
16、0=0 1-0=1 1-0=1 0-1=10-0=0 1-0=1 1-0=1 0-1=1(借位)(借位)乘法:乘法: 0X0=0 0X1=0 1X0=0 1X1=10X0=0 0X1=0 1X0=0 1X1=1除法:除法: 0/0=0 0/1=0 1/1=10/0=0 0/1=0 1/1=1例:例:00101101 + 01011011 = 1 0 0 0 1 0 0 0 0 0 1 0 1 1 0 1 + 0 1 0 1 1 0 1 1 1 0 0 0 1 0 0 02.1.3 2.1.3 二进制数据的运算二进制数据的运算加法运算加法运算合肥工业大学计算机学院15大学计算机基础减法运算减法运
17、算 11011 - 1110 1101 1101 1010 0000 1101 0000+ 1101 10000010乘法运算乘法运算 101 1011 111011 1011 1111 1011 100除法运算除法运算合肥工业大学计算机学院16大学计算机基础(2 2). .二进制的逻辑运算二进制的逻辑运算 用二进制的用二进制的“1”1”与与“0”0”代表逻辑关系的真与代表逻辑关系的真与假、是与非。具有逻辑性的变量称为逻辑变量,逻假、是与非。具有逻辑性的变量称为逻辑变量,逻辑变量之间的运算就是逻辑运算。辑变量之间的运算就是逻辑运算。三种基本的逻辑运算:三种基本的逻辑运算:逻辑逻辑“与与”运算运
18、算(and) 01=0 10=0 00=0 11=1 sw1 sw2 sw1.AND.sw2 0 0 0 0 1 0 1 0 0 1 1 1合肥工业大学计算机学院17大学计算机基础逻辑逻辑“或或”运算运算(or) 00=0 01=1 10=1 11=1 sw1 sw2 sw1.OR.sw2 0 0 0 0 1 1 1 0 1 1 1 1逻辑逻辑“非非”运算运算(not)_ _0=1 1=0 sw .NOT.sw 0 1 1 0合肥工业大学计算机学院18大学计算机基础2.22.2 计算机中数据的表示计算机中数据的表示2.2.1 .2.1 计算机中的数据计算机中的数据 计算机处理的数据分为数值型数
19、据和非数值型数计算机处理的数据分为数值型数据和非数值型数据。数值型数据用于表示数量特征;而非数值数据用据。数值型数据用于表示数量特征;而非数值数据用于表示特定的信息,如文字、图形、图像等。于表示特定的信息,如文字、图形、图像等。 根据冯根据冯诺依曼原理,在计算机内部各种信息都诺依曼原理,在计算机内部各种信息都是以二进制表示的。是以二进制表示的。 计算机只能使用二进制,因此在计算机中,正计算机只能使用二进制,因此在计算机中,正号、负号、数值、字符和文字、图形等都必须用号、负号、数值、字符和文字、图形等都必须用0 0和和1 1的组合来实现,把利用的组合来实现,把利用0 0和和1 1的各种组合来表示
20、信息的的各种组合来表示信息的方法统称为方法统称为编码编码。 合肥工业大学计算机学院19大学计算机基础 计算机为什么采用二进制计算机为什么采用二进制(2)(2)算术算术运算规则简单运算规则简单 (3)(3)便于实现逻辑便于实现逻辑 运算运算 (1)(1)二进制只有两个状态,稳定,易于区分,二进制只有两个状态,稳定,易于区分,硬件容易实现硬件容易实现 ,具有两个稳定状态的物理器件很多。具有两个稳定状态的物理器件很多。合肥工业大学计算机学院20大学计算机基础各种数据在计算机中的转换过程各种数据在计算机中的转换过程 数 值 十 二 进 制 转 换 西 文 A SCII码 汉 字 输 入 码 机 内 码
21、 转 换 声 音 、 图 像 模 数 转 换 二 十 进 制 转 换 西 文 字 形 码 汉 字 字 形 码 数 模 转 换 内 存 输 入 设 备 输 出 设 备 数 值 西 文 汉 字 声 音、图 像 合肥工业大学计算机学院21大学计算机基础2.2.2 2.2.2 数值数据的表示数值数据的表示 数值型数据的表示需要描述三点:数值的绝对值、数值型数据的表示需要描述三点:数值的绝对值、小数点、符号小数点、符号( (正负号正负号) )。1.1.无符号整数的表示无符号整数的表示 数值型数据分为有符号型和无符号型。无符号整数值型数据分为有符号型和无符号型。无符号整数指的是计数系统中只有大于等于数指的
22、是计数系统中只有大于等于0 0的数,没有负数的数,没有负数 ,因此,不需要表示符号。因此,不需要表示符号。 如用如用8 8位二进制表示整数,其范围是:位二进制表示整数,其范围是: 从从0000 00000000 0000到到1111 11111111 1111, 对应的十进制:从对应的十进制:从0 0到到255255。 合肥工业大学计算机学院22大学计算机基础2.2.有符号整数的表示有符号整数的表示 对于有符号型的数值数据中有正、负数和零,对于有符号型的数值数据中有正、负数和零,则必须通过编码的方式表示符号。则必须通过编码的方式表示符号。 在计算机中,通常在二进制数据的绝对值前面在计算机中,通
23、常在二进制数据的绝对值前面加上一位二进制位作为符号位,符号位为加上一位二进制位作为符号位,符号位为0 0代表此数代表此数为正数,符号位为为正数,符号位为1 1代表此数为负数,从而形成了数代表此数为负数,从而形成了数值型数据的机内表示形式。值型数据的机内表示形式。 同时为了方便运算,对有符号数常采用三种表同时为了方便运算,对有符号数常采用三种表示形式,即示形式,即原码、反码、补码原码、反码、补码。合肥工业大学计算机学院23大学计算机基础 正数的符号位为正数的符号位为0 0,负数的符号位为,负数的符号位为1 1,其它位用,其它位用此数的绝对值表示,得到的即为此数的原码。此数的绝对值表示,得到的即为
24、此数的原码。数数 55D55D的的8 8位二进制表示为:位二进制表示为:0011011100110111, 其原码表示为:其原码表示为:0011011100110111。数数 -55D-55D的绝对值是:的绝对值是:0011011100110111, 其原码表示为:其原码表示为:1011011110110111。 原码的原码的0:存在两个:存在两个0 00000000B、1000000B 在运算时需要判断符号。在运算时需要判断符号。(2 2)反码反码 正数的反码与原码相同,负数的反码的符号位为正数的反码与原码相同,负数的反码的符号位为1,其余各位对原码按位取反,得到的即为此数的其余各位对原码按
25、位取反,得到的即为此数的反码反码。 66D的反码为:的反码为:01000010。 -66D的反码为:的反码为:10111101。 (1 1)原码)原码合肥工业大学计算机学院24大学计算机基础(3 3)补码)补码补码是利用有模运算表示数据的一种方式。补码是利用有模运算表示数据的一种方式。 X补补 = 2n +X( -2n-1 X 2n-1 )有模计数系统有如下性质:有模计数系统有如下性质:有模计数系统当计数值超过系统的有模计数系统当计数值超过系统的“模模”时系统重时系统重新开始计数。新开始计数。如:时钟从如:时钟从5点调整到点调整到2点有两种方法:点有两种方法:5- -3=25+9=12+2 1
26、2为计数系统的模,为计数系统的模,3,9互为补数。互为补数。 有模计数系统可以将有模计数系统可以将减减一个数转化成一个数转化成加加该数的补该数的补数。也就是可以将减法运算转化成加法运算。数。也就是可以将减法运算转化成加法运算。如果用八位二进制表示一个数,系统的模是如果用八位二进制表示一个数,系统的模是28。100000000=00000000合肥工业大学计算机学院25大学计算机基础补码补码 正数的补码与原码相同;负数的补码的符号位为正数的补码与原码相同;负数的补码的符号位为1 1,其余各位为反码并在最低位加,其余各位为反码并在最低位加1 1,得到的即为此,得到的即为此数的数的补码补码。引入补码
27、后,可以简化运算,使减法统。引入补码后,可以简化运算,使减法统一变为加法。一变为加法。补码有如下性质:补码有如下性质: X+Y 补补 = X补补+Y补补 X-Y 补补 = X补补+-Y补补补码表示补码表示0 0是唯一的:是唯一的: +0+0补补=-0=-0补补=00000000=00000000合肥工业大学计算机学院26大学计算机基础例例2:(102 25)补补 =(102)补补+ (-25)补补 =01100110 + 11100111 =01001101 =(77)补补 =(77)D 0 1 1 0 0 1 1 00 1 0 0 1 1 0 11 0 0 1 1 0 0 11 1 1 0
28、0 1 1 01 1 1 0 0 1 1 1+102D+102D, 其原码其原码=01100110=01100110;-25D, -25D, 其原码其原码=10011001=10011001;其反码其反码=11100110=11100110;其补码;其补码=11100111=11100111合肥工业大学计算机学院27大学计算机基础3.3.浮点数的表示浮点数的表示 如果数据有整数部分和小数部分,那么就必须表示如果数据有整数部分和小数部分,那么就必须表示小数点。小数点。现在计算机采用的是浮点数表示方法。现在计算机采用的是浮点数表示方法。 一个数的浮点数表示为:一个数的浮点数表示为:E = M2N
29、M是二进制表示的纯小数,称为尾数,是二进制表示的纯小数,称为尾数,N是二进制是二进制表示的纯整数,称为阶码。表示的纯整数,称为阶码。 单精度浮点数的标准规定用单精度浮点数的标准规定用32位二进制表示浮点数,位二进制表示浮点数,其中尾数其中尾数M占占23位,阶码位,阶码N占占8位。位。MsEMrb31 b30 b23 b22 b0数符 阶码 尾数 32 32位二进制的最高位位二进制的最高位b31b31表示数符,即尾数的表示数符,即尾数的符号,也就是整个数的符号;符号,也就是整个数的符号;b30b30到到b23b23一共一共8 8位采位采用补码方式表示阶码;用补码方式表示阶码;b22b22到到b0
30、b0表示尾数。表示尾数。合肥工业大学计算机学院28大学计算机基础 计算机处理的信息包括数值、文字、符计算机处理的信息包括数值、文字、符号、语音、图形、图象。在计算机内部各种号、语音、图形、图象。在计算机内部各种信息都必须以数字化的二进制编码形式传送、信息都必须以数字化的二进制编码形式传送、存储和加工,因此,所有的信息都应转化为存储和加工,因此,所有的信息都应转化为二进制编码。编码是以少量的二进制位,通二进制编码。编码是以少量的二进制位,通过一定的组合规则,表示出大量复杂多样的过一定的组合规则,表示出大量复杂多样的信息。信息。2.2.3 2.2.3 非数值数据表示非数值数据表示合肥工业大学计算机
31、学院29大学计算机基础1. 英文信息的编码英文信息的编码 (ASCII码)码) 英文是符号文字,只要通过二进制编码表示其英文是符号文字,只要通过二进制编码表示其基本元素基本元素(如字母如字母),即可实现英文文字的数字化表,即可实现英文文字的数字化表示。示。 目前,国际上使用的字母、数字和符号的信息目前,国际上使用的字母、数字和符号的信息编码系统是采用美国国家信息交换标准字符码(编码系统是采用美国国家信息交换标准字符码(American Standard Code for Information Interchange),简称为),简称为ASCII码。码。例如:大写字母例如:大写字母 A: A=
32、(1 0 0 0 0 0 1)ASC=65 w7 w6 w5 w4 w3 w2 w1 小写字母小写字母 a: a= ( 1 1 0 0 0 0 1)ASC=97 w7 w6 w5 w4 w3 w2 w1 合肥工业大学计算机学院30大学计算机基础例例: 字符串字符串“Hello!”输入后,每个字节存输入后,每个字节存放一个放一个ASCII码。码。00100001H ( 72)e (101)l (108)l (108)0 (111)! ( 33)0110010101101100011011000110111101001000合肥工业大学计算机学院31大学计算机基础 空格空格 00100000 20
33、H 32 09 00110000 00111001 30H39H 4857 AZ 01000001 01011010 41H5AH 6590 a z 01100001 01111010 61H7AH 97122字符 二进制表示 十六进制表示 十进制表示 ASCII码码包括包括10个十进制数码、个十进制数码、52个英文大小写字母、个英文大小写字母、一些符号(如一些符号(如$、%、&、#等)和等)和32个控制符号,共计个控制符号,共计128个字符。个字符。编码采用一个字节,编码采用一个字节,8位二进制。标准的位二进制。标准的ASCII码码只用了其中只用了其中7位,最高一位为位,最高一位为0
34、。 随着信息技术的发展和全球化的需要,新的随着信息技术的发展和全球化的需要,新的UnicodeUnicode编码标准随之产生。其编码采用两个字节,编码标准随之产生。其编码采用两个字节,1616位二进制,位二进制,可表示可表示2 21616个符号,也就是个符号,也就是6553665536个符号,几乎可以涵盖世个符号,几乎可以涵盖世界上的各种文字和符号,该编码标准已经逐渐推广应用。界上的各种文字和符号,该编码标准已经逐渐推广应用。 合肥工业大学计算机学院32大学计算机基础键盘管理输入码输入码汉字处理汉字库内码内码打印模块显示模块字型码字型码 2 2中文信息的编码中文信息的编码 汉字的特点是象形文字
35、、单字单音。由于汉字本身的汉字的特点是象形文字、单字单音。由于汉字本身的特点,且汉字的输入输出必须利用现有的设备,它在输入、特点,且汉字的输入输出必须利用现有的设备,它在输入、输出、存储和处理过程中所使用的汉字代码是不相同的,输出、存储和处理过程中所使用的汉字代码是不相同的,主要有用于信息交换的国标码,用于计算机内部处理的内主要有用于信息交换的国标码,用于计算机内部处理的内码,输入时的输入码和输出时的字形码等。码,输入时的输入码和输出时的字形码等。合肥工业大学计算机学院33大学计算机基础 汉字编码体系与汉字信息处理在汉字系汉字编码体系与汉字信息处理在汉字系统的不同部位可根据环境使用不同的汉字编
36、统的不同部位可根据环境使用不同的汉字编码,这些编码就组成了一个汉字编码体系。码,这些编码就组成了一个汉字编码体系。汉字机内码汉字机内码系统内部处理和存储汉字而使用的编系统内部处理和存储汉字而使用的编码码;汉字交换码汉字交换码不同的汉字机内码之间进行信息交换不同的汉字机内码之间进行信息交换的编码;的编码;汉字字形码汉字字形码确定汉字字形的编码,它的集合就是确定汉字字形的编码,它的集合就是汉字库;汉字库;汉字地址码汉字地址码汉字库中存储的汉字字形码的逻辑地汉字库中存储的汉字字形码的逻辑地址码址码汉字输入码汉字输入码为采用键盘输入汉字而编制的汉字编为采用键盘输入汉字而编制的汉字编码。码。合肥工业大学
37、计算机学院34大学计算机基础汉字的编码技术汉字的编码技术合肥工业大学计算机学院35大学计算机基础(1 1)汉字信息交换码(国标码)汉字信息交换码(国标码) 我国颁布了我国颁布了信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集,即即GB2312-80GB2312-80,简称国标码。该标准收入了,简称国标码。该标准收入了67636763个常用汉字个常用汉字(其中一级汉字(其中一级汉字37553755个,二级汉字个,二级汉字30083008个),以及英、俄、个),以及英、俄、日文字母与其他符号日文字母与其他符号687687个,共个,共7 0007 000多个符号。多个符号。 国标码的编码
38、规则是:每个汉字由一个国标码的编码规则是:每个汉字由一个2 2字节字节(16(16位二进位二进制制) )编码组成,每个字节的最高位置编码组成,每个字节的最高位置“0”0”,其余,其余7 7位用于组位用于组成各种不同的码值。为了不与成各种不同的码值。为了不与ASCIIASCII码的控制字符相同,每码的控制字符相同,每个字节剔除了个字节剔除了3434个个ASCIIASCII码的控制字符,每个字节还剩码的控制字符,每个字节还剩9494个个编码。两个字节组成一个二维结构,前一个字节称编码。两个字节组成一个二维结构,前一个字节称“区区”,后一个字节称后一个字节称“位位”,所以国标码也称为区位码,一共可以
39、,所以国标码也称为区位码,一共可以表示表示94949494个即个即88368836个汉字以及其他符号。个汉字以及其他符号。汉字分区,每个区汉字分区,每个区94个汉字。个汉字。 区号区中位置汉字汉字 国标码国标码 沪沪 2706(00011011 00000110) 久久 3035(00011110 00100011) 合肥工业大学计算机学院36大学计算机基础(2 2)汉字机内码)汉字机内码机内码是计算机内部存储和加工汉字时所用的代码。机内码是计算机内部存储和加工汉字时所用的代码。不管用何种汉字输入码将汉字输入计算机,为存储和处理不管用何种汉字输入码将汉字输入计算机,为存储和处理方便,都需将各种
40、输入码转换成长度一致的汉字内部码。方便,都需将各种输入码转换成长度一致的汉字内部码。 计算机既要处理汉字,也要处理西文。为了实现中、计算机既要处理汉字,也要处理西文。为了实现中、西文兼容,通常利用字节的最高位来区分某个码值是代表西文兼容,通常利用字节的最高位来区分某个码值是代表汉字或汉字或ASCIIASCII码字符。若最高位为码字符。若最高位为“1”1”视为汉字符,为视为汉字符,为“0”0”视为视为ASCIIASCII字符。所以,汉字机内码在国标码的基础上,把字符。所以,汉字机内码在国标码的基础上,把2 2个字节的最高位一律由个字节的最高位一律由“0”0”改改“1”1”构成。构成。 汉字汉字
41、内码内码 沪沪 10011011 10000110B 久久 10011110 10100011B每个汉字占每个汉字占两个两个字节,国标码最高位为字节,国标码最高位为0,机内码最高位为,机内码最高位为1。合肥工业大学计算机学院37大学计算机基础(3 3)汉字输入码)汉字输入码汉字主要是利用现有的输入设备汉字主要是利用现有的输入设备( (如键盘如键盘) )来实现输入,来实现输入,由键盘输入汉字时是输入汉字的输入码,每个汉字都对应一由键盘输入汉字时是输入汉字的输入码,每个汉字都对应一种汉字输入方法的一个输入码。种汉字输入方法的一个输入码。 汉字的输入方法种类繁多,输入方法不同,同一汉字的汉字的输入方
42、法种类繁多,输入方法不同,同一汉字的输入码也不同。常用的汉字输入法有:拼音法,五笔字形输输入码也不同。常用的汉字输入法有:拼音法,五笔字形输入法,智能入法,智能ABCABC法,自然码等等。法,自然码等等。 在计算机中存入的是汉字的机内码,与所采用的输入法在计算机中存入的是汉字的机内码,与所采用的输入法无关。不管使用何种输入法,在输入码与机内码之间总是存无关。不管使用何种输入法,在输入码与机内码之间总是存在着一一对应的关系,通过在着一一对应的关系,通过“键盘输入管理程序键盘输入管理程序”把输入码把输入码转换为机内码。转换为机内码。zhong 1.中中2.重重3.种种4.钟钟5.肿肿“中中”的输入
43、码是:的输入码是:zhong1合肥工业大学计算机学院38大学计算机基础汉字输入方法汉字输入方法v音码音码拼音拼音v型码型码五笔字型五笔字型v音型码音型码汉字编码方案汉字编码方案音码:音码:根据汉字的发音规律对汉字进行编码。根据汉字的发音规律对汉字进行编码。 采用音码编码的输入法常见的有:智能拼采用音码编码的输入法常见的有:智能拼 音、全拼拼音、全拼双音、双拼双音等。音、全拼拼音、全拼双音、双拼双音等。形码:形码:根据汉字的字形结构特征对汉字进根据汉字的字形结构特征对汉字进 行编码。行编码。 采用形码编码的输入法常见的有:采用形码编码的输入法常见的有: 五笔字形。五笔字形。混合码:混合码:综合汉
44、字的发音及字形结构对汉字综合汉字的发音及字形结构对汉字 进行编码。进行编码。 常见的有阴阳码等输入法。常见的有阴阳码等输入法。合肥工业大学计算机学院39大学计算机基础(4 4)汉字字形码)汉字字形码 汉字显示、打印输出的是汉字的字形,显示、打印是汉字显示、打印输出的是汉字的字形,显示、打印是将汉字的字形分解成由点阵组成的图形,也称为字形码。将汉字的字形分解成由点阵组成的图形,也称为字形码。字形码和内码之间也存在一一对应的关系,通过汉字系统字形码和内码之间也存在一一对应的关系,通过汉字系统的的“输出处理程序输出处理程序”根据内码从汉字库找到对应的汉字点根据内码从汉字库找到对应的汉字点阵输出。阵输出。 汉字的字形称为字模,以一点阵表示。点阵中的点对汉字的字形称为字模,以一点阵表示。点阵中的点对应存储器中的一位二进制应存储器中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 路边广告位转让合同
- 美国自费出国留学咨询服务合同年
- 居间合同佣金承诺书
- 事故车买卖合同协议
- 连车带人租赁合同
- 荒山承包合同范本
- 叉车租赁合同协议书范本大全
- 工地材料运输合同
- 借款合同答辩状范本范本
- 个人工作总结范文20篇
- 2024年广东省公务员录用考试《行测》真题及解析
- 高中英语必背3500单词表(完整版)
- 禁止送礼的协议书
- 2024年版《输变电工程标准工艺应用图册》
- 2024年高考数学试卷(北京)(空白卷)
- 2024从洞见到生意:阿里健康特色人群消费趋势报告-阿里健康x一财商学院
- 人教版2024年新教材七年级上册英语starter unit 1 -unit7重点短语句型清单
- 护理服务在产科中的应用课件
- 2024年小升初语文入学分班测试卷四(统编版)
- 流行文化对青少年价值观的影响研究
- 中国保险行业协会官方-2023年度商业健康保险经营数据分析报告-2024年3月
评论
0/150
提交评论