计算机基础课件进制和汉字编码_第1页
计算机基础课件进制和汉字编码_第2页
计算机基础课件进制和汉字编码_第3页
计算机基础课件进制和汉字编码_第4页
计算机基础课件进制和汉字编码_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机基础课件进制和汉字编码第一页,共九十九页,2022年,8月28日12.1常用数制十进制二进制八进制和十六进制第二页,共九十九页,2022年,8月28日2特点:数值用0~9表示,逢十进一。十进制Decimal举例:(123.45)10、123.45D123.45D=3×100+2×101+1×102+4×10-1+5×10-2基数按权展开式/通式第三页,共九十九页,2022年,8月28日3二进制计算:1B+1B=10BBinary特点:0或1,逢二进一。举例:(101.11)2、101.11B101.11B=1×20+1×22+1×2-1+1×2-2=1+4+0.5+0.25=5.75基数第四页,共九十九页,2022年,8月28日4八进制计算:1O+7O=10OOctal特点:0~7,逢八进一。举例:(76.01)8、76.01O、76.01Q76.01Q=6×80+7×81+1×8-2=6+56+0.0625=62.0625基数第五页,共九十九页,2022年,8月28日5十六进制计算:1H+AH=BHHexadecimal特点:数值用0~9、A(10)、B(11)、C(12)、D(13)、E(14)、F(15)表示,逢十六进一。举例:(7D6.A)16、7D6.AH7D6.AH=6×160+13×161+7×162+

10×16-1

=6+208+1792+0.625=2006.625基数第六页,共九十九页,2022年,8月28日6

二进制中只有0和1两个符号,使用有两个稳定状态的电子器件就可以分别表示它们。

二进制数的运算规则简单,易于进行高速运算。

数理逻辑中的“真”和“假”可以分别用“1”和“0”来表示,这样就把非数值信息的逻辑运算与数值信息的算术运算联系了起来。为什么计算机只用二进制?第七页,共九十九页,2022年,8月28日7第八页,共九十九页,2022年,8月28日8第九页,共九十九页,2022年,8月28日9第十页,共九十九页,2022年,8月28日10第十一页,共九十九页,2022年,8月28日11二进制数太长,书写、阅读、记忆均不便。八、十六进制与二进制之间的转换直观、方便。为什么还用八、十六进制?第十二页,共九十九页,2022年,8月28日122.2数制间的转换★二进制十进制十六进制八进制第十三页,共九十九页,2022年,8月28日13(1)十进制数与二进制数的转换①十进制整数<==>二进制整数例1:将二进制整数(1010101)2转换成十进制整数(1010101)2=1×26+0×25+1×24+0×23

+1×22+0×21+1×20

=64+16+4+1=(85)10方法描述:位权相加法,计算按权展开式的和。第十四页,共九十九页,2022年,8月28日14例2:将(19)10转换为二进制数。31D低位高位余11920余1余1余0余092422212故:(19)10=(10011)2方法描述:除2倒取余,直到商为0。第十五页,共九十九页,2022年,8月28日15②十进制小数<==>二进制小数:例3:将二进制小数(0.111)2转换成十进制数(0.111)2=1×2-1+1×2-2

+1×2-3=0.5+0.25+0.125=(0.875)10方法描述:位权相加法,计算按权展开式的和。第十六页,共九十九页,2022年,8月28日16例4:将(0.625)10转换为二进制数。低位高位1.2500×20.5000×21.00000.625×2故:(0.625)10=(0.101)2方法描述:乘以2顺取整,直到小数部分为0。第十七页,共九十九页,2022年,8月28日17故取近似值(0.1)10=(0.00011)2小数部分乘2会无限循环下去例5:将(0.1)10转换为二进制。并非所有的十进制小数都能用有限位的二进制小数来表示。注意:第十八页,共九十九页,2022年,8月28日18十进制数转换成二进制数时,要将整数和纯小数部分分开转换为相应的二进制,然后再将二进制数的整数和小数部分连接起来。例6:将(19.625)10转换为二进制数。解:(19)10=(10011)2(0.625)10=(0.101)2故:(19.625)10=(10011.101)2注意:第十九页,共九十九页,2022年,8月28日19①二进制数转换为八进制数

(011

110

111.100

010

101)2

.

367425小数部分从高位向低位整数部分从低位向高位=(367.425)8例7:将(11110111.100010101)2转化为八进制数方法描述:先用两端补“0”的方法,将二进制数的整数与小数部分分别补足为3的倍数位,再将三位二进制数用一位等值的八进制数表示。(2)八进制数与二进制数的转换第二十页,共九十九页,2022年,8月28日20(16.327)8②八进制数转换为二进制数例8:将(16.327)8转换为二进制数。=(001

110.011

010

111)2方法描述:一位八进制用三位二进制数表示。第二十一页,共九十九页,2022年,8月28日21转换表八进制数二进制数八进制数二进制数

00004100100151012010611030117111101011101101B=5355O记熟第二十二页,共九十九页,2022年,8月28日22(3)十六进制数与二进制数的转换二进制数转换为十六进制数举例:

0011

0100

1110.1100

1100B→十六进制数转换为二进制数举例:

35A2.CFH

→34E.CCH0011010110100010.11001111B第二十三页,共九十九页,2022年,8月28日23转换表十六进制数二进制数十六进制数二进制数

0000081000

1000191001

20010A1010

30011B1011

40100C110050101D110160110E111070111F1111记熟第二十四页,共九十九页,2022年,8月28日24(4)十进制与八进制或十六进制间的转换八、十六进制→十进制按位权展开十进制→八进制

除8倒取余和乘8顺取整十进制→十六进制

除16倒取余和乘16顺取整和十进制与二进制转换类似第二十五页,共九十九页,2022年,8月28日25R进制转换为十进制(R=2/8/16)

十进制转换为R进制(R=2/8/16)

二进制、八进制、十六进制之间相互转换数制转换小结:二进制十进制十六进制八进制第二十六页,共九十九页,2022年,8月28日26★下列最大的数是

A.11001010BB.712QC.4FFHD.566D练习★在某一进制下,如果7×7=61,则4×6=

。A.24B.30C.18 D.33BC★计算74.75D=()B=()Q=()H1001010.11112.64A.C第二十七页,共九十九页,2022年,8月28日272.3二进制数的运算算术运算逻辑运算①加法

0011

+0+1+0+1 01110(1)算术运算向高位进1逢2进1第二十八页,共九十九页,2022年,8月28日28②减法

01011

-0-1-0-10110向高位借1第二十九页,共九十九页,2022年,8月28日29(2)逻辑运算(1)逻辑数据的表示“真”“假”、

“是”“非”、“对”“错”、

“有”“无”(2)逻辑运算逻辑非逻辑与逻辑或第三十页,共九十九页,2022年,8月28日30(2)逻辑运算①逻辑非

0=11=0与或非第三十一页,共九十九页,2022年,8月28日31②逻辑与:用“AND、×、·、∧”表示

运算规则:

0×1=01×0=00×0=01×1=1当两个逻辑量同时为真时,结果才为真。第三十二页,共九十九页,2022年,8月28日32③逻辑或:用“OR、+、∨”表示运算规则:

0+1=11+0=11+1=10+0=0当两个逻辑量只要有一个为真时,结果才为真。第三十三页,共九十九页,2022年,8月28日33举例:求:10011010OR11110000=?100110101111000011111010OR第三十四页,共九十九页,2022年,8月28日34练习★计算01011001∧10100111=()00000001第三十五页,共九十九页,2022年,8月28日352.4数值型数据的表示及处理数据数值型数据非数值型数据整数实数无符号整数有符号整数1.任何数据在计算机内都采用二进制表示。2.为了解决数值数据的表示范围问题,引入数据的定点表示和浮点表示。注意:第三十六页,共九十九页,2022年,8月28日36数据定点表示的两种形式:(1)如规定小数点隐含在有效数字的最后,则说明表示的是整数。在计算机中并不能表示出小数点和小数点的位置,而是必须人为地做出规定。

整数(定点数)的表示说明(2)如规定小数点隐含在有效数字的最前面,则说明表示的是纯小数。符号位小数点符号位小数点小数点的位置固定第三十七页,共九十九页,2022年,8月28日37例如,二进制数01011101的两种表示:(1)如规定小数点隐含在有效数字的最后,则其表示整数:+1011101(2)如规定小数点隐含在有效数字的最前面,则其表示纯小数:+0.1011101第三十八页,共九十九页,2022年,8月28日38整数的分类:无符号整数:表示正整数

(8位,16位,32位)

例如:10000001取值范围:

8位0~255(28-1)16位0~65535(216-1)32位0~232-1

找出最大值和最小值考试中经常出现第三十九页,共九十九页,2022年,8月28日39

有符号整数:(表示正整数,负整数)其余各位用来表示数值的大小例如:00101011=+43,10101011=-43符号位:使用最高位(最左面的一位)作为符号位

“0”“+”(正数)

“1”“-”(负数)

可以采用不同的方法(原码、反码、补码)来表示有符号整数。第四十页,共九十九页,2022年,8月28日40举例1

假设只用8位二进制来表示一个整数,求+7和-7

的原码。解:[+7]原=

若符号位为0,则表示正数

若符号位为1,则表示负数①原码表示★表示方法规定:最高位作为符号位,其余各位代表数值本身的绝对值(以二进制表示)。0000011110000111[-7]原=用[X]原表示X的原码第四十一页,共九十九页,2022年,8月28日41[+1]原=[+127]原=[-1]原=[-127]原=绝对值相同的正数和负数,它们除了符号位不同外,其他各位都相同。00000001100000010111111111111111总结一下:第四十二页,共九十九页,2022年,8月28日42举例2:假设用8位二进制来表示一个数,求0的原码。解:根据原码的定义:[+0]原=[-0]原=结论:0的原码不唯一分析:当由数轴的左端趋向0时,我们记为-0

当由数轴的右端趋向0时,我们记为+0+0-00000000010000000第四十三页,共九十九页,2022年,8月28日43假设用8位二进制表示一个数

用原码表示的最小值为:

-127,其原码为11111111

用原码表示的最大值为:

+127,其原码为01111111所以,原码的表示范围为:–127~+127原码的表示范围:第四十四页,共九十九页,2022年,8月28日44解:[+7]反=

[-7]反=②反码表示★表示方法规定:1.一个数如果值为正,则它的反码与原码相同。2.一个数如果值为负,则将其符号位置为1,其余各位为对原码的相应数据位取反。举例1:假设只用8位二进制来表示一个整数,求+7和-7的反码0000011111111000第四十五页,共九十九页,2022年,8月28日45举例2:假设用8位二进制来表示一个数,求+0和-0的反码。解:根据反码的定义:[+0]反=[-0]反=结论:0的反码不唯一0000000011111111第四十六页,共九十九页,2022年,8月28日46假设用8位二进制表示一个数

用反码表示的最小值为:

-127,其反码为10000000

用反码表示的最大值为:

+127,其原码为01111111所以,反码的表示范围为:–127~+127反码的表示范围:与原码是一致的第四十七页,共九十九页,2022年,8月28日47③补码表示★应用补码的原因:通过对负数的适当处理,把减法转化为加法。不论求和求差,也不论操作数为正为负,运算时一律只做加法,从而大大简化加减运算。表示方法规定:1.正数的补码、反码、原码相同。

2.对于负数的补码,则将其最高位置为1,其余各位为对原码的相应数据位取反,然后再对整个数加1。第四十八页,共九十九页,2022年,8月28日48举例1

假设只用8位二进制来表示一个整数,求+7和-7的补码解:[+7]补=00000111[-7]补=11110001+111111001补充公式:

X为负数时

[x]补=

[x]反+1想一想:若已知X的补码为11111010,如何求X?第四十九页,共九十九页,2022年,8月28日49补充:

对负数来说,对补码再求一次补,会得到该数的原码。([-128]补不适合此规律)已知补码为:11111010 10000101

+1 10000110

(-6)第五十页,共九十九页,2022年,8月28日50注意:零的补码表示是唯一的举例2假设只用8位二进制来表示一个整数,求+0和-0的补码表示[+0]补=00000000[-0]补为11111111+1000000001进位自然舍去故:[+0]补=00000000=[-0]补第五十一页,共九十九页,2022年,8月28日51注意:

用补码进行运算,减法可以用加法来实现,即两数相减,只需将两数的补码相加,就得到结果值的补码。举例3:假设只用8位二进制来表示一个整数,求7-6的值解:[+7]补=00000111[-6]补=1111101000000111+11111010100000001进位自然舍去第五十二页,共九十九页,2022年,8月28日52127(01111111)原码、反码、补码的表示范围:

若一个数值数据的长度(包括符号位)为一个字节,则它表示的整数的范围为:原码:-127 (11111111)反码:-127 (10000000)补码:最小值最大值-128

系统规定其补码为:

10000000

127(01111111)127(01111111)第五十三页,共九十九页,2022年,8月28日538位二进制代码无符号整数原码补码0000000000000000001111……………………0111111112712712710000000128-0-12810000001129-1-127……………………11111111255-127-1各种整数表示法的比较第五十四页,共九十九页,2022年,8月28日54BCD整数(BinaryCodedDecimal)称为“二进制编码的十进制整数”

例如:(-51)BCD=10101

0001(+32767)BCD=00011

0010

0111

0110

0111

使用4个二进制位表示1个十进制数字,最高位仍为符号位。也称8421码。想想为什么要用4位?④BCD码第五十五页,共九十九页,2022年,8月28日55举例:很多高级程序语言,数值型数据都可以写成如下形式4.32E-5表示4.32×10-5=0.00004320.432E-1表示0.432×10-1=0.0432浮点表示与十进制中的科学计数法,两者很类似,但又不同为什么要引入浮点数?

在一定字长下,整数数值的表示范围有限;实际的数据往往有整数部分又有小数部分;实际数据有的特别大,有的特别小。2.4.2实数(浮点数)表示★小数点的位置不固定第五十六页,共九十九页,2022年,8月28日56基数(R):在计算机中,通常隐含为2尾数(M):必须是二进制定点纯小数,位数决定数的精度阶码(E):必须是二进制定点整数,位数决定数的范围

基数尾数在一般数据的浮点表示法中,一个数可表示成:

N=M·RE

阶码第五十七页,共九十九页,2022年,8月28日57回忆:二进制数01011101的两种表示:(1)如规定小数点隐含在有效数字的最后,则其表示整数:+1011101(2)如规定小数点隐含在有效数字的最前面,则其表示纯小数:+0.1011101第五十八页,共九十九页,2022年,8月28日58=

-(26.5)10

例1:假设某机器字长为16位,规定前6位表示阶码(包括阶码符号,原码表示),后10位表示尾数(包括尾数符号,原码表示),则:表示的浮点数是,-(0.110101)2×2(101)2=(-11010.1)2

0001011110101000阶码尾数符号位第五十九页,共九十九页,2022年,8月28日59=+(0.078125)10

例2:假设数值数据的长度为16位,其中前4位为阶码(包括阶码符号,原码表示),后12位为尾数(包括尾数符号,原码表示),则:

表示的浮点数是

D。10100=+(0.0101)2×符号位=+(0.000101)2

N=M·RE

2-(10)2阶码尾数第六十页,共九十九页,2022年,8月28日60复习★假设用8位二进制来表示一个数,计算:

[-12]原

=[-12]反

=[-12]补

=100011001111001111110100★某存储单元中的机器码表示一个浮点数,该浮点数的阶码为4位(含阶符1位,补码表示),尾数位12位(含数符1位,补码表示),则与该浮点数等值的十进制数是

。-29.125D第六十一页,共九十九页,2022年,8月28日612.5文字的表示及处理2008年8月8日,China原码、反码、补码表示汉字在计算机中如何表示?西文在计算机中如何表示?第六十二页,共九十九页,2022年,8月28日62※文字是人与计算机进行信息交流的主要媒体。※文字的基本元素字符※字符在计算机中采用采用二进制编码表示。西文字符编码汉字编码汉字的输入输出文本处理主要内容:第六十三页,共九十九页,2022年,8月28日63(1)ASCII码★2.5.1西文字符的编码ASCII码,即美国标准信息交换码(AmericanStandardCodeforInformationInterchange),使用7个二进位对字符进行编码。想一想,ASCII码可以表示多少个不同的字符?其中:可打印字符95个,如常用字母、数字、标点符号;控制字符33个,不可直接显示或打印。第六十四页,共九十九页,2022年,8月28日640123456789ABCDEF控制字符01234567b3b2b1b0

b6b5b4ASCII码字符集想一想:相邻的两个字母的ASCII码值相差多少?小写字母的ASCII码值比同一大写字母的ASCII码值大多少?第六十五页,共九十九页,2022年,8月28日65

每个字符用标准规定的7位二进制数表示,在机内占一个字节(最高位为0)。

如:字符“A”的ASCII码为:字符“0”的ASCII码为:

(00110000)2

或(48)10、(60)8、(30)16(01000001)2

或(65)10、(101)8、(41)16第六十六页,共九十九页,2022年,8月28日66会比较ASCII字符的大小(按其ASCII码值)空格<0~9<A~Z<a~z要求:会推算同组字符ASCII码值如A的ASCII值(十进制)为65,则B、C…的ASCII值分别为66、67…第六十七页,共九十九页,2022年,8月28日67(2)EBCDIC码说明:有很多编码没有使用,保留做为扩充定义方式:用8位二进制数位表示一个字符的扩充二~十进制交换码。特点:

每个字符对应一个字节,共256种。第六十八页,共九十九页,2022年,8月28日68GB2312-80汉字编码(国标码)GBK汉字内码扩展规范UCS/Unicode汉字编码GB18030-2000编码2.5.2汉字编码第六十九页,共九十九页,2022年,8月28日69国家标准局1981年《信息交换用汉字编码字符集》,汉字交换码的国家标准。采用双字节编码。★(1)GB2312-80汉字编码第七十页,共九十九页,2022年,8月28日70第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)第二部分:一级常用汉字,共3755个,按汉语拼音排列第三部分:二级常用字,共3008个,按偏旁部首排列组成:汉字6763所有字符7445第七十一页,共九十九页,2022年,8月28日71这是一个二维代码表,有94行、94列,汉字在代码表中的位置用它所处的区位号表示。区号行号位号列号①汉字区位码:例如:“北”字的区号17,位号17区位码是1717用2个字节表示为:0001000100010001第七十二页,共九十九页,2022年,8月28日72GB2312-80字符集第七十三页,共九十九页,2022年,8月28日73解决方案:为了避免冲突,每个汉字的区号和位号必须分别加上32。得到的代码称为汉字的“国标交换码”。②国标交换码:问题:信息通信中,汉字的区位码与通信使用的控制码(00H~1FH)发生冲突。第七十四页,共九十九页,2022年,8月28日74“大”字的区号20,位号83区位码

2083二进制表示为:0001010001010011例如:国标交换码

52115二进制表示为0011010001110011第七十五页,共九十九页,2022年,8月28日75解决方法:使表示GB2312汉字的两个字节的最高位(b7)都置为“1”。这种汉字编码称为GB2312汉字的“机内码”。③机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。第七十六页,共九十九页,2022年,8月28日76“大”字的区号20,位号83区位码

2083二进制表示为:0001010001010011例如:国标交换码

52115二进制表示为:0011010001110011机内码

180243二进制表示为:1011010011110011(B4F3H)机器中存储“大”的真正编码!★总结:区位码+32=国标码国标码+128=机内码第七十七页,共九十九页,2022年,8月28日77解决方法:1995年颁布GBK,全称为《汉字内码扩展规范》;GBK每一个字符都采用双字节表示;共23940个码位共收入21003个汉字和883图形符号与GB2312保持兼容;微软公司自Windows95简体中文版开始,各种版本的中文操作系统均采用GBK代码。★(2)GBK汉字内码扩充规范(GBK-95)问题:

GB2312-80只有6763个汉字,使用时功能不够。第七十八页,共九十九页,2022年,8月28日78GBK编码区分三个部分:汉字区(21003个汉字)、图形符号区、用户自定义区GBK每一个字符都采用双字节表示总体编码范围为:8140H—FEFEH,共23940个码位;首字节范围:81H—FEH(二进制最高位为1);尾字节范围:40H—FEH(二进制最高位可以为0或1);GBK汉字内码扩充规范第七十九页,共九十九页,2022年,8月28日79目的:统一的多文本处理环境,实现全世界所有字符在同一字符集中统一编码。途径:UCS:ISO/IEC10646(通用多8位编码字符集)Unicode:统一码或联合码,与UCS完全等同的工业标准.优点:编码空间极大(4个字节),能容纳足够多的各种字符集(13亿字符)。(3)UCS/Unicode(UniversalMultiple-OctetCodedCharacterSet)编码第八十页,共九十九页,2022年,8月28日80克服:UCS-2为其子集,采用双字节编码,共有字符49194个,其中包括:欧洲及中东地区使用的拉丁字母、音节文字;各种标点符号、数学符号、技术符号、几何形状、箭头及其他符号;中、日、韩(CJK)统一编码的汉字。缺点:4字节的字符编码使存储空间浪费严重。第八十一页,共九十九页,2022年,8月28日81目的:与GB2312和GBK兼容,向UCS/Unicode过渡。内容:信息交换用的基本图形字符及二进制编码的十六进制表示,同时收录了主要的少数民族文字。编码方式:在GB2312和GBK的基础上进行了扩充,采用单字节/双字节/四字节三种方式编码,码位数160多万。(4)GB18030-2000汉字编码标准第八十二页,共九十九页,2022年,8月28日82GBK-95GB2312-80GB18030-200000FF00FF00FF00FF00FF00FF27484汉字21003汉字6763汉字GB2312-80GBK-95GB18030-20003种汉字编码的关系:这三者向下兼容,但与Unicode不兼容第八十三页,共九十九页,2022年,8月28日83(5)BIG5编码收录内容:13461个汉字和符号符号408个常用汉字5401个次常用汉字7652个使用范围:通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”。第八十四页,共九十九页,2022年,8月28日842.5.3汉字的输入输出(1)汉字输入文本信息的输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别第八十五页,共九十九页,2022年,8月28日85拼音编码:如:智能ABC,紫光拼音,搜狗拼音,谷歌拼音优点:易学缺点:同音字引起的重码多,需增加选择操作①键盘输入字形编码:如:五笔字形法等优点:重码少、输入速度较快缺点:编码规则不易掌握“大”的输入码为“da”想想为什么要对汉字进行编码才能输入?第八十六页,共九十九页,2022年,8月28日86文字识别的性能指标:识别精度和识别速度工作过程:在书写板上书写,书写板将笔尖的运动按时间采样,发送到计算机中,由软件进行识别,然后用该汉字(或符号)对应的代码进行保存。例如:

汉王笔正确识别率95℅~90℅,速度12字/秒需求的配件:专用的书写板、笔②联机手写汉字识别(笔输入)第八十七页,共九十九页,2022年,8月28日87

使计算机具有人的听觉,使人机语音通讯中能听懂人类口述的语言。③语音识别分类(按照不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论