计算机基础课件(进制和汉字编码)_第1页
计算机基础课件(进制和汉字编码)_第2页
计算机基础课件(进制和汉字编码)_第3页
计算机基础课件(进制和汉字编码)_第4页
计算机基础课件(进制和汉字编码)_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、123数值用数值用0 09 9表示,逢十进一。表示,逢十进一。ecimal(123.45)10、123.45D123.45D= 10 + 10 + 10 + 10 + 10基数基数按权展开式按权展开式/ /通式通式4计算:计算:1B1B1B1B 10B10Binary0 或或 1, 逢二进一。逢二进一。(101.11)2、101.11B101.11B = 2 + 2 + 2 + 2 = 1 + 4 + 0.5 + 0.25 = 5.75基数基数5计算:计算:1O1O7O7O10O10Octal0 7, 逢八进一。逢八进一。(76.01)8、76.01O、 76.01Q76.01Q = 8 +

2、8 + 8 = 6 + 56 + 0.0625 = 62.0625 基数基数6计算:计算:1H1HAHAHBHBHexadecimal数值用数值用09、A(10)、B(11)、C(12)、D(13)、E(14)、F(15)表示,逢十六进一。表示,逢十六进一。(7D6.A)16、7D6.AH7D6.AH = 16 + 16 + 16 + 16= 6 + 208 + 1792 + 0.625 = 2006.625 基数基数7 数理逻辑中的数理逻辑中的“真真”和和“假假”可以分别用可以分别用“1 1”和和“0 0”来表示,这样就把非数值信息的来表示,这样就把非数值信息的逻辑逻辑运算与运算与数值数值信

3、息信息的算术运算联系了起来。的算术运算联系了起来。8910111213二进制二进制十进制十进制十六进制十六进制八进制八进制14(1010101)2=126025124 023 122 0 21120 = 641641= (85)1015低位低位高位高位余余11920余余1余余1余余0余余0 92422212故:故:(19)10(10011)21617低位低位高位高位1. 250020 .500021 . 00000 . 625 2 故:故:(0.625)10(0.101)2方法描述:方法描述:乘以顺取整乘以顺取整,直到小数部分为直到小数部分为0。18小数部分乘小数部分乘2会无限循环下去会无限循

4、环下去19解:解: (19)10(10011)2 (0.625)10(0.101)2故:故:(19.625)10(10011.101)220 ( 011 110 111 . 100 010 101 )2 . 367425小数部分从高位向低位小数部分从高位向低位整数部分从低位向高位整数部分从低位向高位(367.425)821 ( 1 6 . 3 2 7 ) ( 1 6 . 3 2 7 )8 8=(=(001001 110110 . . 011011 010010 111111) )2 2方法描述:方法描述:一位八进制用三位二进制数表示。一位八进制用三位二进制数表示。22记记 熟熟2324记记 熟

5、熟25八、十六进制八、十六进制十进制十进制十进制十进制八进制八进制 和和十进制十进制十六进制十六进制 和和26 二进制二进制十进制十进制十六进制十六进制八进制八进制27下列最大的数是下列最大的数是 。 A. 11001010B B. 712Q C. 4FFH D. 566D练习练习在某一进制下,如果在某一进制下,如果77=61,则,则46= 。A.24 B.30 C.18 D.33BC计算计算74.75D = ( )B = ( )Q = ( )H1001010.11112.64A.C2829 30(1 1)逻辑数据的表示)逻辑数据的表示 “ “真真”“”“假假”、 “是是”“”“非非”、 “

6、“对对”“”“错错”、 “有有”“”“无无”(2 2)逻辑运算)逻辑运算 逻辑非逻辑非 逻辑与逻辑与 逻辑或逻辑或31逻辑非逻辑非 0 = 1 1 = 00 = 1 1 = 0与或非与或非32逻辑与逻辑与:用:用“ANDAND、”表示表示 运算规则:运算规则: 0 0 1 = 0 1 1 = 0 1 0 = 0 0 = 0 0 0 0 = 0 1 0 = 0 1 1 = 1 1 = 1当两个逻辑量同时为真时当两个逻辑量同时为真时, ,结果才为真。结果才为真。33逻辑或逻辑或: : 用用“OROR、+ +、”表示表示运算规则:运算规则: 0 + 1 = 1 1 + 0 = 10 + 1 = 1

7、1 + 0 = 1 1 + 1 = 1 0 + 0 = 0 1 + 1 = 1 0 + 0 = 0 当两个逻辑量只要有一个为当两个逻辑量只要有一个为真时,结果才为真。真时,结果才为真。34举例:举例:求:求:10011010 11110000?10011010111100001111101035练习练习计算计算0101100110100111= ( ) 0000000136任何数据在计算机内都采用任何数据在计算机内都采用表示。表示。2. 为了解决数值数据的表示范围问题,引入数为了解决数值数据的表示范围问题,引入数据的据的和和。37数据定点表示的两种形式:数据定点表示的两种形式:(1) 如规定小

8、数点隐含在有效数字的最后,则如规定小数点隐含在有效数字的最后,则 说明表示的是说明表示的是整数整数。在计算机中并不能表示出小数点和小数点的位置,在计算机中并不能表示出小数点和小数点的位置,而是必须人为地做出规定。而是必须人为地做出规定。说明说明(2) 如规定小数点隐含在有效数字的最前面,则如规定小数点隐含在有效数字的最前面,则 说明表示的是说明表示的是纯小数纯小数。小数点小数点小数点小数点小数点的位置固定小数点的位置固定38例如,二进制数例如,二进制数0101110101011101的两种表示:的两种表示:(1) 如规定小数点隐含在有效数字的最后,则其如规定小数点隐含在有效数字的最后,则其表示

9、表示: 1011101(2)如规定小数点隐含在有效数字的最前面,则如规定小数点隐含在有效数字的最前面,则其表示其表示: 0.1011101 39取值范围:取值范围:v 8 8位位 0 0255(2255(28 81)1)v 16 16位位 0 065535(265535(216161)1)v 32 32位位 0 02 232321 1 找出最大值和最小值找出最大值和最小值 考试中经常出现考试中经常出现40 有符号整数:有符号整数:( (表示正整数,负整数表示正整数,负整数) )其余各位用来表示数值的大小其余各位用来表示数值的大小例如:例如: 0 00101011=0101011=43 , 43

10、 , 1 10101011=0101011=4343符号位:符号位:使用最高位使用最高位( (最左面的一位最左面的一位) )作为符号位作为符号位 “0 0”-“”( (正数正数) ) “1 1”-“”( (负数负数) ) 可以采用不同的方法可以采用不同的方法来来表示有符号整数。表示有符号整数。41举例举例1 1 假设只用假设只用8 8位二进制位二进制来表示一个整数,求来表示一个整数,求+7和和-7 的原码。的原码。 解:解: 7 原原 表示方法规定:表示方法规定:最高位作为符号位最高位作为符号位, ,其余各位代其余各位代表数值本身的绝对值表数值本身的绝对值( (以二进制表示以二进制表示) )。

11、0000011110000111 7 原原用用XX原原表示表示X X的原码的原码42 +1原原= +127原原= -1原原= -127原原=绝对值相同的正数和负数,绝对值相同的正数和负数,它们除了它们除了外,外,。00000001100000010111111111111111总结一下:总结一下:43举例举例2 2:假设用:假设用8 8位二进制来表示一个数,求位二进制来表示一个数,求0 0的原码。的原码。解:根据原码的定义:解:根据原码的定义:+0原原=-0原原=结论:结论:0的原码不唯一的原码不唯一分析:当由数轴的左端趋向分析:当由数轴的左端趋向0 0时,我们记为时,我们记为 -0-0 当由

12、数轴的右端趋向当由数轴的右端趋向0 0时,我们记为时,我们记为 +0+0+0-00 0000000000000001 10000000000000044假设用假设用8 8位二进制位二进制表示一个数表示一个数 用原码表示的最小值为:用原码表示的最小值为: -127 -127 ,其原码为,其原码为1 111111111111111 用原码表示的最大值为:用原码表示的最大值为: +127 +127 ,其原码为,其原码为0 011111111111111所以,原码的表示范围为:所以,原码的表示范围为: 127 127 +127 +127 原码的表示范围:原码的表示范围:45解:解: 7 反反 7 反反

13、 表示方法规定:表示方法规定:1.1.一个数如果值为一个数如果值为正正,则它的反码,则它的反码与原码相同与原码相同。2.2.一个数如果值为一个数如果值为负负,则将其符号位置为,则将其符号位置为1 1,其,其余各位为对原码的相应数据位余各位为对原码的相应数据位取反取反。举例举例1: 假设只用假设只用8 8位二进制位二进制来表示一个整数,求来表示一个整数,求+7和和-7的反码的反码000001111111100046举例举例2 2:假设用:假设用8 8位二进制来表示一个数,求位二进制来表示一个数,求0 0和和0 0的反码。的反码。解:根据反码的定义:解:根据反码的定义:+0反反=-0反反=结论:结

14、论:0的反码不唯一的反码不唯一0 0000000000000001 11111111111111147假设用假设用8 8位二进制位二进制表示一个数表示一个数 用反码表示的最小值为:用反码表示的最小值为: -127 -127 ,其反码为,其反码为1 100000000000000 用反码表示的最大值为:用反码表示的最大值为: +127 +127 ,其原码为,其原码为0 011111111111111所以,反码的表示范围为:所以,反码的表示范围为: 127 127 +127 +127 反码的表示范围:反码的表示范围:与原码是一致的与原码是一致的48应用补码的原因:应用补码的原因: 通过对负数的适当

15、处理,把减法转化为加法。不论通过对负数的适当处理,把减法转化为加法。不论求和求差,也不论操作数为正为负,运算时一律只做加求和求差,也不论操作数为正为负,运算时一律只做加法,从而大大简化加减运算。法,从而大大简化加减运算。表示方法规定表示方法规定: 1. 正正数的补码、反码、原码数的补码、反码、原码相同相同。 2. 对于对于负负数的补码,则将其数的补码,则将其最高位置为最高位置为 1,其余各位为对原码的相应数据位其余各位为对原码的相应数据位取反取反,然后再对,然后再对整个数整个数加加1。49举例举例1 1 假设只用假设只用8 8位二进制来表示一个整数,求位二进制来表示一个整数,求+7+7和和-7

16、-7的补码的补码解:解: 7 补补000001117 补补 11110001+11111100150补充:补充: 对负数来说,对负数来说,对补码再求一次补,对补码再求一次补,会得到该数的原码。(会得到该数的原码。( -128 补补不不适合此规律)适合此规律)已知补码为:已知补码为:1111101011111010 10000101 10000101 + 1+ 1 1000011010000110 (-6-6) 51注意:零的补码表示是唯一的注意:零的补码表示是唯一的举例举例2 2 假设只用假设只用8 8位二进制来表示一个整位二进制来表示一个整数,求数,求0 0和和0 0的补码表示的补码表示0

17、补补000000000 补补为为11111111 1000000001进位自然舍去进位自然舍去故故 : 0 补补00000000= 0 补补52举例举例3: 假设只用假设只用8 8位二进制位二进制来表示一个整数,求来表示一个整数,求的值的值 解解 : 7 补补00000111 6 补补11111010 00000111+ 11111010 100000001进位自然舍去进位自然舍去53127 (01111111)原码、反码、补码的表示范围:原码、反码、补码的表示范围: 若一个数值数据的长度(包括符号位)为若一个数值数据的长度(包括符号位)为一个字节,则它表示的整数的范围为:一个字节,则它表示的

18、整数的范围为:原码原码:-127 (11111111)反码:反码:-127 (10000000)补码补码:最小值最小值最大值最大值128 系统规定其补码为:系统规定其补码为: 10000000127 (01111111)127 (01111111)548位二进制位二进制代码代码无符号整数无符号整数原码原码补码补码0000 00000000000 00011110111 11111271271271000 000012801281000 000112911271111 1111255127155 BCD BCD整数(整数(Binary Coded DecimalBinary Coded Deci

19、mal) 称为称为“二进制编码的十进制整数二进制编码的十进制整数” 例如:例如:( (5151) )BCD BCD 1 1 01010101 0001 0001 ( (3276732767) )BCD BCD 0 0 00110011 00100010 01110111 01100110 01110111 使用使用表示表示1 1个十进制数字,最高位仍为个十进制数字,最高位仍为符号位。也称符号位。也称。56举例:举例:很多高级程序语言,数值型数据都可以写成如下形式很多高级程序语言,数值型数据都可以写成如下形式4.32E-5 表示表示 4.32 10 -5 =0.00004320.432E-1 表

20、示表示 0.432 10 -1 =0.0432浮点表示浮点表示与十进制中的科学计数法,两者很类似,但又不同与十进制中的科学计数法,两者很类似,但又不同为什么要引入浮点数?为什么要引入浮点数? v 在一定字长下,整数数值的表示范围有限;在一定字长下,整数数值的表示范围有限;v 实际的数据往往有整数部分又有小数部分;实际的数据往往有整数部分又有小数部分;v 实际数据有的特别大实际数据有的特别大 ,有的特别小。,有的特别小。小数点的位置不固定小数点的位置不固定57通常隐含为通常隐含为 必须是二进制必须是二进制,位数决定数的,位数决定数的必须是二进制必须是二进制,位数决定数的,位数决定数的 基数基数尾

21、数尾数在一般数据的浮点表示法中,一个数可表示成:在一般数据的浮点表示法中,一个数可表示成: N N M M R RE E 阶码阶码58回忆:二进制数回忆:二进制数0101110101011101的两种表示:的两种表示:(1) 如规定小数点隐含在有效数字的最后,则其如规定小数点隐含在有效数字的最后,则其表示表示: 1011101(2)如规定小数点隐含在有效数字的最前面,则如规定小数点隐含在有效数字的最前面,则其表示其表示: 0.1011101 59= -(26.5)10 例例1:假设某机器字长为:假设某机器字长为16位,规定前位,规定前6位表示阶位表示阶码(包括阶码符号码(包括阶码符号,原码表示

22、),后原码表示),后10位表示尾数位表示尾数(包括尾数符号(包括尾数符号,原码表示),则:原码表示),则: 0001011110101000表示的浮点数是,表示的浮点数是,-(0.110101)22 (101) 2= (-11010.1)2 0 00101 1 110101000阶码阶码尾数尾数符号位符号位60 +(0.078125)10 例例2:假设数值数据的长度为:假设数值数据的长度为16位,其中前位,其中前4位为位为阶码(包括阶码符号,原码表示),后阶码(包括阶码符号,原码表示),后12位为尾位为尾数(包括尾数符号,原码表示),数(包括尾数符号,原码表示),则:则:10100010100

23、00000 表示的浮点数是表示的浮点数是 D 。1010 001010000000+(0.0101)2符号位符号位 +(0.000101)2 N N M M R RE E 2 -(10) 2阶码阶码尾数尾数61复复 习习假设用假设用8位二进制来表示一个数,计算:位二进制来表示一个数,计算: -12 原原 = -12 反反 = -12 补补 = 100011001111001111110100某存储单元中的机器码某存储单元中的机器码0110110001011100表表示一个浮点数,该浮点数的阶码为示一个浮点数,该浮点数的阶码为4位(含阶符位(含阶符1位,补码表示),尾数位位,补码表示),尾数位1

24、2位(含数符位(含数符1位,位,补码表示),则与该浮点数等值的十进制数补码表示),则与该浮点数等值的十进制数是是 。-29.125D62汉字在计算机汉字在计算机中如何表示?中如何表示?西文在计算机西文在计算机中如何表示?中如何表示?63文字是人与计算机进行信息交流的主要媒体。文字是人与计算机进行信息交流的主要媒体。文字的基本元素文字的基本元素 字符字符字符在计算机中采用字符在计算机中采用采用二进制编码表示。采用二进制编码表示。n西文字符编码西文字符编码n汉字编码汉字编码n汉字的输入输出汉字的输入输出n文本处理文本处理主要内容:主要内容:64(1)ASCII码码 ASCII码,即美国标准信息交换

25、码码,即美国标准信息交换码(American Standard Code for Information Interchange),使,使用用 个二进位对字符进行编码。个二进位对字符进行编码。想一想,想一想, ASCII码可以表码可以表示多少个不同的字符?示多少个不同的字符?其中:其中:v可打印字符可打印字符个,如常用字母、数字、标点符号;个,如常用字母、数字、标点符号;v控制字符控制字符个,不可直接显示或打印。个,不可直接显示或打印。650123456789ABCDEF0123456789ABCDEF想一想:想一想:v相邻的两个字母的相邻的两个字母的ASCII码值码值相差多少?相差多少?v小

26、写字母的小写字母的ASCII码值比同一码值比同一大写字母的大写字母的ASCII码值大多少?码值大多少?66 每个字符用标准规定的每个字符用标准规定的7 7位二进制数表示,位二进制数表示,在机内占一个字节(最高位为在机内占一个字节(最高位为0 0)。)。 如:如: 字符字符“A A”的的ASCIIASCII码为:码为: 字符字符“0 0”的的ASCIIASCII码为:码为: 0 02 2 或或(48)(48)1010、(60)(60)8 8、(30)(30)16162 2 或或(65)(65)1010、(101)(101)8 8、(41)(41)161667v会比较会比较ASCII字符的大小(按

27、其字符的大小(按其ASCII码值)码值) 空格空格 09 AZ azv会推算同组字符会推算同组字符ASCII码值码值 如如A的的ASCII值(十进制)为值(十进制)为65,则,则B、C的的ASCII值分别为值分别为66、6768(2)EBCDIC码码v说明说明: 有很多编码没有使用,保留做为扩充有很多编码没有使用,保留做为扩充v定义方式:用定义方式:用 位二进制数位表示一个字符位二进制数位表示一个字符的扩充的扩充 交换码。交换码。v特点特点: 每个字符对应一个字节每个字符对应一个字节, ,共共256256种。种。6970v国家标准局国家标准局 19811981年年v信息交换用汉字编码字符集信息

28、交换用汉字编码字符集,汉字,汉字交换码的国家标准。交换码的国家标准。v采用采用编码。编码。71第一部分:字母、数字和各种符号,包括第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共希腊字母、汉语拼音等共682个个(统称为(统称为GB2312图形符号)图形符号)第二部分:一级常用汉字,共第二部分:一级常用汉字,共3755个,按个,按汉语拼音排列汉语拼音排列第三部分:二级常用字,共第三部分:二级常用字,共3008个,按偏个,按偏旁部首排列旁部首排列v组成:组成:汉字汉字6763所有所有字符字符744572这是一个这是一

29、个,有有94行、行、94列列, 汉字在汉字在代码表中的位置用它所代码表中的位置用它所处的处的表示。表示。区号区号行号行号位号位号列号列号:例如:例如:“北北”字的区号字的区号17,位号,位号17是是17 17用用2个字节表示为:个字节表示为:00010001 0001000173GB2312-80字符集字符集74 为了避免冲突,每个汉字的区号和位号必为了避免冲突,每个汉字的区号和位号必须分别须分别。得到的代码称为汉字的。得到的代码称为汉字的“国标国标交换码交换码”。 信息通信中,汉字的区位码与通信使用的信息通信中,汉字的区位码与通信使用的控制码(控制码(00H00H1FH1FH)发生冲突。)发

30、生冲突。75“大大”字的区号字的区号2020,位号,位号8383 20 83 20 83 二进制表示为:二进制表示为:00010100 0101001100010100 01010011例如例如: :52 115 52 115 二进制表示为二进制表示为 0000 10100 0110100 01 100111001176 使表示使表示GB2312GB2312汉字的两个字节的最高位汉字的两个字节的最高位(b7)(b7)都置为都置为“1 1”。这种汉字编码称为。这种汉字编码称为GB2312GB2312汉汉字的字的“机内码机内码” 。 文本中的汉字与西文字符经常是混合在一文本中的汉字与西文字符经常是

31、混合在一起使用的,汉字信息如不予以特别的标识,它起使用的,汉字信息如不予以特别的标识,它与单字节的标准与单字节的标准ASCIIASCII码就会混淆不清。码就会混淆不清。77“大大”字的区号字的区号2020,位号,位号8383 20 83 20 83 二进制表示为:二进制表示为:00010100 0101001100010100 01010011例如例如: :52 115 52 115 二进制表示为:二进制表示为:00110100 0111001100110100 01110011 180 243 180 243 二进制表示为:二进制表示为: 0110100 0110100 1110011111

32、0011(B4F3HB4F3H)机器中存储机器中存储“大大”的真正编码!的真正编码!781995年颁布年颁布GBK,全称为,全称为汉字内码扩展规范汉字内码扩展规范;GBK每一个字符都采用每一个字符都采用表示;表示;共共23940个码位共收入个码位共收入21003个汉字和个汉字和883图形符号图形符号与与GB2312保持兼容;保持兼容;微软公司自微软公司自Windows95简体中文版开始,各种版本简体中文版开始,各种版本的中文操作系统均采用的中文操作系统均采用GBK代码。代码。 GB2312-80只有只有6763个汉字,使用时功能不够个汉字,使用时功能不够。79lGBKGBK编码区分三个部分编码

33、区分三个部分: :汉字区汉字区(2100321003个汉字)、个汉字)、图形符号区、用户自定义图形符号区、用户自定义区区 GBKGBK每一个字符都采用每一个字符都采用双字节双字节表示表示总体编码范围为:总体编码范围为:81814040H HH H,共,共2394023940个码位;个码位; 首字节范围:首字节范围:8181H HH H(二进制最高位为(二进制最高位为1 1);); 尾字节范围:尾字节范围:4040H HH H(二进制最高位可以为(二进制最高位可以为0 0或或1 1););80统一的多文本处理环境,实现全世界所有字统一的多文本处理环境,实现全世界所有字符在同一字符集中统一编码。符

34、在同一字符集中统一编码。UCS:ISO/IEC 10646 (通用多通用多8位编码字符集位编码字符集)Unicode:统一码或联合码,与:统一码或联合码,与UCS完全等同的工完全等同的工业标准业标准.编码空间极大(编码空间极大(4个字节),能容纳足够多个字节),能容纳足够多的各种字符集(的各种字符集(13亿字符)。亿字符)。81UCS-2为其子集,采用双字节编码,共有为其子集,采用双字节编码,共有字符字符49194个,其中包括:个,其中包括:欧洲及中东地区使用的拉丁字母、音节文字;欧洲及中东地区使用的拉丁字母、音节文字;各种标点符号、数学符号、技术符号、几何形各种标点符号、数学符号、技术符号、

35、几何形状、箭头及其他符号;状、箭头及其他符号;中、日、韩(中、日、韩(CJK)统一编码的汉字。)统一编码的汉字。4字节的字符编码使存储空间浪费严重。字节的字符编码使存储空间浪费严重。82与与GB2312和和GBK兼容兼容,向向UCS/Unicode过渡。过渡。信息交换用的基本图形字符及二进制编码的信息交换用的基本图形字符及二进制编码的十六进制表示,同时收录了主要的少数民族文字。十六进制表示,同时收录了主要的少数民族文字。在在GB2312和和GBK的基础上进行了扩充,的基础上进行了扩充,采用单字节采用单字节/双字节双字节/四字节三种方式编码,码位数四字节三种方式编码,码位数160多万。多万。83

36、GBK95GB231280GFF00FF00 FF00FF00 FF00FF27484汉字汉字21003汉字汉字6763汉字汉字GB2312-80GBK-95GB18030-2000这三者向下兼这三者向下兼容,但与容,但与Unicode不兼不兼容容8413461个汉字和符号个汉字和符号符号符号408个个常用汉字常用汉字5401个个次常用汉字次常用汉字7652个个通行于台湾、香港地区的一个繁体通行于台湾、香港地区的一个繁体字编码方案,俗称字编码方案,俗称“大五码大五码”。8586v拼音编码:拼音编码:如:智能如:智能ABCABC,紫光拼音,紫光拼音,搜狗拼音,谷歌拼搜狗

37、拼音,谷歌拼音音优点:易学优点:易学缺点:同音字引起的重码多,需增加选择操作缺点:同音字引起的重码多,需增加选择操作 键盘输入键盘输入v字形编码:字形编码:如:五笔字形法等如:五笔字形法等优点:重码少、输入速度较快优点:重码少、输入速度较快缺点:编码规则不易掌握缺点:编码规则不易掌握“大大”的的为为“da”想想为什么要对汉字想想为什么要对汉字进行编码才能输入?进行编码才能输入?87v文字识别的性能指标:文字识别的性能指标:识别精度和识别速度识别精度和识别速度v工作过程工作过程: : 在书写板上书写,书写板将笔尖在书写板上书写,书写板将笔尖的运动按时间采样的运动按时间采样, ,发送到计算机中,由

38、软件发送到计算机中,由软件进行识别,然后用该汉字(或符号)对应的代进行识别,然后用该汉字(或符号)对应的代码进行保存。码进行保存。v例如例如: : 汉王笔汉王笔 正确识别率正确识别率 95 90,速度,速度 12字字/秒秒v需求的配件:需求的配件:专用的书写板、笔专用的书写板、笔 联机手写汉字识别联机手写汉字识别(笔输入)(笔输入)88 使计算机具有人的听觉,使人机语音通讯中能使计算机具有人的听觉,使人机语音通讯中能听懂人类口述的语言。听懂人类口述的语言。 语音识别语音识别v分类(按照不同的应用及要求):分类(按照不同的应用及要求):小词汇量小词汇量/中词汇中词汇/大词汇量语音识别大词汇量语音

39、识别孤立词孤立词/连接词连接词/连续语音识别连续语音识别特定人特定人/限定人限定人/非特定人语音识别非特定人语音识别v目标目标:非特定人大词汇量的连续语音识别技术:非特定人大词汇量的连续语音识别技术89 脱机文字识别脱机文字识别v分类分类: 印刷体印刷体OCR 手写体手写体OCR 对已经印刷或写完的文字进行识别,对已经印刷或写完的文字进行识别,计算机并转换为数字文本形式的一种技术,也叫做计算机并转换为数字文本形式的一种技术,也叫做OCR(Optical Character Recognition)。)。v手写体手写体OCR的关键问题:的关键问题: 用算法识别书写随机性带来的文字变化。用算法识别

40、书写随机性带来的文字变化。90汉字字形码汉字字形码v用于汉字在显示器或者打印机上输出。用于汉字在显示器或者打印机上输出。v按表示形式分类:按表示形式分类:点阵表示形式点阵表示形式矢量表示形式矢量表示形式汉字的输出过程:汉字的输出过程:根据字符的字体确定相应的字形库,根据字符的字体确定相应的字形库,按照该字符的代码从字型库取出相应的字形,生成映像按照该字符的代码从字型库取出相应的字形,生成映像再传送到显示器或打印机输出。再传送到显示器或打印机输出。91存储描述汉存储描述汉字轮廓特征的信息。字轮廓特征的信息。用点阵表示。用点阵表示。v一个点用一个二进制位表示一个点用一个二进制位表示v16*16、2

41、4*24、40*40v如如Windows中中TrueType技术技术v字形库:简称字库,同一种字字形库:简称字库,同一种字体的所有字符的形状描述信息体的所有字符的形状描述信息的集合。不同的字体对应不同的集合。不同的字体对应不同的字库。的字库。想一想:在想一想:在1616点阵字库中,存储点阵字库中,存储每个汉字的字形码每个汉字的字形码用几个字节?用几个字节?92输入码输入码机内码机内码字形码字形码汉字在机内的处理流程:汉字在机内的处理流程:总结总结93文本编辑的主要功能(了解)文本编辑的主要功能(了解)对字、词、句、段落进行添加、删除、修改等操作对字、词、句、段落进行添加、删除、修改等操作字的处

42、理:设置字体、字号、字的排列方向、间距、颜色、字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等效果等段落的处理:设置行距、段间距、段缩进、对称方式等段落的处理:设置行距、段间距、段缩进、对称方式等页面布局的处理:设置页边距、每页行列数、分栏、页眉、页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等页脚等“所见即所得所见即所得”(What You See Is What You Get, What You See Is What You Get, 简称简称WYSIWYGWYSIWYG)94文本处理内容(了解):文本处理内容(了解):字数统计,字频统计,简字数统计,字频统计,简/ /繁体相互转换,繁体相互转换,汉字汉字/ /拼音相互转换拼音相互转换词语排序,词语错误检测,文句语法检查词语排序,词语错误检测,文句语法检查自动分词,词频统计,词性标注,词义辨识,自动分词,词频统计,词性标注,词义辨识,大陆大陆/ /台湾术语转换台湾术语转换文本压缩,文本加密,文本著作权保护文本压缩,文本加密,文本著作权

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论