信息的编码PPT课件_第1页
信息的编码PPT课件_第2页
信息的编码PPT课件_第3页
信息的编码PPT课件_第4页
信息的编码PPT课件_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息的编码信息的编码汉字的编码汉字的编码信息的编码信息的编码汉字有多少?汉字有多少? 说文解字说文解字(公元(公元100100年)收年)收93539353字;字; 声类声类(227227239239年)收年)收1152011520字;字; 玉篇玉篇(543543年)收年)收2272622726字;字; 唐韵唐韵(751751年)收年)收2619426194字;字; 类篇类篇(10661066年)收年)收3131931319字;字; 字汇字汇(16151615年)收年)收3317933179字;字; 康熙字典康熙字典(17161716年)收年)收4703547035字;字; 中华大字典中华大字典

2、(19151915年)收年)收4800048000字;字; 中文大字典中文大字典(19681968年)收年)收4990549905字;字; 汉语大字典汉语大字典(19861986年)收年)收5600056000字。字。汉汉字字编编码码 由于汉字是象形文字,字的数目很多,由于汉字是象形文字,字的数目很多,常用汉字就有常用汉字就有3000300050005000个,加上汉字个,加上汉字的形状和笔画多少差异极大,因此,不的形状和笔画多少差异极大,因此,不可能用少数几个确定的符号将汉字完全可能用少数几个确定的符号将汉字完全表示出来,像英文那样将汉字拼写出来。表示出来,像英文那样将汉字拼写出来。 汉字必

3、须以独特的编码(每个汉字一个汉字必须以独特的编码(每个汉字一个编码),实现二进制代码表示。由于汉编码),实现二进制代码表示。由于汉字数量多,用一个字节是无法表示的,字数量多,用一个字节是无法表示的,所以汉字需要用所以汉字需要用多个字节多个字节表示。表示。汉汉字字编编码码处理汉字信息需要解决的几个问题:处理汉字信息需要解决的几个问题: 1 1、怎样将汉字输入计算机?、怎样将汉字输入计算机? 2 2、在计算机之间怎样交换汉字信息?、在计算机之间怎样交换汉字信息? 3 3、在计算机内部怎样处理汉字?、在计算机内部怎样处理汉字? 4 4、计算机如何实现汉字信息的输出?、计算机如何实现汉字信息的输出?汉

4、汉字字编编码码1 1、汉字输入、汉字输入输入码输入码(外码)(外码)输输入入汉汉字字有有两两种种方方法:法:自动识别方式自动识别方式汉字字型自动识别汉字字型自动识别汉字语音自动识别汉字语音自动识别将汉字编码输入将汉字编码输入音码音码形码形码形音码形音码音形码音形码利用汉字的音或形进行编码利用汉字的音或形进行编码(拼音码)(拼音码)(五笔字型码)(五笔字型码)输入码(外码)输入码(外码)(郑码)(郑码)汉汉字字编编码码2、汉字信息的交换、汉字信息的交换 为了方便数字系统之间汉字为了方便数字系统之间汉字信息通信交换的需要,信息通信交换的需要,1981年,年,国家颁布了编号为国家颁布了编号为GB23

5、1280标准标准信息交换用汉字编码及字信息交换用汉字编码及字符集符集,这种汉字交换用的代码,这种汉字交换用的代码又称区位码。又称区位码。交换码交换码区位码区位码交换码(区位码)交换码(区位码):9494矩阵方式排列矩阵方式排列计算机中采用计算机中采用2个字节来储存区位码,个字节来储存区位码,第一个字节标记区码,最高位是第一个字节标记区码,最高位是“0”。第二个字节标记位码,最高位是第二个字节标记位码,最高位是“0”。汉汉字字编编码码汉汉字字编编码码汉字的内部处理汉字的内部处理处理码(内码)处理码(内码) 处理码处理码计算机内部用于存储、加工处计算机内部用于存储、加工处理、传输统一使用的代码。理

6、、传输统一使用的代码。处理码连续两个字节的最高位分别置为处理码连续两个字节的最高位分别置为1处理码占用处理码占用2个字节个字节(作为中英区分标志)(作为中英区分标志)字形码 字形码:汉字字库中存储的汉字字形的数字化字形码:汉字字库中存储的汉字字形的数字化信息,用于汉字的信息,用于汉字的显示和打印显示和打印 点阵方式:汉字字形点阵的代码,每个点的虚点阵方式:汉字字形点阵的代码,每个点的虚实来表示汉字的轮廓,实来表示汉字的轮廓,1616或或2424个点,个点,点阵字库汉字最大的缺点是不能放大,一旦放点阵字库汉字最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。一个汉字方块大后就会发现文字边缘

7、的锯齿。一个汉字方块中行数、列数分得越多,描绘的汉字也就越细中行数、列数分得越多,描绘的汉字也就越细微,但占用的存储空间也就越多。微,但占用的存储空间也就越多。字形码 矢量方式:保存的是对每一个汉字的描述信息,矢量方式:保存的是对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度比如一个笔划的起始、终止坐标,半径、弧度等等。在显示、打印这一类字库时,要经过一等等。在显示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可以被无限地放大,笔划库保存的汉字理论上可以被无限地放大,笔划轮廓仍然能保持圆滑。轮廓仍然能保持圆滑。 交换码(区位码):为了方便各种数字系统之交换码(区位码):为了方便各种数字系统之间的汉字信息的交换制定的标准。规定汉字收间的汉字信息的交换制定的标准。规定汉字收集数量、排列顺序。集数量、排列顺序。 处理码(内码):计算机内部实际存储每个汉处理码(内码):计算机内部实际存储每个汉字的编码。字的编码。 输入码(外码):

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论