文本的信息加工_第1页
文本的信息加工_第2页
文本的信息加工_第3页
文本的信息加工_第4页
文本的信息加工_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工4.1 4.1 文本信息加工文本信息加工文字及其处理技术文字及其处理技术4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工 结绳说结绳说 图画说图画说 仓颉造字说仓颉造字说1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。文字是人类为了更加流畅地表述意义、传递经验而发明的工具。4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工一、文字及其处理技术体验文字处理技术字母文字以字母拼写方法的不同表达不同的含义象

2、形文字使用自身的“形”直接昭示其含义汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字的造字法有四种:象形、指事、会意、形声。汉字的造字法有四种:象形、指事、会意、形声。4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工象形4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工这是一个指事字。从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。 指事4251 10011 0010 1010 11

3、01 0001 0100 1011文本的信息加工金文明为日月幷照之会意字。 会意东巴文字东巴文字现代活着的象形文字现代活着的象形文字4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工云南云南 纳西族纳西族 东巴文字东巴文字猜猜看,上面的象形文字究竟表示什么意思?4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工一、体验文字处理技术一、体验文字处理技术1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。文字是人类为了更加流畅地表述意义、传递经验而发明的工具。甲骨文甲骨文 殷周时代金文金文 西周、春秋战

4、国文字战国文字 春秋战国小篆小篆 秦朝隶书隶书 秦朝楷书楷书 东汉行书行书 南北朝草书草书 西汉印刷字体印刷字体 宋朝4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工2 书法是一种凝结了我国民族文化精髓的特殊的艺术形式书法是一种凝结了我国民族文化精髓的特殊的艺术形式兰亭集序(局部) 晋王羲之4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工徐冰徐冰方块英文方块英文将将26个字母改造成类似中国汉字的偏旁部首个字母改

5、造成类似中国汉字的偏旁部首Art For The People4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工一、文字及其处理技术一、文字及其处理技术历史上使用的文字处理技术历史上使用的文字处理技术, ,请按时请按时间顺序排列:间顺序排列: 活字印刷;活字印刷;机械式打字机;机械式打字机;手写;手写;雕版印刷;雕版印刷; 刻字;刻字;计算机文字处理计算机文字处理手写手写刻字刻字雕版印刷雕版印刷活字印刷活字印刷机械式机械式打字机打字机计算机计算机文字处理文字处理从古代的到现在从古代的到现在4251 10011 0010 1010 1101 0001

6、0100 1011文本的信息加工计算机文字处理计算机文字处理只能处理英文可处理包括象形文字在内的任何文字如何在计算机中处理汉字?如何在计算机中处理汉字?4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工Ti yan qing jing : pin yin yu han zi 体验情境:体验情境:拼音与汉字村居村居 (清) 高 鼎 草长莺飞二月天,草长莺飞二月天, 拂堤杨柳醉春烟。拂堤杨柳醉春烟。 儿童散学归来早,儿童散学归来早, 忙趁东风放纸鸢。忙趁东风放纸鸢。 4251 10011 0010 1010 1101 0001 0100 1011文本的信

7、息加工计算机文字处理技术发展计算机文字处理技术发展只能处理拉丁字母只能处理拉丁字母以及一些控制符号以及一些控制符号过去可处理包括象形文可处理包括象形文字在内的任何文字字在内的任何文字现在ASCII码(美国标准信息交换码),可以表示码(美国标准信息交换码),可以表示128个字符个字符GB2312(1980年年)一共收录了一共收录了7445个字符个字符Big5(1984), 一共收录了一共收录了13060个字符个字符GBK1.0 (1995),收录了收录了21886个符号个符号GB18030 (2000),收录了收录了27484个汉字和主要的少数民族文字个汉字和主要的少数民族文字Unicode(

8、1994,统一码、万国码),它为每种语言中的每,统一码、万国码),它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。跨平台进行文本转换、处理的要求。 小结:小结: 从从ASCII、GB2312到到GBK1.0、GB18030 ,这些编码方法是向下兼,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。多的字符。在这些编码中,英文和中文可以统一地处理

9、。4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工中文信息处理技术发展简史中文信息处理技术发展简史 20世纪世纪80年代初,年代初,CCDOS成为我国第一个汉字操作系统;成为我国第一个汉字操作系统; 1983年,年,“王码五笔字型王码五笔字型”输入法,突破了汉字数字化的瓶颈;输入法,突破了汉字数字化的瓶颈; 1984年,联想公司成立并推出联想汉卡;年,联想公司成立并推出联想汉卡; 1985年年5月,北大方正研制的激光照排月,北大方正研制的激光照排II型机,迎来了印刷业型机,迎来了印刷业“告别铅与火,迈入光与电告别铅与火,迈入光与电”的时代;的时代;

10、 1989年年9月,金山公司发布了中文字处理系统月,金山公司发布了中文字处理系统WPS 1.0; 1992年,年,PTDOS 1.0;1993年年10月发布月发布UCDOS 3.0;1994年到年到1997年先后开发出年先后开发出UCDOS 3.1UCDOS 7.0; 1993年年Windows 3.2发布,这是第一个简体中文版的发布,这是第一个简体中文版的Windows操操作系统,此后作系统,此后Windows及其中文版本不断升级;及其中文版本不断升级; 1999年,中国新一代的国产操作系统年,中国新一代的国产操作系统红旗红旗Linux推出。推出。4251 10011 0010 1010 1

11、101 0001 0100 1011文本的信息加工汉字的编码汉字的编码输入码输入码(外码)(外码)机内码机内码(内码)(内码)输出码输出码(字型码)(字型码)用于输入汉字的编码用于输入汉字的编码用于存储汉字的编码用于存储汉字的编码用于输出汉字的编码用于输出汉字的编码字模字模1616,2424宋体、楷体、隶书等宋体、楷体、隶书等区位码区位码 :6625全拼编码:全拼编码:chun五笔字型:五笔字型:dw春春用机内码用机内码表示、存储表示、存储如国标码如国标码(GB)和和BIG5码码用汉字字型用汉字字型输出汉字输出汉字(音码、形码、混合码音码、形码、混合码)智能智能ABC,五笔字型等,五笔字型等宋

12、体 楷体春4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工问题情境:问题情境:丁丁是高一(18)班长,开学时要安排值日表,丁丁的计算机基础较好,于是就想通过电脑编制这个表格,以后修改更方便。可是,在他输入学生姓名的的时候,碰到了几个姓名怎么输也输不进去,你能帮他解决这个问题吗? 4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工汉字的编码汉字的编码 输入码(外码):输入码(外码): 用于输入汉字,如区位码、拼音码、王用于输入汉字,如区位码、拼音码、王码(五笔字型)、自然码等。码(五笔字型)、自然码等。 机

13、内码(内码):机内码(内码): 用于储存汉字,如国标码(用于储存汉字,如国标码(GB)、)、BIG5码等。码等。 4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工汉字的编码汉字的编码 输出码(字型码):输出码(字型码): 字模(点阵、向量)字模(点阵、向量) 00010000 00010000 储存这个字型码需要储存这个字型码需要88=64位二进制,位二进制,即即8个字节(个字节(1字节字节=8位二进制)位二进制)4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工补充说明:二进制补充说明:二进制 一个二进

14、制数的值:一个二进制数的值: 0 1 0 0 1 0 1 04251 10011 0010 1010 1101 0001 0100 1011文本的信息加工 bit(位位)、 Byte(字节字节):8b=1B 1KB(千字节千字节)=1024B 1MB(兆字节兆字节)=1024KB 1GB(千兆字节千兆字节)=1024MB补充说明:补充说明:计算机存储容量单位及换算:计算机存储容量单位及换算:4251 10011 0010 1010 1101 0001 0100 1011文本的信息加工体验文字处理技术体验文字处理技术汉字的编码汉字的编码文字文字及其及其处理处理技术技术输出码输出码(字型码字型码)汉字的输出汉字的输出机内码机内码(内码内码)汉字的存储汉字的存储输入码输入码(外码外码)汉字的输入汉字的输入书法是一门凝结了我国民族文化精髓的艺术书法是一门凝结了我国民族文化精髓的艺术汉字的创造饱含民族的智慧汉字的创造饱含民族的智慧文字的发明是为了更流畅地表述意义、传递经

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论