数字媒体及应用课件_第1页
数字媒体及应用课件_第2页
数字媒体及应用课件_第3页
数字媒体及应用课件_第4页
数字媒体及应用课件_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章 数字媒体及应用5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用5.4 数字视频及应用5.1 文本与文本处理 5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类与表示5.1.4 文本编辑、排版与处理*5.1.5 文本的展现 5.1.1 字符编码 西文字符的编码ASCII码西文字符由拉丁字母、数字、标点符号以及一些特殊符号所组成ASCII码是西文字符在计算机中的常用编码方案美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码):ASCII字符集包含96个可打印字符和32个

2、控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII 字符标准ASCII字符集及其码表 b6 b5 b4 b3 b2 b1 b0 012345670 1 2 3 4 5 6 7 8 9 A B C D E Fb6b5b4b3b2b1b00 1 1 01 0 01 1 01 0 1 1汉字如何编码?汉字的特点数量大;多个国家和地区使用;字形复杂,同音字多如何编码?确定收入多少字、哪些字?汉字在字符集中的应怎样排序?确定使用的代码结构和代码空间常用的汉字编码字符集国家标准GB2312汉字扩充规范 GBK国家标准GB18030台湾地区的标准汉字字符集CNS 11643 (BIG 5,

3、俗称“大五码”)日本工业标准汉字字符集JIS X 0208-90韩国国家标准汉字字符集KSC 5601-87一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号 19423位号 191655568794区 号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布信息交换用汉字编码字符集基本集GB2312-1980GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码”(注:区位码仅用于在键盘上输入汉字

4、)GB2312汉字的编码GB2312汉字的机内码每一个GB2312汉字使用16位(2个字节)表示每个字节的最高位均为“1”输入码字形码机内码汉字区位码机内码转换(1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)A0A0H机内码 ; 例子本1730学4907标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)27 000多汉字(包括GBK汉字和CJK及其扩充中的汉字)包含10万字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1” 双字节存储和表示,第1个字

5、节的最高位必为“1”部分双字节、部分4字节表示 UTF-8单字节可变长编码 UTF-16双字节可变长编码兼容性编码不兼容!几种汉字编码的对比GBK00 FF00FF21003汉字00 FF00FF6763汉字GB231200 FF00FF27484汉字GB18030编码保持向下兼容5.1.2 文本准备 文稿如何输入计算机 文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等(3)字形编码,如五笔字形和表形码等, (4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法文字符号输入

6、计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高文字符号输入计算机的方法印刷体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能文字符号输入计

7、算机的方法印刷体识别手写体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入 技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!5.1.3 文本的分类与表示简单文本(纯文本 ) 本 书 由 南 京 大 学 出 B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7 B3 F6 版 社 ( P u b l i s h i n g B0 E6 C9 E7 28 50 75 62 6C 69 73 68 69 6E 67 H o u s e o f N a n j i n 20 48 6F 75 73 65 20 6F 66 20 4E 61

8、 6E 6A 69 6E g U n i v e r s i t y ) 出 版 67 20 55 6E 69 76 65 72 73 69 74 79 29 B3 F6 B0 E6 文本的内容文本在计算机中的表示 没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例:丰富格式文本 有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”超文本若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本”ABCDEFGHa1 a2b2c2 f1d1c1 b1e1g1h1a3“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分 超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频 5.1.5 文本的展现(输出)文本的展现(输出)使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论