2计算机导论非数值信息的表示_第1页
2计算机导论非数值信息的表示_第2页
2计算机导论非数值信息的表示_第3页
2计算机导论非数值信息的表示_第4页
2计算机导论非数值信息的表示_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第2 2章非数值信息的表示章非数值信息的表示要求要求v了解数据类型了解数据类型v数据在计算机内部的表示形式数据在计算机内部的表示形式v理解不同类型数据机内表示的异同理解不同类型数据机内表示的异同通用计算机:可编程的数据处理机 计算机的基本功能是对数据进行运算和加工处理。数据有两种,一种是数值数据,如3.1416、-2.71828,另一种是非数值数据(信息),如A,b, 。无论哪一种数据在计算机中都是用二进制数码表示的。数值处理采用二进制运算;非数值处理采用二进制编码,它们具有运算简单、电路实现方便、成本低廉等优点。Data Types)Data Types)Data Types)Data T

2、ypes)u工程应用程序主要处理数值:算术运算;求解代数三角方程;求解微分方程等。u文字处理程序主要处理文字:调整对齐、移动删除等。u图像处理程序主要处理图像:创建,缩小,放大和旋转等。u计算机还可以处理音频:播放音乐,输入声音。u计算机也可以处理视频:播放电影,创建电影特效等。Data Types)Data Types)计算机使用术语“多媒体”来定义包含数值,文本,图像,音频,视频的信息。 为了处理不同类型的数据“多媒体”,现代冯诺依曼模型通用计算机必须采用统一的机内表示法比特序列教材术语:位模式。u位(bit,binary digit的缩写)0/1 一个双稳态元件u位模式(bit patt

3、ern)原因冯诺依曼模型“采用二进制”设计理念数据01数串,比特序列,位流,位模式 多个双稳态元件字节(Byte)长度为8的位模式。1Byte=8bits比特,位(bit):最小的物理存储处理单位字节(Byte):最小的逻辑存储处理单位文本:语言中表示某种意思的符号集。例如:英语:26个大写字母(AZ)26个小写字母(az)10个数字字符(09)标点符号(. ? : ; !等)空格、换行和制表符(tab)等格式控制文本表示:一个文本一个位模式一个位模式 为了完整表示语言中符号,需要多少位的位模式?2N = Sum(符号集中符号的总数)-2481612825665,536-12347816为了交

4、流,通用计算机必须采用统一的编码标准代码。常用的字符编码标准:1.美国标准信息交换码ASCII 2.扩展的ASCII 3.Unicode 1ASCII码(American Standard Code for Information Interchange)是美国信息交换标准代码的简称。标准ASCII码为7位,占一个字节(最高位为0)。2ASCII码字符编码表 7位二进制数给出了128个编码,表示了128个不同的字符。其中95个字符可以显示,包括大小写英文字母、数字、运算符号、标点符号等。另外的33个字符,是不可显示的,它们是控制码,编码值为031和127 例 a的ASCII码为1100001(

5、b6 b5b4b0)表示成十六进制为61;回车符(CR)的ASCII码为0001101(b6 b5b4b0)表示成十进制为13ASCII字符(要记住)字符(要记住) 16进制数进制数字符字符16进制数进制数字符字符00Nul 空空20Sp 空格空格07Bel 铃铃7fDel 删除删除08Bs 退格退格30数字数字00aLf 换行换行41字母字母A0dCr 回车回车61字母字母a Unicode 32位 ,232 = 4294967296 分配给世界上不同语言符号 涵盖ASCII码音频(Audio):表示声音和音乐,是模拟数据。 连续数据如何转换为离散的数据数据然后采用位模式表示存储?采样,量化

6、,编码三步。1.采样:以相等的间隔来测量信号值2.量化:将数值整数化3.编码:转换为位模式存储各个采用的量化值。采样,量化,编码三个步骤。 位深度: 16,24,32位 位率:每样本位*每秒样本数 40000*16=640000 b/s=640 KB/s 声音编码标准:MP3, 每秒采样44100, 16位图像计算机机内的两种表示形式:位图(Bitmap graphic)(光栅图)矢量图(Vector graphic)位图:图像视为像素矩阵。 每个像素对应一个位模式。光栅图: 纯黑白: 像素位模式:1bit 非纯黑白: 真彩色 24位 JPEG 索引色 8位 GIF概念:解析度、色彩深度矢量图

7、:将图像分解为曲线和直线的组合,所有的曲线和直线采用图形学中数学公式表示,存储相关参数数值。优缺点:位图:放大会失真,产生锯齿现象。矢量图:便于缩放,各种转换,不失真汉字处理自学内容显示输出显示输出打印输出打印输出机内码向字形码转换机内码向字形码转换机内码机内码输入码向机内码转换输入码向机内码转换字符代码化(输入)字符代码化(输入)数字码数字码拼音码拼音码字形码字形码各种字母符号各种字母符号682个个二级字库二级字库 常用汉字常用汉字3008个个 一级字库一级字库 常用汉字常用汉字3755个个 GB2312-80GB2312-80国标码国标码合计合计74457445个个其中汉字其中汉字6763

8、6763个个GB2312-80GB2312-80规定规定, ,所有的国标汉字与符号组成一所有的国标汉字与符号组成一个个94949494的矩阵。矩阵中的每一行称为一个的矩阵。矩阵中的每一行称为一个“区区”, ,每一列称为一个每一列称为一个“位位”。因此共有。因此共有9494个个区(区号:区(区号:01019494)),),每区每区9494个位(位号:个位(位号:01019494)。)。 有了汉字内码以后,汉字在计算机内部就有了汉字内码以后,汉字在计算机内部就可以处理了,但要在英文键盘上输入汉字,就可以处理了,但要在英文键盘上输入汉字,就要用英文字母键及数字键序列对每一个汉字进要用英文字母键及数字

9、键序列对每一个汉字进行编码,这种为输入汉字而用键序列对汉字定行编码,这种为输入汉字而用键序列对汉字定义的编码就称为汉字输入码,或汉字外码。义的编码就称为汉字输入码,或汉字外码。2.利用语音识别技术利用语音识别技术1.利用汉字识别技术利用汉字识别技术 计算机自动识别汉字计算机自动识别汉字 智能智能ABC、微软拼音、微软拼音汉字输入方法汉字输入方法的实现途径的实现途径3.利用扫描识别技术利用扫描识别技术全拼、简拼、双拼全拼、简拼、双拼 五笔字型和区位码等五笔字型和区位码等人以手动方式输入人以手动方式输入 汉字的输出主要是指在输出设备上输出汉字的字型。汉字汉字的输出主要是指在输出设备上输出汉字的字型

10、。汉字是一种象形文字,每一个汉字都可看成是一个特殊的图形,这是一种象形文字,每一个汉字都可看成是一个特殊的图形,这种图形很容易用点阵来描述。所谓点阵就是把字符图形放在一种图形很容易用点阵来描述。所谓点阵就是把字符图形放在一个网状的方格内,再用黑白点(个网状的方格内,再用黑白点(有点的地方为有点的地方为“1”,空白的地,空白的地方为方为“0”)表现任何一个汉字。)表现任何一个汉字。 例如,可以将例如,可以将“杭杭”字画字画在右图所示的在右图所示的1616的方格上,的方格上,则则“杭杭”字的字形码是字的字形码是0001000010000、0001000001000000、0001000000000

11、000。即每一行。即每一行由由16位,共位,共16行组成一个汉字行组成一个汉字的字形码,即共需要二进制位的字形码,即共需要二进制位161616=25616=256位位=32=32字节字节,24,242424点阵需要点阵需要242424248=728=72个字节个字节1 4 8 12 16 点阵法点阵法向量(矢量)法向量(矢量)法构造汉字字型构造汉字字型有两种方法有两种方法 在计算机内处理的是汉字的内码,而在显示器、在计算机内处理的是汉字的内码,而在显示器、打印机上要输出的是汉字的字形,所以必须事先把全打印机上要输出的是汉字的字形,所以必须事先把全部的汉字字形都放在计算机内,并通过汉字处理系统部的汉字字形都放在计算机内,并通过汉字处理系统的专门处理程序自动把要输出的汉字内码转换成对应的专门处理程序自动把要输出的汉字内码转换成对应的汉字字形后输出。的汉字字形后输出。 全部汉字字形的集合称为汉字字形库(简称汉字库)全部汉字字形的集合称为汉字字形库(简称汉字库) 一级字库一级字库 常用汉字常用汉字3755

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论