版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机的数据与编码
一、数据存储单位
1.数据:对事实、概念或者指令的i种表示形式,可以由人工或者自动装置进行处
理。
(1)数据的形式:数字、文字、图形或者声音等。
(2)数据的分类:数值数据、非数值数据。
2.信息:经过解释赋予一定意义的数据。
(1)控制信息:指挥计算机的各种操作的指令。
(2)数据信息:计算机加工处理的对象。
注意:(1)计算机能识别和处理的只能是二进制数。
(2)计算机中有人读数据和机读数据两种状态。
3.位:一个二进制位称为比特(bit),,以b表示。一位可以表示0和1两种状态。
位是数据的最小单位,
4.字节:八个二进制位称为字节(Byte),以B表示。
字节是数据处理却数据存储的基本单位。
一个字节的8位二进制自左至右罗列,最左边为最高位,最右边为最低位。
换算公式:
1KB=1024B
1MB=1024KB=1024X1024B
1GB=1024MB=1024X1024KB=1024X1024X1024B=1073741824B
5.字与字长
(1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或者一组二
进制位称为字(Word)。
(2)字长:一个字中的字符数量或者二进制的位数称为字长。
1
字长决定计算机处理信息的速率,是计算机的一个重要性能指标。
(3)字的组成:一个字由若干个字节组成。
二、字符及其编码
1.字符集
字符:用来组织、控制或者表示数据的字母、数字及计算机能识别的其它符号。
字符集:为了某一目的而设计的一组互不相同的字符。
在微机系统中普遍采月的是有128个符号的键盘字符集,包括:
(1)10个十进制数码0-9
(2)52个大小写英文字母
(3)32个标点符号、专用符号、运算符号
(4)34个控制符
2.字符编码
字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。
由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问
题,因此都以国家标准或者国际标准的形式颁布施行。
目前在微型机中普遍采用的字符编码是ASCH码。
ASCII是英文AmericanStandardCodeforInformationInterchange的缩写,意为“美
国标准信息交换代码”。该编码后被国际标准化组织ISO(国际标准化委员会)采用,
作为国际通用的信息交换标准代码。
ASCH有7位版本和8位版本。
(1)7位ASCII码
用七位二进制数表示一个字符,由于27=128,所以可表示128个不同的字符,其
中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符
号及控制命令等。
注意:7位ASCH表示数的范围是0〜127
在微机中采用7位ASCII字符编码时,最高位b7恒为零,因此,一个字符的ASC
2
n码占一个字节位置。
(2)8位ASCII码
使用8位二进制数进行编码,这样可以表示256种字符。
当最高位恒为。时,编码与7位ASCII码相同,称为基本ASCII码。当最高位为1
时,形成扩充ASCII码。
通常,各国都把扩充ASCII码部份作为自己本国诺言字符代码。
常用ASCII码:
CRESCSP0AaDEL
二0001101001101101000000110000100000111000011111111
十132732486597127
十六0D1B203041617F
字符大小比较:按ASCII码值的大小进行比较。
CR(ESC<SP(空格)〈0〈......A<……a〈DEL
字符串大小比较:先比较第一个字符,若相同,再比较第二个字符,以此类推。
3.汉字编码
我国于1981年颁布了〈信息交换用汉字编码字符集一一基本集〉,即国家标准
GB2312-80o
基本集中共采集汉字和图形符号7445个,汉字6763个,分为两级。
一级汉字有3755个,属常用汉字,按汉字拼音字母顺序罗列;
二级汉字为3008个,属次常用汉字,按部首罗列。
图形符号682个。
规定:一个汉字用两个字节表示。
为了使中文信息与西文信息兼容,每一个字节的最高位用于区分汉字编码或者是
ASCII字符编码,因此汉字编码每一个字节只用低七位。
此外,由于每一个字节的低7位中还有34个控制字符编码,因此每一个字节只
能有128-34=94种状态可用于汉字编码。这样两个字节可以有94X94=8836种状态。
3
(1)区位码
GB2312-80基本字符集将汉字按规则排成94行,94歹山第一个字节用于表示区号,
第二个字节用于表示位号,因此,每一个汉字就有惟一的一个区号和一个位号,称为汉
字的区位码。
给定汉字编码表中的一个区号(十进制0「94)和位号(十进制01-94),则惟一
对应一个汉字或者图形符号。
例如:区号54,位号48(均为十进制),对应汉字为“中”。
区位码的安排:
01~15区:各种字母、数字及图形符号
16〜55区:一级汉字
56~87区:二级汉字
区位码是用十进制数表示的国标码,即国标BG2312-80中的区位编码,也可称为国
标区位码。
(1)国标码
将汉字区位码的区码和位码分别用十六进制数表示,然后再加之十六进制数2022
形成。
例:“中”的区位码为5448,表示成十六进制3630,再加之2022,则它的国标码
为5650。
国标码的主要作用是用于统一不同的系统之间所用的不同编码。通过将不同的系统
使用的不同编码统一转换成国标码,不同系统之间的汉字信息就可以相互交换。
4.汉字内码
计算机系统内部进行存储、加工处理、传输统一使用的代码,简称汉字内码或者机
内码。
不同系统使用的机内码可能不同,目前国内广泛使用的汉字内码是将国标码的两个
字节的最高位分别置为“1”形成。
即一个汉字在机器内部占两个字节,每一个字节的最高位恒为1。
汉字机内码=汉字国标码+8080H
=区位码+2022H+8080H
4
=区位码+AOAOH
加十六进制8080H的目的是将表示汉字国标码的两个字节的最高位分别置为“1”。
在计算机中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同
的输入码,进入系统后再统一转换成机内码存储。
5.汉字外码
为方便人工通过键盘键入汉字而设”的代码称为汉字输入码,又称为汉字外码。
(1)以国标GB2312-80为基准的区位码、国标码
(2)以汉字拼音为基础的拼音类输入法
(3)以汉字拼形为基础的拼形类输入法
(4)以汉字拼音和拼形结合为基础的音形类输入法
(5)在电信业中通用的电报码
6.汉字字形码
是指汉字字库中存储的汉字字形的数字化信息。
汉字是一种象形文字,每一个汉字都可以看成是一个特定的图形,这种图形可以用
点阵来描述。
用点阵来表示汉字,以16x16点阵为例,表明一个汉字图形有16行,每一行上有
16个点。一位二进制可以表示点阵中一个点的信息,因此用两个字节来存放每一行上的
16个点,并且规定某二进制位值“0”表示对应点为白,而“1”表示对应点为黑。由此可
知,一个16x16点阵的汉字字形需要用2x16=32个字节来存放。其它点阵的汉字可以
此类推。
汉字字形点阵有:16X16、24X24、32X32点阵等。随点阵数的不同,汉字字形码
的长度不同。例16X16点阵占32个字节,24X24点阵需72个字节。
汉字字形码又称为汉字输出码或者汉字发生器编码。
7.汉字字模
字模:即汉字字库中存放的汉字字形。字模与字形的概念没有严格区别。
字模可分为宋体字模、仿宋体字模、楷体字模、黑体字模。
5
字模按点阵大小可分为16X16点阵字模、24X24点阵字模等。点阵数越大,字形
质量越高。
8.汉字字库
汉字字库:汉字字形数字化后,以二进制文件的形式存储在存储器中,构成汉字字
形库或者汉字字模库,简称汉字字库。
汉字字库为汉字的输出设备提供字形数据,汉字字形的输出是将存储在汉字字库中
的相应字形信息取出,送到所指定的汉字输出设备上输出。
字库中汉字字形信息的存储方法:
(1)整字存储法
将汉字字形的点阵信息逐个字节存放在字形信息存储器中,需要输出时直接读出。
(2)压缩信息存储法
采用信息压缩办法,只存储汉字的压缩信息,使用时再还原成字形信息。
汉字字库存硬字库和软字库之分。
(1)硬字库
将汉字库固化在ROM或者EPROM中,称为硬字库。
(2)软字库
将汉字库存放在某种外设(软、硬盘)中,称为软字库。
要输出一个汉字时,首先根据该汉字的机内码找出其字模信息在字库中的位置,然
后取该汉字的字模信息作为图形在屏幕上显示或者打印机上打印输出。
三、计算机中数的表示
1.带符号数的表示
用0表示正数,用1表示负数,使数的符号数字化,符号和数一起进行存储和运算。
(1)符号位
位于数值最高位的左部,0表示正数,1表示负数。
如果用八进制位表示一个有符号的整数,则最高位为符号位,具体表示数值的惟独
七位,其最小数为(111为1111)2=(-127)10,最大数为(011数为1)2=+127O
如果用16进制位表示一个有符号的整数,除去最高位的符号位外,具体表示数值
6
的惟独15位,所能表示数的范围为(-32767,+32767)
显然,在表示一个数值时,使用的二进制位数越多,其表示数值的范围就越大。
例如:用八位二进制数表示+50和-50
(+50)10=(00110010)2(-50)10=(10110010)2
用十六位二进制数表示+513和-513
(+513)10=(0000001000000001)2(-513)10=(1000001000000001)2
显然,用八位二进制数无法表示513、-513。
(2)真值
真正表示数值大小的部份,并按普通书写规则表示的原值。
(3)机器数
在计算机中使用的,连同数符一起数码化了的数叫机器数。机器数表示的范围由计
算机字长决定。
如果数值越过机器所能表示的范围,运算就会因此出错而住手,称为“溢出
例:用8位二进制数表示+49和-49
十进制数+49-49
真值+0110001-0110001
机器数0011000110110001
机滞数也有不同表示方法,常用的有三种,即原码,补码和反码。
(1)原码
用最高位表示数符,0代表正数,1代表负数,数值部份为真值的绝对值,这种表
示方法称为原码。
例:
十进制+73-73+127-127+0-0
真值+1001001-1001001+1111111-1111111+0000000-0000000
原码010010011100100101111111111111110000000010000000
由上可知,数值0在原码中有两种形式:两种形式均当0处理
[+0]=00000000[-0]=10000000
(2)反码
正数的反码和原码相同,负数的反码是对该数的原码除符号位外各位求反(即0变
7
1,1变0)。用数学式子表示如下:
例:(+50)10原码=00110010反码=00110010(相同)
(-50)10原码=10110010反码=11001101(不同)
[+0]反=[黑+0]=00000000
[-0]=10000000,[-01=11111111
Ift反
注意:一个数反码的反码是原码本身。
(3)补码
正数的补码与原码相同,负数的补码则是该数的反码未位加1。
例:(+50)10原码=00110010=反码=补码
(-50)10原码=10110010
反码=11001101
补码=11001110
[+0](=00000000
[-0]=[-0]+1=11111111+1=100000000=00000000
反
由于字长限定为N位,因此最高位前面的1因表示不出来而丢失。从而保留下来的
结果与[+0]相同。所以计算机中普通都采用补码进行运算。
补
注意:负数补码的补码等于该负数的原码。即[[X]]=[X]
讣祚®
例:求下列数的原码、反码、补码.
十进制数+1-1+127-127+0-0
原码000000011000000101111111111111110000000010000000
反码000000011111111001111111100000000000000011111111
补码000000011111111101111111100000010000000000000000
(4)各种码的十进制数范围
二进制数无符号数原码反码补码
000000000+0+0+0
01111111127+127+127+127
10000000128-0-127-128
11111111255-127-0-1
范围0~255-127^+127-127〜+127-128^127
8
2.小数点的表示
由于计算机只能识别0和1,所以采用约定的方式表示小数点。在计算机中,小数
点通常有两种表示法:定点表示法与浮点表示法。
(1)定点数
规定小数点的位置固定不变,总是隐含在某个预定位置上。采用定点数表示法的计
算机称为定点计算机。
定点纯整数:将小数点固定在数的最低位之后(隐含,小数点不占二进制位)。在
这种表示法中,符号位右边的所有位数表示的是一个整数。格式如下:
符号位尾数
例:机器字长16,符号位L数值位15
0111111111111111-4-111111111111111^+32767
定点纯小数:将小数点固定在符号位之后,最高数值位之前(隐含,小数点不占二
进制位)。在这种表示法中,符号位右边的第一位是小数的最高位。格式如下:
符号位.尾数S
例:机器字长16位,符号位1,数值位15
1000000000000001一.000000000000001-2-15
(2)浮点数
小数点位置不固定的数(位置浮动),采用浮点数表示的计算机称为浮点计算机。
浮点表示的普通表示形式为:
N=2PXS
其中:P——称为阶码(含符号)
S一一称为尾数(含符号)
2一一阶码的底(隐含的,不必浮现在数据表示中)
在计算机中表示一个浮点数其结构如下:
Pf阶码PSf尾数S
Pf:阶符,即指数部份的符号位。
P:阶码,表示累次。
Sf:数符,即尾数部份符号位。
9
S:尾数
注意:浮点数表示法要规定字的格式。
实际应用中,阶码用补码(或者移码)表示成定点纯整数,尾数用补码(或者原
码)表示成定点纯小数。为了保证不损失有效数字,常对尾数进行规格化处理,即保
证尾数部分最高位是1,而数的大小可以通过阶码进行调整。
四、多媒体数据简介
1.多媒体的概念
(1)媒体
存储信息的实体,磁盘、光盘、存储器等。
承载信息的载体,数值、文字、图形、声音、视频、图象
(2)多媒体
文、图、声像等多种信息同计算机融合在一起形成的信息传播媒体。
硬件配置在原有计算机系统基础上扩充了:数字信号处理器、大容量光盘、触摸式
屏幕、其它外围设备,以多种形式表达、存储和处理信息。
电视与信息系统的多媒体明显区别:①被动与主动
②摹拟与数字
(3)多媒体信息
用多媒体传播的信息
(4)多媒体系统
能产生、储存、传播多媒体信息的系统,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 城市废弃物处理策略-深度研究
- 形状记忆效应与温度响应关系研究-深度研究
- 数据库性能监控与调优-深度研究
- 医疗数据挖掘策略研究-深度研究
- 2025年广州工程技术职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 异构云资源协同-深度研究
- 数字时代摄影人才培养-深度研究
- 文物修复虚拟现实应用-深度研究
- 旅游经济效应分析-深度研究
- 2025年广东省外语艺术职业学院高职单招语文2018-2024历年参考题库频考点含答案解析
- 医学脂质的构成功能及分析专题课件
- 高技能人才培养的策略创新与实践路径
- 2024年湖北省知名中小学教联体联盟中考语文一模试卷
- 2024年湖北省中考数学试卷(含答案)
- 油烟机清洗安全合同协议书
- 2024年云南省中考数学试题(原卷版)
- 污水土地处理系统中双酚A和雌激素的去除及微生物研究
- 气胸病人的护理幻灯片
- 《地下建筑结构》第二版(朱合华)中文(2)课件
- JB T 7946.1-2017铸造铝合金金相
- 包装过程质量控制
评论
0/150
提交评论