数据编码思维_第1页
数据编码思维_第2页
数据编码思维_第3页
数据编码思维_第4页
数据编码思维_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大学计算机应用基础

(公选课)内容提要数字技术基础文本信息在机内的表示1数据编码思维数值信息机内的表示数字技术基础——0和1的思维(1)什么是比特(2)比特的逻辑(3)比特的存储(4)比特与二进制什么是比特?比特(bit,binarydigit的缩写)中文翻译为“二进位数字”、“二进位”或简称为“位”比特只有2种取值:0,1如同DNA是人体组织的最小单位、原子是物质的最小组成单位一样,比特是组成数字信息的最小单位数值、文字、符号、图像、声音、命令······都可以使用比特来表示,其具体的表示方法就称为“编码”或“代码”例用比特表示图像比特在计算机中如何表示?在计算机中表示二进位的方法:电路的高电平状态或低电平状态(CPU)电容的充电状态或放电状态(RAM)两种不同的磁化状态(磁盘)光盘面上的凹凸状态(光盘)···例1:CPU内部二进位信息的表示CPU内部通常使用高电平表示1,低电平表示00.0V0.5V2.8V3.3V010V+3v010磁盘表面微小区域中,磁性材料粒子的两种不同的磁化状态分别表示0和1例2:磁盘存储器中比特的表示磁盘表面磁性材料粒子例2:磁盘存储器中比特的表示例3:CD/DVD盘片上比特的表示

光盘表面的凹、凸状态用于表示和存储二进位信息CD光盘表面DVD光盘表面比特的三种基本逻辑运算比特的取值“0”和“l”可表示两种不同的状态(例如电位的高或低、命题的真或假)比特的运算使用逻辑代数,它有3种基本逻辑运算:逻辑加也称“或”运算,用符号“OR”、“∨”或“+”表示逻辑乘也称“与”运算,用符号“AND”、“∧”或“·”表示取反也称“非”运算,用符号“NOT”或上横杠“¯”表示逻辑运算的规则逻辑加:F=A∨

BA: 0 0 1 1B:∨0

∨1

∨0

∨1F: 0 1 1 1逻辑乘:F=A·BA: 0 0 1 1B:∧0

∧1

∧0

∧1F: 0 0 0 1取反:F=NOTAA:NOT 0

NOT 1

F: 1 0两个多位的二进制信息进行逻辑运算时,按位独立进行,即每一位都不受其它位的影响:例1 A: 0110 B:∨ 1010

F: 1110例2 A: 0110 B:∧1010

F: 0010比特的存储(1)存储(记忆)1个比特需要使用具有两种稳定状态的元器件,例如:开关、灯泡等。在计算机的CPU中,比特使用一种称为“触发器”的双稳态电路来存储触发器有两个状态,可分别用来记忆0和1,1个触发器可存储1个比特一组(例如8个或16个)触发器可以存储1组比特,称为“寄存器”CPU中有几十个甚至上百个寄存器断电后信息不再保持!比特的存储(2)计算机存储器中用电容器存储二进位信息:当电容的两极被加上电压,它就被充电,电压去掉后,充电状态仍可保持一段时间,因而1个电容可用来存储1个比特信息存储原理电容C处于充电状态时,表示1

电容C处于放电状态时,表示0集成电路技术可以在半导体芯片上制作出以亿计的微型电容器,从而构成了可存储大量二进位信息的半导体存储器芯片断电后信息不再保持!比特的存储(3)磁盘:利用磁介质表面区域的磁化状态来存储二进位信息光盘:通过“刻”在光盘片表面上的微小凹坑来记录二进位信息磁盘表面磁性材料粒子断电后信息可以保持!

比特与二进制十进制

R=10,可使用0,1,2,3,4,5,6,7,8,9二进制

R=2,可使用0,1八进制 R=8,可使用0,1,2,3,4,5,6,7十六进制 R=16,可使用0,……,9,A,B,C,D,E,F“逢R进一,借一当R”进制的概念二进制概念11111000信息复制的精确性运算规则简单电子线路制造计算机成为可能信息的存储单位位(Bit):度量数据的最小单位字节(Byte):最常用的基本单位b7b6b5b4b3b2b1b010010101=27+24+22+20=149

返回数值信息在机内的表示“数”是一种信息,它有大小(数值),可以进行四则运算

“数”有不同的表示方法。日常生活中人们使用的是十进制数,但计算机使用的是二进制数,程序员还使用八进制和十六进制数,它们怎样表示?其数值如何计算?十进制数每一位可使用十个不同数字表示(0、1、2、3、4、5、6、7、8、9)低位与高位的关系是:逢10进1各位的权值是10的整数次幂(基数是10)标志:尾部加“D”或缺省例:204.96=2×102+0×101+4×100+9×10-1+6×10-2二进制数每一位使用两个不同数字表示(0、1),即每一位使用1个“比特”表示低位与高位的关系是:逢2进1各位的权值是2的整数次幂(基数是2)标志:尾部加B例:101.01B=1×22+0×21+1×20+0×2-1+1×2-2=5.25八进制数每一位使用八个不同数字表示(0、1、2、3、4、5、6、7)低位与高位的关系是:逢8进1各位的权值是8的整数次幂(基数是8)标志:尾部加Q例:

365.2Q=3×82+6×81+5×80+2×8-1=245.25十六进制数每一位使用十六个数字和符号表示(0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F)逢16进1,基数为16各位的权值是16的整数次幂(基数是16)标志:尾部加H例:

F5.4H=15×161+5×160+4×16-1=245.25不同进位制数的比较十进制二进制八进制十六进制零0000000壹1000111贰2001022叁3001133肆4010044伍5010155陆6011066柒7011177捌81000108玖91001119拾10101012A拾壹11101113B拾贰12110014C拾叁13110115D拾肆14111016E拾伍15111117F不同进制数的相互转换

熟练掌握不同进制数相互之间的转换,在编写程序和设计数字逻辑电路时很有用二进制数十进制数转换方法:二进制数的每一位乘以其相应的权值,然后累加即可得到它的十进制数值例:11101.1011B=1×24+1×23+1×22+0×21+1×20+1×2-1+0×2-2+1×2-3+1×2-4

=29.6875

十进制数二进制数转换方法: 整数和小数放开转换整数部分:除以2逆序取余小数部分:乘以2顺序取整例如:29.6875

11101.1011B

注意:十进制小数(如0.63)在转换时会出现二进制无穷小数,这时只能取近似值129371421222200111余数低位高位整数部分小数部分0.6875×21.37500.75001.50001.0000×2×2×2高位低位八进制数与二进制数的互换八进制→二进制:把每个八进制数字改写成等值的3位二进制数,且保持高低位的次序不变例:2467.32Q

→010100110111.011010B二进制→八进制:整数部分从低位向高位每3位用一个等值的八进制数来替换,不足3位时在高位补0凑满3位;小数部分从高位向低位每3位用一个等值八进制数来替换,不足3位时在低位补0凑满三位例:1101001110.11001B

→001101001110.110010B

→1516.62Q

八进制数二进制数八进制数二进制数000041001001510120106110301171111位八进制数与3位二进制数的对应关系:十六进制数与二进制数的互换转换方法:与八、二进制互换的方法类似例1:35A2.CFH

→11010110100010.11001111B例2:1101001110.110011B→34E.CCH十六进制数二进制数十六进制数二进制数

0000081000

1000191001

20010A1010

30011B1011

40100C110050101D110160110E111070111F11111位十六进制数与4位二进制数的对应关系:二进制数的算术运算1位二进制数的加、减法运算规则:被加数加数和进位0000011010101101(a)加法规则被减数减数差借位0000011110101100(b)减法规则2个多位二进制数的加、减法运算举例:01011001+0100-010010010101由低位到高位逐位进行!小结:数字技术的基础——二进制二进制数的运算有2类:逻辑运算:∨,∧,NOT.按位进行,不考虑进位算术运算:+,-,x,/.从低位到高位逐位进行,需考虑低位的进位(借位)逻辑运算可以用门电路(与门、或门、非门等)实现算术运算可以表达为逻辑运算,因此二进制数的四则运算同样也可以使用门电路来实现成千上万个门电路可以制作在集成电路上,工作速度极快,因而能高速度地完成二进制数的各种运算整数的表示(1)计算机中数的类型(2)无符号整数的表示(3)带符号整数的表示无符号整数的表示采用“自然码”表示:取值范围由位数决定:8位: 可表示0~255(28-1)范围内的所有正整数16位: 可表示0~65535(216-1)范围内的所有正整数n位: 可表示0~2n-1范围内的所有正整数。十进制数8位无符号整数

00000000010000000120000001030000001140000010050000010125211111100253111111012541111111025511111111······带符号整数的表示(1)表示方法:用1位表示符号,其余用来表示数值部分符号如何表示? 用最高位表示,“0”表示正号(+),“1”表示负号(-)数值部分如何表示? (1)原码表示: 整数的绝对值以二进制自然码表示 (2)补码表示: 正整数:绝对值以二进制自然码表示 负整数:绝对值使用补码表示···符号位数值部分最低位最高位举例:

[+43]的8位原码为:00101011[-43]的8位原码为:10101011带符号整数的编码表示(2)负数的绝对值如何用补码表示?先表示为自然码将自然码的每一位取反码在最低位加“1”例1:[-43]用8位补码表示所以:[-43]

的8位补码为:11010101例2:[-64]用8位补码表示所以:[-64]

的8位补码为:1100000043=>0101011取反:1010100加1:101010164=>1000000取反:0111111加1:1000000带符号整数的编码表示(3)优缺点分析:原码表示法优点:与日常使用的十进制表示方法一致,简单直观缺点:整数0有“00000000”和“10000000”两种表示形式,不方便补码表示法优点:没有“-0”,可表示的数比原码多一个缺点:不直观,人使用不方便结论:带符号整数在计算机内不采用“原码”而采用“补码”的形式表示!带符号整数的编码表示(4)原码可表示的整数范围8位原码:-27+1~27-1(-127~127)16位原码:-215+1~215-1(-32767~32767)n位原码:-2n-1+1~2n-1-1补码可表示的整数范围

8位补码:-27~27-1(-128~127)

n位补码:-2n-1~2n-1-1-128表示为10000000+127表示为01111111小结:3种整数的比较8位二进制码表示无符号整数时的数值表示带符号整数(原码)时的值表示带符号整数(补码)时的值0000000000000000001111……………………0111111112712712710000000128-0-12810000001129-1-127……………………11111111255-127-1计算机中整数有多种,同一个二进制代码表示不同类型的整数时,其含义(数值)可能不同一个代码它到底代表哪种整数(或其它东西),是由指令决定的实数的表示

特点:既有整数部分又有小数部分,小数点位置不固定整数和纯小数是实数的特例任何一个实数总可以表达成一个乘幂和一个纯小数之积例如:

56.725=0.56725×102-0.0034756=-0.34756×10-2实数的表示方法(记阶法):用3个部分表示乘幂中的指数:表示实数中小数点的位置纯小数部分(尾数):表示实数中的有效数字部分数的正负(符号)二进制实数的浮点表示与十进制实数一样,二进制实数也可以用记阶法表示例如:+1001.011B=+0.1001011B×2100

-0.0010101B=-0.10101B×2-10可见,任一个二进制实数N均可表示为: N=±S×2P(其中,±是该数的符号;S是N的尾数;P是N的阶码)因此,32位的单精度浮点数在计算机中可表示为:尾数符号位8位23位阶码

返回文本信息在机内的表示文本(text)文字信息在计算机中的表示形式。是计算机中最常用的一种数字媒体。字符组成文本的基本元素,字符在计算机中采用二进制编码表示。字符集常用字符的集合代码

码表一、ASCII字符集美国标准信息交换码(AmericanStandardCodeforInformationInterchange)使用7个二进位对字符进行编码(叫做标准ASCII码)。基本的ASCII字符集共有128个字符96个可打印字符(常用字母、数字、标点符号等)32个控制字符西文字符的编码标准ASCII字符集0123456789ABCDEF控制字符01234567b3b2b1b0b6b5b4西文字符的编码0001100b6b5b4b3b2b1b01000001扩充ASCII字符集ASCII-8版用8位二进制编码,可表示256个字符最高位不再全为0目前大多数计算机系统都支持扩充ASCII的使用西文字符的编码一、GB2312-80汉字编码《信息交换用汉字编码字符集·基本集》

1.组成第一部分字母、数字和各种符号,共682个(统称为GB2312图形符号)第二部分一级字库,共3755个,按汉语拼音排列第三部分二级字库,共3008个,按偏旁部首排列共7445个字符汉字编码一、GB2312-80汉字编码2.区位码GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每个汉字的区号和位号分别用十进制代码或七位二进制来表示来表示。如:“大”字的区号20,位号83,则:区位码是2083用二进制表示为:00101001010011汉字编码一、GB2312-80汉字编码问题:信息通信中,汉字的区位码与通信使用的控制码(00H~1FH)发生冲突。解决方案:区位码+32→国标码3.国标交换码

每个汉字的区号和位号必须分别加上32(即二进制00100000)。如:“大”字的国标码是:

0011010001110011。汉字编码一、GB2312-80汉字编码问题:1个汉字与2个单字节的标准ASCII码混淆解决方案:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”4.机内码高位为l的双字节(16位)汉字编码称为GB2312汉字的“机内码”,又称内码。如:“大”字的内码是:

1011010011110011(B4F3)汉字编码二、UCS/Unicode与GB13000问题约有6800种语言和文字在使用,需要建立一个多文种(Multilingual)处理环境。目标与途径实现所有字符在同一字符集中统一编码。汉字编码二、UCS/Unicode与GB13000UCS/Unicode(UniversalMultiple-OctetCodedCharacterSet,通用多8位编码字符集)用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作

UCS-4)。中国国家标准GB13000优点:编码空间极大,能容纳足够多的各种字

符集(13亿字符)。缺点:4字节的字符编码使存储空间浪费严重汉字编码二、通用编码字符集UCS/Unicode实际方案采用双字节的UCS-2编码(又称Unicode编码或统一码),共有字符49194个,其中包括:欧洲及中东地区使用的拉丁字母、音节文字。各种标点符号、数学符号、技术符号、几何形状、箭头及其他符号。中、日、韩(CJK)统一编码的汉字。汉字编码既包容GB2312也包含大5码(BIG5)汉字的编码通用编码字符集UCS/Unicode4.1.2汉字编码三、GBK——汉字内码扩充规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为《汉字内码扩展规范》。优点:汉字收字充足、与GB2312完全兼容,支持GB13000及CJK汉字。例如:計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。缺点:与UCS/Unicode编码不兼容汉字编码四、GB18030-2000编码问题:

UCS/Unicode与GB2312-80和GBK编码不兼容。解决手段:

在GB2312-80和GBK的基础上进行了扩充,为了既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312-80和GBK编码标准。所包含的汉字数目增加到27000多个。汉字编码文本处理计算机处理的文字信息称为文本。

文本存储与传输(阅读器)用户文本处理(文本处理软件)文本生成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论