第三讲信息表示与存储程序原理_第1页
第三讲信息表示与存储程序原理_第2页
第三讲信息表示与存储程序原理_第3页
第三讲信息表示与存储程序原理_第4页
第三讲信息表示与存储程序原理_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲信息表示与存储程序原理第1页,共29页,2023年,2月20日,星期一

计算机中的信息表达自然界的信息形式多种多样,在计算机中都是以二值形式来表达。输入过程实现信息表达方式的转换(编码)。相关术语:位(bit)计算机中存储信息的最小单位。0,1字节(B,byte)1字节(byte)=8位(bit)1K(kilo)B==1024B千字节1M(mega)B==兆字节1G(giga)B==吉字节

第2页,共29页,2023年,2月20日,星期一字符0(48)第3页,共29页,2023年,2月20日,星期一数制转换

十进制:9001=

二进制:

0,1,10,11,100,101,110,111,1000,1001,1010,1011,1100,1101,1110,1111

八进制:

十六进制:

(A=10,B=11,C=12,D=13,E=14,F=15)

第4页,共29页,2023年,2月20日,星期一数码转换:

∎二、八、十六十进制:按上页方法展开即可

∎十二、八、十六进制:例:将十进制435转换为二进制数

24352217(12108(1254(0227(0213(126(123(021(120(1435=∎二、八、十六进制之间八进制:三位一组十六进制:四位一组例:∎二进制数的四则运算例:0+0=00+1=11+0=11+1=10

第5页,共29页,2023年,2月20日,星期一

用补码能表示的数据范围是(4位)

~

数原码反码(值位求反)补码(值位求反加1)000001000120010同原码…6011070111-1100111101111-2101011011110-3101111001101…-6111010011010-7111110001001-8无无1000无符号数:0—15有符号:-8—7第6页,共29页,2023年,2月20日,星期一2数的表示范围和精度∎无符号整数例:数据宽度是16位,可表示的数据范围是:151413210100……1100~∎

有符号整数

1、有三种表示方法:原码、反码、补码。最高位是符号位,0表示正数,1表示负数。

2、计算机中对负数采用补码表示。用补码表示的数做加减法可以不考虑符号位,即符号位可参与运算。例:数据宽度是4位,求各数的二进制原、反、补码(见下页表)并用补码计算:1-2=-13-2=13+6=9(溢出)

000100110011+)1110+)1110+)01101111100011001

进位丢掉同符号数相加,符号变了

第7页,共29页,2023年,2月20日,星期一我们前面介绍了计算机中数的二进制表示及补码,下面讨论数的表示方法和范围。同学们还应熟悉数的八进制和十六进制表示。例:用16位表示的数15141312321081011000111000001……(1011000111000001)2=?有符号数:--无符号数0--十六进制数与二进制数的对应关系十六二00000001001000110100010101100111100010011010101111001101111011110123456789ABCDEF如0xFF=?,0x00=?(在C语言的位运算中会用到)第8页,共29页,2023年,2月20日,星期一符号表现形式数据长度数值范围带符号int32-2147483648~2147483647short16-32768~32767long32-2147483648~2147483647无符号unsignedint320~4294967295unsignedshort160~65535unsignedlong320~4294967295第9页,共29页,2023年,2月20日,星期一小数的表示方法计算机中通常采用浮点方式表示小数

一个数N用浮点形式表示可以写成:

N=M×2E

E表示2的幂,称为数N的阶码。阶码确定了数N的小数点的位置,其位数反映了该浮点数所表示的数的范围。M表示数N的全部有效数字,称为数N的尾数。其位数反映了数据的精度。第10页,共29页,2023年,2月20日,星期一

实数(小数)的表示——

采用科学计数法

824

指数符号位尾数符号位

4字节表示一实数:阶码范围-128—127,数的范围——23位大约表示7位十进制数,精度7位。采用双精度一实数:范围——

,精度16—17位例0000,0110,1010,0000,0000,0000,0000,0000表示

指数有效数位尾数有效数位第11页,共29页,2023年,2月20日,星期一练习将下列十进制数转换为16位二进制补码及十六进制形式。(32)10=?(32)10=(0000000000100000)2=(0020)16(-32)10=?(-32)10=(1111111111100000)2=(FFE0)16(-1)10=?(-1)10=(1111111111111111)2=(FFFF)16(65535)10在16位二进制数代表?(65535)10=(1111111111111111)2=(FFFF)16无符号第12页,共29页,2023年,2月20日,星期一3字符及其编码

当我们从键盘上输入十进制数或字符时,都被计算机内完成输入工作的软件翻译成内部的二进制形式。编码方法:确定字符集,按顺序排队,给每个符号确定一个编码。编码只起区分作用,数值大小无所谓。通常采用ASCII编码。(AmericanStandardCodeforInformationInterchang

美国标准信息代码)0-127或EBCDIC(ExtentedBinaryCodeDecimalInterchangeCode)码(0—255)第13页,共29页,2023年,2月20日,星期一空格退格486597用一个字节表示一个字符。以上是ASCII码(128个),扩展的ASCII首位为1ASCII码表第14页,共29页,2023年,2月20日,星期一4、中文信息的编码和输入方法汉字在机器内部是如何表示的?国标码。GB基本字符集共6763个,一级3755个,二级3008个。国家标准“信息交换用汉字编码字符集—基本集”—GB2312—80区位码:共设94个区,每区94个字符。

1—15区表示西文字母、数字、图形符号

16-87区编排汉字

88—94用户自定义内码:用双字节16位表示一个汉字(汉字的机器内码)可表示65536个,使用每个字节的后7位(33—126共94个)表示。区位码与内码的关系:第1区第1位在计算机中用A1A1H表示例:爱的区位码为1614D,求内码(汉字每字节高位均为1)

区(第一字节)位(第二字节)

10H10H0EH0EH+A0H20H+A0H20H--------------------30H(0)-------------2FH(/)302FH国标

B0H(10110000)AEH(10101110)B0AEH内码第15页,共29页,2023年,2月20日,星期一

国家标准总局于一九八○年发布的国家标准信息交换用汉字编码字符集,即常称的国标码字符集(GB),共有6763个汉字,包括常用汉字有四千多,次常用汉字约三千左右。现在常用的汉字输入法一般只支持这一字库量。汉字数量近十万,常用的汉字字典、词典收集的汉字一般在一万二千左右,字典、词典上大量的汉字特别是人名、地名用字没能包括在国标码之中,如“蹓跶”这两个字、啰嗦的“啰”字、瞭望的“瞭”字、朱镕基总理的“镕”字、只支持国标码的输入法满足不了日常输入需要。一九九○年中国、日本、韩国共同制定的统一东亚表意文字字符集,即常称的国标扩展码字符集(GBK),共有20902个汉字,包括现代汉语通用字表和邮电通信字符符集的字符及其繁体、台湾地区的《通用汉字标准交换码》所含字符、一些香港用字及日文、朝鲜文用汉字,原来的国标码的编码位置不变。考虑近一半汉字有简繁体两种字体形式这一因素,扩展码实际拥有的汉字量为一万三千左右,常用字、词典收集的汉字差不多全部包含在其中。简体中文WIN95及其以后的版本符合GBK标准,目前的各种输入法也应做到支持GBK标准。大量的汉字存在于古籍之中,数量达九万之多,如从事古文输入输出,GBK仍不能满足要求,所以用于特殊专业的输入法,还应扩大所能支持的字库规模。

GBK编码范围是8140H~FEFEH。BIG5(大五码)台湾常用的信息交换码编码范围是A140H~FEFEH,有13060汉字。第16页,共29页,2023年,2月20日,星期一Unicode统一的字符编码标准,是一种可伸缩的编码。允许用单字节表示常用的ASCII符号,采用双字节对汉字符进行编码等。由APPLE和XEROX在1988年建立,目前Apple、IBM、Microsoft、Novell、Sun、Lotus等负责。其中有拉丁字母、俄罗斯、日语、汉字等的编码。第17页,共29页,2023年,2月20日,星期一汉字的输入方法有很多,如全拼输入法、五笔字型法、智能ABC等数以千计。但常用的有几十种,同学们至少应掌握1—2种。这些输入方案大都以汉字的拼音及字型有关。如“种”全拼为zhong,双拼为as,ABC为zhong,“缠”的五笔为丝广日土xyjf例:人输入te键盘转换te的编码查找汉字库,找到输入码对应的汉字显示1特2忑…-选择1得到”特”的国标码得到内码…第18页,共29页,2023年,2月20日,星期一前面讲的是如何解决输入及内部表示,汉字在输出时需解决内码到字型的变换一个汉字要32字节表示对一种字型,大字体与小字体需要不同的分辨率,否则显得粗糙,16×16字库需270KB,64×64字库需4MB,1024×1024字库需百兆汉字有很多字型,字库需要的存储量过大

第19页,共29页,2023年,2月20日,星期一用矢量的方法表示汉字,实际上是描述汉字的轮廓特征。对于某种字型而言,一个汉字的矢量描述大约需要一百到几百字节,一种字体的国标汉字库大约有1兆到几兆字节大小.它描述的是汉字字型的有关信息,与汉字实际输出大小无关,任何时候都能根据需要产生高质量的汉字输出。不过字型恢复需花费时间。例如方正汉字激光照排系统。第20页,共29页,2023年,2月20日,星期一

5、图形的数字化编码

……480……

图的“点阵表示”:个像元(像素)图象等非字符信息也是通过数值化的方法在计算机中表示的。像元640第21页,共29页,2023年,2月20日,星期一

5、图形的数字化编码★一副图所需的存储空间:纯黑、纯白图需字节每个像元使用256个灰度表示需字节=300KB每个像元使用真彩色表示,红绿蓝各256色需字节=0.9M★10分钟的连续电视图象需=13800MB★图象的压缩和恢复问题,不同方法,图形数据的格式各不相同.bmp.jpg.gif等,动画.gif.avi。声音mp3编码→例画图---保存可看几种格式第22页,共29页,2023年,2月20日,星期一典型的图形/图象处理软件有PaintBrush,Photoshop等。机器中自带画图例画图---保存可看几种格式第23页,共29页,2023年,2月20日,星期一

指令、程序和存储程序原理1、指令分类与编码操作码(OP)地址码(D)指令是一系列二进制代码,由操作码和地址码组成本条指令要求计算机完成的操作如加、减、移位、传送等参加本次运算的操作数和运算结果所在地址,如通用寄存器、内存地址等。第24页,共29页,2023年,2月20日,星期一①存储器访问类(内存)②算术运算和逻辑运算③条件判断和分支④输入、输出:启动外设⑤控制和系统指令指令分类一个CPU所能执行的所有指令、指令的编码方式、参数个数和意义等的整体构成CPU的“指令系统”。第25页,共29页,2023年,2月20日,星期一2、程序和计算机的基本工作循环由操作系统将第一条指令地址放入程序计数器

控制器由“程序计数器”取出指令地址取指令执行指令读内存,将指令送入“指令寄存器”解释指令、可能的内存读取加1,更新程序计数器内容,变为下一条指令地址

返回(扫描中断)

指令通过数据总线进入CPU

美国数学家冯•诺依曼

控制器是实现此基本循环的主体第26页,共29页,2023年,2月20日,星期一3、分支指令和程序流程控制

开始

累加单元放初值0

计数器单元放初值1

求出计数器单元值的平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论