第03讲第1章计算机基础知识_第1页
第03讲第1章计算机基础知识_第2页
第03讲第1章计算机基础知识_第3页
第03讲第1章计算机基础知识_第4页
第03讲第1章计算机基础知识_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章

计算机基础知识1计算机基础知识1.3计算机中的信息表示1.3.1计算机中的数据表示2计算机基础知识主要内容1)进位计数制二进制、十进制、八进制、十六进制2)不同进位计数制间的转换3)

数值数据的表示⑴机器数的定点和浮点表示1.2.1计算机中的数据表示3计算机基础知识3)数值数据的表示问题:a.数的符号表示

b.小数点位置

c.有限的设备表示的有效数值范围。1.2.1计算机中的数据表示4计算机基础知识3)数值数据的表示(1)机器数的定点表示①机器数:数的正、负号,也必须用“0”和“1”来表示。通常把一个数的最高位定义为符号位,用0表示正,1表示负,称为数符;其余位仍表示数值。若用8位(即8bit)字长来表达一个带符号的二进制数(-101100)B,其表示形式如下图。1.2.1计算机中的数据表示5计算机基础知识在机器中存放的正负号数码化后的数称为机器数,也就是说,数在计算机内的表示称为机器数。机器数对应的数值称为机器数的真值。例:真值数(-1100101)B

和(+100111)B,表示成机器数时则分别为11100101和00100111,在机器中表示为如下的形式:1.2.1计算机中的数据表示6计算机基础知识机器数总是与具体的计算机的硬件及型号相关联的。在早期的微型计算机,其机器数的字长为8位、16位,现在仍有一些是32位。在现代微机中,机器数的最大长度达到64位(在运算中一次指令可处理的数据长度)。把数值数据送入计算机处理,仅转换为二进制还是不行的,除了解决数的符号表示问题,也要解决小数点位置以及用有限的设备表示的有效数值范围等问题。这里重点介绍数的定点表示。1.2.1计算机中的数据表示7计算机基础知识②定点整数可以认为它是小数点定在数值最低位右边的一种数据。整数分为带符号和不带符号两类。带符号整数,符号位被放在最高位。

无符号整数:符号整数:1.2.1计算机中的数据表示8计算机基础知识一般来看,8位字长的定点机器数最大者为01111111,最小者为11111111,但与00000000是不同的,规定10000000为-128,故8位字长的定点机器数中带符号整数数值范围是-128~+127,共计256个。8bit宽的无符号数的表达范围为:0~+2551.2.1计算机中的数据表示9计算机基础知识③定点小数是指小数点固定在最高数据位的左边,小数点前边再设一位符号位。N=±.a-1a-2a-3a-4...a-m

例如,m=7最大的小数为:0.1111111最小的小数为:-0.11111111.2.1计算机中的数据表示10计算机基础知识③浮点数(不讲)基本思想类似于十进制数:-678.90123=-0.67890123×1031.2.2信息编码11计算机基础知识计算机既能处理数值数据,也可以处理如字符、汉字、图形、图像、声音等各种类型的数据。前面已经强调:计算机只能识别二进制形式的数,所以要计算机进行处理的任何类型的数据都必须用二进制的形式存储在计算机内。1)数字BCD编码2)西文字符编码3)汉字编码1.2.2信息编码12计算机基础知识1)数字BCD码(又称8421码,二--十进制数字编码)计算机采用二进制,为了便于人机交互,常常用一组四位二进制编码表示一个十进制数字符号,称为BCD编码,中文意思就二进制编码的十进制数,不能叫8421码。例如,397的BCD码是0011100101112)西文字符编码(ASCII)字符是人与计算机进行通信、交互的重要媒介。要计算机识别字符必须对字符进行二进制编码。字符编码有各种标准,我国颁布的字符编码标准与国际上普遍使用的ASCII基本相同。1.2.2信息编码13计算机基础知识ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)采用七位二进制编码(d6d5d4d3d2d1d0),故可以表示128个字符,其中包括10个十进制数(0~9),52个英文大写和小写字母(A~Z,a~z),32个通用控制字符,34个专用字符。ASCII的排列顺序见教材,其中d3d2d1d0表示字符所在行,d6d5d4表示字符所在列。要求能正确查找西文字符的ASCII编码!1.2.2信息编码14计算机基础知识

1.2.2信息编码15计算机基础知识通常计算机中用一个字节(8位二进制码)来表示一个字符,右边七位对应字符的ASCII码,最左边的一位通常用作奇偶校验,用来发现错误。所谓“奇校验”是指在校验位上设置0或1,以保证一个字节中“1”的个数为奇数。奇偶校验码是一种最简单的校验码,如果数码在存储、传送过程中,由于某种原因使得字符编码的某一位发生变化(由1变为0或由0变为1),在接收到的字节中,“1”的个数不是原规定的偶(或奇)数,于是就能发现错误。1.2.2信息编码16计算机基础知识3)汉字编码汉字比西文字符数量要多且复杂,这给计算机的汉字编码带来了一定的困难。汉字是象形文字,在一个汉字处理系统中,输入、内部处理、输出对汉字有不同的编码要求。汉字信息处理系统在处理汉字时要进行一系列的汉字代码转换。主要介绍四类:汉字输入码、汉字交换码、汉字内码和汉字字型码。为适应计算机处理汉字信息的需要,我国于1980年发布了《信息处理交换用汉字编码字符集基本集》GB2312-80。1.2.2信息编码17计算机基础知识GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而GB2312最多能表示6763个汉字。1.2.2信息编码18计算机基础知识汉字系统对每个汉字规定了输入计算机的代码,即汉字的外部码,键盘输入汉字是输入汉字的外部码。计算机为了识别汉字,要把汉字的外部码转换成汉字的内部码,以便进行处理和存储。为了将汉字以点阵的形式输出,还要将汉字的内部码转换为汉字的字形码,确定一个汉字的点阵。并且,在计算机和其它系统或设备需要信息、数据交流时还必须采用交换码。1.2.2信息编码19计算机基础知识(1)外部码外部码是从键盘上往计算机内输入汉字时的代码,代表某一个汉字的一组键盘符号。外部码也叫汉字输入码。目前汉字输入编码的方案很多,常见的就有几十种,如汉语拼音码、五笔字型、区位码等。各种输入编码法大致可以分为四类:A、数字编码:国标码、区位码B、字音编码:全拼、微软拼音、智能拼音、搜狗拼音C、字形编码:五笔字型、郑码、太极码、七部形码D、音形编码:自然码1.2.2信息编码20计算机基础知识(2)内部码汉字内部码亦称为汉字内码或汉字机内码。计算机处理汉字,实际上是处理汉字的代码。当计算机输入外部码时,通常要转成内部码,才能进行存储、运算、传送。一般用二个字节表示一个汉字的内码。内部码经常是用汉字在字库中的物理位置表示,如汉字在字库中的序号或汉字在字库中的存储位置表示。一般地,汉字的内部码不能与西文字符编码(ACSII码等)发生冲突,并应容易区分汉字与西文字符;尽可能占用少的字节表示尽可能多的汉字;与标准交换码兼容。1.2.2信息编码21计算机基础知识除了二字节汉字内部码外,还有三字节内部码、四字节内部码、带引导码的汉字内部码、带符号的汉字内部码、带括号的汉字内部码等(3)交换码(国家标准交换码)当计算机之间或与终端之间进行信息交换时,要求它们之间传送的汉字代码信息完全一致,国家规定了信息交换用的标准汉字交换码"GB2312-80信息交换用汉字编码字符集(基本集)",即国标码。交换码是用于不同的汉字信息系统间进行汉字交换时使用的编码,简称国标码。。1.2.2信息编码22计算机基础知识GB312-80国标码共收集了7445个图形字符,其中汉字6763个(常用一级汉字3755个,二级汉字3008个),一般符号、数字、拉丁字母、希腊字母、汉语拼音等709个。汉字国家标准交换码与机内码区位码、国标码和机内码之间的关系:国标码=(区位码的十六进制表示)+2020H机内码=国标码+8080H1.2.2信息编码23计算机基础知识编码的转换举例汉字区位码16进制国标码机内码文4636

2E24H4E44HCEC4H以汉字“大”为例,“大”字的区位码为2083,将其转换为十六进制表示为1453H,加上2020H得到国标码3473H,再加上8080H得到机内码为B4F3H。(4)汉字输出码(汉字字形码)为输出汉字,对汉字字形经过点阵的数字化后的一串二进制数称为汉字输出码。又称汉字字形码、汉字发生器编码。1.2.2信息编码24计算机基础知识汉字字形码是表示汉字字形的字模数据。汉字的字形码是用在显示或打印汉字时产生字形,通常用点阵、矢量和曲线函数等方式表示用点阵表示字形时,汉字字形码叫做这个汉字的字形点阵码。例如,16*16点阵码,每个汉字占32个字节,其中每个字节的一位(bit)代表一个点,当该位为“0”时,对应的点为“白”色,为“1”时,对应的点为黑。点阵汉字有24×24点阵、32×32点阵、48×48点阵等多种。每个24×24点阵汉字占用72字节,同理于16×16点阵占用32字节。1.2.2信息编码25计算机基础知识⑸汉字编码之间的关系例如,我们通过键盘输入一个汉字“计”,并在屏幕上显示,其编码的转换过程如下:①通过键盘输入输入码:ji(拼音输入法)。②由输入法控制程序,按交换码(国标码0011110001000110),把输入码(ji)转换成机内码(1011110011000110),并保存在计算机内。输入码交换码(国标码)机内码字形码1.2.2信息编码26计算机基础知识③汉字显示驱动程序根据机内码计算出“计”的字形码所在字库的地址,通过相应的地址把字库中的字形码取出,存入到相应的显示内存单元中。④在显示驱动程序的控制下,根据显示内存中的字形码,在屏幕的相应位置显示汉字“计”的字形。1.2.2信息编码27计算机基础知识⑹其他编码①UCS编码②Unicode码③GBK码④BIG5编码①UCS编码(通用多八位编码字符集)1993年,国际标准化组织公布了UCS(UniversalCodeSet)。整个字符集由(组、面、行、字共4维)组成,每维用一个8位二进制来编码,组(最高位不用,剩下7位),能表示128个组;可容纳字符数128组×256面×256行×256个字位;一个字符就被安排在这个编码空间上。这巨大的空间足以容纳世界上的各种文字,同时也符合现代处理系统的体系结构。1.2.2信息编码28计算机基础知识⑹其他编码①UCS编码②Unicode码③GBK码④BIG5编码②Unicode码。全世界正在使用的各种文字中,经常使用的只是其中的一部分,其数量不足65536(216)个,将他们放在UCS字符集中的最前面第0号组、第0号平面,该平面被称为“基本多文种平面”。在使用UCS编码时每个字需要4个字节表示,这样消耗的空间非常多,但我们可以看到组号、平面号都是0,为了节省存储空间,把基本多文种平面中的所有字符编码的后两个字节组成一个编码集,就形成了Unicode代码。1.2.2信息编码29计算机基础知识⑹其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论