大学计算机应用基础课件 2.2 信息编码技术

上传人：h*** IP属地：山东上传时间：2024-01-10 格式：PPTX 页数：41 大小：1.21MB 积分：12 举报 版权申诉

已阅读5页，还剩36页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2.2信息编码技术《大学计算机应用基础》12.2.1信息编码技术基础CONTENTS目录2.2.2计算机编码使用的

二进制数2.2.3数值编码2.2.4英文编码2.2.5汉字编码22.2.1信息编码技术基础

信息编码的概念人们为了便于记忆、书写、交流和处理，经常用字母、数字和符号等的组合来表示特定的信息，这就是所谓的编码，有时也称代号。信息编码是将事物或概念（编码对象）赋予有一定规律性的，易于计算机和人识别与处理的符号。信息编码一般有等长码和不等长码两种。等长码是指信息编码长度固定，如身份证用18位固定长度的编码。在信息技术编码中，为了便于存储和处理一般用等长码，但其编码效率较低。有时为了压缩信息存储空间和节省信息传输时间，需要提高信息的编码效率，可以采用不等长码编码方式。一个编码由若干个区间组成，每一区间代表一个组，一个组码中数字的值和位置都代表一定意义。32.2.1信息编码技术基础

信息编码的原则为了保证信息编码科学、有效和便于计算机进行处理，信息编码应遵循以下基本原则：（1）唯一性原则。即一种信息只能有一个信息编码，不同的信息有不同的信息编码，不同的信息编码表示不同的信息。（2）正确性原则。即表示信息编码应当科学、合理，既遵循信息编码的基本原理，又符合组织的实际情况；既能满足组织自身的需要，又能满足组织合作伙伴的特殊要求；既要符合国家的标准或规定，又应该尽可能地遵守国际标准或惯例；信息编码既不宜过长，也不宜过短。42.2.1信息编码技术基础

（3）分类性原则。分类是为了便于认识、描述和解析信息，该原则要求信息应该按照合理的规则划分成不同的类别，使得同一类信息的编码在某一方面具有相同或相近的性质，这样便于信息系统的管理和使用。（4）扩展性原则。随着组织的发展变化，组织中的管理信息也会随之发生变化。信息编码不能仅仅考虑组织当前的信息状况，而且应该考虑组织未来的发展状况和需要。（5）统一性原则。即一个组织机构中，信息无论是否采取统一的编码体系，只要有了唯一性的编码，那么组织中的所有部门都应该使用这种唯一性的编码，不能出现各自为政、一码多用的现象，同一种信息只能有一种信息编码。52.2.1信息编码技术基础

信息编码的常用方法通常给信息进行编码时，主要采用如下编码方法：（1）顺序编码。顺序编码是一种用连续数字代表编码对象的编码方法。如某工厂01表示第一代产品，02表示第二代产品等。（2）区间编码。区间编码是编码由若干个区间组成，每一区间代表一个组，一个组码中数字的值和位置都代表一定意义。例如我国的邮政编码采用四级六位数编码结构，730060位于甘肃省兰州市西固区。（3）助记符编码。将编码对象的名称、规格等作为代码的一部分或全部的编码。例如用“TV-B-14”代码表示14寸黑白电视机，用“TV-C-29”代码表示29寸彩色电视机。在一个信息系统进行设计时，往往要将以上这些编码方法进行组合应用。62.2.2计算机编码使用的二进制数

1.计算机采用二进制数的原因（1）物理上易于实现，可靠性高。采用二进制表示数据，只有0和1两个数码，即有两个稳定状态的电子器件就可以表示二进制，如开关的接通和断开、晶体管的导通与截止、电位电平的低与高等都可用来表示0和1两个数码。（2）运算法则简单，通用性强。在进行计算时，二进制数运算法则少，如二进制乘法只0×0=0、0×1=0、1×0=0和1×1=1共4条运算法则。（3）便于进行逻辑运算。二进制的两种状态可以表示“是”与“否”、“成立”与“不成立”、“真”与“假”等，因此实现逻辑运算时使用二进制非常方便与自然。72.2.2计算机编码使用的二进制数

目前所有计算机毫无例外地使用二进制，是因为以二进制为基础设计和制造计算机元件少、成本低、速度快。大家可能存在这样的疑问，为什么我们在键盘上输入和显示器上看到的都是十进制数据呢？这是因为数据在输入和输出时，为了符合人们日常的习惯，计算机系统会将二进制数自动转化为十进制的形式输出，而在输入数据时则会将十进制数自动转化为二进制数保存。82.2.2计算机编码使用的二进制数

2.二进制数和N进制数的表示二进制使用数字0、1来表示数值，且采用“逢二进一”的进位计数制。二进制数也具有以下与十进制数相类似的三个特点：（1）十进制数据用0～9十个数码表示数据，二进制数使用0和1两个数码表示数据。（2）十进制的最大数字是9，二进制中最大的数字为1。（3）每个数字表示的权值由该数字的位置确定。92.2.2计算机编码使用的二进制数

以上原理可以推广到一个N进制数：（1）N进制数据用0～N-1个数码表示数据，即使用0、1、2、…、N-1表示数据。（2）N进制的最大数字是N-1。（3）N进制每个数字表示的权值由该数字的位置确定。从个位开始向左依次的计数单位为N0、N1、N2、N3、…；从小数点向右的计数单位依次为N-1、N-2、N-3、…。102.2.2计算机编码使用的二进制数

3.二进制数的运算二进制运算中，常用的加法、乘法和移位运算规则如下：（1）加法运算规则0＋0＝01＋0＝10＋1＝11＋1＝10（2）乘法运算规则0×0＝01×0＝00×1＝01×1＝1（3）移位运算十进制数据小数点向右移一位，数就扩大10倍，反之，小数点左移一位，数就缩小10倍。相应地对于二进制数，小数点向右移一位，数就扩大2倍，反之，小数点左移一位，数就缩小2倍。112.2.2计算机编码使用的二进制数

十进制数转化为二进制数将数由一种数制转换为另一种数制称为数制之间的转换。将十进制整数转换为二进制整数采用“除2取余法”，即将十进制数逐次除以需转换为数制的基数2，直到商为0为止，然后将所得的余数由下而上依次排列即可。122.2.2计算机编码使用的二进制数

将十进制小数转换为二进制数采用“乘2取整法”，即将十进制小数乘以2，取结果的整数位，再将小数部分乘以2，依次进行下去，最后将乘积取得的整数位依次排列即可。132.2.2计算机编码使用的二进制数

八进制数和十六进制数（1）八进制数和十六进制数的表示方法由于二进制数书写起来不方便，因此为了方便起见可以将一个二进制数用八进制或十六进制数来书写。八进制使用数字0、1、2、3、4、5、6、7来表示数值，且采用“逢八进一”的进位计数制。八进制数中处于不同位置上的数值代表不同的值，八进制数的基数为8。十六进制数使用数字0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F来表示数值，其中A、B、C、D、E、F分别表示十进制数中的10、11、12、13、14、15。十六进制数的计数方法为“逢十六进一”，十六进制数中处于不同位置上的数值代表不同的值。每一个数字的权由16的幂次决定，十六进制数的基数为16。142.2.2计算机编码使用的二进制数

152.2.2计算机编码使用的二进制数

（2）二进制数转化为八进制数由于3位二进数恰好是一位八进制数，所以把二进制数转换为八进制数的方法是以小数点为界，将整数部分自右向左、小数部分自左向右分别按每3位为一组（不足3位用0补足），然后将各个3位二进制数转换为对应的一位八进制数，即得到转换的结果。若把八进制数转换成二进制数，只要把每一位八进制数转换为对应的3位二进制数即可。如表2-3所示：162.2.2计算机编码使用的二进制数

（3）二进制数转化为十六进制数由于4位二进制数恰好是一位十六进制数，所以把二进制数转换为十六进制数的方法是以小数点为界，将整数部分自右向左、小数部分自左向右分别按每4位为一组（不足4位用0补足），然后将各个4位二进制数转换为对应的一位十六进制数，即得到转换的结果。若把十六进制数转换成二进制数，只要把每一位十六进制数转换为对应的4位二进制数即可。如表2-4所示：172.2.3数值编码

整数的表示在计算机中，一个整形正数与负数的表示方法非常简单，通常把一个数据的最高位设置为符号位，用“0”表示正数，用“1”表示负数。其格式如图2-2所示。这种直接将数据的正、负用符号表示的数叫“机器数”，而它代表的数值叫此机器数的“真值”。如真值为（-1011001）的二进制，其机器数为（11011001）。182.2.3数值编码

如果符号位在计算机中运算时直接参与计算，可能会产生错误的运算结果。例如将-9与5相加，其正确结果应为-4。如果用8位二进制表示一个数据，且最高位为符号位，运算如下：192.2.3数值编码

（1）原码原码是符号位用“0”表示正数，用“1”表示负数，其数值部分用原数的绝对值表示。202.2.3数值编码

使用原码表示数据时，存在两个问题：问题1：原码00000000表示的数是正0，而10000000表示的数是负0，即：[+0]原=00000000[-0]原=10000000这样数值0就有两种表现方式，即一个0占了两个编码，造成编码资源的浪费。问题2：用原码表示的数在进行运算时，符号位的处理比较复杂。当两个原码数据相加时，如果符号位相同则数值相加，符号位不变；如果符号位不同则数值要相减，符号位取两个数中绝对值大的原码数据的符号位。212.2.3数值编码

（2）反码正整数的反码，与其原码相同；负整数的反码是其符号位“1”，数值部分是其绝对值取反（即0变1，1变0）。例如+1和+127的反码分别为：[+1]反=00000001[+127]反=01111111例如-1和-127的反码分别为：[-1]反=11111110[-127]反=10000000在反码中0也有两种表示形式：[+0]反=00000000[-0]反=11111111222.2.3数值编码

（3）补码正整数的补码与其反码和原码相同；负整数的补码其符号位取“1”，数值部分是其绝对值取反后加1得到的结果。例如+1和+127的补码分别为：[+1]补=00000001[+127]补=01111111例如-1和-127的补码分别为：[-1]补=11111111[-127]补=10000001在补码中我们发现0有唯一的表示方法：[+0]补=[-0]补=00000000232.2.3数值编码

在补码中，所有编码都可以表示数据，因此其数据表示范围为00000000~11111111，可以分解为00000000~01111111（正数部分）和10000000~11111111（负数部分）两个部分，即表示的数据范围正数为0到127和负数为-1到-128，也就是说8位补码可以表示的数据范围为-128~+127。（1）用补码可以将加法运算统一为一种算法；（2）用补码进行加法运算时，符号位产生的进位要丢弃。242.2.3数值编码

浮点数的表示在实际应用中还会遇到大量带小数的数据。在计算机中存放小数时没有必要保存小数点，只要确定小数点在数据中的位置即可。前面介绍的整数可以看做其小数点在整个数据的最后，这就是所谓的定点整数。如规定小数点在符号位与数值部分之间，这就是所谓定点小数表示法。如图2-5所示。252.2.3数值编码

任何一个小数都可以用这指数形式表示成如下格式：0.1XXXXXXXXXXXX×2n

X可以是二进制的数码“1”或“0”，其中“1XXXXXXXXXXXX”叫尾数；n叫阶码，n可以是正整数也可以是负整数。一个数据格式化后，在计算机中存放时只要保存其尾数数值与指数数值即可。这种表示方法中小数点的位置是由阶码数值确定的，其位置根据数据的情况是变化的，即“浮动”的，这就是将其称为浮点数的原因。浮点数由阶码和尾数两部分组成，阶码用定点整数来表示，阶码所占的位数确定了数的范围；尾数用定点小数表示，尾数所占的位数确定了数的精度。由此可见，浮点数是定点整数和定点小数的结合。262.2.3数值编码

在程序设计语言中，最基本的浮点数有两种：（1）单精度（float或single）浮点数。该类数据占4个字节，阶码部分占7位，尾数部分占23位，阶符和数符各占1位（分别表示其正与负）。（2）双精度(double)浮点数。该类数据占8个字节，共64位，阶码部分占10位，尾数部分占52位，阶符和数符各占1位。单精度浮点数与双精度浮点数的区别在于，双精度浮点数占的内存空间大，因此其表示的数的精度更高、范围更大。272.2.4英文编码

ASCII：计算机内英文字符及其各种符号采用国际通用的ASCII（AmericanStandardCodeforInformationInterchange，美国信息交换标准代码）码。ASCII码是由美国国家标准委员会制定的一种包括数字、字母、通用符号、控制符号在内的字符编码，广泛应用于各种类型的计算机中。ASCII码采用7位二进制编码表示一个字符，共能表示128个国际上通用的各类字符。282.2.3数值编码

29每个字符的7位二进制编码用b6b5b4b3b2b1b0表示。高3位用b6b5b4表示，低4位用b3b2b1b0表示。2.2.4英文编码

观察表2-5可以发现ASCII码中有4类符号的编码，分别是：（1）控制符。编码中前34个码和最后一个码（DEL）通常是计算机系统专用的，代表一个不可见的控制字符，也称为非打印字符，主要集中在高3位为000和001的两列，例如“NUM”表示空白、“STX”表示文本开始、“ETX”表示文本结束、“EOT”表示发送结束、“CR”表示回车、“CAN”表示作废、“SP”表示空格、“DEL”表示删除等。（2）标点与常用符号。共有32个，如“：”、“！”等。（3）数字0~9。（4）大、小写英文字母。在ASCII码表中，数字与字母的编号是连续的。302.2.4英文编码

（1）记住表2-6所示的“0”、“A”、“a”的编码值，对以后程序设计的学习会带来很大的方便。（2）ASCII编码的所有符号之间是可以比较大小的，比较的原则是用其编码值的大小，这也是各类应用软件（如WPS）中字段可以排序的依据。如字符“a”大于“A”。312.2.5汉字编码

汉字在输入、存储、处理和输出时由于使用了不同的编码，这些编码之间还要进行相互转换，如图2-7所示为汉字“啊”的处理过程。322.2.5汉字编码

汉字输入码汉字输入码主要指通过键盘向计算机输入汉字时所使用的汉字代码，一般用键盘上一组确定的符号代表一个汉字，因此汉字输入码也叫外部码（简称外码）。（1）音码。以拼音编码做为汉字的输入码就是“音码”，如全拼、简拼和智能ABC等输入法。要输入“美”字，在全拼状态下只要输入拼音“mei”即可。音码的特点是编码易于学习与记忆，但重码率较高，影响了汉字录入的速度。（2）形码。根据汉字的字形特点编制其输入码的就是“形码”，如五笔字型输入法就属于形码。在五笔字型状态下输入“khlg”字符编码就可以录入“中国”。形码的特点是重码率较低，录入速度快，但要学习与记忆汉字的编码规律。332.2.5汉字编码

汉字机内码为了便于信息交换，计算机系统内部对汉字进行存储、处理、传输时要使用统一的代码，常用的汉字标准编码有GB2312-1980国标码和GB18030-2000等。（1）GB2312-1980国标码为了规范信息处理时汉字的编码，我国根据有关国际标准于1980年制定并颁布了《信息交换用汉字编码字符集》GB2312-1980，简称国标码。GB2312-1980国标码用2个字节来给一个汉字或字符进行编码，每个字节的最高位为“0”，理论上共可以有128×128=16384个不同的编码。为了简便起见国际码常用一个四位的十六进制数表示，每个字节的取值范围与ASCII中可打印字符的取值范围一样（即二进制的00100001~01111110），见表2-5。如汉字“啊”的国际码是3021H。342.2.5汉字编码

（2）区位码国标码是一个四位十六进制数，每个字节的取值范围为33到126，即共94个值，因此整个国标码字符集可分成94个区，每区有94个位，如果用这种区号和位号来表示一个字符，即每个区位上对应一个字符，这种表示方式称为区位码。区位码共有94×94=8836个码位。其符号编码情况如下：1）01-09区收录除汉字外的682个字符。2）10-15区为空白区，没有使用。3）16-55区收录3755个一级汉字，按拼音排序。4）56-87区收录3008个二级汉字，按部首/笔画排序。5）88-94区为空白区，没有使用。352.2.5汉字编码

（3）机内码GB2312-1980国标码对字符编码时2个字节的最高位为“0”，ASCII用一个字节的低7位编码表示一个字符，第8位即最高位也是“0”，这样计算机内部在处理时就会出现混乱。为了解决这个问题，汉字编码时引入了机内码，将GB2312编码中两个字节的最高位都设置成“1”（即国际码加8080H），这个首位上的“1”就可以作为识别汉字代码的标志，计算机在处理到首位是“1”的代码时把它理解为是汉字的编码，在处理到首位是“0”的代码时把它理解为是ASCII码。例如“啊”字的机内码就是B0A1H。362.2.5汉字编码

（4）其他汉

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大学计算机应用基础课件 2.2 信息编码技术

文档简介

温馨提示

最新文档

评论

大学计算机应用基础 课件 2.2 信息编码技术

文档简介

温馨提示

最新文档

评论

相关文档

大学计算机应用基础课件 2.2 信息编码技术