数据编码的基本方式_第1页
数据编码的基本方式_第2页
数据编码的基本方式_第3页
数据编码的基本方式_第4页
数据编码的基本方式_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、成武一中技术中心2017-10-20数据编码的基本方式了解二进制的基本原理和进制转换方法知道数值、文字、图形图像、音视频等数据在计算机中的编码方式。3 计算机最主要的功能就是处理信息,而信息在计算机中如何表示、存放、传递?这是首先要解决的问题。基本要求是:信息的表示、存放和传递要方便、可靠、易处理。显然,在计算机内部,信息只有经过数字化编码后才能表示、存放和传递。计算机与信息处理计算机与信息处理4信息的表示及采集编码:用少量的基本符号,根据简单的组合规则,以表示大量复杂的信息。二进制:是一种最简单的编码系统。多媒体信息的表示与采集基于计算机的信息处理信息的组织信息的传输信息的检索数据编码的基本

2、方式数据编码的基本方式5计算机中的信息采用二进制编码来表示。二进制表示数字容易实现(只有0、1)。二进制运算规则简单(逢二进一)。二进制编码在物理上最容易实现;自然界中具有两个固定状态的物理量很多,例如:电流的有无、电压的高低等。计算机为什么选用二进制计算机为什么选用二进制6数制:人们利用符号来计数的科学方法。进位计数制:按一定进位规则进行计数的方法。基数:是指该进制中允许使用的基本数码的个数。十进制的基数为10,数码为0,1,2,9十个。二进制的基数为2,数码为0,1两个。八进制的基数为8,数码为0,1,7八个。十六进制的基数为16,数码为09,AF十六个。位权:数制每一位所具有的值,简记为

3、“权”。计算机中的数制计算机中的数制7012108107106678基数基数权权数码数码按权展开式:按权展开式:234.32=2234.32=2* *10102 2+3+3* *10101 1+4+4* *10100 0+3+3* *1010-1-1+2+2* *1010-2-28在按位定制的计数制中,十进制数可以表示成下列形式(用D D代表或略去,无后缀符默认为十进制数):(D)10 = Di10i = Dn-110n-1+Dn-210n-2+D0100+D-110-1+D-m10-m举例: 519.02 = 5102+ 1101+ 9100+ 010-1+ 210-2特点:有0-9十个数字

4、符号,基数为10,是逢十进一的计数制,各数位的权是以10为底的幂。n-1n-1 i= -mi= -m十进制表示法十进制表示法9一个二进制数可以表示成下列形式(用B代表):(B)2Bn-12n-1+Bn-22n-2+B020+B-12-1 B-m2-m举例: 1101.01 = 123+ 122+ 021+120+ 02-1+12-2 特点:数值用0,1表示,基数为2,是逢二进一的计数制,各数位的权是以2为底的幂。表示:1101.01B或(1101.01)2二进制表示法二进制表示法10一个八进制数可以表示成下列形式(用Q代表):(B)8=Bn-18n-1+Bn-28n-2+B080+B-18-1

5、 B-m8-m举例: 3765.02 = 383+ 782+ 681+580+ 08-1+28-2 特点:数值用07表示,基数为8,是逢八进一的计数制,各数位的权是以8为底的幂。表示:452.16Q或(1101.01)8八进制表示法八进制表示法11一个十六进制数可以表示成(用H H代表):(H)16= Hn-116n-1+Hn-216n-2+H020+H-116-1 H-m16-m举例: A3F.3B =10162+316+15160+316-1+1116-2特点:有0-9及A-F共16个数字符号,基数为16,是逢十六进一的计数制,各数位的权是以16为底的幂。表示:3EFH或(20)16十六进

6、制表示法十六进制表示法二进制二进制八进制八进制十进制十进制十六进制十六进制不同进制数之间的转换不同进制数之间的转换1213(11001.101)2=124123022021120121022123 = (25.625)10(16A.B)16(1162616110160 1116-1)10 (25696100.69)10 (362.69)10(34.6)8= ?= = ( ( 3 38 81 14 48 80 0 6 68 8-1-1) )1010= (24= (244 40.75)0.75)1010= = (28.75)(28.75)1010二、八、十六进制转换成十进制二、八、十六进制转换成十

7、进制14方法:除2反序取余法例:(29)10=(?)2 结果:(29)10=(11101)22 2 9 91 41 47 73 31 12 22 22 22 22 21100 0 1 0 11111(高位)(高位)(低位)(低位)十进制整数转换成二进制整数十进制整数转换成二进制整数15方法:乘2顺序取整法例:(0.125)10=(?)2结果0 0. 500. 5002 21 1 . . 000000(低位)(低位)0 0 .250.250 2 2 0.125 0.125 (高位)(高位) 2 2并非所有的十并非所有的十进制小数都能进制小数都能用有限位的二用有限位的二进制小数来表进制小数来表示

8、。 例 如 将示 。 例 如 将(0.63)10转换为转换为二进制。因为,二进制。因为,小数部分乘以小数部分乘以2会无限循环下会无限循环下去,故:只能去,故:只能取近似值。取近似值。十进制小数转换成二进制小数十进制小数转换成二进制小数16100(D)=100(D)=144(Q)=144(Q)=64(H)64(H)八进制八进制1001008 812128 81 18 80 04 44 41 110010016166 60 04 46 61616十六进制十六进制十进制转化成十进制转化成 八、十六八、十六 进制进制17八进制数转换为二进制数只需将每一个八进制数字改写成等值的3位二进制数即可,且要保持

9、高、低位次序的不变。(16.327)8(001 110 . 011 010 111)2 (1110.011010111)2二进制与八进制之间的转换二进制与八进制之间的转换18整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后若不足3位的在高位处用0补够3位;小数部分从高位向低位每3位用一个等值的八进制数来替换,不足3位的在低位处用0补够3位。 (011 110 111 . 100 010 101)2(367.425)8 3 6 7 . 4 2 5 二进制数转换成八进制数二进制数转换成八进制数19十六进制数转换成二进制数把每一个十六进制数字改写成等值的4位二进制数即一位拆成四位,且要

10、保持高、低位的次序不变。二进制与十六进制间的转换二进制与十六进制间的转换20整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,即四位并为一位,最后不足4位时在高位处补0,补够4位;小数部分从高位向低位方向每4位用一个等值的十六进制数来替,最后不足4位时在低位处补0,补够4位。二进制数转换为十六进制数二进制数转换为十六进制数210 0000 1 0001 2 0010 3 0011 4 0100练练 习习5 01016 0110 7 0111 8 1000 9 100110 101011 101112 110013 110114 111015 1111(1110011010.111)2

11、 ( )8 ( )16 22计算机是美国人发明的,因此计算机的字符集中自然包含了英文的26个字母。计算机要在全世界通用,必须采用公认的标准格式对字符、符号进行编码。常用的字符编码有ASCII码、BCD码、西文字符编码和EBCDIC码。编编 码码23十进制数的二进制编码(BCD)是指十进制数在计算机中用二进制编码来表示。二十进制编码的方法很多,8421码是最常见的一种,即每一位十进制数用四位二进制编码来表示。例如,十进制数2816的8421码为: 十进制数 2 8 1 6 8421码 0010 1000 0001 0110 BCD BCD码在形式上变成了码在形式上变成了0 0和和1 1组成的二进

12、制形组成的二进制形式,而实际上它表示的是十进制数,只不过是式,而实际上它表示的是十进制数,只不过是每位十进制数是用每位十进制数是用4 4位二进制编码表示。位二进制编码表示。 BCDBCD(Binary Coded Decimal )(Binary Coded Decimal )码码24 ASCII码有标准ASCII码和扩展ASCII码两种。标准的ASCII码使用7位的二进制数来编码,即每一个字符对应着一个7位的二进制数。所以用标准的ASCII码可以表示27 = 128个字符,其中包含10个阿拉伯数字,52个英文大小字母,33个符号及33个控制字符。扩展的ASCII码用8位二进制数来表示,可以表

13、示256种不同的符号。ASCIIASCII码码 (A American merican S Standard tandard C Code for ode for I Information nformation I Interchangenterchange,美国标准信息,美国标准信息交换码)交换码)25西文字符处理起来比较简单,而中文信息处理起来就复杂了。汉字是图形文字,常用汉字就有30006000个,形状和笔画差异很大。这就决定了汉字字符的编码方案必须完全不同于西文的编码方案。在计算机系统中汉字的输入、内部处理、存储和输出过程中不能使用同一代码。输入码输入码机内码机内码字库字库字形码字形

14、码26输入码是解决汉字输入采用的编码,如“国标区位码”、“全拼”、“双拼”、“五笔”、“智能ABC”、“搜狗拼音”等输入编码。每一种输入码之所以能存在,是因为各有其特点。如果有人问,哪种输入码最好,回答是“你熟练掌握的那种输入码就是最好的”。输入码输入码27我国在1980年制定了信息交换用汉字编码字符集基本集作为国家标准GB2312-80编码字符集,称为国标码。GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括字母、数字和符号,例如英文、俄文、日文平、片假名等)的代码。在国家标准GB2312-80中,每个汉字采用双字节表示。每个字节只用ASCII码中的低7位,最

15、高位为0。国标码采用十六进制表示。每个汉字的区位码同时对应一个国标码。国标码国标码28十六进制编码十六进制编码十进制编码十进制编码区位编码区位编码国标码编码国标码编码0020002021 22 23 24 25 26 7C 7D 7E21 22 23 24 25 26 7C 7D 7E7F7F00002020 位位区区1 2 3 4 5 6 91 92 93 1 2 3 4 5 6 91 92 93 949421212F2F1 11515非汉字图形符号(常用符号、数字序号、俄文、非汉字图形符号(常用符号、数字序号、俄文、英文、法文、希腊字母、日文平、片假名等)英文、法文、希腊字母、日文平、片假

16、名等)3030575716165555啊啊 阿阿 埃埃 一级汉字一级汉字(37553755个)个)5858777756568787二级汉字(二级汉字(30083008个)个)78787E7E88889494空白区域空白区域7F7F29由于低7位中只有94种状态可用于汉字编码(其它34位是控制字符,不能用),所以两个字节的低7位共有94 94 = 8836种不同的状态。国标码将6763个汉字和682个非汉字字符(共7445个)划分为94个区,每个区又分为94位,称其为区位表。每个汉字在区位表中有唯一的一个区位码(四位十进制数,前两位数是区号,后两位数是位号)与之对应,称之为“区位码”。例如,汉字

17、“啊”在区位表中的编码是“1601”,既区号是“16”,位号是“01”。 30GB2312-80统一规定了汉字的基本编码标准,但是要存储在计算机中与西文编码在计算机中的表示有冲突。例如,英文字符“L”和“1”的ASCII码是“76”和“108”,而汉字的“天”的区位码也是“76”和“108”。问题出在ASCII码和汉字国标码都采用字节的低7位编码方式。为了避免冲突,将国标码两个字节的最高位置“1”,形成汉字的机内码。例如,汉字“中国”,的机内码分别是十六进制的“D6D0”和“B9FA” 。机内码机内码31国标码和机内码解决了汉字的编码标准和存储表示,但还没有解决汉字的显示和输出问题。一套汉字(

18、如GB2312)其所有字符形状的数字描述信息组合在一起称之为字库(font)。 对汉字形状的数据描述,我们称为汉字字形码。目前计算机系统中有两种字形码:点阵式字形码和矢量字形码。字形码字形码32以点阵方式来表示汉字。每个点用二进制的一位“0”或“1”来分别表示汉字相应位置处的状态,如白、黑特征,从而体现出字的形和体。点阵越大,点数越多,输出的字形就越清晰,越美观。常见的有1616、2424、3232、4848和128128。 通过一组直线和曲线的数学描述(端点及控制点的坐标),将汉字的每个笔画都转化为数字特征值,组合在一起便得到了这个汉字的字形矢量信息。通过矢量法表示的汉字字形大小、方向可以任

19、意变化,这种方式构成的汉字精度高、美观、清晰,Windows环境中使用的TrueType字库采用的就是典型的矢量字形表示法。缺点是输出前必须通过复杂的运算处理。字形码字形码33 “大”字的区号为20,位号为83,区位码为:2083,用14位二进制表示为: 0010100 1010011 国标码: 0110100 1110011 七位+七位 机内码:10110100 11110011 八位+八位(1) 字形码:1616点阵34汉字信息的处理过程汉字信息的处理过程35汉字处理过程中各种编码之间的关系,如下图所示。自动自动转换转换字节最高字节最高位置位置“1”转换(调用转换(调用汉字字库汉字字库)3

20、6声音、图形(Graphic)、图像(Image)等多种信息在计算机中的处理也是基于二进制的,但其表现形式是复杂多样的。采集量化编码多媒体信息的表示与采集多媒体信息的表示与采集描述数字声音的参数有:取样频率:一秒钟内采样的次数。量化位数:采样值的二进制位数。声道数目:一次采样所记录产生的声音波形个数,分为单声道和双声道。码率(Bit Rate):表示每秒的数据量,以kb/s为单位。采用的压缩编码方法:MPEG 通过对实际声音的波形信号进行数字化处理而获得的数字声音,我们称为“波形声音”。PC机中使用最广泛的波形声音文件是采用.wav作为扩展名的数据文件,称为波形文件格式。除此之外还有.mid、

21、.mp3等其它描述音乐的数据文件。合成声音是使用符号(参数)对声音进行描述,然后通过合成的方法来生成声音。典型的有MIDI声音。37声音信息的表示声音信息的表示381 1秒钟秒钟CDCD音质的数据量(码率)为:音质的数据量(码率)为: (44.1kHz (44.1kHz 16bit 16bit 2)2)8 = 1411.2kb/s 8 = 1411.2kb/s 8 = 8 = 176.4kB/s176.4kB/s 1 1小时小时CDCD音质的数据量为:音质的数据量为: 176.4kB/s 176.4kB/s 3600 3600 1000 = 635.04MB 1000 = 635.04MB声音

22、信息存储的文件大小计算声音信息存储的文件大小计算39 点阵图像(Dot Matrix Image)/位图图像(Bitmap) “图像”(Image) 几何图形/矢量图形 “图形”(Graphics)u通过以下几个方面对Image进行描述: 图像由一个像素组成的矩阵来表示。 矩阵中的行数称为图像的垂直分辨率, 列数称为图像的水平分辨率。 矩阵中的元素是像素彩色分量的亮度值,用整数表示,一般是8位12位。u描述数字图像属性指标有:图像的分辨率(图像大小)位平面的数目:彩色分量(Component)的数目彩色空间的类型:彩色图像所使用的颜色描述方法,也叫彩色模型。常见的彩色空间有RGB(红、绿、蓝)

23、空间、CMYK(青、橙、黄、黑)空间、YUV(亮度、色差)空间等。 图像信息的表示图像信息的表示l图像40像素的深度(所有分量的位数之和):决定了图像中可能出现不同颜色(灰度)的最大数目。例如,由R、G、B 三个位平面组成的彩色图像,若三个位平面中像素的位数分别为4、4、2,此时,该图像的深度为10,因而像素的最大颜色数目为24+4+2=210 =1024。 一幅图像的数据量按下面的公式进行计算(以字节为单位):图像数据量图像数据量= =图像宽度图像宽度图像高度图像高度图像深度图像深度/8/8图像信息存储的文件大小计算图像信息存储的文件大小计算41 图形的形成可以简单地认为是通过使用专业的命令

24、集合来描述形成图形的各种几何要素,如直线、圆、矩形等,同时还要确定它们的位置、大小、线条粗细等等,并能把它们组合在一起构成一幅完整的图像。 用计算机实现时: 造型(Modeling)-绘制(Rendering)/图像合成(Image Synthesis)图形及图像合成图形及图像合成42信息组织是依据信息资源的主题内容或特征,利用一定的规则和方法,通过对其特征的分析、选择、处理,将无序的信息资源组织为有序集合的过程。 信息组织的层次结构位、字节、域、记录、文件 、数据库文件和数据库技术信息的组织信息的组织二进制的运算二进制的运算1 1算术运算算术运算(1)加法运算。(2)减法运算。 2 2逻辑运

25、算逻辑运算(1)逻辑加法( OR “或”运算)。(2)逻辑乘法( AND“与”运算)。(3)逻辑否定( NOT“非”运算)。数据的单位数据的单位数据单位换算公式如下:1Byte=8Bit1KB=1024Byte=210 Byte1MB=1024KB=220 Byte1GB=1024MB=230 Byte1TB=1024GB=240 Byte45进制和不同进制之间的转换编码:字符、文字处理。多媒体信息的表示与采集信息的组织数据编码的基本方式数据编码的基本方式谢谢大家谢谢大家47数据编码的基本方式数据编码的基本方式指用一组固定的符号和统一的规则来表示数值的方法。是采用少量的基本符号,选用一定的组合

26、原则,以表示大量复杂多样的信息的技术。计算机只认识“ ”和“ ”,任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。48最多只有两个不同的数字符号,即 和 。逢二进一。 (基数为二,逢二进一,借一为二。)0,1两个状态易物理实现;运算规则简单。算术运算与逻辑运算容易沟通。一、二进制数一、二进制数49二进制数与其它数制的对照表二进制数与其它数制的对照表 0000 0 0 00001 1 1 10010 2 2 20011 3 3 30100 4 4 40101 5 5 50110 6 6 60111 7 7 71000 8 10 81001 9 11 91010 10 12 A

27、1011 11 13 B1100 12 14 C1101 13 15 D1110 14 16 E1111 15 17 F 50不同进制数之间的转换不同进制数之间的转换二进制二进制八进制八进制十进制十进制十六进制十六进制51十进制整数转换为二进制整数十进制整数转换为二进制整数除二取余,直到商为零为止,倒排。除二取余,直到商为零为止,倒排。, ,(86)(86)1010=(1010110)=(1010110)2 20 0所以所以52:乘二取整,直到小数部分为零或给定的精度为止,顺排。 例:将十进制数0.875转化为二进制数 0.875 2 .75 0.75 2 .5 0.5 2 .0 所以(0.8

28、75)10=(0.111)2 十进制小数转换为二进制小数十进制小数转换为二进制小数53(1101.1)(1101.1)2 2=1=12 23 3+1 +1 2 22 2+0+02 21 1+1 +1 2 20 0+1 +1 2 2-1-1 = =(8+2+1+0.5+0.258+2+1+0.5+0.25)1010 = =(11.7511.75)10 10 二进制数转换为十进制数二进制数转换为十进制数按按“权权”展开,求和。展开,求和。54二、计算机的数据单位与编码二、计算机的数据单位与编码1 1数据单位数据单位 (1 1)位()位(bitbit):位是计算机中存储数据的最小单位,指二进制数中的

29、一个):位是计算机中存储数据的最小单位,指二进制数中的一个位数,其值为位数,其值为“0”0”或或“1”1”。 (2 2)字节()字节(bytebyte):字节是计算机存储容量的基本单位,一个字节由):字节是计算机存储容量的基本单位,一个字节由8 8位二位二进制数组成。在计算机内部,一个字节可以表示一个数据,也可以表示一个英进制数组成。在计算机内部,一个字节可以表示一个数据,也可以表示一个英文字母,两个字节可以表示一个汉字。文字母,两个字节可以表示一个汉字。10241024个字节称为个字节称为1K1K字节(字节(1KB1KB),),1024K1024K个字节称为个字节称为1 1兆字节(兆字节(1MB1MB),),1024M1024M个字节称为个字节称为1 1吉字节(吉字节(1GB1GB)。)。 (3 3)字()字(wordword):字是指计算机一次存取、加工、运算和传送的数据长度,):字是指计算机一次存取、加工、运算和传送的数据长度,一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论