版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于数据编码的基本方式第一页,共六十三页,2022年,8月28日了解二进制的基本原理和进制转换方法知道数值、文字、图形图像、音视频等数据在计算机中的编码方式。学习目标第二页,共六十三页,2022年,8月28日3
计算机最主要的功能就是处理信息,而信息在计算机中如何表示、存放、传递?这是首先要解决的问题。基本要求是:信息的表示、存放和传递要方便、可靠、易处理。显然,在计算机内部,信息只有经过数字化编码后才能表示、存放和传递。计算机与信息处理第三页,共六十三页,2022年,8月28日4信息的表示及采集编码:用少量的基本符号,根据简单的组合规则,以表示大量复杂的信息。二进制:是一种最简单的编码系统。多媒体信息的表示与采集基于计算机的信息处理信息的组织信息的传输信息的检索数据编码的基本方式第四页,共六十三页,2022年,8月28日5计算机中的信息采用二进制编码来表示。二进制表示数字容易实现(只有0、1)。二进制运算规则简单(逢二进一)。二进制编码在物理上最容易实现;自然界中具有两个固定状态的物理量很多,例如:电流的有无、电压的高低等。计算机为什么选用二进制第五页,共六十三页,2022年,8月28日6数制:人们利用符号来计数的科学方法。进位计数制:按一定进位规则进行计数的方法。基数:是指该进制中允许使用的基本数码的个数。十进制的基数为10,数码为0,1,2,…,9十个。二进制的基数为2,数码为0,1两个。八进制的基数为8,数码为0,1,…,7八个。十六进制的基数为16,数码为0~9,A~F十六个。位权:数制每一位所具有的值,简记为“权”。计算机中的数制第六页,共六十三页,2022年,8月28日7基数权数码按权展开式:234.32=2*102+3*101+4*100+3*10-1+2*10-2第七页,共六十三页,2022年,8月28日8在按位定制的计数制中,十进制数可以表示成下列形式(用D代表或略去,无后缀符默认为十进制数):(D)10=åDi×10i
=Dn-1×10n-1+Dn-2×10n-2++D0×100+D-1×10-1++D-m×10-m举例:519.02=5×102+1×101+9×100+0×10-1+2×10-2特点:有0-9十个数字符号,基数为10,是逢十进一的计数制,各数位的权是以10为底的幂。n-1
i=-m十进制表示法第八页,共六十三页,2022年,8月28日9一个二进制数可以表示成下列形式(用B代表):(B)2=Bn-1×2n-1+Bn-2×2n-2++B0×20+B-1×2-1
+B-m×2-m举例:
1101.01=1×23+1×22+0×21+1×20+0×2-1+1×2-2
特点:数值用0,1表示,基数为2,是逢二进一的计数制,各数位的权是以2为底的幂。表示:1101.01B或(1101.01)2二进制表示法第九页,共六十三页,2022年,8月28日10一个八进制数可以表示成下列形式(用Q代表):(B)8=Bn-1×8n-1+Bn-2×8n-2++B0×80+B-1×8-1
+B-m×8-m举例:
3765.02=3×83+7×82+6×81+5×80+0×8-1+2×8-2
特点:数值用0-7表示,基数为8,是逢八进一的计数制,各数位的权是以8为底的幂。表示:452.16Q或(1101.01)8八进制表示法第十页,共六十三页,2022年,8月28日11一个十六进制数可以表示成(用H代表):(H)16=Hn-1×16n-1+Hn-2×16n-2++H0×20+H-1×16-1
+H-m×16-m举例:
A3F.3B=10×162+3×16+15×160+3×16-1+11×16-2特点:有0-9及A-F共16个数字符号,基数为16,是逢十六进一的计数制,各数位的权是以16为底的幂。表示:3EFH或(20)16十六进制表示法第十一页,共六十三页,2022年,8月28日12二进制八进制十进制十六进制不同进制数之间的转换第十二页,共六十三页,2022年,8月28日13(11001.101)2=1×24+1×23+0×22+0×21+1×20+1×2–1+0×2–2+1×2–3=(25.625)10(16A.B)16=(1×162+6×161+10×160
+11×16-1)10
=(256+96+10+0.69)10
=(362.69)10(34.6)8=?=
(
3×81+4×80
+6×8-1)10=(24+4+0.75)10=(28.75)10二、八、十六进制转换成十进制第十三页,共六十三页,2022年,8月28日14
方法:除2反序取余法例:(29)10=(?)2
结果:(29)10=(11101)2291473122222……1……00……1……1……1(高位)(低位)十进制整数转换成二进制整数第十四页,共六十三页,2022年,8月28日15方法:乘2顺序取整法例:(0.125)10=(?)2结果:(0.125)10=(0.001)20.500×21
.000(低位)0.250×2
0.125(高位)
×2并非所有的十进制小数都能用有限位的二进制小数来表示。例如将(0.63)10转换为二进制。因为,小数部分乘以2会无限循环下去,故:只能取近似值。十进制小数转换成二进制小数第十五页,共六十三页,2022年,8月28日16100(D)=144(Q)=64(H)八进制100812818044110016604616十六进制十进制转化成八、十六进制第十六页,共六十三页,2022年,8月28日17八进制数转换为二进制数
只需将每一个八进制数字改写成等值的3位二进制数即可,且要保持高、低位次序的不变。
(16.327)8=(001110.011010111)2
=(1110.011010111)2二进制与八进制之间的转换第十七页,共六十三页,2022年,8月28日18
整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后若不足3位的在高位处用0补够3位;小数部分从高位向低位每3位用一个等值的八进制数来替换,不足3位的在低位处用0补够3位。
(011110111.100010101)2=(367.425)8367.425二进制数转换成八进制数第十八页,共六十三页,2022年,8月28日19十六进制数转换成二进制数
把每一个十六进制数字改写成等值的4位二进制数即一位拆成四位,且要保持高、低位的次序不变。(4C.2E)16=(0100
1100.0010
1110)2
4C2E
=(1001100.0010111)2
二进制与十六进制间的转换第十九页,共六十三页,2022年,8月28日20
整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,即四位并为一位,最后不足4位时在高位处补0,补够4位;小数部分从高位向低位方向每4位用一个等值的十六进制数来替,最后不足4位时在低位处补0,补够4位。
(1110
0101
1010.1011
1001)2
=(E5A.B9)16E5A.B9
二进制数转换为十六进制数第二十页,共六十三页,2022年,8月28日210
0000
1
0001
2
0010
3
0011
4
0100练习5
01016
0110
7
0111
8
1000
9
100110
101011
101112
110013
110114
111015
1111(1110011010.111)2=()8=()16=
第二十一页,共六十三页,2022年,8月28日22计算机是美国人发明的,因此计算机的字符集中自然包含了英文的26个字母。计算机要在全世界通用,必须采用公认的标准格式对字符、符号进行编码。常用的字符编码有ASCII码、BCD码、西文字符编码和EBCDIC码。编码第二十二页,共六十三页,2022年,8月28日23
十进制数的二进制编码(BCD)是指十进制数在计算机中用二进制编码来表示。 二·十进制编码的方法很多,8421码是最常见的一种,即每一位十进制数用四位二进制编码来表示。 例如,十进制数2816的8421码为:十进制数28168421码0010100000010110BCD码在形式上变成了0和1组成的二进制形式,而实际上它表示的是十进制数,只不过是每位十进制数是用4位二进制编码表示。BCD(BinaryCodedDecimal)码第二十三页,共六十三页,2022年,8月28日24
ASCII码有标准ASCII码和扩展ASCII码两种。
标准的ASCII码使用7位的二进制数来编码,即每一个字符对应着一个7位的二进制数。所以用标准的ASCII码可以表示27=128个字符,其中包含10个阿拉伯数字,52个英文大小字母,33个符号及33个控制字符。
扩展的ASCII码用8位二进制数来表示,可以表示256种不同的符号。
ASCII码
(AmericanStandardCodeforInformationInterchange,美国标准信息交换码)第二十四页,共六十三页,2022年,8月28日25西文字符处理起来比较简单,而中文信息处理起来就复杂了。汉字是图形文字,常用汉字就有3000~6000个,形状和笔画差异很大。这就决定了汉字字符的编码方案必须完全不同于西文的编码方案。在计算机系统中汉字的输入、内部处理、存储和输出过程中不能使用同一代码。输入码机内码字库字形码第二十五页,共六十三页,2022年,8月28日26输入码是解决汉字输入采用的编码,如“国标区位码”、“全拼”、“双拼”、“五笔”、“智能ABC”、“搜狗拼音”等输入编码。每一种输入码之所以能存在,是因为各有其特点。如果有人问,哪种输入码最好,回答是“你熟练掌握的那种输入码就是最好的”。输入码第二十六页,共六十三页,2022年,8月28日27我国在1980年制定了《信息交换用汉字编码字符集·基本集》作为国家标准GB2312-80编码字符集,称为国标码。GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括字母、数字和符号,例如英文、俄文、日文平、片假名等)的代码。在国家标准GB2312-80中,每个汉字采用双字节表示。每个字节只用ASCII码中的低7位,最高位为0。国标码采用十六进制表示。每个汉字的区位码同时对应一个国标码。国标码第二十七页,共六十三页,2022年,8月28日28十六进制编码十进制编码区位编码国标码编码
00……20
212223242526…………7C7D7E7F00~20
位区123456………………91929394
21~2F1~15非汉字图形符号(常用符号、数字序号、俄文、英文、法文、希腊字母、日文平、片假名等)
30~5716~55啊阿埃一级汉字(3755个)
58~7756~87二级汉字(3008个)
78~7E88~94空白区域
7F
第二十八页,共六十三页,2022年,8月28日29由于低7位中只有94种状态可用于汉字编码(其它34位是控制字符,不能用),所以两个字节的低7位共有94×94=8836种不同的状态。国标码将6763个汉字和682个非汉字字符(共7445个)划分为94个区,每个区又分为94位,称其为区位表。每个汉字在区位表中有唯一的一个区位码(四位十进制数,前两位数是区号,后两位数是位号)与之对应,称之为“区位码”。例如,汉字“啊”在区位表中的编码是“1601”,既区号是“16”,位号是“01”。第二十九页,共六十三页,2022年,8月28日30GB2312-80统一规定了汉字的基本编码标准,但是要存储在计算机中与西文编码在计算机中的表示有冲突。例如,英文字符“L”和“1”的ASCII码是“76”和“108”,而汉字的“天”的区位码也是“76”和“108”。问题出在ASCII码和汉字国标码都采用字节的低7位编码方式。为了避免冲突,将国标码两个字节的最高位置“1”,形成汉字的机内码。例如,汉字“中国”,的机内码分别是十六进制的“D6D0”和“B9FA”
。机内码第三十页,共六十三页,2022年,8月28日31国标码和机内码解决了汉字的编码标准和存储表示,但还没有解决汉字的显示和输出问题。一套汉字(如GB2312)其所有字符形状的数字描述信息组合在一起称之为字库(font)。对汉字形状的数据描述,我们称为汉字字形码。目前计算机系统中有两种字形码:点阵式字形码和矢量字形码。字形码第三十一页,共六十三页,2022年,8月28日32以点阵方式来表示汉字。每个点用二进制的一位“0”或“1”来分别表示汉字相应位置处的状态,如白、黑特征,从而体现出字的形和体。点阵越大,点数越多,输出的字形就越清晰,越美观。
常见的有16×16、24×24、32×32、48×48和128×128。通过一组直线和曲线的数学描述(端点及控制点的坐标),将汉字的每个笔画都转化为数字特征值,组合在一起便得到了这个汉字的字形矢量信息。通过矢量法表示的汉字字形大小、方向可以任意变化,这种方式构成的汉字精度高、美观、清晰,Windows环境中使用的TrueType字库采用的就是典型的矢量字形表示法。缺点是输出前必须通过复杂的运算处理。字形码第三十二页,共六十三页,2022年,8月28日33
“大”字的区号为20,位号为83,区位码为:2083,用14位二进制表示为:00101001010011
国标码:01101001110011七位+七位
机内码:1011010011110011八位+八位(1)
字形码:16×16点阵第三十三页,共六十三页,2022年,8月28日34汉字信息的处理过程第三十四页,共六十三页,2022年,8月28日35汉字处理过程中各种编码之间的关系,如下图所示。自动转换字节最高位置“1”转换(调用汉字字库)第三十五页,共六十三页,2022年,8月28日36声音、图形(Graphic)、图像(Image)等多种信息在计算机中的处理也是基于二进制的,但其表现形式是复杂多样的。采集——量化——编码多媒体信息的表示与采集第三十六页,共六十三页,2022年,8月28日37描述数字声音的参数有:取样频率:一秒钟内采样的次数。量化位数:采样值的二进制位数。声道数目:一次采样所记录产生的声音波形个数,
分为单声道和双声道。码率(BitRate):表示每秒的数据量,以kb/s为单位。
采用的压缩编码方法:MPEG通过对实际声音的波形信号进行数字化处理而获得的数字声音,我们称为“波形声音”。PC机中使用最广泛的波形声音文件是采用.wav作为扩展名的数据文件,称为波形文件格式。除此之外还有.mid、.mp3等其它描述音乐的数据文件。合成声音是使用符号(参数)对声音进行描述,然后通过合成的方法来生成声音。典型的有MIDI声音。声音信息的表示第三十七页,共六十三页,2022年,8月28日381秒钟CD音质的数据量(码率)为:
(44.1kHz×16bit×2)÷8=1411.2kb/s÷8=176.4kB/s
1小时CD音质的数据量为:
176.4kB/s×3600÷1000=635.04MB声音信息存储的文件大小计算第三十八页,共六十三页,2022年,8月28日39
点阵图像(DotMatrixImage)/位图图像(Bitmap)“图像”(Image)
几何图形/矢量图形“图形”(Graphics)通过以下几个方面对Image进行描述:
①图像由一个像素组成的矩阵来表示。②矩阵中的行数称为图像的垂直分辨率,
列数称为图像的水平分辨率。③矩阵中的元素是像素彩色分量的亮度值,用整数表示,一般是8位-12位。
描述数字图像属性指标有:图像的分辨率(图像大小) 位平面的数目:彩色分量(Component)的数目 彩色空间的类型:彩色图像所使用的颜色描述方法,也叫彩色模型。常见的彩色空间有RGB(红、绿、蓝)空间、CMYK(青、橙、黄、黑)空间、YUV(亮度、色差)空间等。图像信息的表示图像第三十九页,共六十三页,2022年,8月28日40
像素的深度(所有分量的位数之和):决定了图像中可能出现不同颜色(灰度)的最大数目。例如,由R、G、B三个位平面组成的彩色图像,若三个位平面中像素的位数分别为4、4、2,此时,该图像的深度为10,因而像素的最大颜色数目为24+4+2=210=1024。
一幅图像的数据量按下面的公式进行计算(以字节为单位):
图像数据量=图像宽度×图像高度×图像深度/8图像信息存储的文件大小计算第四十页,共六十三页,2022年,8月28日41
图形的形成可以简单地认为是通过使用专业的命令集合来描述形成图形的各种几何要素,如直线、圆、矩形等,同时还要确定它们的位置、大小、线条粗细等等,并能把它们组合在一起构成一幅完整的图像。用计算机实现时:造型(Modeling)----绘制(Rendering)/图像合成(ImageSynthesis)图形及图像合成第四十一页,共六十三页,2022年,8月28日42信息组织是依据信息资源的主题内容或特征,利用一定的规则和方法,通过对其特征的分析、选择、处理,将无序的信息资源组织为有序集合的过程。信息组织的层次结构位、字节、域、记录、文件、数据库文件和数据库技术信息的组织第四十二页,共六十三页,2022年,8月28日二进制的运算1.算术运算(1)加法运算。(2)减法运算。
2.逻辑运算(1)逻辑加法(OR“或”运算)。(2)逻辑乘法(AND“与”运算)。(3)逻辑否定(NOT“非”运算)。第四十三页,共六十三页,2022年,8月28日数据的单位数据单位换算公式如下:1Byte=8Bit1KB=1024Byte=210Byte1MB=1024KB=220Byte1GB=1024MB=230Byte1TB=1024GB=240Byte第四十四页,共六十三页,2022年,8月28日45进制和不同进制之间的转换编码:字符、文字处理。多媒体信息的表示与采集信息的组织数据编码的基本方式第四十五页,共六十三页,2022年,8月28日谢谢大家第四十六页,共六十三页,2022年,8月28日47数据编码的基本方式数制(计数制)
指用一组固定的符号和统一的规则来表示数值的方法。编码
是采用少量的基本符号,选用一定的组合原则,以表示大量复杂多样的信息的技术。计算机只认识“0”和“1”,任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。第四十七页,共六十三页,2022年,8月28日48二进制数的特点:最多只有两个不同的数字符号,即0和1。逢二进一。
(基数为二,逢二进一,借一为二。)二进制优点:0,1两个状态易物理实现;运算规则简单。算术运算与逻辑运算容易沟通。一、二进制数第四十八页,共六十三页,2022年,8月28日49二进制数与其它数制的对照表二进制
十进制
八进制
十六进制00000000001111001022200113330100444010155501106660111777100081081001911910101012A10111113B11001214C11011315D11101416E11111517F第四十九页,共六十三页,2022年,8月28日50不同进制数之间的转换二进制八进制十进制十六进制第五十页,共六十三页,2022年,8月28日51十进制整数转换为二进制整数规则:除二取余,直到商为零为止,倒排。例:将十进制数86转化为二进制
2|86……0 2|43……12|21……1 2|10……02|5……1 2|2……02|1……10所以,(86)10=(1010110)2第五十一页,共六十三页,2022年,8月28日52规则:乘二取整,直到小数部分为零或给定的精度为止,顺排。例:将十进制数0.875转化为二进制数
0.875
╳2
1.750.75
╳2
1.50.5
╳2
1.0所以(0.875)10=(0.111)2
十进制小数转换为二进制小数第五十二页,共六十三页,2022年,8月28日53例:(1999.8)10=1╳103+9╳102+9╳101+9╳100+8╳10-1“权”(1101.1)2=1╳23+1╳22+0╳21+1╳20+1╳2-1
=(8+2+1+0.5+0.25)10=(11.75)10二进制数转换为十进制数规则:按“权”展开,求和。第五十三页,共六十三页,2022年,8月28日54二、计算机的数据单位与编码1.数据单位
(1)位(bit):位是计算机中存储数据的最小单位,指二进制数中的一个位数,其值为“0”或“1”。(2)字节(byte):字节是计算机存储容量的基本单位,一个字节由8位二进制数组成。在计算机内部,一个字节可以表示一个数据,也可以表示一个英文字母,两个字节可以表示一个汉字。1024个字节称为1K字节(1KB),1024K个字节称为1兆字节(1MB),1024M个字节称为1吉字节(1GB)。(3)字(word):字是指计算机一次存取、加工、运算和传送的数据长度,一个字的二进制位数称为字长。计算机中常用的字长有8位、16位、32位、64位等。第五十四页,共六十三页,2022年,8月28日55存储容量:一个存储器中存储单元的总数称为该存储器的存储容量。表示存储容量的单位有字节(B)、KB、MB、GB、TB,它们之间的关系是
1KB=1024B,
1MB=1024KB,
1GB=1024MB,
1TB=1024GB。二、计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于2024年度市场环境甲乙双方关于高新技术产品研发与成果共享的股权激励合同3篇
- 2024年度股权转让及投资框架协议
- 航空航天吊车租赁协议模板
- 港口码头施工便道工程合同
- 简易道路铺设工程合同模板
- 眼镜店钥匙使用指南
- 2024年新版公司聘用劳动协议样式版B版
- 桌球室换热站安装合同
- 烟草机械融资租赁合同范本
- 2024年专业管桩基础工程劳务分包协议
- 居民死亡医学证明(推断)书
- 医学影像学论文5000
- 《新编普通高校大学生军事课教程》第二章
- 口腔诊所医师技术操作规范流程
- 班主任带班育人方略ppt
- 船员安全守册
- 2023年四川事业单位之综合高频考点题库(共500题含答案解析)模拟练习试卷
- 2023-2024人教版小学5五年级数学下册(全册)教案
- 急救类生命支持类应急预案演练-
- 《反比例函数中比例系数k的几何意义》优课一等奖教学设计
- 安全生产费用投入台帐明细
评论
0/150
提交评论