计算机中的信息表示_第1页
计算机中的信息表示_第2页
计算机中的信息表示_第3页
计算机中的信息表示_第4页
计算机中的信息表示_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 进位计数制1. 常见的进位计数制Binary 二进制 Octonary八进制 Decimalism十进制 Hexadecimal十六进制0.7725x2=1.545010.7725进位计数制:利用固定的数字符号和统一的规则来计数的方法。有3个基本要素:基数->指数制中可以使用的基本符号个数。进位规则->R进制数逢R进1。0.5450x2=1.0900210位权->不同位置上数字表示的单位数值0.0900x2=0 常见的进位计数制的数的转换0.1800x2=0.36002011.二、八、十六进制转成十进制10多项式展开直接求和1010.11002

2、.十进制转换成二进制整数部分:除基到零,反向写余小数部分:乘基到精,正向写整3. 二进制转成八、十六进制12.60001010.110000小数点为界,向两边分组。八进制3个一组,十六进制4个一组,不足添0。各组二进制转成十进制再转成八(十六)进制即可。2.计算机中的数据1.二进制与计算机位(bit):计算机中最基本的单位,一个二进制数字0/1。字节(Byte):8个位。字:字节的集合。字长:一个字中二进制的位数。字长是计算机一次能同时进行运算的二进制位数。现在一般为32bit、64bit。一般来说,n位的二进制数字能够表示种状态。2. 模拟数据和数字数据模拟数据:一种连续表示法,模拟它表示的

3、真实信息。数字数据:一种离散表示法,把信息分割成了独立的元素。阈值:大于阈值的电压看成高电压,小于阈值的电压看成低电压。计算机不能处理模拟数据,要对模拟数据进行数字化。3. 数据及其分类数值、文本、音频、视频、图像、图形。4. 数值型数据的表示机器数:一个数在计算机中的表示形式。机器数有位数限制,多余的位数将被截断,少的位数将被填充。(机器数的)真值:带有正负号的数。1. 数值型数据的分类根据是否带小数点分为实数和整数。按照是否带有符号,整数分为带符号和无符号。对于带符号的整数要对符号进行编码。数值数据可以用原码和补码表示。定点小数定点整数补码原码直接表示无符号整数带符号整数定点表示浮点表示整

4、数实数数值型数据为了表示实数中的小数点的位置,可以表示为定点数或浮点数。2. 整数的表示无符号整数表示:转成二进制数,对不足机器字长的在前面补0。最小值全是0,最大值全是1。00001010带符号整数表示:0表示正,1表示负。符号位占用一位二进制数位。0填充绝对值符号位原码:最高位符号位,其余位数是数值的绝对值。加111110110取反1111010110001010补码:正数同原码,负数补码除符号位外其他位取反,末尾位加1。数值位假想的小数点假想的小数点符号位数值位+、-0的补码一致。符号位定点小数定点整数3. 实数的表示定点数的表示:定点数就是在运算过程中小数点的位置固定不变。小数点位置不

5、一定是明确指定的。由于小数点位置固定,计算时可以直接进行加减运算。=(0.1110100)x阶码(定点整数)尾数(定点小数)尾数(定点小数)基数(2,二进制)基数(2,二进制)浮点数的表示:任何一个数都可以用科学计数法来表示,这种表示方法称为浮点表示法。浮点数的一般表示形式:单精度(32b)尾数(23b)符号(1b)阶码(8b)IEEE 754规定单精度浮点数(32b)双精度浮点数(64b)。(-0.1110100)x取反加11111111111111111000110000000000000000001110100阶码的符号0 00001101对于二进制实数,现将其写成尾数是定点小数的科学计

6、数法的形式。再将其尾数扩充为23位,阶码扩充为8位,再把尾数转换成补码形式。4. 溢出计算机中n位有符号数的表示范围()。超出范围会产生溢出。5. 文本表示一个文本是由一系列字符构成的。要处理一个文本,必须表示和存储每个可能出现的字符。内码:字符在计算机中存储和处理时的编码。1. 文本类型1. 简单文本:仅由一串字符代码组成,没有字体字号的变化和其他媒体。文件扩展名为txt。2. 丰富格式文本:允许在文档中设置格式(字体、颜色、页边距、自选图形、公式等)的文本。3. 超文本(HTML文本):有声音、视频等多媒体信息,还有链接。不管是哪种类型,核心问题是要表示字符本身,格式符号需要单独表示。最早

7、也是最常用的方法是列出所有字符,给每个字符编一个二进制位串。要表示的符号数决定了需要多少二进制位数来表示。西文字符>ASCII码汉字字符>GB 2312-1980全世界所有字符>Unicode码2. 文本内码1. ASCII码美国标准信息互换标准代码。最初,ASCII字符集中每个字符由7个二进制位表示,总共有128个不同字符。用一个字节存储,第8位用作校验位。ASCII码表中特殊的33个字符(031和127)是不可显示和打印的控制码。比如CR(回车)。2. Unicode编码表示世界上使用的所有语言的所有字符。Unicode使用16位表示每个字符,能够表示个字符。Unicod

8、e字符集是ASCII字符集的超集。Unicode常用的两种编码方案如下:1) UTF-8单字节可变长编码:每个字符占14个字节。有单、双、三、四字节。2) UTF-16双字节可变长编码:每个字符占2或4个字节。3. 汉字编码汉字内码是计算机内部使用的用二进制表示的汉字编码。i) 区位码1 94x94个ASCII字符为基础构成二维平面,行为区,列为位。每一个汉字/字符都对应唯一一个区(左)位(右)号。每个汉字用2个字节表示。1ii) 汉字内码GB2312标准ASCII码用1个字节表示,最高位为0。汉字内码用2个字节来表示,每个字节最高位是1。为了与ASCII码的可打印字符位置一致,在区号和位号上

9、分别加上20H(32),称为国标码。D6H D0H+20H+80H56H 50H10->1636H 30H5448区位码转换成机内码的方法是:将十进制的区码和位码转成十六进制的,将他们分别加上20H得到国际码。再在高低字节上加上80H。Ex:中国OK! 占2+2+1+1+1=7个字节1/011iii) 汉字内码GBK标准编码1995年汉字内码扩充标准。要求双字节最高位为1。iv) 汉字内码 GB18030汉字编码标准国家发布过GB 18030-2000和GB 18030-2005,现已强制贯彻执行。4. 文本输入1 键盘输入2 联机手写输入3 语音输入4 印刷体识别5. 文本输出1. 字

10、符点阵描述每个字符按照图形符号设计成点阵图,用一位二进制对应屏幕上的一个点,亮为1暗为0,就得到相应的点阵代码(字形码)。2. 字符轮廓描述以字符轮廓的转折点为特征来描述字符,又称矢量字体。用一组直线和曲线命令以及一些参数来描述字体的轮廓。3. 字库把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中,称为字形库。C:windowsfonts4. 文本压缩数据压缩:又称数据编码。是为了在存储和传输数据时减小数据所占空间大小的方法。分为有损/无损。压缩率:原始数据大小/压缩后大小。1. 关键字编码:用单个字符代替常用单词。2. 行程长度编码:又称迭代编码。将重复的字符序列替换为标志字

11、符。后面加重复字符和说明重复次数的数字。Ex:*A7 就是AAAAAAA。3. 赫夫曼编码用不同长度的二进制位串表示不同字符。把较少的位串表示经常出现的字符,而较长的位串表示不常出现的字符。1010110001111011郝夫曼编码的重要特征:用于表示一个字符的位串是表示另一个字符的位串的前缀。从左到右扫描一个位串事,每当发现一个位串对应一个字符时,他就一定表示这个字符,他不可能是更长的位串的前缀。BOARD5.图像和图形的表示1.颜色表示三基色原理:人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。计算机中颜色表示:用RGB指表示。RGB是3个数(0255),表示每种颜色占

12、的比例。对颜色编码:把一种颜色分解为RGB值的过程。颜色深度:用于表示颜色的数据量。通常用表示颜色的位数来表示。现在用24位的真彩色表示(3x8),即RGB值中的每个数字由8位表示,范围是0255。能表示1670万种颜色。2. 图像数字化数字化图像:将图像按照行和列的方式均匀地划分为若干个小格子(像素)。分辨率:水平像素点x垂直像素点。图像:像素点的集合。存储一幅图像就是要存储图像上每个像素点的信息。图像的编码:每个像素呈现一种颜色(灰度层次),对每个像素进行RGB编码,再把所有行列的像素编码连接起来。图像的获取:是模拟信号数字化的过程。扫描、分色、取样、量化、编码。3. 数字图像的表示根据图

13、像中每个像素点的信息位数,可将图像分为彩色图像、灰度图像和黑白图像。1. 彩色图像:由RGB 3个彩色分量组成,需要用3个矩阵分别表示每个彩色分量的亮度值。2. 灰度图像:每个像素只有1个灰度分量。通常8位表示,代表256个灰度。人眼能识别的灰度大概是100个。3. 黑白图像:每个像素只有1个黑色分量。只用一个二进制位表示。取值只有0(黑)1(白)。二值化:把图像转换成黑白图像的操作。二值化选定一个阈值,高于它为黑,反之为白。4. 图像的存储和压缩图像数字化后的大小 = 水平分辨率x垂直分辨率x颜色深度/81024x1024x24/8=3.75MB图像压缩:提高在网络上传输的速度。流行的图像压

14、缩都遵循静态图像压缩国际标准JPEG。流行的逐个像素存储图像方法有位图(BMP)、GIF、PNG、JPEG、TIFF、PSD,他们都采用了不同方式的压缩方式。5. 图形的表示图形:由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。分为平面图形和三维图形。矢量图形:计算机图形一般用矢量图形格式来描述。它不适用于描述真实世界的图像,是用于艺术线条和卡通绘画。图像效果差,但是放大不失真。常见格式:3DSDXFWMFFLASHSVG。6.音频信息表示1.声音数字化采样:周期性测量模拟信号的电压,记录合适的数值。将模拟信号数字化。量化:把采样的结果用有限个数字表示出来。量化精度:量化的二进制数值的位数。每秒声音的数据量可以用声音的码率来表示(每秒二进制位b/s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论