第一部分 信息的存储与表示_第1页
第一部分 信息的存储与表示_第2页
第一部分 信息的存储与表示_第3页
第一部分 信息的存储与表示_第4页
第一部分 信息的存储与表示_第5页
已阅读5页,还剩188页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一部分信息的存储与表示第1页,共193页,2023年,2月20日,星期三2信息是什么?(1)关于信息(information),至今并没有统一的定义日常生活中比较笼统和模糊的几种解释是:语言、文字、图画、照片等表示的内容(新闻、消息或知识)读书、上课、交谈等所学习和了解的知识、方法、事实和情况为了做判断、订计划或求解问题等所需要的数据、资料···第2页,共193页,2023年,2月20日,星期三3信息是什么?(2)中国大百科全书的解释:从认识论层次来看,信息是指认识主体所感知或主体所表述的“事物运动的状态及状态变化的方式”信息因它所表达的内容而有一定的价值,也因能相互交流而体现其作用信息有多种表现形式,语言、文字、声音、图片等都是信息的表现形式(载体)信息与物质和能量同样重要,它是人们认识世界、改造世界的一种基本资源第3页,共193页,2023年,2月20日,星期三4什么是信息处理?信息处理指的是与下列内容相关的行为和活动:信息的收集(如信息的感知、测量、获取、输入等)信息的加工(如信息的分类、计算、分析、转换等)信息的存储(如书写、摄影、录音、录像等)信息的传递(如邮寄、电报、电话、广播等)信息的施用(控制、显示、指挥、管理等)第4页,共193页,2023年,2月20日,星期三5人工信息处理人们用眼睛、耳朵、鼻子、手等感觉器官直接获取外界的各种信息,然后经神经系统传递到大脑,再经过大脑的分析、归纳、综合、比较、判断等处理后,能产生更有价值的信息,并且采用说话、写字、动作、表情等方式输出信息第5页,共193页,2023年,2月20日,星期三6人工进行信息处理的过程人工信息处理的不足:算不快记不住传不远

看(听)不清事物客体信息获取(感觉器官)信息加工与存储(大脑)信息传递(神经系统)信息施用(效应器官)信息传递(神经系统)信息技术(IT)手/脚/身眼/耳/鼻/舌/身第6页,共193页,2023年,2月20日,星期三7什么是信息技术?信息技术(InformationTechnology,简称IT)指的是用来扩展人们信息器官功能、协助人们更有效地进行信息处理的一门技术。内容包括:扩展感觉器官功能的感测(获取)技术扩展神经系统功能的通信技术扩展大脑功能的计算与存储技术扩展效应器官功能的控制与显示技术扩展神经系统功能的通信技术外部世界事物第7页,共193页,2023年,2月20日,星期三8信息技术的发展历史◎语言的形成和使用

◎文字的创造

◎造纸技术的出现

◎印刷技术的发明◎电报和电话通信

◎广播、电视

◎雷达、卫星

◎计算机

◎因特网···

第1次信息技术革命(35000~50000年之前)第3次信息技术革命第5次信息技术革命(20世纪40~60年代)第4次信息技术革命(19世纪30~20世纪40年代)(1000年之前)第2次信息技术革命(大约3500年之前)现代信息技术第8页,共193页,2023年,2月20日,星期三9现代信息技术有什么特征?三大特征:采用微电子和光电子器件以数字技术(计算机)为基础以软件为核心核心技术:计算机、集成电路、通信、广播、互联网、自动控制、机器人等第9页,共193页,2023年,2月20日,星期三10数字技术基础比特比特与二进制数信息在计算机中的表示比特的运算小结第10页,共193页,2023年,2月20日,星期三11什么是比特?比特(bit,binarydigit的缩写)中文翻译为“二进位数字”、“二进位”或简称为“位”比特只有2种取值:0和1,一般无大小之分如同DNA是人体组织的最小单位、原子是物质的最小组成单位一样,比特是组成数字信息的最小单位数值、文字、符号、图像、声音、命令······都可以使用比特来表示第11页,共193页,2023年,2月20日,星期三12比特在计算机中如何表示?在计算机中表示二进位的方法:电路的高电平状态或低电平状态(CPU)电容的充电状态或放电状态(RAM)两种不同的磁化状态(磁盘)光盘面上的凹凸状态(光盘)···第12页,共193页,2023年,2月20日,星期三13例1:CPU内部比特的表示CPU内部通常使用高电平表示1,低电平表示00.0V0.5V2.8V3.3V010V+3v010第13页,共193页,2023年,2月20日,星期三14磁盘表面微小区域中,磁性材料粒子的两种不同的磁化状态分别表示0和1例2:磁盘中比特的表示与存储磁性材料粒子磁头,用于写入和读出信息“0”“1”旋转方向磁盘片第14页,共193页,2023年,2月20日,星期三15例3:内存储器中比特的存储计算机存储器中用电容器存储二进位信息:当电容的两极被加上电压,它就被充电,电压去掉后,充电状态仍可保持一段时间,因而1个电容可用来存储1个比特信息存储原理电容C处于充电状态时,表示1电容C处于放电状态时,表示0存储单元字线位线C读放大器集成电路技术可以在半导体芯片上制作出以亿计的微型电容器,从而构成了可存储大量二进位信息的半导体存储器芯片断电后信息不再保持!第15页,共193页,2023年,2月20日,星期三16存储容量的计量单位8个比特=1个字节(byte,用大写B表示)计算机内存储器容量的计量单位:KB(千字节):1KB=210字节=1024BMB(兆字节):1MB=220字节=1024KBGB(吉字节、千兆字节):1GB=230字节=1024MBTB(太字节、兆兆字节):1TB=240字节=1024GB外存储器容量经常使用10的幂次来计算:1MB=103KB

=1000KB1GB=106KB

=1000000KB1TB=109KB=1000000000KB第16页,共193页,2023年,2月20日,星期三17现象160GB的移动硬盘为什么160GB的硬盘显示出来的容量只有149.05GB?8GB的U盘显示出来的容量只有7.46GB?第17页,共193页,2023年,2月20日,星期三18原因:前缀名称前缀符号十进制前缀二进制前缀比值kilok/K103210=1,0240.976megaM106220=1,048,5760.954gigaG109230=1,073,741,8240.931teraT1012240=1,099,511,627,7760.909petaP1015250=1,125,899,906,842,6240.888exaE1018260=1,152,921,504,606,846,9760.867zettaZ1021270=1,180,591,620,717,411,303,4240.847yottaY1024280=

1,208,925,819,614,629,174,706,1760.827相同的符号,有两种不同的含义!厂商标注的容量使用十进制前缀操作系统显示的容量使用二进制前缀第18页,共193页,2023年,2月20日,星期三19不同进位制前缀的使用场合内存、cache、半导体存储器芯片的容量均使用二进制前缀:512MB的内存条(其中1M=220

)256KB的cache(其中1K=210

)文件和文件夹的大小使用二进制前缀频率、传输速率等使用十进制前缀:主频1GHz(1G=109)传输速率100Mbps(其中1M=106)外存储器(硬盘、DVD光盘、U盘、存储卡等)容量:厂商标注的容量使用十进制前缀操作系统显示的容量使用二进制前缀第19页,共193页,2023年,2月20日,星期三20比特与二进制数不同进位制数的表示和含义二进制数的算术运算不同进位制数的相互转换第20页,共193页,2023年,2月20日,星期三21不同进位制数的表示和含义

“数”是一种信息,它有大小(数值),可以进行四则运算“数”有不同的表示方法。日常生活中人们使用的是十进制数,但计算机使用的是二进制数,程序员还使用八进制和十六进制数。二进制数,八进制和十六进制数怎样表示?其数值如何计算?第21页,共193页,2023年,2月20日,星期三22十进制数每一位可使用十个不同数字表示(0、1、2、3、4、5、6、7、8、9)低位与高位的关系是:逢10进1各位的权值是10的整数次幂(基数是10)标志:尾部加“D”或缺省例:2×1026×1014×1009×10-16×10-2264.96=200+60+4+0.9+0.06=264.96第22页,共193页,2023年,2月20日,星期三23二进制数每一位使用两个不同数字表示(0、1),即每一位使用1个“比特”表示低位与高位的关系是:逢2进1各位的权值是2的整数次幂(基数是2)标志:尾部加B例:1×220×211×200×2-11×2-2101.01B=4+0+1+0+1/4

=5.25第23页,共193页,2023年,2月20日,星期三24八进制数每一位使用八个不同数字表示(0、1、2、3、4、5、6、7)低位与高位的关系是:逢8进1各位的权值是8的整数次幂(基数是8)标志:尾部加Q例:

365.2Q=3×826×815×802×8-1192+48+5+2/8

=245.25第24页,共193页,2023年,2月20日,星期三25十六进制数每一位使用十六个数字和符号表示(0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F)逢16进1,基数为16各位的权值是16的整数次幂(基数是16)标志:尾部加H例:

F5.4H=15×1615×1604×16-1240+5+4/16

=245.25第25页,共193页,2023年,2月20日,星期三26二进制数的算术运算1位二进制数的加、减法运算规则:被加数加数进位和0000010110011110(a)加法规则被减数减数借位差0000011110011100(b)减法规则2个多位二进制数的加、减法运算举例:01011001+0100-010010010101由低位到高位逐位进行,低位向高位进(借)位!第26页,共193页,2023年,2月20日,星期三27比特的3种基本逻辑运算逻辑加:F=A∨

B(“或”运算)逻辑乘:F=A∧B(“与”运算)取反:F=NOTA(“否定”运算)

ABA∨B000011101111ABA∧B000010100111ANOTA0110EFABEFABAEFR开关闭合=1,断开=0逻辑运算可以用开关电路实现!第27页,共193页,2023年,2月20日,星期三28两个多位数的逻辑运算按位独立进行逻辑运算,每一位都不受其它位的影响例1 A: 0110 B:∨1010

F: 1110例3 A:0110

NOTA:1001

例2 A:0110 B:∧1010

F:0010

例4 B:1010

NOTB:0101第28页,共193页,2023年,2月20日,星期三29不同进位制数的比较十进制二进制八进制十六进制零0000000壹1000111贰2001022叁3001133肆4010044伍5010155陆6011066柒7011177捌81000108玖91001119拾10101012A拾壹11101113B拾贰12110014C拾叁13110115D拾肆14111016E拾伍15111117F第29页,共193页,2023年,2月20日,星期三30不同进制数的相互转换熟练掌握不同进制数相互之间的转换,在编写程序和设计数字逻辑电路时很有用。只要学会二进制数与十进制数之间的转换,与八进制、十六进制数的转换就不在话下了。第30页,共193页,2023年,2月20日,星期三31十进制数二进制数转换方法: 整数和小数放开转换整数部分:除以2逆序取余小数部分:乘以2顺序取整例如:29.6875

11101.1011B

注意:十进制小数(如0.63)在转换时会出现二进制无穷小数,这时只能取近似值129371421222200111余数低位高位整数部分小数部分0.6875×21.37500.75001.50001.0000×2×2×2高位低位第31页,共193页,2023年,2月20日,星期三32二进制数十进制数转换方法:二进制数的每一位乘以其相应的权值,然后累加即可得到它的十进制数值例:11101.1011B=1×24+1×23+1×22+0×21+1×20

+1×2-1+0×2-2+1×2-3+1×2-4

=29.6875

第32页,共193页,2023年,2月20日,星期三33记住2n的值很有用!21=222=423=824=1625=3226=6427=12828=25629=512210=1024211=2048212=4096213=8192214=16384215=32768216=65536···220=1M230=1G240=1T二进制十进制值0.1 0.50.01 0.250.11 0.750.001 0.1250.011 0.3750.101 0.6250.111 0.875记住常用二进制小数的值!第33页,共193页,2023年,2月20日,星期三34八进制数与二进制数的互换八进制→二进制:把每个八进制数字改写成等值的3位二进制数,且保持高低位的次序不变例:2467.32Q

→010100110111.011010B二进制→八进制:整数部分从低位向高位每3位用一个等值的八进制数来替换,不足3位时在高位补0凑满3位;小数部分从高位向低位每3位用一个等值八进制数来替换,不足3位时在低位补0凑满三位例:1101001110.11001B

→001101001110.110010B

→1516.62Q

八进制数二进制数八进制数二进制数000041001001510120106110301171111位八进制数与3位二进制数的对应关系:第34页,共193页,2023年,2月20日,星期三35十六进制数与二进制数的互换转换方法:与八、二进制互换的方法类似例1:35A2.CFH

→11010110100010.11001111B例2:1101001110.110011B→34E.CCH十六进制数二进制数十六进制数二进制数

0000081000

1000191001

20010A1010

30011B1011

40100C110050101D110160110E111070111F11111位十六进制数与4位二进制数的对应关系:第35页,共193页,2023年,2月20日,星期三36信息在计算机中的表示数值文本与文本处理图像与图形数字声音及应用数字视频及应用第36页,共193页,2023年,2月20日,星期三37无符号整数的表示采用“自然码”表示:取值范围由位数决定:8位: 可表示0~255(28-1)范围内的所有正整数16位: 可表示0~65535(216-1)范围内的所有正整数n位:

可表示0~2n-1范围内的所有正整数。十进制数8位无符号整数

00000000010000000120000001030000001140000010050000010125211111100253111111012541111111025511111111······第37页,共193页,2023年,2月20日,星期三38举例:二进制整数的表示范围十进制数可表示数的数目可表示的最大数二进制数可表示数的数目可表示的最大数2位102=100994位24=161111=153位103=10009998位28=25611111111=2554位104=10000999916位216=6553611···111=655355位105=1000009999932位232=429496729611····111=232-16位106=100000099999964位264=1844674407x101011······111=264-1第38页,共193页,2023年,2月20日,星期三39带符号整数的表示(1)表示方法:用1位表示符号,其余用来表示数值部分符号如何表示?

用最高位表示,“0”表示正,“1”表示负数值部分如何表示? (1)原码表示: 整数的绝对值以二进制自然码表示 (2)正整数的补码表示与原码一致···符号位数值部分最低位最高位举例:

[+43]的8位原码为:00101011[-43]的8位原码为:10101011[+43]的8位补码为:00101011第39页,共193页,2023年,2月20日,星期三40带符号整数的表示(2)负整数的补码表示方法先表示为原码符号位不变,其它位取反,得到反码在末位加“1”,得到补码例1:-43用8位补码表示所以:(-43)补=11010101例2:-64用8位补码表示所以:(-64)补=11000000(-43)原=10101011取反:11010100加1:11010101(-64)原=11000000取反:10111111加1:11000000第40页,共193页,2023年,2月20日,星期三41带符号整数的表示(3)优缺点分析:原码表示法优点:与日常使用的十进制表示方法一致,简单直观缺点:加法与减法运算规则不统一,增加了成本;整数0有“00000000”和“10000000”两种表示形式,不方便补码表示法优点:加法与减法运算规则统一,没有“-0”,可表示的数比原码多一个缺点:不直观,人使用不方便结论:带符号整数在计算机内不采用“原码”而采用“补码”的形式表示!第41页,共193页,2023年,2月20日,星期三42原码可表示的整数范围8位原码:-27+1~27-1(-127~127)16位原码:-215+1~215-1(-32767~32767)n位原码:-2n-1+1~2n-1-1补码可表示的整数范围

8位补码:-27~27-1

(-128~127)

n位补码:-2n-1~2n-1-1-128表示为10000000+127表示为01111111-2n-1表示为10000···0002n-1-1表示为01111···111带符号整数的表示(4)第42页,共193页,2023年,2月20日,星期三43小结:3种整数的比较8位二进制码表示无符号整数时的数值表示带符号整数(原码)时的值表示带符号整数(补码)时的值0000000000000000001111……………………0111111112712712710000000128-0-12810000001129-1-127……………………11111111255-127-1计算机中整数有多种,同一个二进制代码表示不同类型的整数时,其含义(数值)可能不同一个代码它到底代表哪种整数(或其它东西),是由指令决定的第43页,共193页,2023年,2月20日,星期三44文本的信息表示字符的编码文本准备文本的分类文本编辑、排版与处理文本的展现第44页,共193页,2023年,2月20日,星期三45文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息的处理是各种计算机应用的基础文字数值语言音乐图像···信息的形态有多种第45页,共193页,2023年,2月20日,星期三46写作编辑排版印刷发行写作传统的文字处理过程第46页,共193页,2023年,2月20日,星期三47计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理(文本处理)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)第47页,共193页,2023年,2月20日,星期三48字符在计算机中的表示

第48页,共193页,2023年,2月20日,星期三49字符、字符集及其编码表文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符的二进位表示,称为该字符的编码或代码(code)不同的字符其编码各不相同第49页,共193页,2023年,2月20日,星期三50西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(AmericanStandardCodeforInformationInterchange,简称ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII字符第50页,共193页,2023年,2月20日,星期三51标准ASCII字符集及其码表b6b5b4b3b2b1b0

012345670123456789ABCDEFb6b5b4b3b2b1b00110100110101196个可打印字符32个控制字符第51页,共193页,2023年,2月20日,星期三52汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······)汉字的特点数量大;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?在字符集中如何排列?使用多少个二进位进行编码?第52页,共193页,2023年,2月20日,星期三53常用的汉字编码字符集国家标准GB2312-1981汉字扩充规范GBK(已被GB18030取代)国家标准GB18030-2005港澳台使用的汉字编码字符集CNS11643(BIG5,俗称“大五码”)UCS/Unicode多文种大字符集Unicode的UTF-8Unicode的UTF-16第53页,共193页,2023年,2月20日,星期三54一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号 ………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1981年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1981GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码”第54页,共193页,2023年,2月20日,星期三55GB2312汉字的编码每一个GB2312汉字使用16位(2个字节)表示为了与ASCII字符相区别,每个字节的最高位均为“1”机内码(又称内码):这种高位均为1的双字节汉字编码例如:“南”字的代码是1100010011001111(用十六进制表示为C4CF)

11第1字节第2字节XXXXXXXXXXXXXX第55页,共193页,2023年,2月20日,星期三56设有一段文本由基本ASCII字符和GB2312字符集中的汉字组成,其代码为ABF58094CAD77062B6C8,则在这段文本中含有________。

A.1个汉字和8个西文字符B.2个汉字和6个西文字符C.3个汉字和4个西文字符D.4个汉字和2个西文字符题解第56页,共193页,2023年,2月20日,星期三57GBK汉字内码扩充规范GB2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”第57页,共193页,2023年,2月20日,星期三58UCS/Unicode多文种大字符集背景:为了实现全球数以千计的不同语言文字的统一编码方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112个),称为UCS/UnicodeUCS/Unicode的编码方案:先实现部分字符的编码(近11万个字符)尽量与已有编码标准兼容包含有中、日、韩统一整理出来的约7万汉字(称CJK汉字)允许有若干不同的编码方案,常用的两种是:UTF-8单字节可变长编码、UTF-16双字节可变长编码第58页,共193页,2023年,2月20日,星期三59GB18030汉字编码标准背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示UCS/Unicode中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行第59页,共193页,2023年,2月20日,星期三60标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)近3万汉字(包括GBK汉字和CJK及其扩充中的汉字)包含近11万字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示,双字节表示方案与GBK相同UTF-8采用单字节可变长编码UTF-16采用双字节可变长编码兼容性编码不兼容!小结:几种汉字编码的对比编码保持向下兼容第60页,共193页,2023年,2月20日,星期三61例:IE浏览网页时文字编码的选择第61页,共193页,2023年,2月20日,星期三62文本准备

——文稿如何输入计算机

第62页,共193页,2023年,2月20日,星期三63文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法第63页,共193页,2023年,2月20日,星期三64文字符号输入计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低第64页,共193页,2023年,2月20日,星期三65文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高第65页,共193页,2023年,2月20日,星期三66文字符号输入计算机的方法印刷体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能第66页,共193页,2023年,2月20日,星期三67文字符号输入计算机的方法印刷体识别手写体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!第67页,共193页,2023年,2月20日,星期三68汉字的键盘输入汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多)第68页,共193页,2023年,2月20日,星期三69汉字键盘输入方法的比较类型原理举例优点缺点数字编码使用一串数字来表示汉字电报码区位码仅使用10个数字键难记忆字音编码把汉语的拼音作为汉字的输入编码智能ABC紫光微软拼音输入简单易学,适合于非专业人员重码多,需增加选择操作,不会汉语拼音或不知道读音时无法使用字形编码把汉字的部件或笔画作为码元,按照汉字结构及其切分规则作为编码依据,确定每个汉字的输入代码五笔字形表形码郑码重码少、输入速度较快,适合于专业录入员、打字员使用缺乏统一的规范,编码规则不易掌握音形编码(或形音编码)采用字音及字形两种属性作为码元的汉字编码输入方法粤音输入法同上同时要掌握音、形两种取码方法或规则,对普通用户比较困难第69页,共193页,2023年,2月20日,星期三70文本的分类第70页,共193页,2023年,2月20日,星期三71简单文本(纯文本)

本书由南京大学出

B1BECAE9D3C9C4CFBEA9B4F3D1A7B3F6

版社(Publishing

B0E6C9E7285075626C697368696E67

HouseofNanjin

20486F757365206F66204E616E6A696E

gUniversity)出版

6720556E697665727369747929B3F6B0E6

文本的内容文本在计算机中的表示没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是.txt由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息举例:第71页,共193页,2023年,2月20日,星期三72丰富格式文本本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。举例:下面标题的格式为:中文用黑体,西文用ArialBlack体,居中使用HTML语言描述为:<palign="center"><fontface="黑体">本书由南京大学出版社</font><fontface="ArialBlack">(PublishingHouseofNanjingUniversity)</font><fontface="黑体">出版</font></p>用一对<>指出的是标记,如<fontface=“黑体”>和</font>等,用于说明排版的格式和文字属性,它们不属于正文内容正文内容第72页,共193页,2023年,2月20日,星期三73超文本(www网页)WWW网页按照其内容的关联性相互进行链接,网页就是典型的“超文本”超文本也属于丰富格式文本网页A网页B网页C网页D网页E网页F网页G网页Ha1a2b2c2f1d1c1b1e1g1h1a3“超链”实际上就是一个指针,用于指向其他网页,也可以指向同一网页中的其他部分

超链是有向的,起点位置称为链源,它可以是网页中的一个标题、一句句子、一个关键词、一幅画、一个图标等第73页,共193页,2023年,2月20日,星期三74小结:文本的分类文本类型特点在计算机内的表示文件扩展名用途简单文本没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息.txt网上聊天短信文字录入OCR输入丰富格式文本(线性文本)有字体、字号、颜色等变化,文本在页面上可以自由定位和布局,还可插入图片和表格除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等.doc.rtf.htm.html.pdf公文论文书稿网页丰富格式文本(超文本)除上述特征外,文本中还含有超链,使文本呈现为一种网状结构同上,但还应包含用于指出“链源”和“链宿”的标记.doc.rtf.htm.html.pdf.hlp同上,以及软件的联机文档(帮助文件)第74页,共193页,2023年,2月20日,星期三75文本的编辑与排版第75页,共193页,2023年,2月20日,星期三76使用Word的操作流程创建新文档或打开老文档文稿输入编辑排版文档存盘、打印或发送输入中西文字、符号和图表进行增、删、改操作,保证文本的正确性满足清晰、美观、便于使用等要求第76页,共193页,2023年,2月20日,星期三77文本处理初步第77页,共193页,2023年,2月20日,星期三78使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理文本处理举例:字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆/台湾术语转换关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成)文种转换(机器翻译)篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护什么是文本处理?第78页,共193页,2023年,2月20日,星期三79例:Word2003的文本处理功能英文拼写检查和英语同义词检查字数统计自动编写摘要中文简繁体转换和术语转换中英词语翻译语法和格式检查语音识别(口授命令和听写)文档保护(防止打开或修改文档)第79页,共193页,2023年,2月20日,星期三80文本的展现(输出)第80页,共193页,2023年,2月20日,星期三81文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word独立的软件:如Adobe公司的AcrobatReader,微软公司的IE等

文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出电子书阅读器:近几年市场出现的用于阅读.txt、.doc、html、pdf等电子文档的专用设备第81页,共193页,2023年,2月20日,星期三82附:输出过程中字形的生成

过程:先根据字符的字体确定相应的字库(font),再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处2种不同的字库:点阵描述轮廓描述轮廓点直线二次曲线第82页,共193页,2023年,2月20日,星期三83图像与图形数字图像的获取图像的表示与压缩编码数字图像处理与应用计算机图形第83页,共193页,2023年,2月20日,星期三84举例:黑白图像的表示每个像素使用1个比特表示:0=黑;1=白010101010101010101010110101101001001000111110000011010101010101010101001011010010110010100000110100101010101010101010110110001010000101001010100101101101011011010110101100110010110100010001001011010010110100101101010001001100100101101010010100101101100101011010101110110011001010010101100011010010011010110010010001001100110101010010001010101101100101100100101110110011001010100100101010101010101010011011010001001100010100001010100101010101010101100010010110010001101001110100001010101010101010001000101000101101000010000001101110110101010010100110100011010010011100101101000101001010100100010100101100101101100001010000010101011010001001001001001011110101011010100101100101010000100010010010111110101111100101001001001010100101001000100101010101110101011010010010000101001000010011001101111101011101010101000100101010010010100100011011000011110111011010110101000000100000001001100100111111111110110111000000010101000101010010011011000010101011101000010101000000010000100101101010011111111111111011101000101001000101001101010100100011101111110100010010000010010010110001001001001111011110101101100100101100100100000111010010010010111111111011001001000第84页,共193页,2023年,2月20日,星期三85黑白图像的表示黑白图像黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种第85页,共193页,2023年,2月20日,星期三86灰度图像的表示灰度图像灰度图像的每个像素也只有一个分量,一般用8~12个二进位表示,其取值范围是:0~2n-1,可表示2n个不同的亮度第86页,共193页,2023年,2月20日,星期三87彩色图像的表示蓝色分量绿色分量红色分量彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色第87页,共193页,2023年,2月20日,星期三88数字图像的获取第88页,共193页,2023年,2月20日,星期三89图像的获取过程扫描模拟图像取样取样取样数字图像分色量化量化量化从现实世界中获得数字图像的过程称为图像的“获取”常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等图像获取过程:将画面划分为M×N个网格,每个网格称为一个取样点将彩色图像取样点的颜色分解成R,G,B三个基色测量每个取样点的每个分量(基色)的亮度值对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示

第89页,共193页,2023年,2月20日,星期三90图像的表示与压缩编码第90页,共193页,2023年,2月20日,星期三91数字(取样)图像的组成数字取样图像由M(列)×N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量Red分量Green分量Blue分量第91页,共193页,2023年,2月20日,星期三92数字(取样)图像的主要参数图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目使用水平分辨率x垂直分辨率表示对在屏幕上显示出来的大小有影响颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用HSB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和图像类型像素的组成像素深度(位数)颜色空间单色图像黑白图像仅1个分量1位不使用灰度图像仅1个分量2~12位不使用彩色图像彩色图像3个分量以上8~36位RGB,CMY,YUV等第92页,共193页,2023年,2月20日,星期三93举例:分辨率与图像尺寸的关系520x376260x188130x94在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比第93页,共193页,2023年,2月20日,星期三94数字图像的数据量数字图像数据量的计算公式(以字节为单位):

数据量=水平分辨率×垂直分辨率×像素深度/8

几种常用格式的图像的数据量:图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB例:数字图像传输时间的计算 假设数据传输速率为56kb/s(电话上网),则传输一幅分辨率为640×480的6.5万种颜色的未压缩图像的时间为:

(640x480x16)/56000=87.8秒第94页,共193页,2023年,2月20日,星期三95数字图像的数据压缩图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用

图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价压缩倍数的高低重建图像的质量(有损压缩时)压缩算法的复杂程度第95页,共193页,2023年,2月20日,星期三96一架数码相机,其Flash存储器的容量为20MB,它一次可以连续拍摄65536色的分辨率为1024╳1024的彩色相片40张,由此可以推算出图像数据的压缩倍数是________倍。A、2B、4C、6D、8

题解第96页,共193页,2023年,2月20日,星期三97数字图像的常用文件格式常用的图像文件格式有:名称压缩编码方法性质典型应用开发公司(组织)BMPRLE(行程长度编码)无损Windows应用程序MicrosoftTIFRLE,LZW(字典编码)无损桌面出版Aldus,MicrosoftGIFLZW无损因特网CompuServeJPEGDCT(离散余弦变换),Huffman编码大多数为有损因特网,数码相机等ISO/IECJP2小波变换,算术编码无损/有损医学应用等ISO/IEC不同的图像文件格式采用了不同的数据压缩技术和数据组织方法,适合不同的应用!第97页,共193页,2023年,2月20日,星期三98图像文件格式例1:BMP格式BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持第98页,共193页,2023年,2月20日,星期三99图像文件格式例2:GIF图像颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画透明背景缺点:不适合真彩色图片第99页,共193页,2023年,2月20日,星期三100图像文件格式例3:JPEG图像JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是.jpgJPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用JPEG的最新标准是JPEG2000(图像文件扩展名是.jp2),它采用更先进的技术,可取得更好的效果第100页,共193页,2023年,2月20日,星期三101数字图像处理与应用第101页,共193页,2023年,2月20日,星期三102数字图像处理:目的与内容目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护

内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等第102页,共193页,2023年,2月20日,星期三103图像的特效处理原始图像波浪效果旋转效果旋涡效果第103页,共193页,2023年,2月20日,星期三104图像去噪去噪之后的图像有噪声的图像第104页,共193页,2023年,2月20日,星期三105图像增强增强前的图像增强后的图像第105页,共193页,2023年,2月20日,星期三106图像恢复陈旧的老照片恢复后的照片第106页,共193页,2023年,2月20日,星期三107抠图场景合成第107页,共193页,2023年,2月20日,星期三108人脸检测与识别第108页,共193页,2023年,2月20日,星期三109数字图像处理的应用(1)图像通信,包括图像传输、电视电话、电视会议等(2)遥感(3)医疗诊断(4)工业生产中的应用,如产品质量检测,生产过程自动控制等(5)机器人视觉(6)军事、公安、档案管理等其他方面的应用X光图像CT图像核磁共振图像指纹图像第109页,共193页,2023年,2月20日,星期三110常用的图像编辑软件Word和PowerPoint具有基本的图像编辑功能Windows附件中的“画图”软件微软Office工具中的PictureManagerACDSystem公司的ACDSee32Adobe

PhotoShop第110页,共193页,2023年,2月20日,星期三111Word和PowerPoint的图像编辑功能使用快捷菜单,屏幕上显示“图片”工具栏,进入图片编辑状态:颜色控制裁剪图片线型文字环绕设置图片格式设置透明色增加对比度降低对比度增加亮度降低亮度旋转图片压缩图片第111页,共193页,2023年,2月20日,星期三112图片编辑举例(外形修改)缩小压扁放大拉长原始图片第112页,共193页,2023年,2月20日,星期三113图片编辑举例(裁剪与旋转)旋转90度裁剪底部裁剪左部旋转任意角度原始图片第113页,共193页,2023年,2月20日,星期三114图片编辑举例(图像属性修改)增加对比度降低对比度增加亮度降低亮度灰度图片黑白图片原始图片第114页,共193页,2023年,2月20日,星期三115计算机图形第115页,共193页,2023年,2月20日,星期三116什么是计算机图形(graphics)通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:建模/造型(Modeling)景物的模型(model)(1)建模景物的视图绘制(Rendering)(ImageSynthesis)(2)绘制第116页,共193页,2023年,2月20日,星期三117景物的2种描述(建模)方法几何造型技术规则形体(如工业产品)用基本的几何元素(如点、线、面、体等)及材料的表面性质等进行描述过程模型技术不规则形体(如自然现象)找出其生成规律,并使用相应的算法来描述

第117页,共193页,2023年,2月20日,星期三118计算机图形的绘制技术绘制(rendering),也称为图像合成(imagesynthesis)——依据景物的模型,根据观察位置和光线情况,生成该景物可视图像的过程第118页,共193页,2023年,2月20日,星期三119计算机图形的绘制过程将各个物体的所有表面用小的多边形(三角形或四边形)进行近似表示用户选择一个观测位置,并设定一个取景范围,将景物向成像平面作透视投影;然后将景物中不在取景范围内的部分裁剪掉,同时还把景物中所有被遮挡而看不见的部分隐去根据景物表面材料的性质和环境光源的设定,计算出物体可见面上每一点(像素)的颜色及其亮度计算出物体所产生的本影和半影;根据景物表面和背景使用的材料,选择合适的纹理映射到物体的表面第119页,共193页,2023年,2月20日,星期三120绘制的硬件支持——显卡(图形卡)图形绘制过程中,每一个像素的颜色及其亮度都要经过大量的计算才能得到,因此绘制过程的计算量很大,特别是三维图形和动画目前PC机所配置的图形卡(显卡)上安装了功能很强的专用绘图处理器,它能承担绘制过程中的大部分计算任务S-Video接口DVI接口VGA接口绘图处理器显示卡第120页,共193页,2023年,2月20日,星期三121美国康乃尔大学SuzanneSmits和PriamosGeorgiades建模并绘制的俄罗斯茶壶俄罗斯茶壶第121页,共193页,2023年,2月20日,星期三122例2:计算机绘制的钢笔画和铅笔画

木桶

玻璃瓶引用自:GeorgesWinkenbach,D.Salesin(Univ.ofWashington)pp.469-476,

SIGGRAPH’96第122页,共193页,2023年,2月20日,星期三123例3:分形图案第123页,共193页,2023年,2月20日,星期三124钢笔画效果

钢笔素描产生于中世纪,从19世纪开始成为一门艺术,然而用计算机模拟钢笔绘画却是20世纪90年代的事情。

第124页,共193页,2023年,2月20日,星期三125铅笔画效果第125页,共193页,2023年,2月20日,星期三126油画效果第126页,共193页,2023年,2月20日,星期三127水彩画效果第127页,共193页,2023年,2月20日,星期三128计算机图形的应用(1)计算机辅助设计和辅助制造(CAD/CAM)(2)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等(3)作战指挥和军事训练(4)计算机动画和计算机艺术(5)其它:电子出版、数据处理、工业监控、辅助教学、软件工程等

第128页,共193页,2023年,2月20日,星期三129虚拟手术仿真将医用CT扫描的数据转化为三维图象,并通过一定的技术生成在人体内漫游的图像,使得医生能够看到并准确地判别病人的体内的患处,然后通过碰撞检测一类的技术实现手术效果的反馈,帮助医生成功完成手术。台湾pcexpert公司研制的LSVR系统逼真地模拟了腹腔手术,进行过程教学、手术成果检验等第129页,共193页,2023年,2月20日,星期三130常用的矢量绘图软件专业绘图软件:

AutoCAD、PROTEL和CAXA电子图板(机械、建筑等)MAPInfo、ARCInfo、SuperMapGIS(地图、地理信息系统)办公与事务处理、平面设计、电子出版等使用的绘图软件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微软公司的MicrosoftVisio等MSOffice中内嵌的绘图软件:Word和PowerPoint中的绘图功能(简单的二维图形)第130页,共193页,2023年,2月20日,星期三131小结:图像与图形的比较计算机中的图像按其生成方法可以分为两大类:通过数字化设备获取的图像,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image)通过计算机建模并绘制而成的图像,称为矢量图形,通常简称图形(graphics)两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理图像图形第131页,共193页,2023年,2月20日,星期三132小结:图像与图形的对比图像图形生成途径通过图像获取设备获得景物的图像使用矢量绘图软件以交互方式制作而成表示方法将景物的映像(投影)离散化,然后使用像素表示使用计算机描述景物的结构、形状与外貌表现能力能准确地表示出实际存在的任何景物与形体的外貌,但丢失了部分三维信息规则的形体(实际的或假想的)能准确表示,自然景物只能近似表示相应的编辑处理软件典型的图像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论