多媒体技术概论模板课件_第1页
多媒体技术概论模板课件_第2页
多媒体技术概论模板课件_第3页
多媒体技术概论模板课件_第4页
多媒体技术概论模板课件_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 图形与图像处理 图形和图像处理是多媒体技术的重要组成部分,图形和图像是信息量及其丰富的媒体,可以生动形象的表现大量信息,具有声图并茂的优点。在多媒体软件中使用图形和图像可以提供色彩丰富的画面和良好的人机界面。3.1 图形与图像概述3.2 静止图像压缩标准3.3 显示设备与扫描仪3.4 图像处理软件Photoshop目录3.1 图形与图像概述3.1.1 光和颜色3.1.2 图形与图像3.1.3 图像的数字化3.1.4 图像的文件格式3.1.1 光和颜色 图形与图像都是视觉媒体元素。谈到视觉,自然离不开光和颜色。色彩始于光,也源于光。人的视觉系统是根据光线的波长来感觉颜色的。光的本质 光的

2、分类颜色内涵颜色的三要素色彩模式 通常意义上的光是指可见光,波长在780nm-380nm之间。光的本质是一种电磁波,其电磁光谱如下:光的本质104 106 108 1010 1012 1014 1016 频率(Hz) 104 102 100 10-2 10-4 10-6 10-8 波长(m)无线电波 微波 红外线 紫外线 射线可见光光的分类 1672年牛顿用三棱镜将太阳光(白光)分解成红、橙、黄、绿、青、蓝、紫七种颜色,按顺序排列成渐变的彩带, 这种现象称作色散。 经三棱镜分解出的七种色光即使再一次通过三棱镜也不会再分解为其他的色光,所以将这种不能再分解的色光叫做单色光。 由单色光所混合的光称

3、为“复色光”。太阳光及一般光源发出的光都是复色光。 色彩是人类视觉对可见光感知的结果,在可见光的七色光谱内不同波长的光会引起不同的颜色感觉。颜色内涵380436480546580620700波长紫色蓝色青色绿色黄色橙色红色颜色光的波长与颜色对照 暖色与冷色 从红色到黄色的色彩,包括橙色、粉红、棕色和红葡萄酒色等颜色都称为暖色。暖色是明亮的,比其它颜色更能吸引眼睛的注意。 从绿色到紫色的色彩,包括蓝色和所有灰色调都被认为是冷色。冷色产生与暖色完全相反的效果,比较平和,容易使人安静下来。 互补色 若两种色光混合后成白色,这两种色光成为互补色。互补色是彼此之间最不一样的颜色,例如,红与青,绿与品红,

4、蓝与黄互为补色。 人眼根据光线的波长来感觉颜色,有色物体对光线具有选择性吸收的特性,即光线照射到有色物体上时,入射光中被吸收的各种波长的色光是不等量的,有的被多吸收,有的被少吸收。反射或透射的光线与入射光线相比,不仅亮度有所减弱,光谱成分也改变了,因而物体呈现出各种不同的颜色。而当没有光线时,人眼感觉的颜色是黑色的。 色彩的产生主要是因为物体表面或内部反射或透射的光线进入人的视觉系统形成的,因此色彩是由光、物体特性与人眼视觉机构等三大因素决定的。 人的视觉系统对色彩的感知可用色调,饱和度和亮度来描述,它们综合决定了视觉的总体效果,称为色彩的三要素。 色调:是指当我们看到一种或多种波长的光时所产

5、生的彩色感觉。它表示颜色的种类,如红、橙、黄、绿、青、蓝、紫等,取决于光的波长,是决定颜色的基本特征。颜色的三要素 饱和度:表示颜色的纯度,或者说是颜色的深浅程度,即掺入白光的程度。对于同一色调的彩色光,饱和度越深颜色越鲜明,或越纯。例如,当红色加进白光之后,由于饱和度降低,红色被冲淡成粉红色。饱和度的增减还会影响到颜色的亮度,例如在红色中增加白光成分后,增加了光能,因而变得更亮了。所以在某色调的彩色光中,掺入别的彩色光,会引起色调的变化,而掺入白光时仅引起饱和度的变化。 亮度:指光作用于人眼时所引起的明暗程度的感觉,它与被观察物体的发光强度有关,反光能力大的看起来就亮一些,反之就暗一些。对于

6、色调和饱和度固定的光而言,当其全部能量增强时,亮度增加,因此亮度与光功率有关。 由于色调和饱和度表示的是颜色的种类和深浅程度,因而这两者统称为色度。所以颜色由亮度和色度来表示。 色彩模式是表示颜色的数字方法。使用色彩模式的目的是尽可能多的、有效的描述各种颜色,以便需要时能方便地加以选择。不同领域一般采用不同的色彩模式,如计算机显示器采用RGB模式,彩色印刷采用CMYK模式,艺术绘画采用HSI模式,彩色电视信号采用YUV/YIQ模式,还有其他的色彩模式。色彩模式1.RGB模式 RGB模式适用于彩色显示器这类发光物体。 RGB分别代表红(Red)、绿(Green)、蓝(Blue)三种基本颜色,每种

7、颜色的亮度大小用数字0-255表示,共有1670万种颜色。 由于人眼对这三种色光最为敏感,RGB三种颜色相配所得到的彩色范围也最广,所以一般都选这三种颜色作为基色,这就是色度学的基本原理三基色原理。 理论上讲,任何一种颜色都可以用这三种基本颜色按不同比例混合得到,称为相加混色,或称为RGB相加模式。 没有光是全黑,各色光加入后才产生色彩,光强越强,光就越多,极限就是白色。R=G=B=0 R=G=B=2550R=G=B255黑色 白色灰色 彩色显示器和电视都是利用RGB模式显示彩色图像,而彩色扫描仪则是利用它的逆过程,扫描是把一幅彩色图片分解成R、G、B三种基色,每一种基色的数据代表特定颜色的强

8、度,当这三种基色的数据在计算机中重新混合时又显示出它原来的颜色。 由于计算机的彩色显示器采用的是RGB模式,所以不管多媒体系统中采用什么色彩模式,最后输出一定要转换成RGB模式。 CMYK模式主要用于彩色打印机和彩色图片印刷这类吸光物体上。 CMY模式由青(Cyan)、品红(Magenta)、黄(Yellow)三种基本颜色按一定比例合成,每种颜色用百分数0-100%来表示。 CMY模式和RGB模式不同,其色彩的产生不是直接来自于光线,而是由照射在颜料上反射回来的未被吸收的光线产生的,因为颜料会吸收一部分光线,所以这种色彩的产生方式称相减混色。2.CMYK模式 在相减混色中,当三种基本颜色等量相

9、加时得到黑色或灰色;而等量相减后才能得到白色。 理论上利用CMY三基色混合可以得到所需要的各种色彩,但实际上同量的CMY混合后并不能产生完善的黑色或灰色。因此在印刷时必须加上一种真正的黑色(Black),这样CMY模式又称为CMYK模式。C=M=Y=K=0% 白色 C=M=Y=K=100% 黑色 四色印刷便是依据CMYK模式发展而来的。以我们常见的彩色印刷品为例。我们所看到的五颜六色的彩色印刷品,其实在印刷的过程中仅仅只用了四种颜色。在印刷之前先通过计算机或电子分色机将一件艺术品分解成四色,并打印成胶片。一般来说,一张真彩色图像的分色胶片是四张透明的灰度图,单独地看一张单色胶片时不会发现什么特

10、别之处,但如果将这几张分色胶片分别涂以青、品红、黄和黑四种颜色叠印到一起观察时,就产生了一张绚丽多姿的彩色图片。3. HSB模式 HSB模式由色调(Hue)、饱合度(Saturation)、亮度(Brightness) 来生成颜色。 用HSB模式描述颜色更加自然 ,比较符合人的主观感受,适合绘画艺术,但使用时不方便,显示时要转换成RGB模式。HIS和RGB的转换方程为:4. YUV/YIQ模式 在PAL彩色电视信号标准中采用YUV模式来表示彩色图像,其中Y表示亮度,U、V表示色度,是构成彩色的两个分量。在NTSC彩色电视信号标准中使用YIQ模式,其中Y表示亮度,I、Q是两个彩色分量。 YUV模

11、式的优点是亮度信号Y和色度信号U、V是相互独立的,也就是用Y分量构成的黑白灰度图和用U、V信号构成的两幅单色图是相互独立的,因为Y、U、V的相互独立,所以可以对这些单色图分别进行编码。 不管用YUV模式还是YIQ模式来表示彩色图像,都要求在显示每个像素前,把彩色分量值转换成RGB值。YUV和RGB彩色空间的转换方程为: Y = 0.299R + 0.587G + 0.114B U = 0.147R 0.289G + 0.436B V = 0.615R 0.515G 0.100BYIQ和RGB的转换方程为: Y = 0.299R + 0.587G + 0.114B I = 0.596R 0.27

12、5G 0.321B Q = 0.212R 0.523G + 0.311B 5. 灰度模式和黑白模式 灰度模式采用8位来表示一个像素,即将纯黑和纯白间的层次等分为256级,就形成了256级的灰度模式,可以用来模拟黑白照片的图像效果。 黑白模式采用1位表示一个像素,只能显示黑色和白色。黑白模式无法表示层次复杂的图像,可以制作黑白线条图。3.1.2 图形与图像 计算机中的图片有两种类型:图形与图像。 图形又称矢量图或几何图,是用数学模型表示图形的形状、位置、颜色等属性和参数。例如,圆是由圆心坐标、半径和色彩组成的。 矢量图形的精度高、灵活性大,并且用它们设计出来的作品可以任意放大、缩小而不会变形失真

13、。它不会像一些位图图像,在进行高倍放大后图像会不可避免的方块化。三维线框图三维填色图 相对于位图图像来讲,矢量图占用的存储空间较小。但在屏幕每次显示时,它都需要经过重新计算,所以显示速度没有图像快。 图像又称点阵图或位图,是空间和亮度上离散化的图像,它通过描述画面中每一像素的颜色或亮度来表示该图像,非常适合表现如明暗、浓淡、层次和色彩变化等包含大量细节的图片。图形与图像的比较 图形(Graphics)图像(Image)数据量很少数据量很大有结构,便于编辑修改无结构,不便于编辑修改不会产生失真现象可能出现失真现象生成视图需要复杂的计算,显示速度慢生成视图不需复杂的计算,显示速度快自然景物的表示很

14、困难自然景物的表示不困难国际标准:OpenGL国际标准:JPEG,TIFF绘图软件: AutoCAD,CorelDraw等图像处理软件:Photoshop,PhotoDraw等图形的研究与发展 图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。从处理技术上来看,图形主要分为两类,一类是基于线条信息表示的,用于刻画物体形状的点、线、面、体等几何要素。如工程图、等高线地图等;另一类是反映物体表面属性或材质的灰度颜色等非几何要素。它侧重于根据给定的物体描述模型、光照效果等来生成真实感图形,如建筑模型图、实体造型等。 图形的应用已经有数千年的历史。早在两千多年前,就出现了欧几

15、里德几何,后来又出现立体几何、解析几何和样条几何,广泛用于数学和建筑学。 计算机图形学的研究最早起源于美国麻省理工学院。从20世纪50年代初到60年代中期,麻省理工学院积极从事现代计算机辅助设计/制造技术的开拓性研究。计算机图形这个术语是在1962年美国麻省理工学院林肯实验室的Ivan E.sutherland发表的一篇博士论文“一个人机通信的图形系统”中首次使用。它证明了交互式计算机图形学是一个可行的、有用的研究领域,从而确立了计算机图形学作为一个崭新的学科分支的独立地位。 1964年,孔斯(S.Coons)提出了用小块曲面片的组合来表示自由曲面,称孔斯曲面。此方法受到了工业界和学术界的极大

16、重视。法国雷诺公司的贝赛尔(P.Bezier)也提出了Bezier曲线和曲面,并将其成功地用于几何外形设计,开发了用于汽车外形设计的系统。他们被称为计算机辅助几何设计的奠基人。 1964年,IBM公司推出了第一台交互式光笔输入显示器的设计方案,以后经过改进,成为IBM 2250显示器。它预示着交互式计算机图形学的诞生。洛克希德飞机公司利用IBM 2250开发了CAD绘图加工系统,从1974年起向外界转让,成为IBM主机上目前应用最广的CAD/CAM软件。DAC-1, 世界上第一个用于汽车发动机设计的CAD系统,1959年由IBM开发世界上第一台光笔交互式图形显示器IBM2250图像的研究与发展

17、 图像的应用已有数千年历史。最初是用于像形文字和绘画。17世纪出现显微镜图,在医学上有很大的贡献。20世纪30年代出现电视,对新闻传播和文化娱乐起了很大作用。1858年出现的黑白照片和1924年出现的彩色照片,更是对人类文化、艺术和生活带来了很大影响。1972年出现了卫星遥感图和医学上的CT图,这些图像不仅数量大,而且采用了计算机技术,对军事、科研和医学具有极为重要的意义。 从20世纪60年代以来,美国及一些国际组织发射了资源遥感卫星和天空实验室,由于成像条件受飞行器位置、姿态、环境条件等影响,图像质量总不是很高。因此,以如此昂贵的代价进行简单直观的判读来获取图像是不合算的,而必须采用数字图像

18、处理技术。如LANDSAT系列陆地卫星,采用多波段扫描器,在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上十几米或100米左右(如1983年发射的LANDSAT-4,分辨率为30m)。这些图像在空中先处理成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。 首次获得实际成功应用的是美国喷气推进实验室。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了几何校正、灰度变换、去除噪声等图像处理技术,并考虑了太阳位置和月球环

19、境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。 从20世纪70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,类似于人类的视觉系统对外部世界的理解,这被称为图像理解或计算机视觉。在这个领域当中,其中代表性的成果是2

20、0世纪70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的课题。 数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功

21、研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。 与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,例如:航空航天、生物医学、工业检测等,使图像处理成为一门引人注目、前景远大的新型学科。 图像反映了客观景物的亮度和颜色随空间位置和方向的变化,是空间坐标的函数。图像数字化就是把连续的空间位置和亮度离散,使连续的模拟图像变成计算机能处理的离散的数字图像的过程,包括采样、量化和编码三个阶段。3.1.3 图像的数字化 在日常生活中当我们从某点观察某一景象时,物体所发出的光线就会进入人眼,

22、在人眼的视网膜上成象,这就是人眼所看到的客观世界,我们将它称之为景象。这个“象”反映了客观景物的亮度和颜色随空间位置和方向的变化,因此“象”是空间坐标的函数。视网膜成像是一种自然生理现象,而且是人类文明发展到一定时期才能意识到它的存在,并设法用各种手段将其记录下来,这种记录下来的各种各样的“象”则称之为图像。图像的表示 图像是人类用来表达和传递信息的最重要手段。现代图像既包括可见光范围的图像(能被人眼观察到的各种图像),也包括不可见光范围内借助于适当转换装置转换成人眼可见的图像(如红外成像技术),还包括视觉无法观察的其他物理图像和空间物体图像,以及由数学函数和离散数据所描述的连续或离散图像。

23、在大多数情况下,要采用离散的技术来处理来自连续世界的图像。实际图像是连续的,计算机只能处理离散的数字图像,所以要对连续图像经过采样和量化以获取离散的数字图像。图像数字化的概述 现实中的图像是一种模拟信号。图像数字化的目的是把真实的图像转变成计算机能够接受的显示和存储格式,以便用计算机进行分析处理 。 图像的数字化过程分为采样、量化与编码三个步骤,采样的实质就是要用多少点来描述一张图像,采样的结果就是通常所说的图像分辨率。比如,一幅640480的图像,就表示这幅图像是由307200个像素点所组成。采样频率是指一秒钟内采样的次数 ,它反映了采样点之间的间隔大小。采样频率越高 ,得到的图像样本就越细

24、腻逼真,图像的质量越高,但要求的存储量也越大。 量化是指用多大范围的数值来表示图像采样之后每一个点的亮度和颜色信息。量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。例如,如果量化位数是4位,也就是说用4位二进制表示每一个点的颜色和亮度信息,则图像能够容纳的颜色总数是16种颜色。若采用16位存储一个点,则有216(65536)种颜色。所以,量化位数越大,图像表示的颜色越多,产生的效果越好。但是,也会占用更大的存储空间。两者的基本问题就是视觉效果与存储空间的取舍问题。 假设有一幅黑白照片,这被称作一幅模拟图像,因为它在水平与垂直方向上的灰度变化都是连续的,都可认为有无数个像素,而且任一点上

25、灰度的取值都是从黑到白的无限个可能值之一。通过沿水平和垂直方向的等间隔采样可将一幅模拟图像分解为近似的有限个像素,每个像素的取值代表该像素的灰度,对灰度进行量化,使其取值变为有限个可能值。对黑白照片通常采用8位量化来得到优质的图像。 经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的图像称为数字图像。只要水平与垂直方向采样点数N和M足够多,量化位数足够大,则得到的数字图像就会很逼真。 在采样与量化处理后,才能产生一张数字化的图像,再运用计算机图像处理软件的各种技巧,对图像进行处理、修饰或转换,达到所需要的图像效果。采样 采样就是把一副连续亮度的图

26、像在二维空间上等间隔地分成M行、N列的矩形网状结构,形成MN个网格,每个网格称为像素,其亮度、色彩等特征是通过特定的数值来表示的。 采样的实质就是用多少像素点描述一张图像,采样的结果就是通常所说的图像分辨率。 在进行采样时,采样点的间隔的选取是一个重要的问题。它决定了采样后的图像是否能真实地反映原图像的程度。一般说来,原图像中的画面越复杂,色彩越丰富,则采样间隔应越小。采样前图像采样后图像88像素(256色)1616像素(256色) 3232像素(256色) 6464像素(65536色) 量化 采样后得到的亮度值在取值空间上仍然是连续值。量化就是把亮度空间分成K个子区间,每个子区间对应相同的亮

27、度值,这样就有K个不同的亮度值,即亮度取值空间被离散化为有限个数值。 量化的实质就是用多大范围的数值来表示图像采样后的每个点。量化的结果就是图像能够容纳的颜色总数,反映了采样的质量。 为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的量化字长来表示图像的颜色。量化字长越大,越能真实地反映原有图像的颜色。5bit(32色) 4bit(16色) 3bit(8色) 2bit(4色) 1bit(2色) 影响图像数字化质量的主要参数 影响图像数字化质量的主要参数有分辨率、颜色深度等,其中分辨率分为显示分辨率、图像分辨率和像素分辨率。 显示分辨率:指显示器上能

28、够显示出的像素数目,由水平方向和垂直方向的像素总数构成。若某显示器水平方向为800像素,垂直方向为600像素,则显示分辨率为800600像素。显示分辨率越高,显示图像越精细。 图像分辨率:指组成一幅图像所拥有的像素数目,它反映图像在屏幕中显示的大小。例如,分辨率为320240的彩色图像在显示分辨率为640480的屏幕上显示时只占整个屏幕的1/4;如果分辨率为1024768的彩色图像在显示分辨率为640480的屏幕上显示时,在屏幕上只能看到图像的1/4;只有当二者相同时,图像才能正好布满整个屏幕。图像分辨率越高,图像越清晰,数据量也越大。 像素分辨率:指显像管荧光屏上一个像素点的宽和长之比,在像

29、素分辨率不同的机器间传输图像时会产生图像变形。 颜色深度:指表示每个像素颜色(或亮度)的二进制位数。对于彩色图像来说,它决定了图像可以使用的最多颜色数目,对于灰度图像来说,它决定了图像可以使用的亮度级别数目。颜色深度值越大,显示的画面越自然。颜色深度颜色总数图像名称12二值图像416简单色(16 色) 图像8256基本色(256色) 图像1665536增强色图像2416672216真彩色图像324294967296真彩色图像颜色深度与显示的颜色数目 图像文件的大小:指存储整幅图像所需的字节数,计算公式为: 图像文件的字节数=图像分辨率颜色深度/8 例如,一幅640480的真彩色图像,未经压缩的

30、原始数据量为: 64048024/8=921600B=900KBComparison:图像分辨率:271300颜色深度:1大小:9.9 KB图像分辨率:271300颜色深度:4大小:19.8 KBComparison:图像分辨率:271300颜色深度:8大小:79.4 KB图像分辨率:271300颜色深度:24大小:238.2 KB3.1.4 图像的文件格式GIFJPEGTIFFPNGBMP PSD BMP(Bitmap)文件是一种与设备无关的图像文件,是Windows系统推荐使用的位映射存储形式,可达24位全彩色模式,BMP文件通常都不采用压缩格式。 GIF(Graphics Interch

31、ange Format)是压缩图像交换格式文件,适合于动画制作、网页制作等领域,图像文件短小,下载速度快,但不能存储超过256色的图像,可以在web浏览器中播放,有小动画的效果。 JPEG(Joint Photographic Experts Group)是采用JPEG压缩标准储存图像的文件格式,压缩率较高,适合在Web上传输,常用于广告设计中的图像素材。 TIFF(Tag Image File Format)是一种通用的位映射图像文件格式,支持从单色的二值图像到32位真彩色的所有图像;适用于多种操作平台和多种机型,支持多种压缩方法。TIFF格式的优点主要是适用于各种应用程序,与计算机体系结构

32、、操作系统和图形处理硬件无关。 PNG(Portable Network Graphic)是一种位图文件存储格式,希望能够替代GIF和TIFF,存储彩色图像时,颜色深度可达48位。 PSD(PhotoShop Document)是Photoshop专用文件格式,支持所有颜色模式以及图层、参考线和Alpha通道等信息。3.2 静止图像压缩标准3.2.1 图像压缩方法概述3.2.3 JEPG图像压缩标准3.2.2 常用的编码方法3.2.1 图像压缩方法概述 图像数字化后的信息量通常都比较大,因此采用压缩编码技术就显得尤为重要,它是实现图像传输与存储的关键。以压缩后的文件能否准确恢复原文件为界,将图

33、像压缩编码技术分为无损压缩编码和有损压缩编码。图像压缩编码的发展 第一代图像编码技术是Shannon于1948年在他的论文“通信的数学原理”中首次提出的,同时还提出了信息率失真的函数概念;1959年,又确立了码率失真理论,从而奠定了信息编码的理论基础。主要编码方法有预测编码、变换编码和统计编码,压缩比一般为10:1左右,也称为三大经典编码方法。1 第二代图像编码技术是Kunt等人于1985年提出的,他们认为图像编码应充分利用人的视觉、生理、心理和图像信源的各种特征,实现从“波形”编码到“模型”编码的转变,以获得更高压缩比。压缩比多在30:1至70:1之间,甚至更高。主要的编码方法有:子带图像编

34、码、基于分形的编码、基于模型的编码等。2 第三代图像编码技术是指标准化的压缩编码技术。研究内容是图像数据压缩,主要应用领域是图像通信和图像信息存储。当需要对所传输或存储的图像信息进行高比率压缩时,必须采取复杂的图像编码技术。但是,如果没有一个共同的标准做基础,不同系统间不能兼容,各系统间的联结将十分困难。3 鉴于这一状况,近年来,国际电信联盟、国际标准化组织和国际电工委员会已经制定并在继续制定一系列静止和活动图像编码的国际标准,如:JPEG、MPEG、H.261等,这些国际标准的出现促进了图像编码压缩技术的发展。 图像压缩编码技术总的来说就是利用图像数据固有的冗余性和相关性,将一个大的图像文件

35、转换成较小的同性质的文件。图像数据的压缩机理 图象数据的压缩机理来自两个方面:一是利用图象中存在的大量冗余度进行压缩;二是利用人眼的视觉特性。图象数据中一般存在下列冗余: 空间冗余:指同一幅图象中规则的物体和规则的背景都具有的很强的相关性。 时间冗余:指图象序列中两幅相邻图象之间具有较大的相关性。 结构冗余:有些图象从大域上看存在着非常强的纹理结构。 视觉冗余:人眼的视觉系统对于图象的注意是非均匀和非线性的,图象的编码、解码处理尽管引入了噪声使图象发生了变化,但这些变化不一定被视觉所查觉。无损压缩和有损压缩 无损压缩是指在压缩时不丢失数据,解压缩后的还原图像与原始图像完全一致,也叫做冗余压缩或

36、熵编码。常见的无损压缩编码有哈夫曼编码、行程编码、算术编码以及LZW编码。 有损压缩是指压缩时舍弃部分数据,解压后的还原图像与原始图像存在一定的误差,但视觉效果可以接受,压缩比较高。有损压缩编码有预测编码、变换编码、矢量量化编码等。评价压缩编码算法的指标 无论是针对图像信号还是音频信号,各种压缩编码算法都有其优缺点。评价压缩编码算法的指标通常有以下几种: 1 压缩比:压缩过程中输入数据量和输出数据量之比。 2 图像质量(失真度):压缩解压后的图像的好坏。这个指标主要是针对有损压缩。 3 算法的复杂性和运算速度:复杂性一般指算法实现的难易程度,运算速度是指算法的压缩和解压速度。 根据编码算法的原

37、理可以把压缩算法分为:统计编码、变换编码、预测编码、分析-合成编码等。下面介绍几种常用的编码方法。 一、统计编码 统计编码也称为信息熵编码,它是根据信源符号出现概率的分布特性而进行的压缩编码。统计编码包括哈夫曼编码、行程编码、算术编码以及LZW编码等。3.2.2 常用的编码方法 信息熵的概念: 香农(Shannon)的信息论认为,信源中所含有的平均信息量(熵)就是进行无失真压缩编码的理论极限。只要不低于此极限,就总能找到某种编码方法去任意的逼近熵。 设信息源X的符号集为xi(i=1,2.n),设xi出现的概率为p(xi),则信息源X的熵定义为: H(X)在信息论中称为信源X的熵 (Entrop

38、y),单位为bit/符号,-log2P(xi)表示包含在xi中的信息量,因此熵就是一个符号包含的平均信息量,是进行无失真压缩编码的理论极限。如果我们设计的编码方法的码字的平均比特率接近熵,那么说明这个编码方法是最佳的。 例如:信源X中有16个随机事件,即n=16。每个随机事件的概率都相等,即P(x1)=P(x2) =P(x16)=1/16,计算信源X的熵: 1 哈夫曼编码 思想:对于出现频率高的信息采用字短的码,对于出现频率低的信息采用字长的码,以缩短平均码长实现数据压缩。 方法: (1)把信源符号(共N个)按其出现概率的值由大到小顺序排列; (2)将出现概率最小的两个符号的概率相加,合成一个

39、概率,这时概率个数减为n-1个 ,将n-1个概率重新按概率大小顺序排列; (3)重复第2步做法,直到概率为1; (4)用线将符号连接起来,逐步从后向前进行编码,每个节点有两个分支,对概率大的赋0,概率小的赋1,(也可以对概率大的赋1,概率小的赋0),经过几个节点后到达端点; (5)将一路遇到的0或1按顺序排列起来,就是这个端点所对应的信源符号的码字。 在理解上述步骤的基础上,学会给已知的信源编码。 一个Huffman编码例子如图所示。应用Huffman编码应注意的事项:(1)Huffman方法构造出来的码不是唯一的。但对于同一信源而言,其平均码字长是相同的,编码效率是一样。(2)Huffman

40、编码对不同的信源其编码效率是不同的。只有当信源概率分布很不均匀的时,Huffman码才会收到显著效果。平均码长N为:信息熵H为: 可见,Huffman编码后的冗余仅为: 2.73 - 2.61 = 0.12 bit / 码字。一个Huffman编码练习。设有六个符号的信源X=X1, X2, X3, X4, X5, X6,若其概率分布P=P(Xi)0.40,0.26,0.15,0.10,0.06,0.03,做出Huffman编码,求出平均码字长度。 2 行程编码的思想:将具有相同颜色值的连续像素用像素的颜色值和相同颜色的像素数目来代替,图像中相同颜色的图像块越大,压缩比越高,不适合颜色丰富的自然

41、图像。比如:77799999的行程编码为(7,3),(9,5)。 3 算术编码的思想:将被表示的信息映射到0,1区间上的一个间隔,用这个间隔里的一个实数表示此信息,信息越长,间隔越小,表示这一间隔所需的二进制位数越多。二、预测编码 预测编码主要是减少数据在时间和空间上的相关性。它是利用原始的离散信号之间存在一定相关性的特点,建立一个预测模型,然后根据这个模型及以往的样本值,预测下一个信号的值,然后由实际值和预测值计算出预测误差,再对这个误差编码后发送到接收端,接收端通过预测值加差值信号来重建原信号。如果模型选取得足够好且样本序列在时间上相关性较强,误差信号就会很小,从而可以用较少的码数进行编码

42、,以达到数据压缩的目的。常用的预测编码算法主要有DPCM和ADPCM。三、变换编码 变换编码可以有效的去除图像信号的相关性,性能往往优于预测编码。 变换编码主要有变换、量化和编码三个阶段。具体的说,在空间域、时间域和频率域3个域中进行变换,然后对变换后的数据进行量化和编码操作。变换是可逆的,本身并不进行压缩,它只是把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。通常可使用的变换都是线性的,如离散余弦变换、傅立叶变换等。量化过程是不可逆的,因此变换编码是有损压缩编码。 这类编码方法是通过对原始数据进行分析,将其分解为一系列更易于表示的基本单元或从中提取若干具有更本质

43、意义的参数,编码仅对这些基本单元或特征参数进行。译码则是将这些基本单元或参数再综合成原信源的一个逼近。从信息论的观点看,这些方法一般是熵压缩,即有损压缩。常见的分析-合成编码方法有子带编码、小波变换、分形编码等。四、分析 - 合成编码 小波变换编码的思想:将原始图像经过一系列的带通滤波器,由时域变换到频域,从变换后的不同分层定位中提取出图像特征,低频部分平滑表示背景,高频部分不平稳则表示细节,达到数据压缩的目的。 子带图像编码的思想:利用滤波器组将输入信号分解为高频分量和低频分量,分别对高频和低频分量进行量化和编码。解码时,高频和低频分量经过插值和共轭滤波器而合成原信号。 各种压缩编码方法适用

44、的场合不同,达到的效果也不一样,为了充分利用各自优点,克服缺点,通常将多种压缩编码方法结合起来使用,从而达到最优的效果。 分形图像编码的思想:利用自相似性质对原始图像分形,形成一些子图像,然后在分形集中查找这些子图像。分形集中存储的只是子图像对应的迭代函数,而不是子图像,因而具有较高的压缩比。3.2.3 JEPG 图像压缩标准 JPEG是由联合图像专家组(Joint Photo graphic Experts Group)批准的高质量静止图像压缩编码国际标准。JPEG包括以DCT为基础的有损压缩方法和以预测编码中的DPCM为基础的无损压缩方法。以DCT为基础的压缩方法压缩比较高,应用广泛。 该

45、标准适用于连续色调、多级灰度的静止图像,是彩色、灰度、静止图像的第一个国际标准,也是适用范围广泛的通用标准。JPEG的基于DCT的有损压缩算法编码框图原始数据8*8DCT正变换量化器量化熵 编码器压缩数据量化表说明编码表说明编码器编码过程:(l) 用DCT去除图象数据的空间冗余;(2) 用视觉最佳效果的量化表来量化DCT系数;(3) 对数据进行熵编码,采用Huffman编码。 解码框图压缩数据逆向 DCT量化器逆量化熵 解码器重构数据量化表编码表解码器解码过程:(1)熵解码:对接收的数据按照Huffman码表进行熵解码; (2)逆量化:按照量化表进行逆量化;(3)逆向DCT:进行反DCT变换后

46、得到重建的图象数据。由于量化误差的存在,重构图像和原始图像之间有些小的误差,这些误差只要控制在视觉误差范围内,是不易被人眼察觉的。 1、基于DCT的压缩算法包括两种不同层次的系统,即基本系统和增强系统,增强系统是基本系统的扩充。 2、JPEG压缩算法定义了四种编码工作方式:无失真编码方式、顺序编码、渐进编码和分层编码,后三种属于有损编码方式。在基本系统中只使用顺序编码方式、增强系统可以采用渐进编码方式。 3、JPEG压缩算法使用了两种熵编码:DPCM和Huffman编码。JPEG压缩算法小结JPEG 2000 标准 JPEG2000是2000年3月确定的彩色静态图像的新一代编码方式,主要内容包

47、括6部分: 1 图像编码系统(核心部分) 2 扩展系统(在核心系统上扩展更多性能) 3 运动JPEG2000,针对运动图像提出的方案 4 兼容性(即包容性和继承性) 5 参考软件(目前主要为JAVA和C程序) 6 复合图像文件格式(主要用于印刷和传真) JPEG2000的飞跃表现在采用以离散小波变换算法为主的多解析编码方式替代了以DCT为主的区块编码方式,大大提高了压缩性能。JPEG与JPEG 2000的性能比较标准JPEGJPEG 2000标题连续色调静态图像的数字压缩编码新一代静态图像编码标准日期1986.3-1992.101996.2-2000.12压缩比2-30:12-50:1主要技术

48、离散余弦变换DCTZigzag扫描哈夫曼编码算术编码离散小波变换DWT面向对象编码ROI编码空间可扩展编码应用场合Internet数字照相图像视频编辑Internet数字照相打印、扫描、移动通信3.3 显示设备与扫描仪3.3.1 显示设备3.3.2 扫描仪3.3.1 显示设备 显示设备是多媒体计算机系统实现人机交互的重要输出设备,包括显示器和显示卡两部分,只有两者有机结合才能获得良好的显示效果。主机显示卡显示器总线扩展槽多芯视频信号电缆显示卡 显示卡是用于将主机中的数字信号转换成图像信号并由显示器显示出来。主要由显示芯片、显示内存、RAMDAC、VGA BIOS等几个重要部件组成,此外还包括一

49、些连接插座或插针等。1 CPU将数据通过总线送到显示芯片进行处理 2 显示芯片将数据处理的结果送到显示内存 3 显示内存将数据送到RAM DAC(数模转换器)中进行转换,将数字信号转化为模拟信号 4 RAM DAC将模拟信号通过VGA接口送到显示器输出显示卡的基本工作过程视频标准总线接口MDA:单色显示卡PC/XT总线(8位,7.9MB/s)CGA:彩色图形显示卡320*200或640*200/4色ISA总线(16位,15.9MB/s)工业标准结构EGA:增强型图形适配卡640*350/16色EISA总线(32位,31.8MB/s)扩展的工业标准结构VGA(视频图形阵列)640*480或800

50、*600/4-24位VESA局部总线(32位)视频电子标准协会XGA(增强型图形阵列)PCI总线(32-64位,127.2MB/s)外围部件互连(508.6MB/s)2D/3D图形加速卡AGP1-4接口(32位,254.3MB/s)加速图形端口(1017.3MB/s)显示卡的视频标准与总线接口显示卡的性能指标分辨率:指在显示器屏幕上所能描绘的像素个数(横纵比为4:3),如640*480、800*600、1024*768、1600*1200等。颜色位数:指显示卡能同屏显示的色彩数量,如8位、16位、24位、32位等。刷新频率:指图像在显示器上的更新速度,即屏幕每秒重新显示的次数。刷新频率越高,屏

51、幕图像闪烁感越小,图像的稳定性越高。过低的刷新频率会使眼睛感到疲劳,所以一般应大于75Hz。显示器 显示器是通过电子扫描的方式将计算机的信息以人能识别的形式实时显示在屏幕上。 按照结构原理分,主要有CRT显示器、LCD显示器、等离子显示器等。 CRT显示器经历了球面、柱面、平面直角、纯平几个发展阶段,在色彩还原、亮度调节、扫描速度、清晰度等方面更趋完善和成熟。CRT显示器由电子枪、偏转线圈、荧光粉层、荫罩和玻璃外壳组成,采用RGB色彩模式。 显示器加电后,在电子枪和荧光粉层之间形成一个高达几万伏的直流电压加速场,当电子枪射出的电子束经过聚焦和加速后,在偏转线圈产生的磁场的作用下偏转,通过荫罩孔

52、射在荧光屏上,荧光屏被激活就会产生彩色。F-荫罩板A-阴极B-导电涂层C-阳极D-荧光屏E-电子束CRT显示器的工作原理 屏幕尺寸:衡量显示器屏幕大小,以显象管对角线的长度(英寸)来表示,如:14in、15in、17in、21in 点距:指两个相邻的像素点之间的距离。点距越小,显示图像越细腻,清晰度越高,显示器质量越好。如:0.28mm、0.25mm、0.24mm。CRT显示器的性能指标分辨率:指屏幕上可容纳像素的个数。显示器的分辨率受到屏幕尺寸和点距的限制,也与显卡的性能有关。扫描方式:隔行扫描和逐行扫描隔行扫描是指更新屏幕数据需要两遍扫描(奇数行、偶数行扫描),实现便宜但易闪烁。逐行扫描是

53、指更新屏幕时只需一遍扫描,其无闪烁标准是垂直刷新频率为75-85Hz。 液晶显示器LCD(Liquid Crystal Display)具有CRT显示器无法相比的优点。首先,液晶显示器有超大平坦的有效显示区,比同尺寸的CRT显示器的有效面积大得多。其次,它采用了阵列显示技术,节能效果较好。另外,它采用的矩阵技术在亮度和对比度方面有很大提高,同时有效减小了眩光和反光,使之具有清晰的图像和平滑均匀的显示效果。同时还具有占用空间小、重量轻、低辐射、无闪烁等特点。LCD显示器 液晶是1888年由奥地利植物学者Reinitzer发现的一种介于固体与液体之间、具有规则排列的有机化合物。当给液晶加电时,液晶

54、分子会做90度的规则旋转排列,产生透光度的差别,以此控制每个像素的明暗,显示出图像。液晶是具有规则性分子排列的有机化合物 TFT (Thin Film Transistor,薄膜晶体管)液晶显示器由多层叠加而成,就像三文治一样。两面的最外层是透明度极高的玻璃层,在玻璃层中间是薄膜电容,生成红、蓝、绿三原色所必要的色彩滤镜和液晶层。 一般在没有加电时,液晶处于一种无序状态,此时液晶是透光的。当给液晶层施加不同的电压时,液晶单元就朝不同的方向偏转,令液晶层形成不同的透光性。液晶显示器的显像原理是将液晶置于两片导电玻璃之间,靠两个电极间电场的驱动,引起液晶分子扭曲向列的电场效应,以控制光源透射或遮蔽

55、功能。当不同的透光经过RGB三色滤光片时,屏幕就会因为不同的透光程度形成各种色彩的图像信号。LCD的工作原理 屏幕尺寸:显示屏对角线的长度,以英寸为单位,常见的有12.1英寸、13.3英寸、14.1英寸、15英寸等。 可视角度:分为水平可视角度和垂直可视角度,要求水平可视角度在1400以上,垂直可视角度在1200以上。可视角度可以通过从不同角度观察来衡量,当画面强度或亮度变暗、颜色改变、文字模糊等现象出现时,证明超过了它的可视角度范围。LCD的性能指标 响应时间:指LCD各像素点对输入信号反应的速度,即像素由亮转暗或由暗转亮所需的时间。当响应时间较大时,在屏幕上快速移动鼠标会有残影现象,这是因

56、为LCD反应太慢,来不及改变亮度的关系。 亮度:指每平方米的烛光数量,单位是cd/m2,亮度值越高,画面越亮丽,一般要求LCD的亮度值在200cd/m2以上。 对比度:对比度越高,还原的画面层次感越好,一般要求对比度要达到200:1。CRT显示器LCD显示器外型庞大、笨重体积小、重量轻辐射较高辐射极低功耗高、发热量大功耗低、发热量小存在聚焦不存在聚焦信号反应速度快信号反应速度慢色彩表现力强色彩表现力一般不受可视角度限制可视角度一般LCD与CRT显示器的比较 1984年第一台扫描仪问世。 扫描仪(Scanner)是一种光机电一体化的数字化输入设备,它可将图像或文字转换成计算机能够识别和处理的数字

57、图像文件,最大程度的保留原稿风貌。3.3.2 扫描仪 扫描仪是由光电转换部件(CCD)、光源及聚焦透镜等组成。 将光线照射在图片上,产生反射光或透射光,通过CCD将光线亮度以及色彩信号转换成模拟电信号,再经A/D转换成数字图像。扫描仪的工作原理光源 W原图反射镜透镜CCDA/D计算机扫描仪内部实际结构 扫描头从右至左逐行进行扫描,最后得到全部图像 平板式扫描仪:由步进电机带动扫描头对图片进行自动扫描。 特点:扫描精度高、成像稳定、使用方便 适用场合:精度要求较高、图稿幅面不大扫描仪的分类 手持式扫描仪:以手动的方式推动扫描仪对图片进行扫描。 特点:体积小、携带方便、价格便宜 缺点:图像失真(手

58、推进速度不均匀) 适用场合:图稿幅面小、精度要求不高 滚筒式扫描仪:采用扫描头固定、 滚动式走纸移动图纸而自动完成扫描,是性能最好价格最贵的一种扫描仪。 适用场合:大型工程图、A0、A1大幅面图稿扫描透明胶片扫描仪 1. 分辨率:决定了扫描图像的清晰程度,分光学分辨率和插值分辨率。分辨率越高,扫描图像越清晰。分辨率单位为dpi,表示每英寸长度所含像素点的个数。扫描仪的性能指标 2. 色彩位数:表示扫描仪所能分辨颜色的数量,比如24位、30位、36位、42位、48位等。色彩位数越高,图像色彩表现力越丰富。 3. 扫描速度:指扫描仪在扫描图稿时所需的时间。影响因素:步进电机的速度、接口类型、分辨率

59、的设定等。 4. 接口标准:USB接口:通用串行总线,支持热插拔 USB12Mbps USB 2.0480MbpsSCSI接口:SCSI卡,20Mbps并行接口:安装方便,速度最慢 5. 扫描幅面:平板式扫描仪:A4、A3 滚筒式扫描仪:A0、A1 OCR(Optical Character Recognition):光学字符识别 文字识别过程:文字出版物扫描仪文字图像OCR软件识别为文本格式文字处理软件排版 扫描仪捆绑销售软件: 驱动程序:Windows 98/2000/XP 字符识别软件:OCR软件OCR文字识别3.4 图像处理软件Photoshop3.4.1 Photoshop概述3.4

60、.2 图像的基本操作3.4.3 图层的应用3.4.4 通道与蒙板3.4.5 路径与矢量图3.4.6 典型滤镜效果Photoshop7.0 PhotoShop是美国Adobe公司开发的真彩色和灰度图像编辑处理软件,它提供了多种图像涂抹、修饰、编辑、创建、合成、分色与打印的方法,并给出了许多增强图像的特殊手段,可广泛地应用于美工设计,广告及桌面印刷,计算机图像处理,旅游风光展示,动画设计,影视特技等领域,是计算机数字图像处理的有力工具。3.4.1 Photoshop概述1. Photoshop的基本功能支持大量的图像文件格式选择和绘图功能图像编辑和转换功能色调和色彩功能图层功能滤镜功能开放式结构2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论