多媒体技术课件 ch5_第1页
多媒体技术课件 ch5_第2页
多媒体技术课件 ch5_第3页
多媒体技术课件 ch5_第4页
多媒体技术课件 ch5_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多媒体技术基础第四章:彩色数字图像基础多媒体技术基础,2006年中山大学信息科学与技术学院主要内容视觉系统对颜色的感知图像的颜色模型图像的基本属性图像的分类伽马()校正常用图像文件格式多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知可见光的波长范围为380nm780nm,大多数自然光都是由不同波长的光组合而成。眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod)。人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低

2、的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,因此不同组成成分的可见光就呈现出不同的颜色多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知视觉系统对颜色和亮度的响应特性曲线(各个波长的光的强度相等)多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知上面的颜色响应曲线表明,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。多媒体技术,2006年中山大学信息科学与技术学院视觉

3、系统对颜色的感知许多具有不同光谱分布的光产生的视觉效果(颜色)是一样的。即光谱与颜色的对应是多对一的。光谱分布不同而看上去相同的两种颜色称为条件等色(匹配等色)。绝大部分可见光谱对眼睛的刺激效果都可以用红(700nm)、绿(546.1)、蓝(435.8nm)三色光按不同比例和强度的混合来等效表示。(三刺激理论)多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知匹配任意可见光所需的三原色光比例曲线多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知从人的主观感觉角度,颜色包含三个要素:1、色调(

4、hue):色调反映颜色的类别,如红色、绿色、蓝色等。色调大致对应光谱分布中的主波长。多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知2、饱和度(Saturation) 饱和度是指彩色光所呈现颜色的深浅或纯洁程度。对于同一色调的彩色光,其饱和度越高,颜色就越深,或越纯;而饱和度越小,颜色就越浅,或纯度越低。高饱和度的彩色光可因掺入白光而降低纯度或变浅,变成低饱和度的色光。100%饱和度的色光就代表完全没有混入白光的纯色光。多媒体技术,2006年中山大学信息科学与技术学院视觉系统对颜色的感知3、明亮度(luminance) 明亮度是光作用于人眼时引起的明亮程度的感觉。一般来说,

5、彩色光能量大则显得亮,反之则暗。 大量试验表明,人的眼睛能分辨128种不同的色调,1030种不同的饱和度,而对亮度非常敏感。人眼大约可以分辨35万种颜色。多媒体技术,2006年中山大学信息科学与技术学院颜色模型颜色模型(color model)是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。颜色空间通常用三维模型表示,空间中的颜色通常使用代表三个参数的三维坐标来指定对于人来说,可以通过色调、饱和度和亮度来定义颜色(HSL颜色模型);对于显示设备来说,可以用红、绿、蓝磷光体的发光量来描述颜色(RGB颜色模型);对于打印设备来说,可以使用青色、品红、

6、黄色和黑色颜料的用量来指定颜色(CMYK颜色模型)。多媒体技术,2006年中山大学信息科学与技术学院 理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。颜色CR(红色的百分比)G(绿色的百分比) B(蓝色的百分比) RGB模型称为相加混色模型,用于光照、视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。RGB颜色模型多媒体技术,2006年中山大学信息科学与技术学院CMYK颜色模型在理论上,绝大多数颜色都可以用三种基本颜料(青色cyan、品红magenta、和黄色yellow)按一定比例混合得到。理论上,青色、品红和黄色三种基本色素等量混合能得

7、到黑色。但实际上,因为所有打印油墨都会包含一些杂质,这三种油墨混合实际上产生一种土灰色,必须与黑色 (K) 油墨混合才能产生真正的黑色,所以再加入黑色作为基本色形成CMYK颜色模型。CMYK模型称为相减混色模型。多媒体技术,2006年中山大学信息科学与技术学院相加色与相减色的关系多媒体技术,2006年中山大学信息科学与技术学院RGB模型到CMYK模型的转换分色算法(F代表白色)多媒体技术,2006年中山大学信息科学与技术学院颜色模型的空间表示RGB彩色空间和CMY彩色空间的表示法多媒体技术,2006年中山大学信息科学与技术学院HSL颜色模型在HSL模型中,H定义色调;S定义颜色的深浅程度或饱和

8、度;L定义亮度。RGB模型和CMYK模型主要是面向设备的,而HSL模型更容易被人理解和控制。多媒体技术,2006年中山大学信息科学与技术学院颜色的输入多媒体技术,2006年中山大学信息科学与技术学院图像的分类矢量图与点位图 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。 矢量图的优点是:(1)缩放、旋转、移动时图像不会失真。(2)存储和传输时数据量较小。 矢量图的缺点是:(1)图像显示时花费时间比较长。(2)真实世界的彩色图像难以转化为矢量图。多媒体技术,2006年中山大学信息科学与技术学院图像的分类矢量图与点位图 点位图

9、是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。 点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。 点位图的缺点是: (1)存储和传输时数据量比较大。(2)缩放、旋转时算法复杂且容易失真。多媒体技术,2006年中山大学信息科学与技术学院图像的分类矢量图点位图多媒体技术,2006年中山大学信息科学与技术学院图像的分类灰度图标准单色图 标准灰度图多媒体技术,2006年中山大学信息科学与技术学院图像的分类彩色图256色标准图像 24位标准图像多媒体技术,2006年中山大学信息科

10、学与技术学院图像的基本属性1、分辨率 显示分辨率:指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。(640480,1024 768) 图像分辨率:指组成一副图像的像素的密度,一般用单位长度上包含像素的个数来衡量。常用单位为DPI(dots per inch),即每英寸多少点。多媒体技术,2006年中山大学信息科学与技术学院图像的基本属性2、像素深度 像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。3、调色板 一个彩色图像假如只包含24位真彩色空间中的16

11、个离散的点(16色图),则可以建立一个颜色查找表,表中的每一行记录一组RGB值,实际像素的值用来指定该点颜色在查找表中的索引值,这样就可以大大缩小存储量。这个颜色查找表就叫做调色板。多媒体技术,2006年中山大学信息科学与技术学院图像的基本属性4、真彩色、伪彩色与直接色 真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生

12、的彩色称为伪彩色。 直接色:每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。多媒体技术,2006年中山大学信息科学与技术学院伽马()校正一个图像系统中一般包含输入设备(扫描仪、摄像机、数码相机)、存储设备(胶片、磁盘)和输出设备三大模块。各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的,且表现为幂函数的形式: yxn 输出(输入) (按照惯例,“输入”和“输出”都缩放到01之间)。所以整个图像系统的传递函数是一个幂函数。 12n一个图像系统追求的目标:真实的再现原始场景。多媒体

13、技术,2006年中山大学信息科学与技术学院伽马()校正为了真实地再现原始场景,如果图像再现环境为明亮环境则必须时整个图像系统的1;如果为暗淡环境,则必须使整个系统的1.25;如果为黑暗环境,则必须使系统的1.5。实际图像系统的值并非符合我们要求的值,且是不能随意改变的。所有要求我们加入一个中间环节来校正整个系统的值,即补偿系统的非特性曲线,使之接近于应用环境所要求的值。这个过程就叫做伽马()校正。多媒体技术,2006年中山大学信息科学与技术学院伽马()校正Photoshop 中提供的Gamma校正功能多媒体技术,2006年中山大学信息科学与技术学院 位图文件(Bitmap-File,BMP)格

14、式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。BMP图像文件格式 BMP文件大体上分为四个部分:位图文件头BITMAPFILEHEADER位图信息头BITMAPINFOHEADER调色板Palette实际的位图数据ImageData多媒体技术,2006年中山大学信息科学与技术学院BMP图像文件格式typedef struct tagBITMAPFILEHEADER WORD bfType; /* 说明文件的类型 */ DWORD bfSize; /* 说明文件的大小,用字节为单位 */ W

15、ORD bfReserved1; /* 保留,设置为0 */ WORD bfReserved2; /* 保留,设置为0 */ DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构 开始到实际的图像数据之间的字 节 偏移量 */ BITMAPFILEHEADER;多媒体技术,2006年中山大学信息科学与技术学院BMP图像文件格式typedef struct tagBITMAPINFOHEADER DWORD biSize; /* 说明结构体所需字节数 */ LONG biWidth; /* 以像素为单位说明图像的宽度 */ LONG biHeight; /* 以像素

16、为单位说明图像的高速 */ WORD biPlanes; /* 说明位面数,必须为1 */ WORD biBitCount; /* 说明位数/像素,1、2、4、8、24 */ DWORD biCompression; /* 说明图像是否压缩及压缩类型 */ DWORD biSizeImage; /* 以字节为单位说明图像大小 */ LONG biXPelsPerMeter; /* 说明水平分辨率,像素/米 */ LONG biYPelsPerMeter; /* 说明垂直分辨率,像素/米 */ DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为0 则颜色数为2的biBitC

17、ount次方 */ DWORD biClrImportant; /*说明对图像显示有重要影响的颜色 索引的数目,如果是0,表示都重要。*/ BITMAPINFOHEADER;多媒体技术,2006年中山大学信息科学与技术学院BMP图像文件格式 调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。typedef struct tagRGBQUAD BYTE rgbBlue; /*指定蓝色分量*/ BYTE rgbGreen; /*指定绿色分量*/ BYTE rgbRed; /*指定红色分量

18、*/ BYTE rgbReserved; /*保留,指定为0*/ RGBQUAD;多媒体技术,2006年中山大学信息科学与技术学院BMP图像文件格式 紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。 多媒体技术,2006年中山大学信息科学与技术学院 GIF(Graphics Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本

19、号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。GIF图像文件格式多媒体技术,2006年中山大学信息科学与技术学院GIF图像文件格式1HeaderGIF文件头2Logical Screen Descriptor逻辑屏幕描述块3Gloabal Color Table全局颜色表。扩展模块(任选)4Image Descriptor图像描述块5Local Co

20、lor Table局部颜色表可6Table Based Image Data表基压缩图像数据重7Graphic Control Extension图像控制扩展块复8Plain Text Extension无格式文本扩展块n9Comment Extension注释扩展块次10Application Extension应用程序扩展块。扩展模块(任选)11GIF TrailerGIF文件结束快多媒体技术,2006年中山大学信息科学与技术学院GIF图像文件格式GIF文件采用了LZW无损压缩算法来存储图像数据。GIF文件允许设置背景的透明属性。GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片

21、或者动画效果。GIF文件支持图像数据的交叉存储方式,这样一个大的图像可以逐步显示,让用户首先看到图像概貌,然后逐步清晰。GIF文件定义的图像中可以加入文本。GIF文件格式的特点:多媒体技术,2006年中山大学信息科学与技术学院算法概要 JPEG(Joint Photographic Experts Group) 是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩

22、,电视图像的帧内图像的压缩编码,也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。 标准主要采用了两种基本的压缩算法,一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的DPCM无损压缩算法。JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院JPEG编码标准基于DPCM的无损编码模式:压缩比可以达到2:1。基于DCT的有损顺序编码模式:压缩比可以达到10:1以上。基于DCT的递增编码模式基于DCT的分层编码模式JPEG规定了4种运行模式,以满足不同需要:多媒体技术,2006年中山大学信息科学与技术学院JPEG有损顺序编码算法的主

23、要计算步骤如下:1. 将源图像分成几个颜色平面(分量图像)。2. 分成88数据块进行正向离散余弦变换(FDCT)。 2. 量化(quantization)。 3. Z字形排列量化结果(zigzag scan)。 4. 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。 5. 使用行程长度编码(run-length encoding,RLE)对 交流系数(AC)进行编码。 6. 熵编码(entropy coding)。JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院JPEG编码标准多媒体技术,2006

24、年中山大学信息科学与技术学院译码或者叫做解压缩的过程与压缩编码过程正好相反。IDCTJPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院正向离散余弦变换 对每个单独的彩色图像分量,把整个分量图像分成88的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。DCT变换使用下式计算逆变换使用下式计算JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院量化 对于有损压缩算法,JPEG算法使用如图所示的均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。 JPEG编码标准多媒体技术,2006年中山大学信息科

25、学与技术学院量化 因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院DC系数DPCM编码和AC系数Z形排列之后采用RLE编码JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院熵编码 使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。 JPEG标准规定了两种熵编码算法:哈夫曼编码和自适应算术编码。哈夫曼编码采用的一般是固定的哈夫曼编码表,而不是临时统计出来的,并且对亮度分量和色度分量采用了不同的哈夫曼表。JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院基于DPCM的无损编码模式:主要采用了三邻域二维预测编码和熵编码。无失真编码器源图像数据压缩的图像数据预测器熵编码器表说明DPCM预测编码框图JPEG编码标准多媒体技术,2006年中山大学信息科学与技术学院JPEG编码标准基于DCT的递增编码模式: 此模式与顺序模式编码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论