第二章视觉特性及图像制式

上传人：5*** IP属地：湖北上传时间：2022-02-01 格式：PPT 页数：100 大小：5.55MB 积分：30 举报 版权申诉

已阅读5页，还剩95页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第二章第二章视觉特性与图像制式视觉特性与图像制式信息工程学院信息工程学院管张均管张均2.1 图像的表示图像的表示图像信号：图像是一种可视化的信息，图像信号：图像是一种可视化的信息，图像信号图像信号是图像信息的理论描述方法。是图像信息的理论描述方法。图像图像景物在某种成像介质上再现的视觉信息景物在某种成像介质上再现的视觉信息v图：物体透射或反射光的分布图：物体透射或反射光的分布v像：人的视觉系统对图的接收并在大脑形成的印象或认识像：人的视觉系统对图的接收并在大脑形成的印象或认识具有明暗和色彩变化的许多单个像素信息的集合，具有明暗和色彩变化的许多单个像素信息的集合，以及接收者的感觉和心理

2、状态以及接收者的感觉和心理状态图形？图像？视频？图形？图像？视频？图形是用几何要素和操作过程（点、线、长图形是用几何要素和操作过程（点、线、长方、椭圆、指定点填充等等）描述的图，即由计方、椭圆、指定点填充等等）描述的图，即由计算机绘制的直线、圆、矩形、曲线、图表等。算机绘制的直线、圆、矩形、曲线、图表等。图像是扫描仪、摄像机等输入设备捕捉实图像是扫描仪、摄像机等输入设备捕捉实际画面产生的，用具有一定灰度级的点阵描述际画面产生的，用具有一定灰度级的点阵描述的图。静止图像是与时间无关的相片图像。的图。静止图像是与时间无关的相片图像。运动图像指的是人们所能见到的活动图像运动图像指的是人们所能见

3、到的活动图像（如电视、电影、录像等）。由于要使图像运（如电视、电影、录像等）。由于要使图像运动起来，需要每秒钟内有足够多的帧数（如动起来，需要每秒钟内有足够多的帧数（如PAL制式电视每秒制式电视每秒25帧，电影每秒帧，电影每秒24帧）。每帧）。每一帧就是一幅单独的静止图像。一帧就是一幅单独的静止图像。图形：图形：物理单元：点、直线、曲线等基本的几何对象物理单元：点、直线、曲线等基本的几何对象属性：线宽、填充色、填充模式、对象间的空域关系等属性：线宽、填充色、填充模式、对象间的空域关系等文件格式文件格式：PHIGS、GKS、IDS 、EPS等等图像：图像：物理单元：像素物理单元：像素

4、属性：属性：编码属性编码属性 - - 像素深度像素深度（pixel depth）显示属性显示属性 - - 分辨率、尺寸等分辨率、尺寸等文件格式：文件格式：GIF、TIFF、BMP、JPEG、PNG等等视频：视频：物理单元：像素（物理单元：像素（pixelpixel）、帧）、帧（frame）属性：属性：编码属性编码属性 - - 像素深度像素深度显示属性显示属性 - - 分辨率、尺寸、帧率等分辨率、尺寸、帧率等文件格式：文件格式：M-JPEG、MPEG、WMV、ASF、AVI等等2.2 图像的数字化图像的数字化q 传统的远程通信系统中，所传送的信息一般是以模拟形式出传统的远程通信系

5、统中，所传送的信息一般是以模拟形式出现的，表现为一种时间连续的信号。而在计算机通信中，信现的，表现为一种时间连续的信号。而在计算机通信中，信号的传送方式采用数字方式，把连续变化的模拟信号转换为号的传送方式采用数字方式，把连续变化的模拟信号转换为离散的数字信号。离散的数字信号。q 信号的数字化主要包括取样、量化和编码三大部分。数字化信号的数字化主要包括取样、量化和编码三大部分。数字化后的信号一般称为后的信号一般称为PCM信号（脉冲编码调制）。信号（脉冲编码调制）。q 取样是实现空间上的离散化。取样是实现空间上的离散化。q 量化是实现幅度上的离散化。量化是实现幅度上的离散化。q 编码是实现把离散化

6、了的幅度用二进制码型表示。编码是实现把离散化了的幅度用二进制码型表示。图像的数字化图像的数字化电视信号的数字化和复原电视信号的数字化和复原（a）A/D变换变换（b）D/A变换变换量化PCM信号模拟电视信号取样脉冲PCM信号模拟电视信号取样编码解码插入滤波(a)(b)又称抽样或取样，它把时间上连续的模拟信号变成时又称抽样或取样，它把时间上连续的模拟信号变成时间上离散的有限个样值的信号。这是模拟信号数字化间上离散的有限个样值的信号。这是模拟信号数字化过程中的第一步处理措施。过程中的第一步处理措施。采采样样采样定理采样定理q根据傅立叶变换原理，在一定条件下，一个时间根据傅立叶变换原理，在一定

7、条件下，一个时间函数函数f(t)可以变换成一个相应的频率函数可以变换成一个相应的频率函数F(w)。采。采样定理是选择采样频率的理论依据。样定理是选择采样频率的理论依据。q其主要内容为：对于一个最高频率为其主要内容为：对于一个最高频率为f0的模拟信的模拟信号号，当选择的取样频率当选择的取样频率fs满足满足fs = 2f0时时，经过取经过取样后的离散信号能够包含原模拟信号的全部信息。样后的离散信号能够包含原模拟信号的全部信息。并且，经过低通滤波和反变换，可以不失真地回并且，经过低通滤波和反变换，可以不失真地回复出原模拟信号。复出原模拟信号。图像的采样图像的采样将物理图像按行列扫描划分后，每个小块区

8、域称为像素将物理图像按行列扫描划分后，每个小块区域称为像素（pixel）。）。测量每个像素位置上的值就称为采样。测量每个像素位置上的值就称为采样。二维采样定理二维采样定理q 图像在采样时，必须满足二维采样定理，确保无失真或有图像在采样时，必须满足二维采样定理，确保无失真或有限失真地恢复原图像。限失真地恢复原图像。q 如果二维图像信号如果二维图像信号f (x, y)的频谱的频谱F(u,v) 满足满足其中其中Uc和和Vc 为频域最高截止频率。则采样图像的频谱为为频域最高截止频率。则采样图像的频谱为1( , )(,)smnmnF u vF uvx yxy ( , ),( , )0,ccccF u v

9、uUvVF u vuUvV二维采样定理二维采样定理q 当采样周期当采样周期x和和y满足满足通过采样信号通过采样信号f (mx, ny)能唯一地恢复原图像信号能唯一地恢复原图像信号f (x, y) ，且有，且有1212scscuUxvVy mnynyyynyyxmxxxmxxynxmfyxf)()(sin)()(sin),(),(二维采样定理二维采样定理（a）原图像的频谱）原图像的频谱（b）采样信号的频谱）采样信号的频谱采样信号的频谱采样信号的频谱量化量化在时间轴上已变为离散的样值脉冲，在幅度轴上仍会在在时间轴上已变为离散的样值脉冲，在幅度轴上仍会在动态范围内有连续值，即在幅度轴上仍是模拟信

10、号的性质，动态范围内有连续值，即在幅度轴上仍是模拟信号的性质，故还必须用有限个电平等级来代表实际量值。故还必须用有限个电平等级来代表实际量值。量化是幅度上把连续值的模拟信号变为离散值的数字信量化是幅度上把连续值的模拟信号变为离散值的数字信号，也就是对每个样点值数字化，使其和有限个可能电平中号，也就是对每个样点值数字化，使其和有限个可能电平中的一个对应。的一个对应。另外，人的耳朵或眼睛都不可能辨别出微小的信号变化，另外，人的耳朵或眼睛都不可能辨别出微小的信号变化，所以也没有必要对很小的幅度差别如实地传送。这就是说，所以也没有必要对很小的幅度差别如实地传送。这就是说，量化对于实现数字化不仅是必

11、要的，而且也是可能的。量化对于实现数字化不仅是必要的，而且也是可能的。目标：当幅值的概率分布为目标：当幅值的概率分布为p(z)，量化值为，量化值为qi时，总误时，总误差平方为最小时失真最小。差平方为最小时失真最小。 dzzpqzkizziii)()(10221图像的量化图像的量化量化可分为两种：量化可分为两种：v均匀量化均匀量化v非均匀量化非均匀量化在输入信号的动态范围内，量化间距处处相等的量化称在输入信号的动态范围内，量化间距处处相等的量化称为均匀量化或线性量化。为均匀量化或线性量化。均匀量化时信噪比随输入信号动态幅度的增加而增加。均匀量化时信噪比随输入信号动态幅度的增加而增加。采用

12、均匀量化，在强信号时固然可把噪声淹没掉，但在弱信号采用均匀量化，在强信号时固然可把噪声淹没掉，但在弱信号时，噪声的干扰就十分显著。时，噪声的干扰就十分显著。为改善弱信号时的信噪比，量化间距应随输入信号幅度为改善弱信号时的信噪比，量化间距应随输入信号幅度而变化，大信号时进行粗量化，小信号时进行细量化，也就是而变化，大信号时进行粗量化，小信号时进行细量化，也就是采用非均匀量化。采用非均匀量化。 q 如图所示，设信号的整个动态变化范围为如图所示，设信号的整个动态变化范围为A，共分为，共分为M个量化等级；每个个量化等级；每个量化层距为量化层距为 A，采用均匀量化，则有：，采用均匀量化，则有：AA/M

13、。q 量化等级通常用二进制的位数量化等级通常用二进制的位数b表示，它与十进制数表示，它与十进制数M之间的关系为：之间的关系为：M2b或或blog2M。q b通常称为量化位数。例如，对于通常称为量化位数。例如，对于8位量化，相应的十进制量化等级位量化，相应的十进制量化等级M为：为：M2b256。MA A123均匀量化均匀量化q 将将z z0 0,z zk k) 均分成均分成k个子区间后，每个区间的长度个子区间后，每个区间的长度q 各子区间以它的中心位置作为量化值各子区间以它的中心位置作为量化值 q 当待量化值在当待量化值在 z z0 0, ,z zk k) )区间内均匀分布时区间内均匀分布时kz

14、zLk/ )(02/ )(1iiizzqkLzp/1)(22/12Lq 主要思想：主要思想：l p(z) 不等于常数，使总误差平方最小；不等于常数，使总误差平方最小；l 样本值在某个取值范围内较频繁出现，而在另外一些范围内出现不多；样本值在某个取值范围内较频繁出现，而在另外一些范围内出现不多；l 可对样本值较频繁出现的取值范围采用较小的量化区间，而在其它地方用可对样本值较频繁出现的取值范围采用较小的量化区间，而在其它地方用较大的量化区间；较大的量化区间；l 这样就可在不增加量化级数这样就可在不增加量化级数k k的条件下，降低平均误差，减少量化噪声。的条件下，降低平均误差，减少量化噪声。非均匀量

15、化非均匀量化为使总误差最小，令其对为使总误差最小，令其对z zi i和和q qi i的偏导数为的偏导数为0 0，可得，可得1z2iiiqq11( )( )iiiizzizzz p z dzqp z dzq 步骤：步骤：l初始化所有的量化电平初始化所有的量化电平qi；l更新所有的判决电平更新所有的判决电平zi，并计算总误差的初始值；，并计算总误差的初始值；l更新所有的量化电平更新所有的量化电平qi；l再次计算总误差的值；再次计算总误差的值；l如果两次计算的总误差之差小于某个阈值，则算法停止，否如果两次计算的总误差之差小于某个阈值，则算法停止，否则转入第则转入第2步。步。Lloyd Max量化器量

16、化器Max量化器在误差平方和最小的意义上是最优的。量化器在误差平方和最小的意义上是最优的。取样点数和量化级数的选取取样点数和量化级数的选取假定一幅图像取假定一幅图像取MN个采样点，对样点值进行个采样点，对样点值进行Q级分档取整。那么对级分档取整。那么对M、 N和和Q如何取值呢？如何取值呢？q 首先，首先， Q一般总是取一般总是取2的整数次幂，如的整数次幂，如Q = 2b，b为正整数，通常称为对图为正整数，通常称为对图像进行像进行b比特量化。比特量化。q M、N可以相等，也可以不等。若取相等，则图像距阵为方阵，分析运算可以相等，也可以不等。若取相等，则图像距阵为方阵，分析运算方便一些。方便一些

17、。 q 其次，量化过程相当于由输入值找到它所在的区间号，反量化过程相当于其次，量化过程相当于由输入值找到它所在的区间号，反量化过程相当于由量化区间号得到对应的量化电平值。量化处理是把一批输入量化到一个由量化区间号得到对应的量化电平值。量化处理是把一批输入量化到一个输出级上，量化区间总数远远小于输入值的总数，所以量化能实现数据压输出级上，量化区间总数远远小于输入值的总数，所以量化能实现数据压缩。很明显，反量化后并不能保证得到原来的值，因此量化过程是一个不缩。很明显，反量化后并不能保证得到原来的值，因此量化过程是一个不可逆过程，用量化的方法来进行压缩编码是一种非信息保持型编码。通常可逆过程，用量化

18、的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表法实现。对这两个过程均可用查表法实现。对b来讲，取值越大，量化区间总数越接来讲，取值越大，量化区间总数越接近于输入值总数，所引起的量化失真就越小。近于输入值总数，所引起的量化失真就越小。q 在实际应用中，如果图像的总比特数在实际应用中，如果图像的总比特数MNb给定，对给定，对MN和和b的分配往往是根据图像的内容和应用要求以及的分配往往是根据图像的内容和应用要求以及系统本身的技术指标来选定的。例如，若图像中有大面积系统本身的技术指标来选定的。例如，若图像中有大面积灰度变化缓慢的平滑区域（如人的特写照片等），则灰度变化缓慢的平滑区

19、域（如人的特写照片等），则MN取样点可以少些，而量化比特数取样点可以少些，而量化比特数b多些，这样可使多些，这样可使重建图像灰度层次多些。若重建图像灰度层次多些。若b太少，在图像平滑区往往会太少，在图像平滑区往往会出现出现“假轮廓假轮廓”。q 反之，对于复杂景物图像，如群众场面的照片等，量化比反之，对于复杂景物图像，如群众场面的照片等，量化比特数特数b可以少些，而取样点数可以少些，而取样点数MN要多些，这样就不会要多些，这样就不会丢失图像的细节。究竟丢失图像的细节。究竟MN和和b如何组合才能获得满意如何组合才能获得满意的结果很难讲出一个统一的方案。的结果很难讲出一个统一的方案。不同采样点数对

20、图像质量的影响不同采样点数对图像质量的影响（a）256256 （b）128128 （c）6464（d）3232 （e）1616 （f）88不同量化级别对图像质量的影响不同量化级别对图像质量的影响（a）256色色（b）64色色（c）32色色（d）16色色（e）4色色（f）2色色q 图像处理时要考虑三个因素：分辨率、图像深度和显示图像处理时要考虑三个因素：分辨率、图像深度和显示深度。深度。q 分辨率指图像的清晰度。有屏幕分辨率、图像分辨率和分辨率指图像的清晰度。有屏幕分辨率、图像分辨率和像素分辨率。像素分辨率。屏幕分辨率屏幕分辨率：指计算机显示器屏幕显示图像的最大显示区，指计算机显示器屏幕

21、显示图像的最大显示区，以水平和垂直像素点表示。以水平和垂直像素点表示。图像分辨率：指数字化的图像的大小，以水平和垂直像素图像分辨率：指数字化的图像的大小，以水平和垂直像素点个数表示。例如：在点个数表示。例如：在640480屏幕上显示屏幕上显示320240个像个像素点的图像。素点的图像。像素分辨率：指像素的宽高比，一般为像素分辨率：指像素的宽高比，一般为1：1。2.3 图像的基本属性图像的基本属性2.3 图像的基本属性图像的基本属性q 图像深度（颜色深度）：表示数字位图图像中每个像图像深度（颜色深度）：表示数字位图图像中每个像素上用于表示颜色的二进制数字位数。目前黑白图像素上用于表示颜色的二进

22、制数字位数。目前黑白图像为为8比特，彩色为比特，彩色为24比特。比特。q 显示深度：表示显示器上每个点用于显示颜色的二进显示深度：表示显示器上每个点用于显示颜色的二进制数字位数。若显示深度小于图像深度，则图像失真。制数字位数。若显示深度小于图像深度，则图像失真。图像文件大小的计算（图像文件大小的计算（Byte）：）：图像数据量大小图像数据量大小=像素总数像素总数图像深度图像深度8例如：一幅例如：一幅640480的的256色图像为：色图像为： 64048088=307200 Bytes2.3 图像的基本属性图像的基本属性q 真彩（真彩（True color）彩色图像直接采用包含彩色图像直接采用

23、包含R、G、B三基色分量的像素值。三基色分量的像素值。q 伪彩（伪彩（Pseudo color） Color look-up table，原图像的灰度值按一定的数学关系同各种颜色，原图像的灰度值按一定的数学关系同各种颜色对应起来获得彩色图像的色调对应起来获得彩色图像的色调。q 直接色直接色每个像素值分为每个像素值分为R、G、B分量，这些分量再作为单独索引值，通过分量，这些分量再作为单独索引值，通过相应的彩色变换表找出基本色调。这样产生的相应的彩色变换表找出基本色调。这样产生的RGB强度值构成的彩强度值构成的彩色称为直接色。用这种系统产生颜色与真彩色系统相比，相同之处色称为直接色。用这种系统

24、产生颜色与真彩色系统相比，相同之处是都采用是都采用RGB分量决定基色强度，不同之处是后者的基色强度直接分量决定基色强度，不同之处是后者的基色强度直接用用RGB决定，而前者的基色强度由决定，而前者的基色强度由RGB经变换后决定。因而这两种经变换后决定。因而这两种系统产生的颜色就有差别。试验结果表明，使用直接色在显示器上系统产生的颜色就有差别。试验结果表明，使用直接色在显示器上显示的彩色图像看起来更真实自然。显示的彩色图像看起来更真实自然。2.4 数字图像种类数字图像种类q 表达方法表达方法矢量图（矢量图（vector graphics）（图形）（图形）点阵图（点阵图（bit mapped g

25、raphics）（图像）（图像）v 利用点、线、矩形、多边形、圆和弧线等描述；采用利用点、线、矩形、多边形、圆和弧线等描述；采用数学计算方式数学计算方式，通过计算机语言编程表达，通过计算机语言编程表达v 简单、小块图像时有效，适合做各种变换简单、小块图像时有效，适合做各种变换v 用像素表示用像素表示v 像素具有颜色、亮度像素具有颜色、亮度和属性和属性v 扫描仪、摄像机、录像扫描仪、摄像机、录像机、激光视盘、视频机、激光视盘、视频信号数字卡等获得信号数字卡等获得优点：适合表现大量的优点：适合表现大量的图像细节，可以很好的反图像细节，可以很好的反映明暗的变化、复杂的场映明暗的变化、复杂

26、的场景和颜色，表现逼真的图景和颜色，表现逼真的图像效果。像效果。缺点：文件比较大，放缺点：文件比较大，放大时清晰度会降低并出现大时清晰度会降低并出现锯齿。锯齿。通过数学公式计算获得通过数学公式计算获得描述图形的直线和曲线，描述图形的直线和曲线，文件一般较小，例如文字、文件一般较小，例如文字、线条。线条。优点：无论放大、缩小优点：无论放大、缩小或旋转等都不会失真。或旋转等都不会失真。缺点：难以表现色彩层缺点：难以表现色彩层次丰富的逼真图像效果，次丰富的逼真图像效果，而且显示矢量图也需要花而且显示矢量图也需要花费一些时间。费一些时间。矢量图矢量图点阵图点阵图q亮度等级亮度等级v二值图像二值

27、图像v灰度图像灰度图像q色调等级色调等级v黑白图像黑白图像v彩色图像彩色图像q空间的维数空间的维数v平面二维图像平面二维图像v立体三维图像立体三维图像 2.4 数字图像种类数字图像种类q 灰度图（灰度图（gray-scale image） 256级灰度图，每级灰度图，每个像素个像素1Byte二值二值图，每个像图，每个像素素1bit256色彩色图及其转换的色彩色图及其转换的256级灰度图级灰度图2424位真彩色图及其转换位真彩色图及其转换的的256256级灰度图级灰度图q 彩色图（彩色图（color image）2.5 彩色图像信号的表示和编码彩色图像信号的表示和编码彩色的三参量（彩色的三参量（

28、HIS）q 是视觉系统对一个区域呈现的颜是视觉系统对一个区域呈现的颜色的感觉，即对物体辐射或者反色的感觉，即对物体辐射或者反射的光波波长的感觉。射的光波波长的感觉。q 有一千万种以上，颜色专业人士有一千万种以上，颜色专业人士可辨认出三百至四百种颜色。可辨认出三百至四百种颜色。q 混合相邻颜色时，可以获得在这混合相邻颜色时，可以获得在这两种颜色之间连续变化的色调。两种颜色之间连续变化的色调。色调（色调（hue）：表征各颜色（具有不同频率或波长）：表征各颜色（具有不同频率或波长）q饱和度是指色彩的鲜艳程度，饱和度是指色彩的鲜艳程度，即颜色的纯洁性。即颜色的纯洁性。q当一种颜色渗入其它光（比如当一种

29、颜色渗入其它光（比如白光）成分愈多时，颜色愈不白光）成分愈多时，颜色愈不饱和。饱和。q饱和度为零时，图像变成一灰饱和度为零时，图像变成一灰度图像。度图像。饱和度（饱和度（saturation）：表征颜色的浓度）：表征颜色的浓度q亮度是视觉系统对可见物体辐亮度是视觉系统对可见物体辐射或者发光多少的感知属性。射或者发光多少的感知属性。亮度是主观感觉，例如，一根亮度是主观感觉，例如，一根点燃的蜡烛在黑暗中看起来要点燃的蜡烛在黑暗中看起来要比白炽光下亮。亮度的单位是比白炽光下亮。亮度的单位是坎德拉坎德拉/平方米（平方米（cd/m2）q亮度是用反映视觉特性的光谱亮度是用反映视觉特性的光谱敏感函数加权之

30、后得到的辐射敏感函数加权之后得到的辐射功率。功率。亮度（亮度（intensity或或brightness ）：表征总能量，明暗效果，）：表征总能量，明暗效果，与颜色无关。与颜色无关。另外一个常见概念另外一个常见概念对比度对比度q 对比度指不同颜色之间的差异，对比度越大，两种颜对比度指不同颜色之间的差异，对比度越大，两种颜色之间的反差就越大。比如对一幅灰度图像，提高对色之间的反差就越大。比如对一幅灰度图像，提高对比度会更加黑白分明，反之，则得到一幅灰色的图像。比度会更加黑白分明，反之，则得到一幅灰色的图像。HIS颜色圆锥空间模型颜色圆锥空间模型2.5.1 彩色图像信号的分量表示彩色图像信号的分

31、量表示q 黑白图像信号（灰度级，黑白图像信号（灰度级，8比特，人眼对灰度的最大分辨比特，人眼对灰度的最大分辨力为力为26。）。） q 彩色视频信号（彩色的三基色原理，彩色视频信号（彩色的三基色原理，RGB混合而成，混合而成，24比比特，特，不便于传输和存储。）不便于传输和存储。）q 利用人的视觉特性降低彩色图像的数据量，将利用人的视觉特性降低彩色图像的数据量，将RGB转换到转换到别的彩色空间，别的彩色空间，转换后每一种彩色都产生一个亮度分量和转换后每一种彩色都产生一个亮度分量和两个色度分量信号。两个色度分量信号。 RGB YUV，YIQ，YCbCr颜色空间（彩色空间）颜色空间（彩色空间）

32、RGB型型/计算机图形颜色空间计算机图形颜色空间电视机和计算机的颜色显示系统电视机和计算机的颜色显示系统 CMY型型/彩色印刷及打印模型彩色印刷及打印模型与与RGB三基色互补三基色互补 YUV型型/电视系统颜色空间（电视系统颜色空间（Luminance and chrominance）广播电视需求，以压缩色度信息有效传输电视图像广播电视需求，以压缩色度信息有效传输电视图像 YCbCr（数字电视采用的颜色空间）数字电视采用的颜色空间） XYZ型型/CIE颜色空间颜色空间国际照明委员会定义的国际性颜色空间标准，是国际照明委员会定义的国际性颜色空间标准，是YUV的前身的前身RGB彩色空间q在多媒体计

33、算机中，用得最多的是在多媒体计算机中，用得最多的是RGB彩色空间表彩色空间表示，因为显示器的输入需要示，因为显示器的输入需要RGB三个彩色分量。三个彩色分量。q不管多媒体系统中使用什么彩色空间，最后输出一不管多媒体系统中使用什么彩色空间，最后输出一定要转换为定要转换为RGB。配色方程：配色方程：F=rR+gG+bB，r、g、b为三色系数。为三色系数。白光的白光的亮度公式：亮度公式：PAL，Y=0.22R+0.707G+0.071B NTSC，Y=0.299R+0.587G+0.114B系数不同是因为三基色波长选择不同。系数不同是因为三基色波长选择不同。RGB彩色空间彩色空间彩色图像描述示例彩色

34、图像描述示例 00255800255240240255R 02550160255255801600G 25525525524000160800BRGB彩色空间彩色空间q自然界中任何一种光都可由自然界中任何一种光都可由R、G、B三基色按不同的比例相加混合而成，当三基三基色按不同的比例相加混合而成，当三基色分量都为色分量都为0（最弱）时混合为黑色光，（最弱）时混合为黑色光，当三基色分量都为当三基色分量都为k（最强）时混合为白（最强）时混合为白色光。色光。p任一颜色任一颜色F是这个三维坐标中的一点，调整三色系数是这个三维坐标中的一点，调整三色系数r、g、b中的任一系数都会改变中的任一系数都会改变F的

35、坐标值，也即改变了的坐标值，也即改变了F的的色值。色值。pRGB颜色空间采用物理三基色表示，因而物理意义很清颜色空间采用物理三基色表示，因而物理意义很清楚，适合彩色显像管工作。然而这一体制并不适应人的视楚，适合彩色显像管工作。然而这一体制并不适应人的视觉特点，因而产生了其他不同的颜色空间表示法。觉特点，因而产生了其他不同的颜色空间表示法。 RGB图像图像q亮度信号亮度信号Y和色差信号和色差信号U、Vq亮度信号表示了单位面积上反射光线的强度亮度信号表示了单位面积上反射光线的强度q色差信号（所谓色差信号，就是指基色信号中的色差信号（所谓色差信号，就是指基色信号中的三个分量信号三个分量信号R、G、B

36、与亮度信号之差）决定了与亮度信号之差）决定了彩色图像信号的色调。彩色图像信号的色调。q最后发送端将最后发送端将Y、U、V三个信号进行编码，用同三个信号进行编码，用同一信道发送出去，这就是在一信道发送出去，这就是在PAL（德、英、中、（德、英、中、朝朝）彩色电视制式中使用的）彩色电视制式中使用的YUV彩色空间。彩色空间。YUV彩色空间彩色空间-=BGRVUY100. 0515. 0615. 0436. 0289. 0147. 0114. 0587. 0299. 0YUV与与RGB彩色空间变换彩色空间变换Y=0.299R+0.587G+0.114BqY和和U、V相互独立。即黑白灰度图与单色图是相

37、互独相互独立。即黑白灰度图与单色图是相互独立的，因此可以对这些单色图分别进行编码。这也解决立的，因此可以对这些单色图分别进行编码。这也解决了彩色电视机与黑白电视机的兼容问题。了彩色电视机与黑白电视机的兼容问题。q降低数字彩色图像数据量。利用人眼视觉特性可把几个降低数字彩色图像数据量。利用人眼视觉特性可把几个相邻像素不同的色彩值当做相同的色彩值来处理（即大相邻像素不同的色彩值当做相同的色彩值来处理（即大面积着色原理），从而减少了所需的数据量。面积着色原理），从而减少了所需的数据量。q在在PAL彩色电视制式中，亮度信号的带宽为彩色电视制式中，亮度信号的带宽为4.43MHz，用以保证足够的清晰度，

38、而把色差信号的带宽压缩为用以保证足够的清晰度，而把色差信号的带宽压缩为1.3MHz，达到了减少带宽的目的。，达到了减少带宽的目的。优点优点视频采集卡得到的图像视频采集卡得到的图像qY和和U、V分别采用不同的采样频率。分别采用不同的采样频率。q目前常用的目前常用的Y、U、V采样频率的比例有采样频率的比例有4 4 4、4 2 2、4：1：1、4：2：0。q如要存储如要存储RGB彩色图像，每分量用彩色图像，每分量用8个比特表示，个比特表示，图图像的大小为像的大小为640480像素，像素，那么所需要的存储容量那么所需要的存储容量为为64048038/8921600字节；字节；q如果用如果用Y U

39、 V4 1 1来表示，对于来表示，对于Y每个像素每个像素仍用仍用8比特表示，而对于色差信号比特表示，而对于色差信号U、V，每，每4个像素个像素用用8比特表示，则存储量变为比特表示，则存储量变为640480(8+2+2)/8460800字节。尽管数据量减少了一半，但人眼察觉不字节。尽管数据量减少了一半，但人眼察觉不出有明显变化。出有明显变化。 YUV图像图像q在在NTSC彩色电视制式中选用彩色电视制式中选用YIQ彩色空间，其彩色空间，其中中Y表示亮度，表示亮度，I、Q是两个彩色分量。是两个彩色分量。q I、Q与与U、V是不相同的。人眼的彩色视觉特性是不相同的。人眼的彩色视觉特性表明，人眼对红、黄

40、之间颜色变化的分辨能力最表明，人眼对红、黄之间颜色变化的分辨能力最强；而对蓝、紫之间颜色变化的分辨能力最弱。强；而对蓝、紫之间颜色变化的分辨能力最弱。所以把相角为所以把相角为123度的橙色（红黄之间的颜色）及度的橙色（红黄之间的颜色）及其相反相角其相反相角303度的青色定义为度的青色定义为I轴。与轴。与I正交的色正交的色度信号轴叫度信号轴叫Q轴。即色彩信号轴。即色彩信号I表示人眼最敏感的表示人眼最敏感的色轴，色轴，Q表示人眼最不敏感的色轴。表示人眼最不敏感的色轴。 YIQ彩色空间彩色空间-=BGRQIY311. 0523. 0212. 0321. 0275. 0596. 0114. 0587.

41、 0299. 0YIQ与与RGB彩色空间变换的对应关系：彩色空间变换的对应关系： q在在NTSC制式（美、加）中，传送人眼分辨能力较制式（美、加）中，传送人眼分辨能力较强的强的I信号时，用较宽的频带（信号时，用较宽的频带（1.31.5 MHz）；而传）；而传送人眼分辨能力较弱的送人眼分辨能力较弱的Q信号时，用较窄的频带（信号时，用较窄的频带（0.5 MHz）。）。Y分量的带宽是分量的带宽是4.2MHz。qYCbCr彩色空间是由彩色空间是由ITU-R（国际电联无线标准（国际电联无线标准部，原国际无线电咨询委员会部，原国际无线电咨询委员会CCIR）制定的彩）制定的彩色空间。色空间。q 按照按照CC

42、IR601-2标准，将非线性的标准，将非线性的RGB信号编码信号编码成（数字化）成（数字化）YCbCr，编码过程开始是先采用符，编码过程开始是先采用符合合SMPTE-CRGB（它定义了三种荧光粉，即一（它定义了三种荧光粉，即一种参考白光，应用于演播室监视器及电视接收机种参考白光，应用于演播室监视器及电视接收机标准的标准的RGB）的基色作为）的基色作为r校正信号。校正信号。 YCbCr彩色空间彩色空间q YCbCr与与RGB彩色空间变换的对应关系如下所示。彩色空间变换的对应关系如下所示。 YCbCr是针对数字图像压缩提出的彩色空间是针对数字图像压缩提出的彩色空间。q 实际上很多时候，我们是把实

43、际上很多时候，我们是把YUV和和YIQ / YCrCb模型混为模型混为一谈的。一谈的。q YUV模型用于模型用于PAL制式的电视系统，制式的电视系统，Y表示亮度，表示亮度，UV并并非任何单词的缩写。非任何单词的缩写。q YIQ模型与模型与YUV模型类似，用于模型类似，用于NTSC制式的电视系统。制式的电视系统。YIQ颜色空间中的颜色空间中的I和和Q分量相当于将分量相当于将YUV空间中的空间中的UV分分量做了一个量做了一个33度的旋转。度的旋转。q YCbCr颜色空间是由颜色空间是由YUV颜色空间派生的一种颜色空间，颜色空间派生的一种颜色空间，主要用于数字电视系统中。从主要用于数字电视系统中。从

44、RGB到到YCbCr的转换中，的转换中，输入、输出都是输入、输出都是8位二进制格式。位二进制格式。+-=BG081. 0419. 0500. 0500. 0331. 0169. 0114. 0587. 0299. 0RCCYrb1281280CMY颜色空间颜色空间 q彩色印刷或彩色打印的纸张是不能发射光线的，因彩色印刷或彩色打印的纸张是不能发射光线的，因而印刷机或彩色打印机就只能使用一些能够吸收特而印刷机或彩色打印机就只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料。油墨或颜定的光波而反射其他光波的油墨或颜料。油墨或颜料的三基色是青（料的三基色是青（Cyan）、品红（）、品红（Mage

45、nta）和黄）和黄（Yellow），简称为），简称为CMY。青色对应蓝绿色，品。青色对应蓝绿色，品红对应紫红色。理论上说，任何一种由颜料表现的红对应紫红色。理论上说，任何一种由颜料表现的颜色都可以用这三种基色按不同的比例混合而成，颜色都可以用这三种基色按不同的比例混合而成，这种颜色表示方法称为这种颜色表示方法称为CMY颜色空间表示法。彩颜色空间表示法。彩色打印机和彩色印刷系统都采用色打印机和彩色印刷系统都采用CMY颜色空间。颜色空间。 CMY颜色空间颜色空间q相减混色：它减少了为视觉系相减混色：它减少了为视觉系统识别颜色所需要的反射光。统识别颜色所需要的反射光。在在CMY相减混色中，三基色相减

46、混色中，三基色等量相减时得到黑色；等量黄等量相减时得到黑色；等量黄色（色（Y）和品红（）和品红（M）相减而）相减而青色（青色（C）为）为0时，得到红色时，得到红色（R）；等量青色（）；等量青色（C）和品）和品红（红（M）相减而黄色（）相减而黄色（Y）为）为0时，得到蓝色（时，得到蓝色（B）；等量黄）；等量黄色（色（Y）和青色（）和青色（C）相减而）相减而品红（品红（M）为）为0时，得到绿色时，得到绿色（G）。）。RGB空间与空间与CMY空间的互补关系空间的互补关系qCMY空间正好与空间正好与RGB空间互补，也即用白色空间互补，也即用白色减去减去RGB空间中的某一颜色值就等于同样颜色空间中的某一

47、颜色值就等于同样颜色在在CMY空间中的值。空间中的值。 2.5.2 彩色图像信号编码彩色图像信号编码q 对于彩色图像信号数字压缩编码，可以采用两种不对于彩色图像信号数字压缩编码，可以采用两种不同的编解码方案：同的编解码方案：一种是复合编码，一种是复合编码，它直接对复合图像信号进行采样、它直接对复合图像信号进行采样、编编码和传输；码和传输；另一种是分量编码，另一种是分量编码，它首先把复合图像中的亮度和色度它首先把复合图像中的亮度和色度信号分离出来，信号分离出来，然后分别进行取样、然后分别进行取样、编码和传输。分量编码和传输。分量编码是图像信号压缩编码的主流编码是图像信号压缩编码的主

48、流（图像压缩国际标准）。（图像压缩国际标准）。Q：什么是彩色的三参量，什么是彩色的三基色，：什么是彩色的三参量，什么是彩色的三基色，RGB、YUV、YIQ、CMY等彩色空间那些实现了亮色分离？等彩色空间那些实现了亮色分离？彩色图像信号分量编码系统的基本框图彩色图像信号分量编码系统的基本框图复合视频信号RBG编码数据流亮色分离YVUA/D变换A/D变换A/D变换映射变换量化编码为了便于国际节目的交换及数字设备的互操作，为了便于国际节目的交换及数字设备的互操作，CCIR（ITUR）颁布了分量电视信号数字编码标准）颁布了分量电视信号数字编码标准ITU-R BT.601（CCIR 6

49、01）（俗称）（俗称D1，标清）。，标清）。组成：亮度、色差信号组成：亮度、色差信号 8比特均匀量化比特均匀量化采样频率采样频率13.5MHZvPAL：fs = 625（行（行/帧）帧） 25（帧（帧/s） 864（样点（样点数数/行）行）vNTSC：fs = 525 29.97 858 v每一行有效样本数均为每一行有效样本数均为720个个2.6 数字视频的分量传输数字视频的分量传输ITU-R BT.601推荐亮度采样结构推荐亮度采样结构2.6.1 图像子采样图像子采样q4：2：2 （ITU-R BT.601推荐）推荐）Y：Cb：Cr：取样点的位置：取样点的位置：525行系统：行系统： M

50、=720，N=480，60Hz刷新频率刷新频率 Y=720 480，Cb=Cr=360 480625行系统：行系统： M=720，N=576，50Hz刷新频率刷新频率 Y=720 576， Cb=Cr=360 576 1 2 3 4 5 M 水平水平像素像素123N垂直垂直像素像素像素像素p 电视演播室应用的国际标准电视演播室应用的国际标准q4：2：0 123N垂直像素 1 2 3 4 5 1 2 3 4 5 M M 水平像素水平像素像素像素与与4:2:2具有相同亮度分辨率，色度分辨率降低为前者一半具有相同亮度分辨率，色度分辨率降低为前者一半隔行扫描隔行扫描用于数字广播电视用于数字广播电视52

51、5行系统：行系统：Y=720 480， Cb=Cr=360 240625行系统：行系统： Y=720 576， Cb=Cr=360 288问题：这两种采样格式下，彩色电问题：这两种采样格式下，彩色电视信号数字化后，存储每帧所需的视信号数字化后，存储每帧所需的存储容量及存储容量及1小时电视小时电视/电影所需的电影所需的存储容量？存储容量？q SIF（源中间格式）（源中间格式）水平和垂直分辨率为水平和垂直分辨率为4:2:0格式的一半（亚取样）格式的一半（亚取样）刷新速率（时间分辨率）减半：刷新速率（时间分辨率）减半：30/25Hz 接收时进行插值计算接收时进行插值计算主要用于存储主要用于存储

52、q CIF（通用中间格式（通用中间格式）结合结合625行系统的空间分辨率、行系统的空间分辨率、525行系统的时间分辨率行系统的时间分辨率 Y =352 288，Cb =Cr = 176 144，30Hz 取样点与取样点与SIF同同主要用于电视会议主要用于电视会议v为转换到为转换到CIF格式，则格式，则525行系统需要行频转换器，而行系统需要行频转换器，而625行系行系统需要帧频转换器。统需要帧频转换器。q QCIF（四分之一通用中间格式（四分之一通用中间格式）水平和垂直分辨率为水平和垂直分辨率为CIF的的1/2 时间分辨率为时间分辨率为CIF的的1/2或或1/4 Y =176 144

53、，Cb =Cr = 88 72，15Hz/7.5Hz 用于可视电话用于可视电话q S-QCIF （标准四分之一通用中间格式）（标准四分之一通用中间格式）更低分辨率更低分辨率用于调制解调器和用于调制解调器和PSTN提供的信道提供的信道 Y =128 96，Cb =Cr = 64 48 2.7.1 傅里叶变换傅里叶变换二维连续傅里叶变换二维连续傅里叶变换q 定义：设定义：设 f (x, y) 是独立变量是独立变量x和和y的函数，且在的函数，且在上绝对上绝对可积，则定义积分可积，则定义积分为二维连续函数为二维连续函数 f (x, y) 的傅里叶变换，并定义的傅里叶变换，并定义为为F (u,

54、v) 的逆变换。的逆变换。 f (x, y) 和和F (u, v)为傅里叶变换对为傅里叶变换对。2.7 图像信号变换图像信号变换 2 () F( , )( , )d djux vyu vf x y ex y j2() ( , )( , )ed dux vyf x yF u vu v2.7.1 傅里叶变换傅里叶变换二维离散傅里叶变换二维离散傅里叶变换q 尺寸为尺寸为MN的离散图像函数的离散图像函数f(x,y)的的DFT q 反变换可以通过对反变换可以通过对F(u,v) 求求IDFT获得获得 1010)/(2),(1),(MxNyNvyMuxjeyxfMNvuF1010)/(2),(),(MuNv

55、NvyMuxjevuFyxf2.7.1 傅里叶变换傅里叶变换二维离散傅里叶变换二维离散傅里叶变换 q F(u, v)即为即为f (x, y)的频谱，通常是复数：的频谱，通常是复数：( , )( , )j ( , )F u vR u vI u v221/2|( , )| ( , )( , )F u vR u vIu v( , )( , )arctan( , )I u vu vR u v幅度谱幅度谱相位谱相位谱 2.7.1 傅里叶变换傅里叶变换幅度谱的特点幅度谱的特点频谱的直流成分为频谱的直流成分为，说明在频谱原点说明在频谱原点的傅里叶变换的傅里叶变换F(0, 0)等于图像的平均灰度级。等于

56、图像的平均灰度级。幅度谱幅度谱|F(u, v)|关于原点对称，即关于原点对称，即。图像图像f (x, y)平移后，幅度谱不发生变化，仅有相位平移后，幅度谱不发生变化，仅有相位发生变化。发生变化。112001(0,0)( , )NNxyFf x yN|( , )| |(,)|F u vFuv2.7.1 傅里叶变换傅里叶变换（a）原始图像）原始图像（b）图像的频谱图）图像的频谱图（c）中心化的频谱图）中心化的频谱图傅里叶变换傅里叶变换2.7.2 离散余弦变换离散余弦变换一维离散余弦变换一维离散余弦变换保证变换基的规范正交性，引入常量保证变换基的规范正交性，引入常量C(k) ，定义：

57、，定义：其中其中DCT逆变换为逆变换为 1112(21)( )(0)( ) ( )cos2Nunuf nFC u F uNNN102(21)( )( )( ) cos()2NnnkF kC kfnNN1,0()21,11kC kkN2.7.2 离散余弦变换离散余弦变换二维离散余弦变换二维离散余弦变换 q正变换：正变换：q逆变换：逆变换：1100211( , )( ) ( )( , )coscos22MNxyF u vC u C vf x yu xv yMNMN1100211( , )( ) ( ) ( , )cos() cos()22MNuvf x yC u C v F u vu xv yM

58、NMN11( ) ( ) ( , )cos() cos()22C u C v F u vu xv yMN线性组合线性组合2.7.2 离散余弦变换离散余弦变换二维离散余弦变换二维离散余弦变换（a）wpeppers2图像图像（b）wpeppers2图像的图像的DCT系数系数离散余弦变换离散余弦变换 2.7.3 沃尔什沃尔什-哈达玛变换哈达玛变换 q 哈达玛矩阵：元素仅由哈达玛矩阵：元素仅由1和和1组成的正交方阵。组成的正交方阵。q 正交方阵：指它的任意两行（或两列）都彼此正交，正交方阵：指它的任意两行（或两列）都彼此正交，或者说它们对应元素之和为零。或者说它们对应元素之和为零。q 哈达玛变换

59、要求图像的大小为哈达玛变换要求图像的大小为N2n 。q 一维哈达玛变换核为一维哈达玛变换核为其中，其中， bk(z) 代表代表z的二进制表示的第的二进制表示的第k位值。位值。10)()() 1(1),(niiiubxbNuxg2.7.3 沃尔什沃尔什-哈达玛变换哈达玛变换 q一维哈达玛正变换一维哈达玛正变换 q一维哈达玛逆变换一维哈达玛逆变换q二维哈达玛正变换二维哈达玛正变换q二维哈达玛逆变换二维哈达玛逆变换10)()(10) 1)(1)(nxubxbniiixfNuH10)()(10) 1)()(nuubxbniiiuHxf1010)()()()(10) 1)(,(1),(NxNyvbyb

60、ubxbniiiiiyxfNvuH1010)()()()(10) 1)(,(1),(NuNvvbybubxbniiiiivuHNyxf2.7.3 沃尔什沃尔什-哈达玛变换哈达玛变换 q正反变换都可通过两个一维变换实现。正反变换都可通过两个一维变换实现。q高阶哈达玛矩阵可以通过如下递推公式求得：高阶哈达玛矩阵可以通过如下递推公式求得：N8的哈达玛矩阵为的哈达玛矩阵为 2222NNNNNHHHHH5261437011111111111111111111111111111111111111111111111111111111111111112218H2.8.1 基本统计分析量基本统计分析量2.8 图

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第二章视觉特性及图像制式

文档简介

温馨提示

最新文档

评论

第二章 视觉特性及图像制式

文档简介

温馨提示

最新文档

评论

相关文档

第二章视觉特性及图像制式