第二章 数字图像基础_第1页
第二章 数字图像基础_第2页
第二章 数字图像基础_第3页
第二章 数字图像基础_第4页
第二章 数字图像基础_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章

数字图象基础2.1视觉和视觉特性图象处理的研究需要了解人类视觉机理:人们能够区分的光强度差别有多大?我们眼睛的空间清晰度是多少?对运动的感觉如何?我们估计和比较距离和面积的精度是多少?人类特性视觉的光谱是什么?人的视觉中彩色起什么作用?人类是如何获得视觉感知,如何认知周围事物的?人们对于自己视觉机构的生物、生理物理过程的了解,以及神经、精神方面的了解还处于低级阶段,认识还很不完善和有局限性。一.视觉感知:是视觉的内在表象.二.视觉的外在表现----视觉现象(视觉特性)(1)相对视敏函数:(2)对比度的灵敏度和同时对比度:(3)马赫带(MachBands)和视觉系统的调制传输函数MTF(4)视觉的瞬时性质(TemporalPropertiesofVision)(5)彩色视觉特性(6)图象逼真度准则一.视觉感知:是视觉的内在表象视觉低级感知层次:视觉系统从外界获取图象,就是在眼睛视网膜上获得周围世界的光学成象,然后由视觉接收器(杆状体和锥状体在视网膜上作为视觉接收器),将光图象信息转化为视网膜的神经活动电信息,最后通过视神经纤维,把这些图象信息传送入大脑,由大脑获得图象感知。视觉感知的低级感知层次视网膜上有杆状体和锥状体两类视觉接收器;视杆体(Rods):细长而薄,数量上约100million,它们提供暗视(ScotopicVision),即在低几个数量级亮度时的视觉响应,其光灵敏度高。视锥体(Cons):结构上短而粗,数量少,约6.5million,光灵敏度较低,它们提供明视(PhotopicVision),其响应光亮度范围比视杆体要高5~6个数量级。在中间亮度范围是两种视觉细胞同时起作用。视锥体集中分布在视网膜中心。视觉感知的低级感知层次眼睛的截面图视觉感知的低级感知层次光图象激活视杆体或视锥体时,发生光电化学反应,同时产生视神经脉冲,视觉系统散布视神经中有80万神经纤维,视觉系统传播视神经脉冲。许许多多的视杆体和视锥体相互连接到神经纤维上。视觉系统的可视波长范围为=350nm~780nm;视觉系统的可响应的亮度范围是:1~或有10个量级的幅度范围。视觉感知的低级感知层次生理学已证实,视网膜中有三种视锥体,具有不同的光谱特性,峰值吸收分别在光谱的红、绿、蓝区域,从实测光谱吸收曲线可以看到视锥体主要对兰光响应,灵敏度相对低。而且,吸收曲线有相当多的部分是相互重叠的。这是三基色原理的生理基础。视觉感知的低级感知层次视觉感知的高级感知层次大脑对视神经纤维传送来的图象信息进行分析和理解,通过图象获得对周围世界感知的信息和知识。人们对大脑的高级感知层次至今知之甚少,仍是生理学、神经科学、生物物理学、生物化学研究的重要课题。生物视觉通路二.视觉的外在表现---视觉现象(视觉特性)图象是周围世界的一种映射,而周围世界是一个能量场,它可以描述为:其中,x,y,z为空间座标,为光波波长,t为时间.而图象是客观世界的一次摄影的结果,是能量场E的一个映射,即:二.视觉的外在表现---视觉现象(视觉特性)对于运动图象,x,y,z都是时间t的函数,若在连续的不同时间获取图象,可以获得序列图象对于按不同波段获取图象,可获得彩色图象或不同波段的图象信号(如遥感图象,医学图象等).对于按不同视角,即不同的x,y,z间相互关系,可以得到不同视角的不同图象.因此,视觉现象包括视觉对光强,对各种波长、彩色的光谱效应,对物体边缘等空间频率变化的响应,以及视觉对时间瞬时变化运动的响应.(1)相对视敏函数:人眼对不同波长的光有不同的敏感度,不同波长而幅射功率相同的光不仅给人以不同的色彩感觉,而且亮度感觉也不同.设具有光幅射的空间、波长分布的物体的亮度感觉为:

为视觉系统的相对视敏函数(RelativeluminousefficiencyfunctionoftheVisionSystem).

对于人眼,是钟形曲线,(1)相对视敏函数:视杆体和视锥体的相对视敏曲线有所不同,对视锥体情况,在=555nm时绿光亮度最敏感,对视杆体暗视情况,则=505nm时最敏感。相对视敏度曲线(2)对比度的灵敏度和同时对比度眼睛对光强的响应是非线性的。一块光强为的小块被背景强度I所包围,则可觉察的差值是I的函数,即对视觉敏感的是对比度,而不是亮度值本身。韦伯定理(Weber’sLaw):如果一个物体的亮度与其周围背景I有刚刚可觉察得到的差别,则它们的比值是I的函数。其在一定的亮度范围内,近似不变,为常数值0.02,这称为韦伯比。即:

(常数)人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实验证明,这一非线性接近的幂指数函数。人眼通过这一对数性质,达到宽达的视觉亮度范围。(2)对比度的灵敏度和同时对比度图象对比度模型(3)马赫带(MachBands)一个物体和它周围的亮度的交互作用,产生一种称为马赫带的效应。这个效应说明视觉的明亮程度并不是亮度的单调函数,例如,灰阶条带图象呈现的明亮视觉感觉沿着条带是不均匀的,在条带过渡部分具有负轮廓的边缘,这就说明了马赫带效应。马赫带效应可以用来估计视觉系统的冲激响应。冲激响应负瓣的出现,称为视觉的侧抑制现象(LateralInhibition)。冲激响应值代表被视杆体和视锥体接收器的相对空间加权值。负瓣指示在给定位置上的神经信号(Postretinal)被某些侧位的接收器所禁止。(4)视觉系统的冲击响应视觉系统冲击响应视觉系统的调制传输函数MTF用马赫带效应测量了视觉系统的在空间座标的冲激响应,这一冲激响应的Fourier

变换给出了视觉系统的空间频率响应,由它可以确定视觉系统的调制传输函数MTF。视觉系统的空间频率响应这频率响应类似于带通泸波器的响应曲线,并展示了人的视觉系统对中间频率最敏感,而对高频最不敏感。实际上,视觉系统的空间频率响应还与空间频率的取向有关,视觉系统的空间频率响应灵敏度在水平和垂直方向最大,当最大偏离为度时,角度灵敏度变化在3db以内。视觉系统的调制传输函数MTF视觉系统的调制传输函数MTF视觉系统的调制传输函数MTF

作为近似,MTF可以被看作为各向同性并忽略其相位效应,视觉系统的频率响应可近似由公式表示为

cycles/degree此处,是常数,对于时,是频率响应的峰值点频率。例如,在图象编码的应用中,采用A=2.6,=0.0192,==8.772,和=1.1,是有用的。视觉的瞬时性质(TemporalPropertiesofVision)视觉的瞬时性质在处理运动图象和图象显示设计时变得十分重要.A.Bloch’sLaw

能量相等而不同持续时间的光闪烁,在持续时间低于一个临界值以下是不能辨识的.当眼睛适应于中等亮度时的临界持续时间是30ms,当眼睛更多适应于黑暗时,则临界持续时间将变长.视觉的瞬时性质(TemporalPropertiesofVision)B.临界熔合频率CriticalFusionFrequency(CFF)缓慢的闪烁光的每单个闪烁都可辨识,但当闪烁频率高于临界闪烁频率时,闪烁将不再与具有同样平均强度的稳定发光相区别.一般来说,这个频率不超过50~60HZ.这是视觉暂留,是电影和电视的基础.C.SpatialversusTemporalEffects眼睛对高空间频率的闪烁的敏感高于对低空间频率的闪烁的敏感度.视觉的瞬时性质(TemporalPropertiesofVision)在图象编码中,对运动图象的编码时,除了边缘以外的任何地方可以进行亚取样,以压缩码率.同样的原因,非隔行光栅的监视器(闪烁频率高,可保留良好的高清析度细节)比隔行光栅(闪烁频率低,对低空间频率已足够)可提供高空间解析度的图象显示.视觉的瞬时性质(TemporalPropertiesofVision)闪烁场的瞬时调制传输函数MTF(5)彩色视觉特性彩色的利用不仅喜人,且可获得更多的信息:视觉仅能感知十余级灰阶,

彩色感知但却能区分上千种彩色;彩色视觉特性是亮度(Brightness)、色调(Hue)和饱和度(Saturation)。亮度表示感受到的光强度(Luminance),

色调表示颜色,饱和度是彩色中包含白光的多少;人眼对于彩色的观察和处理是一种生理和心理现象,其机理还没有完全搞清楚,因而对于彩色的许多结论都是建立在实验基础之上的。人眼对于彩色的观察和处理是一种生理和心理现象,其机理还没有完全搞清楚,因而对于彩色的许多结论都是建立在实验基础之上的。

颜色模型线性感知的,如HSI颜色空间;

非线性感知的,如在计算机上通常采用的RGB三颜色模型设备依赖之分:RGB空间是一个依赖于显示设备的彩色空间;CIEL*a*b色标体系是一个不依赖于显示设备的颜色空间。各种不同的颜色模型之间可以通过数学方法互相转换。

颜色模型

可见光

电磁波波长范围很大,但是只有波长在400~760nm这样很小范围内的电磁波,才能使人产生视觉,感到明亮和颜色。把这个波长范围内的电磁波叫可见光。

三原色1931年,国际照明委员会(CIE)规定用波长为700nm、546.1nm和435.8nm的单色光作为红(R)、绿(G)、蓝(B)三原色。

任意彩色的颜色方程为:

α、β、γ是红、绿、蓝三色的混合比例,一般称为三色系数。

所谓颜色模型指的是某个三维颜色空间中的一个可见光子集。它包含某个色彩域的所有色彩。任何一个色彩域都只是可见光的子集,任何一个颜色模型都无法包含所有的可见光。RGB颜色模型

RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体白(1,1,1)蓝(0,0,1)品红(1,0,1)青(0,1,1)绿(0,1,0)黄(1,1,0)红(1,0,0)黑(0,0,0)RGB颜色模型示意图在正方体的主对角线上,各原色的量相等,产生由暗到亮的白色,即灰度。(0,0,0)为黑,(1,1,1)为白,正方体的其他6个角点分别为红、黄、绿、青、蓝和品红。

RGB颜色模型构成的颜色空间是CIE原色空间的一个真子集。RGB颜色模型通常用于彩色阴极射线管和彩色光栅图形显示器。RGB三原色是加性原色。CMY颜色模型

CMY颜色模型是以红、绿、蓝三色的补色青(Cyan)、品红(Magenta)、黄(Yellow)为原色构成的颜色模型。

CMY颜色模型常用于从白光中滤去某种颜色,故称为减色原色空间。

CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型对应的子空间几乎完全相同。

CMY在原色的减色效果示意图

RGB和CMY颜色模型的区别HSV颜色模型

HSV色彩模型示意图

HSV(Hue,

Saturation,

Value)颜色模型则是面向用户的

在HSV颜色模型中,每一种颜色和它的补色相差180o,

圆锥的顶面对应于V=1,它包含RGB模型中的R=1,G=1,B=1三个面,故所代表的颜色较亮。色度H由绕V轴的旋转角给定。红色对应于角度,绿色对应于角度120o,蓝色对应于角度240o。

在圆锥的顶点处,V=0,H和S无定义,代表黑色。

圆锥的顶面中心处S=0,V=1,H无定义,代表白色。

HSV颜色模型具有以下的优点

符合人眼对颜色的感觉。当采用RGB(或者CMY)颜色模型时,改变某一颜色的属性,比如改变色调就必须同时改变R、G、B(或者C、M、Y)三个坐标;而采用HSV颜色模型时只需改变H坐标。也就是说,HSV颜色模型中的三个坐标是独立的。

HSV颜色模型构成的是一个均匀的颜色空间,采用线性的标尺,彩色之间感觉上的距离与HSV颜色模型坐标上点的欧几里德距离成正比。

CIE(国际照明委员会)颜色模型

CIE颜色模型包括一系列颜色模型,这些颜色模型是由国际照明委员会提出的,是基于人的眼睛对RGB的反应,被用于精确表示对色彩的接收。这些颜色模型被用来定义所谓的独立于设备的颜色。它能够在任何类型的设备上产生真实的颜色,例如:扫描仪、监视器和打印机。这些模型被广泛地使用,因为它们很容易被用于计算机,描述颜色的范围。CIE的模型包括:CIEXYZ,CIEL*a*b和CIEYUV等。设备无关性:

CIE颜色模型的提出

CIE颜色模型的类型CIEXYZ

XYZ三刺激值的概念是以色视觉的三元理论为根据的,它说明人眼具有接受三原色(红、绿、蓝)的接受器,而所有的颜色均被视作该三原色的混合色。1931年CIE制定了一种假想的标准观察者,1931年CIE制定了一种假想的标准观察者,配色函数XYZ三刺激值是利用这些标准观察者配色函数计算得来的。

在此基础上,CIE于1931年规定了Yxy颜色空间,其中Y为亮度,x,y是从三刺激值XYZ计算得来的色坐标。它代表人类可见的颜色范围。CIE彩色图表CIEL*a*b*

L*a*b*颜色空间是在1976年制定的,它是CIEXYZ颜色模型的改进型,以便克服原来的Yxy颜色空间存在的在x,y色度图上相等的距离并不相当于我们所觉察到的相等色差的问题。它的“L”(明亮度),“a"(绿色到红色)和“b”(蓝色到黄色)代表许多的值。与XYZ比较,CIEL*a*b*颜色更适合于人眼的感觉。利用CIEL*a*b*,颜色的亮度(L)、灰阶和饱和度(a,b)可以单独修正,这样,图像的整个颜色都可以在不改变图像或其亮度的情况下,发生改变。L*a*b*的概念图L:明亮度a:从绿色到红色b:从蓝色到黄色在比较色差时,设A为基准色,B为试料色,A’为与B相同亮度的基准色,ΔE*ab为色差程度,

ΔE*ab大小决定了色差程度的大小,具体见表色差程度的鉴定ΔE*ab微量0-0.5轻微0.5-1.5能感觉到1.5-3.0明显3.0-6.0很大6.0-12.0截然不同12.0以上CIEYUV

在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD(点耦合器件)摄像机,它把摄得的彩色图像信号,经分色、分别放大校正得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号R-Y、B-Y,最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的YUV颜色空间。采用YUV颜色空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图就是黑白灰度图。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题,使黑白电视机也能接收彩色信号。根据美国国家电视制式委员会,NTSC制式的标准,当白光的亮度用Y来表示时,它和红、绿、蓝三色光的关系可用如下式的方程描述:色差U、V是由、按不同比例压缩而成的。各种颜色模型之间的转换算法

RGB与CMY颜色模型之间转换算法RGB的取值通常是0~255的整数。

C=255–R M=255–G Y=255–B

RGB与HSV颜色模型之间转换算法查表法RGB颜色模型到HSV颜色模型之间转换的算法要复杂一些。从RGB颜色模型到HSV颜色模型的最可靠的方法是首先把RGB坐标转换为1931CIE-XYZ系统中的(x,y,Y)坐标,然后根据(x,y,Y)查找对应表,得到相应的(H,S,V)坐标。逆向操作则可以从HSV坐标转换到RGB坐标。xyY坐标与HSV坐标的对照表已由色度学实验得到[Newhall1943]。但是这种方法需要依赖对照表,比较笨重。数学公式设m=max(r,g,b),n=min(r,g,b),其中r,g,b分别是归一化的RGB颜色空间中的值

从RGB颜色坐标转换到HSV颜色坐标从HSV颜色坐标到RGB颜色坐标的转换其中%为取余数运算,即f为h除以60的余数

RGB与CIEXYZ颜色模型之间转换算法

CIEXYZ与CIEL*a*b*颜色模型之间转换算法L的范围是0~100,a,b的范围是-300~300。从-a到+a表示绿到红过渡,-b到+b表示蓝到黄过渡。从-a到+a表示绿到红过渡,-b到+b表示蓝到黄过渡。

RGB与CIEYUV颜色模型之间转换算法

RGB与YCC颜色模型之间转换算法

为了区分YCC颜色空间中的两个C,我们分别用Cr和Cb来表示

色彩量化技术

真彩图像包含多达224种颜色,直接比较这些颜色不可行。

进行真彩图像处理时往往需要首先对图像进行量化,减少需要处理的颜色数目。

量化即为图像选择一个调色板,它包含的颜色数目远小于224,然后为图像的每个像素点选择一个调色板中与它最接近的颜色。颜色量化方法Y.Linde,A.BuzoandR.M.Gray,“Analgorithmforvectorquantizerdesign”,IEEETrans.Commun.,vol.COM-28,no.1,pp.84-95,1980.

LBG方法DSQ方法PeiSC.ChengCM.Dependentscalarquantizationofcolorimages.IEEEtrans.onCircuitsandSystemsforVideoTechnology.1995,5(2):124~139.

LBG方法算法4.2:LBG聚类。{x(s)}是所有元素的集合。选择初始类别中心{q(n)|n=1,2,…,M}Do

根据最邻近方法对元素x(s)分类,形成类别{C(m)|m=1,2,…,M}

对C(m)中元素取平均值,得到新的分类中心{q(n)}While每一步都使分类误差TSE减小

该算法能达到TSE的局部极值,但是否能达到最小值与初始聚类中心的选择有关系。这个算法计算量较大。每步迭代需计算MN次距离,N是元素的总数。用在颜色量化上,对像素点的(r,g,b)聚类,终止条件改为|TSEi+1–TSEi|<1,即迭代使TSE的改变小于1就停止。该精度对颜色量化在很多场合是足够的。

DSQ方法DSQ算法是一个层次的颜色空间分解算法。算法每次用垂直于坐标轴的平面将颜色子空间一分为二。

空间划分的方法是,对属于该颜色子空间的像素点,计算相应颜色分量的直方图,确定阈值t和z1,z2,其中z1<t<z2,若将所有小于t的颜色分量用z1代替,所有大于t的颜色分量用z2代替,要求直方图的三个矩保持不变。设I(x,y)表示点(x,y)的某个颜色分量,其前三个矩是:

N是图像的像素点数。

先求I(x,y)<t的像素点占的比例p,t由下式决定nk是颜色分量为k的像素点数。

调色板的颜色取为颜色子空间中所有像素点的平均颜色。

算法大致需要3L(N–1)次整数乘法操作,L是颜色直方图的尺寸,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论