《数字图像处理系统导论》课件第2章_第1页
《数字图像处理系统导论》课件第2章_第2页
《数字图像处理系统导论》课件第2章_第3页
《数字图像处理系统导论》课件第2章_第4页
《数字图像处理系统导论》课件第2章_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章数字图像处理的基础知识2.1色度学基础与颜色模型

2.2数字图像处理中的基本运算

2.3数字图像处理中的模板运算

2.4数字图像处理中的频域变换

2.5小结

2.1色度学基础与颜色模型

色彩是图像的一个基本特征,也是人类感知自然的重要手段。色度学是研究人的颜色视觉规律、颜色测量的理论与技术的综合性科学。人为什么可以看到色彩?为什么人可以看到五彩斑斓的世界?颜色的形成机理是什么?如何对颜色进行量化表示?带着这些问题,我们开始本节的介绍。

1860年,麦克斯韦发现三色混合定律,即以不同量的红、绿、蓝色光,可以调配出各种不同波长光谱的颜色。可见光是电磁光谱(包括无线电波、微波、红外波和X射线)中狭窄的频率波段,从低频到高频的光谱颜色变化分别是红、橙、黄、绿、青、蓝、紫,如图2-1所示为可见光光谱图。由于波长比频率容易处理,故光谱颜色常用波长来指定。图2-1可见光光谱

颜色的感知是由光经过与周围环境相互作用后到达人眼,并经过一系列物理和化学变化转化为人眼所能感知的电脉冲的结果。颜色的形成是一个复杂的物理和心理相互作用的过程,它涉及光的传播特性、人眼结构及人脑心理感知等内容。如何进行颜色的测量和定量描述是色度学的研究对象。色度学其实也仅是对人的眼睛和大脑行为所建立的一种物理关系的表述,真正系统地研究色度学的问题,还不足100年。1931年,国际照明委员会才比较系统地规定了颜色的定量描述方法。2.1.1色度学基础

关于三基色原理,我们在中学的物理课中已经知道,白光通过棱镜后被分解成多种颜色逐渐过渡的色谱。人眼视网膜上的锥状细胞有三种不同的类型,对红、绿、蓝最为敏感,就像一个三色接收器的体系,这就是导出三基色的物理原因。自然界常见的各种色光都可以由红、绿、蓝三种光按不同比例相配而成,同样,绝大多数色光也可以分解成红、绿、蓝三种色光,这便是色度学中的三基色原理,如图2-2所示。

国际照明委员会(CIE)于1931年认可并达成共识:分别取水银光谱中的红、绿、蓝光作为标准的红(R,Red)、绿(G,Green)、蓝(B,Blue)基色光。CIE统一规定了设备三基色光的标准波长:lR=700.0nm,lG=546.1nm,lB=435.8nm。图2-2三基色原理

1.CIE1931色度坐标图

国际照明委员会(CIE)于1931年定义了XYZ颜色模型。色度图中,X轴色度坐标相当于红基色的比例,Y轴色度坐标相当于绿基色的比例。图中没有Z轴色度坐标(即蓝基色所占

的比例),因为比例系数X+Y+Z=1,所以Z的坐标值可以推算出来,即1-(X+Y)=Z。

国际照明委会制定的CIE1931色度图如图2-3所示。色度图中,弧形曲线上的各点是光谱上的各种颜色即光谱轨迹,是光谱各种颜色的色度坐标。红色波段在图的右下部,绿色波段在图的左上角,蓝紫色波段在图的左下部。图2-3

CIE1931色度图·它是一条舌状的曲线,其边界和内部表示所有可见光的色度值。

·曲线边界上的点对应于色纯度为100%的纯彩色;

·线上标明的数字表示该位置所对应单色光的主波长,波长从390~760nm。

·D65点对应于亮白色位置,其色度坐标近似但不等于(1/3,1/3,1/3)。

·连接红色的紫色光谱点的直线称为紫色线,它不属于光谱。

在三基色混色系统中,连接RGB构成的三角形,称为颜色三角形。三角形内所包含的颜色区域,表示这三基色按适当比例混合可得到的全部光谱色。三点的颜色范围是该三点连成的三角形。图中不可能有一个三角形能包含所有颜色,也就是说,没有一个三基色组可以通过加色混合生成所有颜色。

2.光色的互补

若两种颜色的光,按一定比例混合后可得到白光,则这两种色光称为互补。在色度坐标图中,凡是穿过白色区的直线,都可以找到一对互补的颜色光。当然,穿过等能白光点c点的直线两端,也能找到一组互补的颜色光。

如图2-4所示为CIE1931颜色的互补图,从c经过c1画一条直线与光谱曲线相交于cs。颜色c1可表示成光c与光谱颜色cs的混合,因此,c1的主波长就是cs。c1点的颜色纯度可通过沿c到cs的直线计算c1到c的相对位置来确定:表示从c到c1的距离,表示c到cs的距离,比率 来计算纯度。图2-4

CIE1931颜色的互补2.1.2颜色模型

色彩、饱和度和明度都是主观量,它们是颜色的非精确描述。为了用计算机来表示和处理颜色,必须采用定量的方法来描述颜色,即建立颜色模型。

从视觉角度,颜色以色彩(Hue)、饱和度(Saturation)和明度来描述。色彩指颜色是红、绿,还是蓝,它是一种颜色区别于另一种颜色的最重要特征;饱和度反映颜色的纯度,当向某种颜色中加入白色时就降低了它的饱和度;明度即人眼感知到的光的亮度。色彩、饱和度和明度的关系如图2-5所示。明度沿颜色空间的中心线变化,色彩沿圆周变化,饱和度沿着半径变化。图2-5色彩、饱和度和明度的关系一个颜色模型指的是三维颜色空间的一个子集,它包含某个颜色域中的所有颜色。颜色模型是对颜色的特性和行为的解释方法,没有一种颜色模型能解释所有的颜色问题,因此,要使用不同的模型来帮助说明不同的颜色特征。

1.RGB模型

用由R、G和B坐标轴定义的立方体来描述的模型称为RGB模型,如图2-6所示。

·坐标原点代表黑色,坐标点(F,F,F)代表白色。

·坐标轴上的顶点为三基色,余下的顶点则代表每一个基色的补色。图2-6

RGB颜色模型

RGB颜色框架是加色模型。多种基色的强度加在一起生成另一种颜色。立方体边界的每一个颜色点表示一个三元组(R,G,B),R、G和B的值在0~255的范围内赋值,一种颜色F在RGB中表示为:F=R[R]+G[G]+B[B]。灰色的明暗度由立方体的原点到白色顶点的主对角线上的位置来表示。对角线上每一点是每一种基色等量的混合。RGB颜色模型是主动发光体,多一个光源就相当于多一个相加的元素。

2.CMYK模型

图2-7为CMYK颜色模型。CMYK颜色模型,是反射其他发光体的光源。Cyan代表青色,Magenta为品红色,Yellow为黄色、Black为黑色。图2-7

CMYK颜色模型与RGB不同的是,CMYK是减色混合,意思就是CMY元素通过吸收不同的光谱,来得到我们所需要的颜色。例如,我们能看到黄色的染料,细化一下,大致分两步:第一步是白色的光谱照射到黄色的染料上,第二步是黄色的染料吸收了蓝色光谱,所以,在我们的眼中,也就呈现出来黄色了。可以用下面的公式来表达:

因为

红色+绿色+蓝色=白色

所以

白色-蓝色=红色+绿色=黄色

总之,RGB颜色模型与CMYK颜色模型是分别利用了主动发光与被动发光的原理而建立起来的。例如,各种五颜六色的染料在漆黑的屋里都是漆黑的一片。CMYK颜色模型主要用于印刷、染料混合等行业。实际上,减色模型也是相加,只是对于我们的眼睛来说,每增加任何一个CMY元素,就会多吸收一道光谱。所以,就叫减色混合。

理论上,CMY三种染料混合,会吸收所有可见光谱,而使得混合物得到黑色(也就是不反射可见光谱)。但是实际过程中,CMY三种染料混合,得到的是一种深棕色的颜色,所以,实际应用过程中还需要增加一种黑色染料。这也就是为什么不用CMY模型,而使用CMYK这种模型的原因。图2-8所示为CMYK颜色示意图。图2-8

CMYK颜色示意图

3.YIQ模型

YIQ色彩空间通常被北美的电视系统所采用,属于NTSC(NationalTelevisionStandardsCommittee)系统。这里Y指颜色的明视度(Luminance),即亮度(Brightness)。其实Y就是图像的灰度值(Grayvalue),而I和Q则是指色调(Chrominance),即描述图像色彩及饱和度的属性,黑白电视监视器只使用Y信号。在YIQ系统中,Y分量代表图像的亮度信息,I、Q两个分量则携带颜色信息,I分量代表从橙色到青色的颜色变化,而Q分量则代表从紫色到黄绿色的颜色变化。将彩色图像从RGB转换到YIQ色彩空间,可以把彩色图像中的亮度信息与色度信息分开,分别独立进行处理。人眼的彩色视觉的特性表明,人眼分辨红、黄之间颜色变化的能力最强,而分辨蓝与紫之间颜色变化的能力最弱。通过一定的变化,I对应于人眼最敏感的色度,而Q对应于人眼最不敏感的色度。这样,传送Q可以用较窄的频宽,而传送分辨率较强的I信号时,可以用较宽的频带。人眼睛对亮度较色彩敏感,亮度信息带宽4.2MHz,色彩信息1.8MHz,YIQ与RGB的关系为:Y=0.299R+0.587G+0.144B,I=R-Y,Q=B-Y。

PAL彩色电视制式中使用YUV模型,Y表示亮度信号,U、V表示色差信号,UV构成彩色的两个分量。可以用不同位数的字节数来记录这些分量。在YUV彩色空间,通常采用Y∶U∶V=8∶4∶4,或者Y∶U∶V=8∶2∶2。例如8∶2∶2具体的做法是:对亮度信号Y,每个像素都用8位二进制数表示(可以有256级亮度),而U、V色差信号每4个像素点用一个8位数表示,将一个用24位表示的像素压缩为用12位表示,节约1/2存储空间,而人的眼睛基本上感觉不出这种细节的损失。

4.HSV模型

RGB和CMY颜色模型都是面向计算机的,相比较而言,HSV(Hue,Saturation,Value)颜色模型是面向用户的,该模型对应于圆柱坐标系的一个圆锥形子集,图2-9为HSV颜色模型。圆锥的顶面对应于V=1,代表的颜色较亮。色彩H由绕V轴的旋转角给定,红色对应于角度0°,绿色对应于角度120°,蓝色对应于角度240°。在HSV颜色模型中,每一种颜色和它的补色相差180°。饱和度S的取值范围为0~1,由圆心向圆周过渡。由于HSV颜色模型所代表的颜色域是CIE色度图的一个子集,其最大饱和度的颜色的纯度值并不是100%。图2-9

HSV颜色模型在圆锥的顶点处,V=0,H和S无定义,代表黑色;圆锥顶面中心处S=0,V=1,H无定义,代表白色;从该点到原点代表亮度渐暗的白色,即不同灰度的白色。任何V=1,S=1的颜色都是纯色。

HSV模型对多数用户是一个较直观的模型。通常,用模型的接口给出颜色板中HSV参数选择。从指定一种纯色彩开始,即指定色彩角H,且V=S=1,通过将白色或黑色加入到纯色彩中来描述所要的颜色。增加黑色,减小V,而S保持不变。要得到深蓝色,V=0.4,S=1,且H=240°。将白色加进所选色彩中时,参数S减小而V保持不变。浅蓝色用S=0.3,V=1,且H=240°来设定。添加一些黑色和白色,则同时减小V和S。2.1.3颜色模型的转换

当用计算机处理图像时,经常要从一个颜色空间转换到另一个颜色空间。例如,当我们描述相片和图纸时,使用CMYK颜色模型;当我们处理已有图像或在屏幕上产生新图像时,常使用RGB颜色模型;当在纸上输出一个图像时,再一次使用CMYK颜色模型。

1.RGBCIEXYZREC601

2.RGBCMYK

(1)RGB→CMYK

K=min(1-R,1-G,1-B)

C=(1-R-K)/(1-K)

M=(1-G-K)/(1-K)

Y=(1-B-K)/(1-K)

(2)CMYK→RGB

R=1-min(1,C*(1-K)+K)

G=1-min(1,M*(1-K)+K)

B=1-min(1,Y*(1-K)+K)

3.RGB→HSV

(R,G,B)分别是一个颜色的红、绿和蓝坐标,它们的值是在0~255之间的实数。设max等于R、G和B中的最大者,min等于这些值中的最小者。要找到在HSV空间中的(H,S,V)值,这里的H∈[0,360)是角度的色相角,而S,H∈[0,1]分别是饱和度和亮度,计算为:

V=max(R,G,B)

S=(V-min(R,G,B))*255/VifV!=0otherwise

H=(G-B)*60/S,ifV=R

H=180+(B-R)*60/S,ifV=G

H=240+(R-G)*60/S,ifV=B

ifH<0,H=H+360

使用上面从0~360°变化的公式计算色调(hue)值。

4.RGBYIQ

RGB与YIQ之间的对应关系如下:

5.RGBYUV

YUV色彩系统被欧洲的电视系统所采用,其中Y和上面的YIQ色彩系统中的Y相同,都是指亮度。U和V虽然也是指色调,但是和I与Q的表达方式不完全相同。RGB与YUV之间的对应关系如下:

6.RGB4YCbCr

YCbCr色彩系统也是一种常见的色彩系统,JPEG采用的色彩系统正是该系统,它是从YUV色彩系统衍生出来的。其中Y还是指亮度,而Cb和Cr则是将U和V作少量调整而得到的。RGB色彩系统和YCbCr色彩系统之间的对应关系如下: 2.2数字图像处理中的基本运算

2.2.1点运算

所谓点运算,是指像素值(像素点的灰度值)通过运算之后,可以改善图像的显示效果,是逐点运算。

1.线性点运算

在点运算中,输出图像在像素点(m,n)的灰度值g(m,n)仅取决于输入图像在像素点(m,n)的灰度值f(m,n),与像素点(m,n)的邻近点无关。我们通常写成s=T(r),其中s是输出像素点值,r是输出像素点值。T可以是任一从[0,1]到[0,1]映射的递增函数。设原图像f(x,y)的灰度范围为[a,b],输出图像g(x,y)的灰度范围为[c,d],则线性点运算公式为

图2-10为对比度增强函数示意图。图2-10对比度增强函数示意图

点运算是灰度到灰度的映射过程,显然点运算不会改变图像内像素点之间的空间位置关系。点运算与相邻的像素之间没有运算关系,是一种简单但却十分有效的图像处理方法。点运算又称为“对比度增强”、“对比度拉伸”、“灰度变换”。图2-11所示为对比度增强实验结果。

一般情况下,灰度倒置——负像的计算公式为s=L-1-r。图2-11对比度增强实验结果

2.非线性点运算

非线性点运算,是指输出灰度级与输入灰度级呈非线性关系的点运算。其目的是增强原图各部分的反差,即增强原图像某两个灰度值间的动态范围,突出感兴趣的灰度区间,相对抑制不感兴趣的灰度区域。非线性变换往往以牺牲某些灰度范围的图像信息(灰度压缩),来换取其他灰度范围的图像信息的改善(灰度拉伸)。

1)对数变换

对数变换使低灰度区扩展,高灰度区压缩,并使窄带低灰度度输入图像映射为宽带输出值。对数变换可以用于扩展被压缩的高值图像中的暗像素,也可以用来减小动态范围。设原图像为f(x,y),输出图像为g(x,y),a、b、c是按需要可以调整的参数。

则对数变换计算公式为

一般情况下,我们取s=clog(1+r),c是常数,且r≥0,如图2-12所示。图2-12对数变换(低灰度区扩展,高灰度区压缩)图2-13为原图像与对数变换后的图像。图2-13原图像与对数变换后的图像

2)指数变换

幂次曲线中的指数部分值把输入窄带暗值映射到宽带输出值。相反,输入高值时也成立,可以实现高灰度区扩展,低灰度区压缩。设原图像为f(x,y),输出图像为g(x,y),a、b、c是按需要可以调整的参数,则指数变换计算公式为

g(x,y)=bc[f(x,y)-a]-1

一般情况下,取s=crg或s=c(r+e)g,c和g

是正数,有时也称做g校正,如图2-14所示。

图2-15给出了原图像与指数变换后的图像。图2-14指数变换(高灰度区扩展,低灰度区压缩)图2-15原图像与指数变换后的图像

3.点运算的应用

(1)对比度增强。在一些数字图像中,技术人员所关注的特征可能仅占据整个灰度级非常小的一个范围。点运算可以扩展所关注部分的灰度信息的对比度,使之占据可显示灰度级的更大部分。

(2)光度学标定。点运算可消除图像传感器的非线性影响。

(3)显示标定。有些显示设备不能保持数字图像上像素的灰度值和显示屏幕上相应点的亮度之间的线性关系。这一缺点可以通过点运算予以克服,即在图像显示之前,先设计合理的点运算关系,可将点运算和显示非线性组合起来互相抵消,以保持在显示图像时的线性关系。2.2.2代数运算

代数运算是指两幅输入图像之间进行点对点的加、减、乘、除运算得到输出图像的过程。

1.加法运算

记输入图像为f1(x,y)和f2(x,y),输出图像为g(x,y),则两幅图像的加法运算公式为

g(x,y)=f1(x,y)+f2(x,y)

加法运算可以对同一场景的多幅图像求平均值,降低加性噪声,还可以达到二次曝光(Double-exposure)的效果,如图2-16所示。图2-16加法运算后生成图像叠加效果

2.减法运算

图像相减即在两幅图像之间对应像素作减法运算。它可以消除背景影响,进行运动检测,求图像梯度函数。其计算公式为

g(x,y)=f1(x,y)-f2(x,y)

图像的减法运算效果如图2-17所示。图2-17减法运算效果

3.乘法运算

图像相乘即在两幅图像之间对应像素作乘法运算。它主要用于掩膜图像(MaskingImage)和图像的局部显示。其计算公式为

g(x,y)=f1(x,y)×f2(x,y)

图像的乘法运算效果如图2-18所示。

4.除法运算

图像相除即在两幅图像之间对应像素作除法运算。其计算公式为

g(x,y)=f1(x,y)÷f2(x,y)

图像除法可产生对颜色和多光谱图像分析十分重要的比率图像。图2-18图像的乘法运算效果2.2.3几何运算

1.齐次坐标的定义

2×2变换矩阵T不能实现图像的平移以及绕任意点的比例缩放、反射、错切和旋转等变换。为了兼容图像的平移,能够用统一的矩阵变换形式表示这些图像几何变换,需要引入齐次坐标。原坐标为(x,y),定义齐次坐标为(wx,wy,w),实质是通过增加一个坐标量来解决问题。

如图2-19所示,设(x0,y0)为图像的原始坐标,(x1,y1)为变换后的图像坐标,则新位置A1(x1,y1)的坐标可表示为如下形式图2-19平移坐标示意图根据矩阵相乘的规律,在坐标列矩阵[x

y]T中引入第三个元素,扩展为3×1的列矩阵[x

y

1]T,就可以实现点的平移变换。变换形式如下:

为运算方便,将2×3阶变换矩阵T进一步扩充为3×3方阵,即采用如下变换矩阵平移变换可以用如下形式表示:

这种以n+1维向量表示n维向量的方法称为齐次坐标表示法。齐次坐标的几何意义相当于点(x,y)投影在xyz三维立体空间的z=1的平面上。

2.图像的仿射变换

图像仿射变换是采用通用的数学影射变换公式来表示几何变换。除了图像的平移,其他的变换均为线性变换,比较容易处理。有了齐次坐标,可定义仿射变换如下

x′=ax+by+Δx

y′=cx+dy+Δy

用矩阵形式表示为

典型的图像仿射变换通常包括图像的平移、图像的镜像变换、图像的转置、图像的缩放和图像的旋转等。

1)图像的平移

图像平移就是将图像中所有的点都按照指定的平移量进行水平、垂直移动。设(x0,y0)为原图像上的一点,图像水平平移量为tx,垂直平移量为ty,则平移后的点(x0,y0)坐标将变为(x1,y1)。(x0,y0)和(x1,y1)的关系用矩阵表示如下:

平移后,图像上的每一点都可以在原图像中找到对应的点,如图2-20所示。图2-20图像的平移

2)图像的镜像变换

图像的水平镜像操作是将图像的左半部分和右半部分以图像垂直中轴线为中心镜像进行对换;图像的垂直镜像操作是,将图像上半部分和下半部分以图像水平中轴线为中心镜像进行对换。设图像高度为H,宽度为W,原图中的(x0,y0)

经过水平镜像后坐标将变为(W-x0,y0),其矩阵表达式为

同样,(x0,y0)经过垂直镜像后坐标将变为(x0,H-y0),其矩阵表达式为

3)图像的转置

图像的转置操作是将图像像素的x坐标和y坐标互换。该操作将图像的高度和宽度互换。转置的变换矩阵如下:

4)图像的缩放

假设图像x轴方向的缩放比率为fx,y轴方向的缩放比率为fy,那么原图中的点(x0,y0)对应于新图中的点(x1,y1)的转换矩阵为

例如,当fx=fy=0.5时,图像被缩放到一半大小,如图2-21所示。

图像的缩放操作会改变图像的大小,产生的图像中的像素可能在原图中找不到相应的像素点,这样就必须进行近似处理。一般的方法是直接赋值为和它最相近的像素值,也可以通过一些插值算法来计算。图2-21图像的缩放

5)图像的旋转

一般图像的旋转是以图像的中心为原点,旋转一定的角度。旋转后,图像的大小一般会改变,如图2-22所示。点(x0,y0)经过旋转θ后坐标变成(x1,y1)。

在旋转前:

旋转后:写成矩阵表达式为

其逆运算为

3.畸变图像的几何校正

实际图像处理系统中,由于成像系统本身造成的图像失真,我们把这类图像退化称做几何畸变。它主要是由于图像中的像素点发生位移而产生的,其典型表现为图像中的物体扭曲、远近比例不协调等。一般通过几何畸变校正来解决。

图像几何校正的基本方法是:首先建立几何校正的数学模型;其次,利用已知条件确定模型参数;最后,根据模型对图像进行几何校正。这个过程通常分两步:

(1)像空间坐标变换。首先通过已知的正确像素点和畸变点间的对应关系,拟合出多项式系数,然后根据映射关系对图像各个像素坐标进行校正。

(2)确定各像素的灰度值(灰度内插)。设f(x,y)是原始图像,g(x′,y′)是畸变图像,如图2-23所示。两者的坐标之间存在着一个非线性变换Ta,设两幅图像几何畸变的关系能用解析式x′=h1(x,y),y′=h2(x,y)来描述。通常h1(x,y)和h2(x,y)可用多项式来近似

式中:aij、bij是待定系数,n为多项式次数。图2-23图像畸变当n=1时,畸变关系为线性变换,畸变关系式为

上述式子中包含a00、a10、a01

b00、b10、b016个未知数,至少需要3个已知点来建立方程式,求解未知数。

当n=2时,畸变关系式为

上述式子中包含12个未知数,至少需要6个已知点来建立关系式,求解未知数。若已知点坐标,则可利用几何校正直接法求解未知参数:

然后从畸变图像出发,根据上述关系依次计算每个像素的校正坐标,同时把像素灰度值赋予对应像素,这样生成一幅校正图像,如图2-24所示。通常校正后的图像像素分布是不规则的,会出现像素挤压、疏密不均等现象,不能满足要求。最后对不规则图像通过灰度内插生成规则的栅格图像。图2-24图像校正 2.3数字图像处理中的模板运算

2.3.1基本原理

模板:矩阵方块,该矩阵与使用的图像区域大小相同,其行、列是奇数,是一个权矩阵。

模板卷积:可看做加权求和的过程,使用到的图像区域中的每个像素,分别与模板(权矩阵)的每个元素对应相乘,所有乘积之和作为区域中心像素的新值。

模板运算:可看做模板区域覆盖的图像,进行某种运算的过程(最大值、最小值、逻辑运算等),也包括模板卷积。图2-25为模板卷积过程示意图,模板卷积步骤如下:

(1)将模板在图中漫游,并将模板中心与图中某个像素位置重合;

(2)将模板上的各个系数与模板下各对应的像素的灰度值相乘;

(3)将所有乘积相加(为保持灰度范围,常将结果再除以模板的系数个数);

(4)将上述运算结果赋值给图中对应的模板中心位置的像素。图2-25模板卷积过程示意图卷积示例:3×3的像素区域R与模板G的卷积运算

中心像素R5为卷积结果:

R5=R1G1+R2G2+R3G3+R4G4+R5G5+R6G6+R7G7+R8G8+R9G9

当处理图像边界像素时,卷积核的中心与边界像素点对应。此时,可以忽略边界像素,即处理后的图像将丢掉这些像素。或者保留原边界像素,即复制边界像素到处理后的图像。2.3.2常用模板

在图像处理中,我们通常使用模板处理图像。

1.平滑模板

模板内系数和为1,表示对一幅常数图像处理后,图像能量无变化。任意图像处理后,平均亮度不变,但图像会变模糊。如图2-26所示。图2-26平滑模板

2.Laplacian模板

拉普拉斯边缘检测模板的基本要求是,作用于中心像素的系数是一个负数,而且其周围像素的系数为正数,系数之和必为0。

3.锐化模板

锐化模板内系数有正有负,表示差分运算,模板内系数之和为1。锐化图像的实质是g(m,n)=原图像f(m,n)+加重的边缘(α*微分)。2.3.3数学形态学

数学形态学是一种用于数字图像处理和识别的新理论,是利用结构元素与二值图像进行逻辑运算,产生新图像的图像处理方法。其中二值图像B是定义在笛卡尔网格上的集合,网格中值为1的点是集合的元素。结构元素S是集合概念上的二值图像。为简单起见,结构元素为3×3,且全都为1,如图2-27所示。当结构元素的原点(为中心点)移到点(x,y)时,记为Sxy。图2-27结构元素与图像其应用特点如下:

·

利用形态学基本运算,对图像进行处理,从而达到改善图像质量的目的。

·

描述和定义图像的各种几何参数和特征,如面积、周长、连通度、颗粒度、骨架等。

·

大部分形态运算都定义在两个基本运算,即腐蚀和膨胀的基础上,如图2-28所示。常用的形态运算(变换)有开和闭、击中和不击中变换、细化和粗化、边界和骨架等。图2-28腐蚀与膨胀

1.腐蚀

定义:E

B×S={x,y|Sxy

B},腐蚀运算的结果会使二值图像减小一圈。

其算法如下:首先用3×3的结构元素,扫描图像的每一个像素。然后用结构元素与其覆盖的二值图像进行“与”操作。如果都为1,则结果图像中该像素为1,否则为0。

2.膨胀

定义:E=B

S={x,y|Sxy∩B≠Ф},膨胀运算的结果会使二值图像扩大一圈。

其算法如下:首先用3×3的结构元素,扫描图像的每一个像素,然后用结构元素与其覆盖的二值图像进行“与”操作。如果都为0,则结果图像中该像素为0,否则为1。

3.开运算

先腐蚀,再膨胀。定义:B·S=(B

S)

S。其运算结果是消除细小对象,并在细小粘连处分离对象。在不改变形状和不明显改变面积的前提下,平滑对象的边缘。

4.闭运算

先膨胀、再腐蚀。定义:B·S=(B

S)

S。其运算结果是填充对象内的细小空洞,并连接邻近对象。在不改变形状和不明显改变面积前提下,平滑对象的边缘。

5.细化

对给定的细长图形使线幅变细,从而提取线宽为1的中心线的操作叫细化(thinning)。细化是一种特殊的多次迭代的收缩算法,其运算结果是在不破坏连通性的前提下,细化图像。算法首先做腐蚀操作,但不立刻删除像素,只打标记。然后将不破坏连通性的标记点删掉。重复执行,将产生

细化结果。

6.粗化

粗化(thickening)算法在不合并对象的前提下,粗化图像。算法首先做膨胀操作,但不立刻添加像素,只打标记。然后将不产生对象合并的标记点添加进来。重复执行,将产生粗化结果。另一方案是,将图像求反,执行细化,结果再求反。 2.4数字图像处理中的频域变换

2.4.1离散傅里叶变换

1.傅里叶变换的概念

傅里叶变换是将满足一定条件的某个函数,表示成三角函数(正弦和/或余弦函数)或者它们的积分的线性组合,是线性系统分析的一个有力工具。利用频域中特有的性质,可以使图像处理过程更加简单、有效。

离散傅里叶变换(DiscreteFourierTransform,DFT),是连续傅里叶变换在时域和频域上都离散的形式,将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。在形式上,变换两端(时域和频域上)的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的信号作DFT,也应当将其看做经过周期延拓再作变换。

二维离散傅里叶变换对定义为

式中:x、y为时域变量;u、v为频域变量;系数1/(MN)可以在正变换或逆变换中,只要两式系数的乘积等于1/(MN)即可。

2.傅里叶变换的性质

1)可分性

二维离散傅里叶变换具有可分离性,即它可由两次一维离散傅里叶变换计算得到,如图2-29所示。

图2-29二维傅里叶变换分离成两个一维变换

2)平移性

图像原点平移到(x0,y0)时,对应的频谱F(u,v)乘上一个负的指数项:

即空域中f(x,y)产生移动时,在频域中只发生相移,而傅里叶变换的幅值不变,如图2-30所示。图2-30时域平移图像的傅里叶频谱在数字图像处理中,我们常常将F(u,v)的原点移到N×N频域方阵的中心,以便能清楚地分析傅里叶变换谱的情况,只需令u0=v0=N/2,因子为

故得到

即如果将图像频谱的原点从起点(0,0)移到图像中心点(N/2,N/2),只要f(x,y)乘上(-1)(x+y)因子后,再进行傅里叶变换即可。

3)旋转不变性

引入极坐标

则f(x,y)和F(u,v)分别变为f(r,θ)和F(ω

,φ),在极坐标系中,存在以下变换对,

该式表明,如果空间域函数f(x,y)旋转θ0角度后,相应的傅里叶变换F(u,v)在频域中也旋转同一θ0角。反之,F(u,v)在频域中旋转θ0角,其反变换f(x,y)在空间域中也旋转θ0角。如图2-31所示。图2-31时域旋转图像的傅里叶频谱

4)平均值性质

若求f(x,y)的平均值,只需算出相应的傅里叶变换F(u,v)在原点的值F(0,0)。定义二维离散函数的平均值为

将u=v=0代入二维离散傅里叶公式,可得

比较上面两式,可看出

5)卷积定理

卷积定理指出,傅里叶变换可以化复杂的卷积运算为简单的乘积运算,从而提供了计算卷积的一种简单手段。

对于两个二维连续函数f(x,y)和g(x,y),其卷积定义为

其二维卷积定理可由下面关系式表示

6)相关定理

对于二维连续函数f(x,y)和g(x,y)的相关定义为

相关定理可表示为

卷积定理和相关定理都是研究两个函数的傅里叶变换之间的关系,这种关系构成了空间域和频域之间的基本关系。

3.图像傅里叶变换的物理意义

图像通过在连续空间上的采样得到一系列点的集合,用一个二维矩阵表示空间上各点。图像上某一点与邻域点差异的强弱,即梯度的大小,也即该点的频率的大小。图像的频率是表征图像中灰度变化剧烈程度的指标。例如,大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对于地表属性变换剧烈的边缘区域,在图像中是一片灰度变化剧烈的区域,对应的频率值较高。

观察傅里叶变换后的频谱图,可以看出图像的能量分布。如果频谱图中亮的点数多,那么实际图像一定是尖锐的,其边界分明且边界两边像素差异较大。当频谱移频到原点以后,可以看出,图像的频率分布是以原点为圆心,对称分布的。将频谱中心化,除可以清晰地看出图像频率分布以外,还可以分离出有周期性规律的干扰信号。如图2-32所示为原始图像与频谱中心化频谱。

图像经过二维傅里叶变换后,其变换系数矩阵表明:若变换矩阵Fn的原点设在中心,其频谱能量集中分布在变换系数矩阵的中心附近。若所用的二维傅里叶变换矩阵Fn的原点设在左上角,那么图像信号能量将集中在系数矩阵的四个角上。这是由二维傅里叶变换本身性质决定的。同时也表明,图像能量集中在低频区域。变换之后的图像,在原点平移之前,四角是低频,最亮;在平移之后,中间部分是低频,最亮,亮度大说明低频的能量大。图2-32原始图像与频谱中心化频谱2.4.2离散余弦变换

离散余弦变换(DiscreteCosineTransform,DCT)是码率压缩时需要经常使用的一种变换编码方法。任何连续的实对称函数的傅里叶变换中只含余弦项,因此余弦变换与傅里叶变换一样有明确的物理意义。离散余弦变换的变换核为余弦函数,被认为是一种语音、图像信号的准最佳变换。

1.二维离散余弦变换

二维DCT定义如下:设f(x,y)为M×N的数字图像矩阵,则式中:x,u=0,1,2,…,M-1;y,v=0,1,2,…,N-1;原图像为

DCT变换后为

DCT矩阵的左上角代表低频分量,右下角代表高频分量,由DCT域图像我们能够了解图像主要包含低频成分。图2-33所示为离散余弦变换图。图2-33离散余弦变换

2.DCT与DFT的关系

从定义出发,推导离散傅里叶变换和离散余弦变换的关系:

如果把时域数据向量作系列延拓,即

则fe(x)的离散余弦变换可写成

离散余弦变换是实值变换,计算复杂性适中,具有可分离特性,还有快速算法,变换后有很少的非零元素,在JPEG、MPEG-1、MPEG-2及H.261等压缩编码国际标准中都采用了离散余弦变换编码算法。其变换核是实数的余弦函数,因而DCT的计算速度比DFT快得多。2.4.3离散沃尔什-哈达玛变换

由于傅里叶变换和余弦变换的变换核由正弦、余弦函数组成,运算速度受影响,所以我们在特定问题中往往引进不同的变换方法,要求运算简单且变换核矩阵产生方便。WalshTransform中的变换矩阵简单(只有1和-1),占用存储空间少,产生容易,有快速算法,在大量数据需要实时处理的图像处理问题中,得到广泛应用。

沃尔什函数是1923年由美国数学家沃尔什提出的。它是一个完备的正交函数系,其值只能取+1和-1,从排列次序上可将沃尔什函数分为三种定义方法。在此只介绍哈达玛排列定义的沃尔什变换。

一维离散沃尔什变换及逆变换定义为

若将Walsh(u,x)用哈达玛矩阵表示,将表达式写成矩阵形式,则上两式为由哈达玛矩阵的特点可知,沃尔什-哈达玛变换的本质是将离散序列f(x)的各项值的符号按一定规律改变后,进行加减运算,它比采用复数运算的DFT和采用余弦运算的DCT要简单得多。HN为N阶哈达玛矩阵,2n阶哈达玛矩阵有如下形式:二维WHT的正变换核和逆变换分别为

设 ,M=N=4,其二维WHT变换核为

所以,二维离散沃尔什变换的矩阵表达式为

由上式可以看出,二维WHT具有能量集中的特性,而且原始数据中数字越均匀分布,经变换后的数据越集中于矩阵的边角上。因此,二维WHT可用于压缩图像信息。2.4.4小波变换

1.小波变换理论

连续小波变换也称为积分小波变换,设函数f(x,y)为有限能量,即f(t)∈L2(R),则连续小波变换的定义为

式中:t、a、b都是连续变量。尺度因子a是一个频率参数:低频对应于信号的全局信息,尺度因子a的值大;高频对应于信号的细节信息,尺度因子a的值小。平移因子b是一个时

间参数,参数b和a在时-频平面给出了一个可变的时间-频率窗。由于信号的频率与周期成反比,所以对于高频信息,时间间隔变小,可以给出较好的精度;对于低频信息,时间

间隔变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论