




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章数字图像处理的基本概念
2.1人眼的视觉原理
2.2连续图像的描述
2.3图像数字化
2.4图像灰度直方图
2.5数字图像处理算法的形式
2.6图像的数据结构与图像文件格式第2章数字图像处理的基本概念2.7图像的特征与噪声
2.8上机实验习题
本章主要介绍图像信息的基本知识和专业术语、图像与视觉之间的关系等,以便于从感性和直观的角度来了解图像。
由于计算机图像处理的目的之一是帮助人更好地观察和理解图像中的信息,也就是说,最终要通过人眼来判断所处理的结果,因此有必要首先研究人类视觉系统的特点。2.1人眼的视觉原理2.1.1人眼的构造
人眼的主要构造如图2.1.1所示。视觉信号从眼睛的视网膜传入大脑需要通过大约150万个视觉神经的神经元。
人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围着,如图2.1.1所示。
最外层是坚硬的蛋白质膜,其中,位于前方的大约1/6部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。其余5/6为白色不透明组织,称为巩膜,它的作用是巩固和保护整个眼球。
图2.1.1人眼的结构示意图
中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织(睫状肌)来调节(直径大多为2~8mm),以控制进入眼睛内部的光通量大小,其作用和照相机的光圈一样。随着种族的不同,虹膜也具有不同的颜色,如黑色、蓝色、褐色等。最内一层为视网膜,它的表面分布有大量光敏细胞。这些光敏细胞按照形状可以分为锥状细胞和杆状细胞两类。锥状细胞集中分布在视轴和视网膜相交点附近的黄斑区内。每个锥状细胞都连接一个神经末梢,因此,黄斑区对光有较高的分辨力,能充分识别图像的细节。锥状细胞既可以分辨光的强弱,也可以辨别色彩,白天的视觉过程主要靠锥体细胞来完成,所以锥状视觉又称白昼视觉。杆状细胞数目更多,然而,由于它广泛分布在整个视网膜表面上,并且有若干个杆状细胞同时连接在一根神经上,因此,这条神经只能感受多个杆状细胞的平均光刺激,使得在这些区域的视觉分辨力显著下降,所以无法辨别图像中的细微差别,而只能感知视野中景物的总的形象。杆状细胞不能感觉彩色,但它对低照明度的景物往往比较敏感,所以夜晚所观察到的景物只有黑白、浓淡之分,而看不清它们的颜色差别。由于夜晚的视觉过程主要由杆状细胞完成,所以杆状视觉又称夜视觉。
除了三层薄膜以外,在瞳孔后面还有一个扁球形的透明体,称为晶体(或称水晶体)。它由许多同心的纤维细胞层组成,由叫做睫状小带的肌肉支撑着。晶体如同一个可变焦距的透镜,它的曲率可以由睫状肌的收缩进行调节,而睫状肌根据锥状细胞感受到景物的聚焦情况改变其张力,从而使景像始终能聚焦于黄斑区。
角膜和晶体包围的空间称为前室,前室内是对可见光透明的水状液体,它能吸收一部分紫外线。晶体后面是后室,后室内充满的胶质透明体称为玻璃体,它起着保护眼睛的滤光作用。2.1.2图像的形成
人眼在观察景物时,光线通过角膜、前室水状液、水晶体、后室玻璃体,成像在视网膜的黄斑区周围。视网膜上的光敏细胞感受到强弱不同的光刺激,产生强度不同的电脉冲,并经神经纤维传送到视神经小枢,由于不同位置的光敏细胞产生了和该处光的强弱成比例的电脉冲,所以,大脑中阈纬闪艘环拔锏母芯。2.1.3视觉范围和分辨力
视觉范围是指人眼所能感觉到的亮度范围。这一范围非常宽,从百分之几坎每平方米到几百万坎每平方米(坎[德拉],发光强度的单位,符号为cd)。但是,人眼并不能同时感受这样宽的亮度范围。事实上,在人眼适应了某一个平均的亮度环境以后,它所能感受的亮度范围要小很多。当平均亮度适中时,能分辨的亮度上、下限之比为1000∶1;而当平均亮度较低时,该比值只有10∶1。即使是客观上相同的亮度,当平均亮度不同时,主观感觉的亮度也不相同。人眼的明暗感觉是相对的,但由于人眼能适应的平均亮度范围很宽,所以总的视觉范围很宽。
人眼的分辨力是指人眼在一定距离上能区分开相邻两点的能力,如图2.1.2所示,可以用能区分开的最小视角q的倒数来描述,
(2.1.1)
式中,d表示能区分的两点间的最小距离,l为眼睛和这两点连线的垂直距离。人眼的分辨力和环境照度有关。当照度太低时,只有杆状细胞起作用,则分辨力下降;但照度太高也无助于分辨力的提高,因为可能引起“眩目”现象。
人眼分辨力还和被观察对象的相对对比度相关。当相对对比度小时,对象和背景亮度很接近,因此分辨力下降。图2.1.2人眼分辨力的计算2.1.4视觉适应性和对比灵敏度
当我们从明亮的阳光下走入正在放映电影的影院时,会感到一片漆黑,但过一会儿后,视觉便会逐渐恢复。人眼这种适应暗环境的能力称为暗适应性,通常这个适应过程约需30s。人眼之所以有暗适应性,一方面是由于瞳孔放大的缘故,更重要的是因为完成视觉过程的视敏细胞发生了变换,由杆状细胞代替锥状细胞工作。由于前者的视敏度约为后者的10000倍,所以,对于微弱的光刺激又恢复了感觉。
和暗适应性相比,亮适应性过程要快得多,通常只需几秒钟。例如,当在黑暗中突然打开电灯时,人的视觉几乎马上就可以恢复。这是因为锥状细胞恢复工作所需的时间要比杆状细胞少得多。
为了针对图像的总体来描述亮度的差异,引入对比度和相对对比度的概念。图像对比度是图像中最大亮度Bmax与最小亮度Bmin之比,即
(2.1.2)
它表示图像最大亮度对最小亮度的倍数。
相对对比度是图像中最大亮度Bmax与最小亮度Bmin之差与Bmin之比,即
(2.1.3)2.1.5亮度感觉
人眼对亮度差别的感觉取决于相对亮度的变化,于是,亮度感觉的变化DS可用相对亮度来描述,即
(2.1.4)
经积分后得到的亮度感觉为
S=K'lnB+K0 (2.1.5)
式中,K'为常数。该式表明亮度感觉与亮度B的自然对数成线性关系。
图2.1.3表示主观亮度感觉与亮度的关系曲线,实线表示人眼能感觉的亮度范围,为10-4~106cd/m2。但当眼睛已适应某一平均亮度时,其可感觉的亮度范围很窄,如图2.1.3中虚线所示。
图2.1.3人眼的主观亮度感觉与亮度的关系由此可见,人眼在适应某一平均亮度时,黑、白感觉对应的亮度范围较小,随着平均亮度的降低,黑白感觉的亮度范围变窄。黑、白亮度感觉的相对性为图像传输与重现带来了方便,这体现在以下两个方面:
(1)重现图像的亮度不必等于实际图像的亮度,只要保持两者的对比度不变,就能给人以真实的感觉;
(2)人眼不能感觉出来的亮度差别在重现图像时不必精确地复制出来。2.1.6人眼的色觉
正常人的眼睛不仅能够感受光线的强弱,而且还能辨别不同的颜色。通过理论研究和实验结果,人们现在对颜色的物理本质已有了相当的掌握和理解。颜色的本质是牛顿最早系统研究并发现的。早在17世纪,牛顿通过用三棱镜研究对白光的折射就已发现白光可被分解成一系列从紫到红的连续光谱,从而证明白光是由不同颜色(而且这些颜色并不能再进一步被分解)的光线混合而成的。这些不同的颜色的光线实际上是不同频率的电磁波。人的脑和眼将不同频率的电磁波感知为不同的颜色。
人辨别颜色的能力叫色觉,它是指视网膜对不同波长光的感受特性,即在一般自然光线下分辨各种不同颜色的能力。这主要是黄斑区中的锥体感光细胞的功劳,它非常灵敏,只要可见光波长相差3~5nm,人眼即可分辨。
颜色和彩色严格来说并不等同。颜色可分为无彩色和有彩色两大类。无彩色是指白色、黑色和各种深浅程度不同的灰色。以白色为一端,通过一系列从浅到深排列的各种灰色,到达另一端的黑色,这些可以组成一个黑白系列。彩色则指除去上述黑白系列以外的各种颜色。我们通常所说的颜色一般指彩色。
区分颜色常用3种基本特性量:色调(色别)、辉度(亮度)和饱和度(色彩度)。色调是与混合光谱中主要光波长相联系的。辉度与物体的反射率成正比,如果无彩色,辉度就只有1个维量的变化。对彩色光来说,颜色中掺入白色越多就越明亮,掺入黑色越多辉度就越小。饱和度与一定色调的纯度有关,纯光谱色是完全饱和的。随着白光的加入,饱和度逐渐减少。
色调和饱和度合起来称为色度。颜色可用亮度和色度共同表示。设组成某种颜色C所需的3个刺激量分别用X、Y、Z表示,而每种刺激量的比例系数为x、y、z,则有
C=xX+yY+zZ
比例系数x、y、z也称为色系数:
(2.1.6)
(2.1.7)
(2.1.8)
由这些式子可以看出:
x+y+z=1 (2.1.9)
1931年CIE制定了一个色度图(见图2.1.4,图中波长单位是nm),用组成某种颜色的三原色的比例来规定这种颜色。图中横轴对应红色色系数,纵轴对应绿色色系数,蓝色色系数可由z=1-(x+y)求得。图中各点给出光谱中各颜色的色度坐标,蓝紫色在图的左下部,绿色在图的左上部,红色在图的右下部。连接400nm和700nm的直线是光谱上所没有的由紫到红的系列。通过对该图的观察分析可知:
(1)在色度图中每点都对应一种可见的颜色,任何可见的颜色都在色度图中占据确定的位置。在以(0,0),(0,1),(1,0)为顶点的三角形内且色度图外的点对应不可见的颜色。
(2)在色度图中边界上的点代表纯颜色,移向中心代表混合的白光增加而纯度减少。到中心点C处,各种光谱能量相等而显为白色,此处纯度为0。某种颜色的纯度一般称为该颜色的饱和度。
(3)在色度图中连接任2端点的直线上的各点表示将这2端点所代表的颜色相加可组成的一种颜色。根据这个方法,如果要确定由3个给定颜色所组合成的颜色范围,只需将这3种颜色对应的3个点连成三角形,见图2.1.4。在该三角形中的任意颜色都可由这3种颜色组成,而在该三角形外的颜色则不能由这3色组成。由于给定3个固定颜色而得到的三角形并不能包含色度图中所有的颜色,所以只用(单波长)三基色并不能组合得到所有颜色。
图2.1.4色度图图2.1.4所示为色度图中一些点的颜色。中心的C点对应白色,由三原色各1/3组合产生。图2.1.4中P点的色度坐标x=0.48,y=0.40。由C通过P画一条直线至边界上的Q点(约590nm),P点颜色的主波长即为590nm,此处光谱的颜色即为Q点的色调(橙色)。图2.1.4中P点位于从C到纯橙色点的66%的地方,所以它的色纯度(饱和度)是66%。
正常人色觉光谱的范围为400nm(紫色)~760nm(红色),其间大约可以区别出16个色调。红、绿、蓝三种光以不同比例混合,就可形成不同的颜色,从而产生各种色觉。
色觉正常的人在明亮条件下能看到可见光谱的各种颜色,它们从长波一端向短波一端的顺序是:红色、橙色、黄色、绿色、蓝色、紫色。此外,人眼还能在上述任两个相邻颜色范围的过渡区域看到各种中间颜色。
物体的颜色是人的视觉器官受光后在大脑的一种反映。物体的颜色取决于物体对各种波长光线的吸收、反射和透射能力。因此,物体分消色物体和有色物体。
1)消色物体的色
消色物体指黑、白、灰色物体,它对照明光线具有非选择性吸收的特性,即光线照射到消色物体上时,被吸收的各种波长的入射光是等量的;被反射或透射的光线,其光谱成分也与入射光的光谱成分相同。当白光照射到消色物体上时,反射率在75%以上,即呈白色;反射率在10%以下,即呈黑色;反射率介于两者之间,就呈深浅不同的灰色。
2)有色物体的色
有色物体对照明光线具有选择性吸收的特性,即光线照射到有色物体上时,入射光中各种波长的色光是不等量地被吸收的,有的被吸收得多,有的被吸收得少。白光照射到有色物体上,其反射或透射的光线与入射光线相比,不仅亮度有所减弱,光谱成分也改变了,因而呈现出各种不同的颜色。
3)光源的光谱成分对物体颜色的影响
当有色光照射到消色物体时,物体反射光颜色与入射光颜色相同。当两种以上有色光同时照射到消色物体上时,物体颜色呈加色法效应,如红光和绿光同时照射白色物体,该物体就呈黄色。加色法原理如图2.1.5(a)所示,它是利用原色(红、绿、蓝)相加获得彩色影像的方法。
当有色光照射到有色物体上时,物体的颜色呈减色法效应。如黄色物体在品红光照射下呈现红色,在青色光照射下呈现绿色,在蓝色光照射下呈现灰色或黑色。减色法原理如图2.1.5(b)所示,它是利用白光中减去补色(黄、品、青)以获取彩色影像的方法。
图2.1.5色混合原理2.1.7颜色模型
为了正确地使用颜色,需要建立颜色模型。上面提到,一种颜色可用3个基本量来描述,所以建立颜色模型就是建立一个3D坐标系统,其中每个空间点都代表某一种颜色。
目前常用的颜色模型可分为两类,一类面向诸如彩色显示器或打印机之类的硬件设备,另一类面向以彩色处理为目的的应用,如动画中的彩色图形。面向硬件设备的最常用彩色模型是RGB模型,而面向彩色处理的最常用模型是HSI模型,其中H表示色调(hue),S表示饱和度(saturation)
,I表示密度(intensity,对应成像亮度和图像灰度)。这两种颜色模型也是图像技术中最常见的模型。下面分别讨论。
1.RGB模型
RGB模型基于笛卡尔坐标系统,3个轴分别为R,G,B,见图2.1.6。我们感兴趣的部分是个正方体。原点对应黑色,离原点最近的顶点对应白色。在这个模型中,从黑到白的灰度值分布在原点到离原点最远顶点的连线上,而立方体内其余各点对应不同的颜色,可用从原点到该点的矢量表示。为方便起见,我们将立方体归一化为单位立方体,这样所有的R,G,B的值都在区间[0,1]中。
图2.1.6RGB模型
根据这个模型,每幅彩图包括3个独立的基色平面,或者说可分解到3个平面上。反过来,如果1幅图像可被表示为3个平面,则使用这个模型比较方便。例如在处理多频谱的卫星遥感图像时常用RGB模型。
2.HSI模型
HSI模型有两个特点,或者说基于两个重要的事实:其一,I分量与图像的彩色信息无关;其二,H和S分量与人感受颜色的方式是紧密相连的。这些特点使得HSI模型非常适合借助人的视觉系统来感知彩色特性的图像处理算法。顺便指出,还有一种与HSI模型概念上相近但定义不完全相同的HVC模型,其中H仍表示色度,V(value)对应亮度,而C(chroma)表示色品,它也是比较适合于借助人的视觉系统来感知彩色特性的图像处理算法。
前面讨论色度图时已经提到过,由三种颜色组合成的新颜色处在以这3种颜色为顶点的三角形中。HSI模型中颜色分量也可定义在如图2.1.7(a)所示的三角形中。对其中的任意1个色点P,其H的值对应指向给点的矢量与R轴的夹角。这个点的S值与指向该点的矢量长成正比,越长越饱和。在这个模型中,I的值是沿1根通过三角形中心并垂直于三角形平面的直线来测量的。从纸面出来越多越白,进入纸面越多越黑。
如果我们把3种颜色结合到3D颜色空间,则得到如图2.1.7(b)所示的双棱锥结构。该结构外表面上的点代表纯的饱和色。任一点的颜色的H均由三角形中点到该点的连线与R轴的夹角决定。该点的I可用与最下方黑点的距离来表示。该结构内部的点也可借助对图2.1.7(a)的解释,所不同的只是其S值随该点与纵轴距离的减少而减少。
在HSI模型中,也可通过向其中1个轴投影而得到一系列2D彩图。
图2.1.7HSI模型
3.从RGB转换到HSI
对任何3个在[0,1]范围内的R,G,B值,其对应HSI模型中的I,S,H分量可由下面的公式计算:
(2.1.10)
(2.1.11)
(2.1.12)
由式(2.1.12)直接算出的H值在[0°,180°]区间内,对应G≥B的情况。当G<B时,H的值应该大于180°
。此时可令H=360°-H,把H转到[180°,360°]区间内。若将两种情况都考虑上,则由式(2.3.7)算得的是H在[0°,360°]区间内。为把在[0°,360°]之间的H变换到[0,1]之间,可再令H'=H/360°,然后进行转换。当S=0时对应的是无色的中心点,这时H就没有意义了,此时定义H为0。当I=0时,S也就没有意义了。
4.从HSI转换到RGB
若设S,I的值在[0,1]之间,R,G,B的值也在[0,1]之间,则从HSI到RGB的转换公式如下(分成3段以利用对称性):
(1)当H在[0°,120°]之间时:
B=I(1-S) (2.1.13)
(2.1.14)
G=3I-(B+R) (2.1.15)
(2)当H在[120°,240°]之间时:
R=I(1-S) (2.1.16)
(2.1.17)
B=3I-(R+G) (2.1.18)
(3)当H在[240°,360°]之间时:
G=I(1-S) (2.1.19)
(2.1.20)
R=3I-(G+B) (2.1.21)
一幅“真”彩色RGB数字图像一般用24bit,即R,G,B3个分量各用8bit表示。这样用24bit可表示的颜色总数为16777216种。如果将其转换到其他色彩空间,也常保持总比特数不变。2.1.8马赫带
当亮度为阶跃变化时,图像中显示出竖条灰度梯级图像,如图2.1.8所示。已知从每一竖条宽度内反射出来的光强是均匀的,相邻竖条之间的强度差是常数,但看起来却发现每一竖条内左边要比右边稍亮一些,这种现象称为马赫带效应。
马赫带上的亮度过冲是眼睛对不同空间频率产生不同视觉响应的结果。视觉系统对空间高频和空间低频的敏感性较差,而对空间中频则有较高的敏感性,因而在亮度突变处产生亮度过冲现象,这种过冲对人眼所见的景物有增强其轮廓的作用。
图2.1.8马赫带效应
一幅图像可以被看做是空间上各点光强度的集合。它随图像空间坐标(x,y,z)、光线的波长l和时间t的变化而变化。其数学表达式为
g=f(x,y,z,l,t) (2.2.1)
对于二维平面图像而言,其表示为
g=f(x,y,l,t) (2.2.2)2.2连续图像的描述1.灰度图像
若只考虑光的能量而不考虑其波长,则图像在视觉上表现为灰色影像,称之为灰度图像或单色图像,其图像函数为
(2.2.3)
式中Vs(l)为相对视敏函数。
2.彩色图像
若考虑不同波长光的彩色效应,则图像在视觉上表现为彩色图像,其图像函数为
g={fr(x,y,t),fg(x,y,t),fb(x,y,t)}
(2.2.4)
式中,
Rs(l)、Gs(l)、Bs(l)分别为红、绿、蓝三原色的视敏函数。
3.静止图像
图像内容随时间变化的图像称为运动图像,而图像内容不随时间变化的图像则称为静止图像。静止图像是本书重点研究的对象,一般用f(x,y)表示。因为光是能量的一种形式,故f(x,y)大于零,即0<f(x,y)<∞。
在每天的视觉活动中,人眼看到的图像一般都是由物体反射的光组成的。f(x,y)可被看成由两个分量组成:一个分量是所见场景的入射光量,另一个分量是场景中物体反射光量的能力,即反射率。这两个分量被称为照射分量和反射分量,分别用i(x,y)和r(x,y)表示,则i(x,y)和r(x,y)之积形成f(x,y),即
f(x,y)=i(x,y)·r(x,y) (2.2.5)
式中,0<i(x,y)<∞,0<r(x,y)<1。
反射分量在极限0(全吸收)和1(全反射)之间。i(x,y)的性质由光源确定,而r(x,y)则由场景中物体的特性而定。
图像f(x,y)在(x,y)处的强度称为该点的灰度(l),l的范围为
Lmin≤l≤Lmax
(2.2.6)
在理论上,对Lmin的唯一要求是它必须为正,对Lmax的要求是它必须有限。[Lmin,Lmax]叫做灰度范围。通常把这一范围在数轴上平移到[0,L],其中L=Lmax-Lmin,l=0表示黑,l=L表示白,所有中间值都是由黑连续变为白时的灰度值。
图像数字化是将一幅画面转化成计算机能处理的形式(数字图像)的过程。具体来说,就是在成像过程中把一幅图画分割成如图2.3.1所示的一个个小区域(像元或像素),并将各小区域的灰度用整数来表示,这样便形成一幅数字图像。小区域的位置和灰度称为像素的属性。2.3图像数字化
图2.3.1图像数字化从计算机科学的角度来看,所谓数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。数字图像可以由以下三种途径得到:
(1)将传统的可见光图像经过数字化处理转换为数字图像,例如将一幅照片通过扫描仪输入到计算机中,扫描的过程实质上就是一个数字化的过程。
(2)应用各种光电转换设备直接得到数字图像,例如卫星上搭载的推帚式扫描仪和光机扫描仪可以直接获取地表甚至地下物体的图像并实时存入存储器中。此外,侧视雷达也可以直接获取数字图像。
(3)直接由二维离散数学函数生成数字图像。
数字图像处理是指对一个物体的数字表示,即对一个二维矩阵施加一系列操作,以得到所期望的结果。2.3.1采样
将空间上连续的图像变换成离散点的操作称为采样。采样间隔和采样孔径的大小是两个很重要的参数。
图像包含何种程度的细微的浓淡变化,取决于希望真实反映图像的程度。当进行实际的抽样时,怎样选择各抽样点的间隔是个非常重要的问题。关于这一点,严格地说,是一个根据抽样定理加以讨论的问题。如果把包含于一维信号g(s)中的频率限制在v以下,那么根据下式,用间距T=1/(2v)进行采样的抽样值g(iT)就能够完全恢复g(t):
(2.3.1)
式中,
在抽样时,若横向的像素数(列数)为M,纵向的像素数(行数)为N,则图像的总像素数为M×N。
采样孔径的形状和大小与采样方式有关。采样孔径通常有圆形、正方形、长方形和椭圆形四种,如图2.3.2所示。在实际使用时,由于受到光学系统特性的影响,采样孔径会在一定程度上产生畸变,使其边缘出现模糊,降低了输入图像信噪比。
采样方式是指采样间隔确定后,相邻像素间的位置关系。通常有有缝、无缝和重叠采样三种情况,如图2.3.3所示。
图2.3.2采样孔径图2.3.3采样方式2.3.2量化
经采样后图像被分割成空间上离散的像素,但其灰度是连续的,还不能用计算机进行处理。将像素灰度转换成离散的整数值的过程叫量化。一幅数字图像中不同灰度值的个数称为灰度级数,用G表示。若一幅数字图像的量化灰度级数G=256=28级,则像素灰度取值范围一般是0~255的整数,由于用8bit就能表示灰度图像像素的灰度值,因此常称8bit量化。
数字化前需要决定影像大小(行数M、列数N)和灰度级数G的取值。一般数字图像的灰度级数G为2的整数幂,即G=2g。一幅大小为M×N、灰度级数为G的图像所需的存储空间M×N×g(bit)称为图像的数据量。2.3.3采样、量化参数与数字化图像间的关系
数字化方式可分为均匀采样、量化和非均匀采样、量化。所谓“均匀”,指的是采样和量化为等间隔的。图像数字化一般采用均匀采样和均匀量化方式。采用非均匀采样与量化会使问题复杂化,因此很少采用。
一般来说,采样间隔越大,所得图像像素数越少,图像空间分辨率越低,质量越差,严重时会出现像素呈块状的国际棋盘效应;采样间隔越小,所得图像像素数越多,图像空间分辨率越高,质量越好,但数据量越大,如图2.3.4所示。图2.3.4(a)~(f)是采样间距时递增获得的图像,其中图2.3.4(a)为512×512,256级灰度的图像,其余各图的空间分辨率依次为256×256,128×128,64×64,32×32,16×16。
图2.3.4随像素数减少产生的数字图像效果量化等级越多,所得图像层次越丰富,灰度分辨率越高,质量越好,但数据量越大;而量化等级少,图像层次欠丰富,灰度分辨率低,质量变差,会出现假轮廓现象,但数据量较小,如图2.3.5所示。图2.3.5(a)~(f)是在采样间距相同时灰度级数从256逐次减少为64、16、8、2所得到的图像。在极少数情况下,当图像大小固定时,减少灰度级能改善质量,产生这种情况的最可能原因是减少灰度级一般会提高图像的对比度。例如对于细节比较丰富的复杂图像。
图2.3.5随量化级数减少产生的数字图像效果
在数字图像处理中,一个最简单的和有用的工具是灰度直方图,它概括了一幅图像的灰度级内容和图像可观的信息。
2.4.1直方图的定义与性质
1.直方图的定义
灰度直方图(histogram)是灰度级的函数,描述的是图像中具有该灰度级的像素的个数,其横坐标是灰度级,纵坐标是该灰度出现的频率(像素的个数)。2.4图像灰度直方图
图像的灰度统计直方图是1个一维的离散函数:
(2.4.1)
式中,fk为图像f(x,y)的第k级灰度值,nk是图像f(x,y)中具有灰度值fk的像素的个数,n是图像的像素总数。
2.直方图的计算
依据定义,若图像具有L(通常L=256,即8位灰度级)级灰度,则大小为M×N的灰度图像f(x,y)的灰度直方图hist[0,…,L-1]可用如下计算获得:
(1)初始化:
hist[k]=0k=0,…,L-1
(2)统计:
hist[f(x,y)]++x=0,…,M-1;y=0,…,N-1
(3)标准化:
图2.4.1所示为一架落在雪地里的飞机图像和它对应的灰度直方图实例。
图2.4.1图像及其灰度直方图
图2.4.2不同类型的直方图示例图2.4.2给出由相同场景获得不同图像所对应的直方图,图2.4.2(a)对应正常的图像;图2.4.2(b)对应动态范围偏小的图像;图2.4.2(c)对应动态范围比较大,但其直方图与图2.4.2(a)的直方图相比整体向左移动的图像,对应偏暗的图像;图2.4.2(d)对应动态范围比较大,但其直方图与图2.4.2(a)的直方图相比整体向右移动的图像,对应偏亮的图像。2.4.2直方图的性质
根据前面直方图的定义,可以得出其性质主要有以下几点:
(1)直方图是一幅图像各像素灰度值出现次数或频数的统计结果,它只反映该图像中不同灰度值出现的频率,而未反映某一灰度值像素所在的位置。也就是说,它只包含了该图像中某一灰度值的像素出现的概率,而丢失了其所在位置的信息。
(2)任一幅图像,都能唯一地算出一幅与它对应的直方图。但不同的图像可能有相同的直方图。也就是说,图像与直方图之间是一种多对一的映射关系。例如,图2.4.3(a)和图2.4.3(b)所示为两幅不同的图像,但它们对应的直方图却相同。
图2.4.3两幅具有相同直方图的不同图像
(3)由于直方图是对共有相同灰度值的像素统计计数得到的,因此,一幅图像各子区的直方图之和就等于该图全图的直方图。
例如一幅图像如图2.4.4(a)所示,它由两个不相交的区域构成,则整幅图像的直方图是这两个区域直方图之和,即
图像的直方图H(i)
=区域Ⅰ的直方图HⅠ(i)+区域Ⅱ的直方图HⅡ(i)
图2.4.4直方图的分解
(4)若一幅图像包含的灰度均匀一致,且背景与物体对比度很强,假设物体的边界为由灰度级D1定义的轮廓线,则 就等于物体的面积。
一幅500×546像素的图像如图2.4.5所示。直方图左侧峰值的灰度级为33,从灰度54级到255级的
约占图像总面积500×546=273000的60%。
图2.4.5背景与物体对比度很强的图像2.4.3直方图的应用
直方图常应用于以下几个方面。
1.检查数字化参数
直方图给出了一个简单可见的指示,用来判断一幅图像是否合理地利用了全部被允许的灰度级范围。如果图像具有超出数字化器所能处理的范围的亮度,则这些灰度级将被简单地置为0或255,由此将在直方图的一端或两端产生尖峰。对直方图的快速检查可以使数字化中产生的问题及早暴露出来,以便纠正。
2.选择边界阈值
假定一幅图像背景是浅色的,其中有一个深色的物体。物体中的深色像素产生了直方图上的左峰,而背景中大量的灰度级产生了直方图上的右峰。物体边界附近具有两个峰值之间灰度级的像素数目相对较少,从而产生了两峰之间的谷。选择谷作为灰度阈值将得到合理的物体的边界。
从某种意义上讲,用对应于两峰之间的最低点的灰度级作为阈值来确定边界是最适宜的。例如,想知道图2.4.6(a)所示蕨叶图像的面积占总画面面积的情况,就可以利用直方图计算获得。显然,如果阈值对应于直方图的谷,则阈值从T增加到T+DT,只会导致面积略微变化。因此可以把阈值的选择误差对面积测量的影响降到最低。当灰度级从115变化到144时,像素为1850,占图像总面积的1%。因此把阈值选取为130,此时树叶的面积约占总面积的28.87%。
图2.4.6图像直方图边界阈值的应用
3.计算综合光密度
综合光密度是图像质量一个很有用的度量,利用直方图可直接算出综合光密度值。若用IOD表示综合光密度,用D(x,y)表示图像的灰度分布,则综合光密度为
(2.4.2)
其中,a和b是所划定的图像区域的边界。
对于数字图像,有
(2.4.3)
其中,NL和NS分别是图像行和列的数目。令Nk代表灰度级为k时所对应的像素的个数,则上式可改写为
(2.4.4)
观察发现,Nk正好等于直方图中的H(k),因此有
(2.4.5)
即综合光密度是用广度级加权的直方图之和。
4.计算图像信息量H(熵)
假设一幅数字图像的灰度范围为[0,L-1],各灰度级像素出现的概率为P0,P1,P2,…,PL-1,根据信息论可知,各灰度级像素具有的信息量分别为-lbP0,-lbP1,-lbP2,…,-lbPL-1,则该幅图像的平均信息量(熵)为
(2.4.6)
熵反映了图像信息的丰富程度,它在图像编码处理中有重要意义。
2.5.1基本功能形式
按图像处理的输出形式,图像处理的基本功能可分为三种形式:
(1)单幅图像→单幅图像,如图2.5.1(a)所示;
(2)多幅图像→单幅图像,如图2.5.1(b)所示;
(3)单(或多)幅图像→数字或符号等,如图2.5.1(c)所示。2.5数字图像处理算法的形式
图2.5.1图像处理的基本功能2.5.2图像处理的几种具体算法
1.局部处理
对于任一像素(i,j),把其周围像素构成的集合{(i+p,j+q),p、q取适当的整数}叫做像素(i,j)的邻域,如图2.5.2(a)所示。常用的去心邻域如图2.5.2(b)和(c)所示,分别表示中心像素的4-邻域、8-邻域。
在对输入图像进行处理时,计算某一输出像素JP(i,j)值由输入图像像素IP(i,j)小邻域的像素值确定,这种处理称为局部处理。
图2.5.2像素的邻域
图像的移动平均平滑法和空间域锐化等属于局部处理。
在局部处理中,当输出值JP(i,j)仅与IP(i,j)像素灰度有关的处理称为点处理。图像对比度增强、图像二值化等属于点处理。
在局部处理中,输出像素JP(i,j)的值取决于输入图像较大范围或整幅图像像素的值,这种处理称为大局部处理。图像的傅立叶变换就属于大局部处理的例子。
2.迭代处理
反复对图像进行某种运算直至满足给定的条件,从而得到输出图像的处理形式称为迭代处理。如图像的细化处理常常就是一种迭代处理。
3.窗口处理和模板处理
对图像的处理,一般采用对整个画面进行处理,但也有只对画面中特定的部分进行处理的情况。这种处理方式包括窗口处理和模板处理。
单独对图像中选定的矩形区域内的像素进行处理的方式叫做窗口处理,如图2.5.3所示。矩形区域称为窗口,一般由矩形左上角的位置和行、列方向的像素数来确定。窗口处理用于从图像中单独取出对象物所在窗口而进行处理的场合。
图2.5.3窗口处理希望单独处理任意形状的区域时,可采用模板处理,如图2.5.4所示。为了表示区域形状,可预先准备一个和处理图像相同大小的二维数组,使用与处理图像画面1对1的形式存储该区域的信息,并进行处理。把这个任意形状的区域称为模板,例如可将根据阈值处理得到的物体形状作为模板。另外,把存储着模板信息的二维数组叫模板平面。模板平面具有模板位置上的信息,而且一般用二值图像的形式表示。若模板为矩形区域,则与窗口处理具有相同的效果,但窗口处理与模板处理的不同之处是后者必须设置一个模板平面。
图2.5.4模板处理示意图
4.串行处理和并行处理
后一像素输出结果依赖于前面像素处理的结果,并且只能依次处理各像素而不能同时对各像素进行相同处理的一种处理形式称为串行处理。串行处理的特点是:
(1)用输入图像(i,j)邻域的像素值和输出图像(i,j)以前像素的处理结果计算输出图像(i,j)像素的值;
(2)处理算法要按一定顺序进行。
因此,串行处理不能同时计算各像素的输出值,且处理的顺序会影响处理结果。
对图像内的各像素同时进行相同形式运算的一种处理形式称为并行处理。并行处理的特点是:
(1)输出图像的(i,j)值只用输入图像的(i,j)像素的邻域像素进行计算;
(2)相对于不同(i,j)的输出值可以独立进行计算。
2.6.1图像的数据结构
在数字图像处理中,图像数据在处理系统中采用何种存储方式是很重要的。最常用的方式是将图像各像素灰度值用一维或二维数组相应的各元素加以存储。除此之外,还有下列几种方式。2.6图像的数据结构与图像文件格式
1.组合方式
组合方式是用一个字长存放多个像素灰度值的方式,它能起到节省内存的作用,但会导致计算量增加,使处理程序变得复杂。图2.6.1和图2.6.2分别表示图像数据的组合方式及其处理过程。
图2.6.1组合方式
图2.6.2组合方式的图像处理
2.比特面方式
比特面方式是将像素以一种方式按比特位存取,即将所有像素的相同比特位用一个二维数组表示,形成比特面。n个比特位的灰度图像采用比特面方式存取时就有n个比特面,如图2.6.3所示。
这种结构能充分利用内存空间,但对灰度图像处理耗时多。
图2.6.3比特面方式
3.分层结构
由原始图像开始依次构成像素数愈来愈少的系列图像,就能使图像数据表示具有分层性,其代表有锥形(金字塔)结构。
与对原始图像进行处理的场合相比,这种先对粗分辨率图像进行处理,然后限定应该仔细进行处理的范围,再对较高分辨率图像进行处理的方法,可使处理的效率得到提高。
4.树结构
对一幅图像的行、列都接连不断地二等分,如果图像被分割部分中的全体像素都变成具有相同的特征时,则这一部分不再分割。树结构采用以原图像为树根的叉树表示,主要用在特征提取和信息压缩等方面。
5.多重图像数据存储
在彩色图像(红、绿、蓝)或多波段图像中,每个像素包含着多个波段的信息。以多光谱图像为例,其图像数据的存储有下列三种方式:
(1)逐波段存储BSQ(BandSequential),分波段处理时采用;
(2)逐行存储BIL(BandInterleavedbyLine),逐行扫描记录设备采用;
(3)逐像素存储BIP(BandInterleavedbyPix),用于分类。2.6.2图像文件格式
一幅现实世界的图像经由扫描仪、摄像机等设备进行采集,需要以文件的形式存储于计算机的磁盘中,然后被计算机处理。早期各种图像的存储都由其采集者自行定义格式。随着数字图像技术的发展,逐渐出现了流行的图像格式标准,如BMP、PCX、GIF、TIFF等。
不论一幅图像以何种格式存储,图像格式都大致包含下列特征:
(1)描述图像的高度、宽度以及各种物理特征的数据。
(2)彩色定义:每点bit数(决定颜色的数量即色深度)和彩色平面数,非真彩色图像还要提供一个调色板。
(3)描述图像的位图数据体:将该图像由一个矩阵描述出来,该矩阵的结构由图像的高、宽及每点bit数决定。如果图像采用了压缩,则每行都是用特定压缩算法压缩过的数据。
这就是各种图像格式的本质。造成每种格式不同的原因是因为每种格式对上述三种数据的存放位置、存放格式定义不同,而且大多数图像格式都定义了自己独有的数据。
常见图像文件格式有BMP文件、PCX文件、GIF文件和TIFF文件等。
1.BMP文件
随着Windows应用的逐渐普及,BMP(Bitmap的缩写)图像越来越多地被各种应用软件所支持。这主要是因为Windows把BMP作为其图像的标准格式,并且内含了一套支持BMP图像处理的API函数。BMP文件格式可分为文件头、位图信息和位图数据三部分。
1)文件头
BMP文件头含有BMP文件的类型、大小和打印格式等信息。在windows.h中对其定义如下:
typedefstructtagBITMAPFILEHEADER{
WORDbfType;/*位图文件的类型*/
DWORDbfSize;/*位图文件的大小*/
WORDbfReserved1;/*位图文件保留字,必须为0*/
WORDbfReserved2;/*位图文件保留字,必须为0*/
DWORDbfOffBits;/*位图数据相对于位图文件头的偏移量表示*/
}BITMAPFILEHEADER;
2)位图信息
位图信息含有位图文件的尺寸和颜色等信息。在windows.h中对其定义如下:
typedefstructtagBITMAPINFO
{
BITMAPINFOHEADERbmiHeader:
RGBQUADbmiColor[];
}BITMAPINFO;
(1)bmiHeader是一个位图信息头(BITMAPINFOHEADER)类型的数据结构,用于说明位图的尺寸。BITMAPINFOHEADER的定义如下:
typedefstructtagBITMAPINFOHEADER
{DWORDbiSize;/*bmiHeader结构的长度*/
DWORDbiWidth;/*位图的宽度,以像素为单位*/
DWORDbiHeight;/*位图的高度,以像素为单位*/
WORDbiPlanes;/*目标设备的位平面数,必须为1*/
WORDbiBitCount;/*每个像素的位数,必须是1(单色)、4(16色)、8(256色)或24(真彩色)*/
DWORDbiCompression;/*位图的压缩类型,必须是0(不压缩)、1(BI-RLE8压缩类型)或2(BI-RLE4压缩类型)*/
DWORDbiSiZelmage;/*位图的大小,以字节为单位*/
DWORDbiXPelsPerMeter;/*位图的目标设备水平分辨率,以每米像素数为单位*/
DWORDbiYPelsPerMeter;/*位图的目标设备垂直分辨率,以每米像素数为单位*/
DWORDbiClrUsed;/*位图实际使用的颜色表中的颜色变址数*/
DWORDbiClrImportant;/*位图显示过程中被认为是重要颜色的变址数*/
}BITMAPINFOHEADER;
(2)bmiColor[]是一个颜色表,用于说明位图中的颜色。它有若干个表项,每一个表项是一个RGBQUAD类型的结构,定义一种颜色。RGBQUAD的定义如下:
typedeftagRGBQUAD
{
BYTErgbBlue;
BYTErgbGreen;
BYTErgbRed;
BYTErgbReserved;
}RGBQUAD;
注意:RGBQUAD数据结构中增加了一个保留字段rgbReserved,它不代表任何意义,必须取固定值00,同时RGBQUAD结构定义的颜色值中,红色、绿色与蓝色的排列顺序与一般图像文件的颜色数据排列顺序恰好相反,即蓝色的亮度由rgbBlue字段定义、绿色的亮度由rgbGreen字段定义,红色的亮度由rgbRed字段定义。若位图中某个像素点的颜色描述为“00,00,FF,00”,则表示该点的颜色为纯红色,而不是纯蓝色。
3)位图数据
位图阵列记录了位图的每一个像素值。在生成位图文件时,Windows从位图的左下角开始(即从左到右、从下到上)逐行扫描位图,将位图的像素值一一记录下来。这些像素值的字节组成了位图阵列。位图阵列有压缩和非压缩两种存储格式。
归纳起来,BMP图像文件有下列4个特点:
(1)只能存放一幅图像。
(2)只能存储单色、16色、256色或真彩色4种图像数据之一。
(3)图像数据有压缩或不压缩两种处理方式,压缩方式为RLE_4和RLE_8。RLE_4能处理16色图像数据;而RLE_8能压缩256色图像数据。
(4)调色板的数据存储结构较为特殊。
2.PCX文件
PCX文件是由Zsoft公司在20世纪80年代初期设计的,专用于存储该公司开发的PCPaintbrush绘图软件所生成的图像数据。在授权给微软与其产品(MicrosoftPaintbrush)捆绑发行后,成为Windows的一部分。它是使用时间最长的一种位图格式,虽然目前使用这种格式的人减少了,但这种带有.PCX扩展名的文件在今天仍是十分常见的。
PCX文件由3个部分组成,即文件头、位图数据和一个多达256种色彩的调色板。文件头长达128字节,分为几个区域,包括图像的尺寸和每个像素颜色的编码位数。位图数据可以用简单的RLE(行程长度编码)算法压缩,像素值通常是单字节的索引值。调色板最多有256个RGB值。PCX文件的最新版本可以支持真彩色图像,图像最大可达4GB。现在的PCX图像可以用1、4、8或24bpp来对颜色数据进行编码,文件末尾处还有一个单独的位平面和一个RGB值的256色调色板。下面是PCX图像文件的几个特点:
(1)只能存放一张图像。
(2)使用RLE压缩方法进行压缩。
(3)文件有多个版本,能处理多种不同模式下的图像数据。
(4)4色和16色PCX图像文件有设定或不设定调色板数据两种选项。
(5)16色图像数据可分为1个或4个bitPlane来处理。
3.GIF文件
GIF(GraphicsInterchangeFormat)是由CompuServer公司开发的图像格式。GIF图像文件现已成为网络和BBS上图像传输的通用格式,经常用于动画、透明等特技制作。
GIF图像文件结构一般是由7个数据区组成的,它们是文件头、通用调色板、位图数据区以及4个补充区。其中文件头和位图数据区是文件不可缺少的项,通用调色板和其余的4个补充区则不一定会出现在文件内。GIF图像文件内可以有多个位图数据区,每个位图数据区由三部分组成:一个10字节长的图像描述,一个可选的局部色表和位图数据。每个位图数据区存储一幅图像,位图数据用LZW算法压缩。4个补充区如下:图像控制补充区用来描述图像怎样被显示;简单文本补充区包含显示在图像中的文本;注释补充区以ASCII文本形式存放注释;应用补充区存放生成该文件的应用程序的私有数据。通过软件处理和控制使得这些分离的图像能够形成一个连续有动感的画面,即动画图像。所以,GIF图像文件常用于制作Web网页和多媒体系统的特技效果。GIF文件有下面6个特点:
(1)文件具有多元化结构,能够存储多幅图像,这是制作动画的基础。
(2)调色板数据有通用调色板和局部调色板之分。
(3)采用改进版LZW压缩法,优于RLE压缩法。
(4)最多只能存储256色图像,GIF图像中每一像素的存储数据是该颜色列表的索引值。
(5)根据标识符寻找数据区。GIF图像文件内的各种图像数据区和补充区多数没有固定的数据长度和存放位置,为了方便程序寻找数据区,就以数据区的第一个字节作为标识符,让程序能够判断所读到的是哪种数据区。
(6)图像数据有两种排列方式:顺序排列和交叉排列。
4.TIFF文件
TIFF是“TagImageFileFormat”的缩写,是由Aldus公司与微软公司共同开发设计的图像文件格式。
TIFF图像文件主要由三部分组成:文件头、标识信息区和图像数据区。文件规定只有一个文件头,且一定要位于文件前端。文件头有一个标志参数指出标识信息区在文件中的存储地址,标识信息区内有多组标识信息,每组标识信息长度固定为12字节。前8字节分别为标识信息的代号(2字节)、数据类型(2字节)和数据量(4字节),后4字节则存储数据值或标志参数。文件有时还存放一些标识信息区容纳不下的数据,例如调色板数据就是其中的一项。
由于应用了标志的功能,TIFF图像文件能够实现多幅图像的存储。若文件内只存储一幅图像,则将标识信息区内容置0,表示文件内无其他标识信息区。若文件内存放多幅图像,则第一个标识信息区末端的标志参数将是一个非0的长整数,表示下一个标识信息区在文件中的地址,只有最后一个标识信息区的末端才会出现值为0的长整数,表示图像文件内不再有其他的标识信息区和图像数据区。
TIFF文件有如下特点:
(1)应用指针的功能,可以存储多幅图像。
(2)文件内数据区没有固定的排列顺序,只规定文件头必须在文件前端。对于标识信息区和图像数据区,在文件中可以随意存放。
(3)可制定私人用的标识信息。
(4)除了一般图像处理常用的RGB模式之外,还能够接受CMYK等多种图像模式。
(5)可存储多份调色板数据。
(6)调色板的数据类型和排列顺序较为特殊。
(7)能提供多种不同的压缩数据的方法,便于使用者选择。
(8)图像数据可分割成几个部分分别存档。
2.7.1图像的特征类别
图像特征是图像分析的重要依据,它可以是视觉能分辨的自然特征,也可以是人为定义的某些特性或参数,即人工特征。数字图像的像素亮度、边缘轮廓等属自然特征;图像经过变换得到的频谱和灰度直方图等属人工特征。2.7图像的特征与噪声
1.自然特征
图像是空间景物反射或辐射的光谱能量的记录,具有光谱特征、几何特征和时相特征。
(1)光谱特征:同一景物对不同波长的电磁波具有不同的反射率,不同景物对同一波长也可能具有不同的反射率。因而不同类型的景物在各个波段的数字成像就构成了数字图像的光谱特征。
数字图像的光谱特征可用于多波段遥感,从中获得关于地理、地质、地貌等丰富的信息。
(2)几何特征:几何特征主要表现为图像的空间分辨率、图像纹理结构及图像变形等几个方面。
空间分辨率反映所采用的设备性能。如SPOT卫星全色图像分辨率设计为10m×10m。
纹理结构是指影像细部的形状、大小、位置、方向以及分布特征,是图像目视判读的主要依据,也是模式识别的主要依据。
图像变形导致所得图像中的几何形状与实物平面投影不相似。
(3)时相特征:时相特征主要反映在不同时间获得的同一地区各图像之间存在的差异,它是对动体进行监测、跟踪的主要依据。
2.人工特征
图像的人工特征很多,主要有以下几种:
(1)直方图特征。
(2)灰度边缘特征:图像灰度在某个方向上的局部范围内表现出不连续性,这种灰度明显变化点的集合称为边缘。灰度边缘特征反映了图像中目标或对象所占的面积大小和形状。
(3)线和角点特征:城市区划图中有建筑群、街道、公路、铁路、桥梁等,这些地物可用线线相交的角点来表示。从图中提出这些特征,不仅可压缩图像,也可用于识别图像。角点代表的局部结构关系不因视角而改变,在图像匹配中很有用。
(4)纹理特征:纹理区域是指某种结构在比它更大的范围内大致呈现重复排列,这种结构称为纹理基元,如草地、大面积农作物构成的自然纹理和如砖墙、建筑群等构成的人工纹理。
图像的特征有很多,但在实际的特征提取中,重视何种特征主要取决于对象和处理的目的。按提取特征的范围大小,图像的特征又可分为点特征、局部特征、区域特征和整体特征。
(1)点特征:仅由各个像素就能决定的性质。如单色图像中的灰度值蓝(B)成分的值。
(2)局部特征:在小邻域内所具有的性质,如线和边缘的强度、方向、密度和统计量(平均值、方差等)等。
(3)区域特征:在图像内的对象物(一般是指与该区域外部有区别的具有一定性质的区域)内的点或者局部的特征分布,或者统计量以及区域的几何特征(面积、形状)等。
(4)整体特征:整个图像作为一个区域看待时的统计性质和结构特征等。2.7.2特征提取与特征空间
获取图像特征信息的操作称为特征提取。它作为模式识别、图像理解或信息量压缩的基础是很重要的。如图2.7.1所示,通过特征提取,可以获得特征构成的图像(称为特征图像)和特征参数。
图2.7.1图像的特征提取对于由图像中提取出的特征量,利用特征空间这一定义,可应用于模式分类等方面。把从图像中提取的m个特征量y1,y2,…,ym,用m维的向量Y=[y1,y2,…,ym]T表示,称该向量为特征向量。另外,对应于各特征量的m维空间叫做特征空间,那么特征向量Y就可作为这个特征空间的点来表示。具有类似特征量的点(一般是对象物)在特征空间上形成群(称为聚类),把特征空间按照聚类的分布依靠某种标准进行分割,就可判断各个点属于哪一类。也可用鉴别函数对特征空间进行分割。2.7.3图像噪声
所谓噪声,就是妨碍人的视觉器官或系统传感器对所接收的图像信息进行理解或分析的各种因素。一般噪声是不可预测的随机信号,它只能用概率统计的方法去认识。由于噪声影响图像的输入、采集、处理的各个环节以及输出的全过程,尤其是图像输入、采集中的噪声必然影响处理全过程以至最终结果,因此抑制噪声已成为图像处理中极重要的步骤。
1.图像噪声种类
图像噪声按其产生的原因可分为外部噪声和内部噪声。外部噪声是指图像处理系统外部产生的噪声,如天体放电干扰、电磁波从电源线窜入系统等产生的噪声。内部噪声是指系统内部产生的,一般分为以下四种形式:
(1)由光和电的基本性质引起的,如电流可看做电子或空穴运动,这些粒子运动产生随机散粒噪声;导体中电子流动产生热噪声;光量子运
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江省余姚市2022-2023学年高一下学期语文期末试卷(含答案)
- 2025共同借款合同中的连带责任担保条款示范文本
- 2025婚礼宴会承包合同模板
- 2025大货车租赁合同范本
- 2025培训班转让合同协议样本
- 2025关于服务采购合同范本
- 2025商业租赁合同范本模板
- 《流行性疾病概述》课件
- 《软件工程》课件设计模式的应用与实践
- 《前庭神经解剖》课件
- GB/T 45418-2025配电网通用技术导则
- 劳务派遣方案计划书
- 驾校教学大纲范本
- 2025年安全生产考试题库(建筑施工安全):施工安全教育培训试题
- 2024年四川甘孜州招聘事业单位人员笔试真题
- 中国竹编艺术知到课后答案智慧树章节测试答案2025年春浙江广厦建设职业技术大学
- 统编版(2024)七年级下册语文期末复习:古诗文默写 刷题练习题(含答案解析)
- 2024年认证行业法律法规及认证基础知识答案
- (一模)2025年深圳市高三年级第一次调研考试 英语试卷(含标准答案)
- 电商物流中的税务问题及优化措施
- 中考英语专项练习-语法填空20篇(含解析)
评论
0/150
提交评论