第二章 视觉特性及图像制式_第1页
第二章 视觉特性及图像制式_第2页
第二章 视觉特性及图像制式_第3页
第二章 视觉特性及图像制式_第4页
第二章 视觉特性及图像制式_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章

视觉特性与图像制式信息工程学院管张均2.1图像的表示图像信号:图像是一种可视化的信息,图像信号是图像信息的理论描述方法。图像景物在某种成像介质上再现的视觉信息图:物体透射或反射光的分布像:人的视觉系统对图的接收并在大脑形成的印象或认识具有明暗和色彩变化的许多单个像素信息的集合,以及接收者的感觉和心理状态图形?图像?视频?图形是用几何要素和操作过程(点、线、长方、椭圆、指定点填充等等)描述的图,即由计算机绘制的直线、圆、矩形、曲线、图表等。图像是扫描仪、摄像机等输入设备捕捉实际画面产生的,用具有一定灰度级的点阵描述的图。静止图像是与时间无关的相片图像。运动图像指的是人们所能见到的活动图像(如电视、电影、录像等)。由于要使图像运动起来,需要每秒钟内有足够多的帧数(如PAL制式电视每秒25帧,电影每秒24帧)。每一帧就是一幅单独的静止图像。图形:物理单元:点、直线、曲线等基本的几何对象属性:线宽、填充色、填充模式、对象间的空域关系等文件格式:PHIGS、GKS、IDS、EPS等图像:

物理单元:像素属性:编码属性---像素深度(pixeldepth)

显示属性---分辨率、尺寸等文件格式:GIF、TIFF、BMP、JPEG、PNG等视频:物理单元:像素(pixel)、帧(frame)属性:编码属性---像素深度显示属性---分辨率、尺寸、帧率等文件格式:M-JPEG、MPEG、WMV、ASF、AVI等2.2图像的数字化传统的远程通信系统中,所传送的信息一般是以模拟形式出现的,表现为一种时间连续的信号。而在计算机通信中,信号的传送方式采用数字方式,把连续变化的模拟信号转换为离散的数字信号。信号的数字化主要包括取样、量化和编码三大部分。数字化后的信号一般称为PCM信号(脉冲编码调制)。取样是实现空间上的离散化。量化是实现幅度上的离散化。编码是实现把离散化了的幅度用二进制码型表示。图像的数字化

电视信号的数字化和复原

(a)A/D变换(b)D/A变换

又称抽样或取样,它把时间上连续的模拟信号变成时间上离散的有限个样值的信号。这是模拟信号数字化过程中的第一步处理措施。采样采样定理根据傅立叶变换原理,在一定条件下,一个时间函数f(t)可以变换成一个相应的频率函数F(w)。采样定理是选择采样频率的理论依据。其主要内容为:对于一个最高频率为f0的模拟信号,当选择的取样频率fs满足fs>=2f0时,经过取样后的离散信号能够包含原模拟信号的全部信息。并且,经过低通滤波和反变换,可以不失真地回复出原模拟信号。图像的采样

将物理图像按行列扫描划分后,每个小块区域称为像素(pixel)。测量每个像素位置上的值就称为采样。二维采样定理图像在采样时,必须满足二维采样定理,确保无失真或有限失真地恢复原图像。如果二维图像信号f(x,y)的频谱F(u,v)满足其中Uc和Vc

为频域最高截止频率。则采样图像的频谱为二维采样定理当采样周期Δx和Δy满足通过采样信号f(mΔx,nΔy)能唯一地恢复原图像信号f(x,y),且有二维采样定理(a)原图像的频谱(b)采样信号的频谱采样信号的频谱量化在时间轴上已变为离散的样值脉冲,在幅度轴上仍会在动态范围内有连续值,即在幅度轴上仍是模拟信号的性质,故还必须用有限个电平等级来代表实际量值。量化是幅度上把连续值的模拟信号变为离散值的数字信号,也就是对每个样点值数字化,使其和有限个可能电平中的一个对应。

另外,人的耳朵或眼睛都不可能辨别出微小的信号变化,所以也没有必要对很小的幅度差别如实地传送。这就是说,量化对于实现数字化不仅是必要的,而且也是可能的。目标:当幅值的概率分布为p(z),量化值为qi时,总误差平方为最小时失真最小。图像的量化量化可分为两种:均匀量化非均匀量化

在输入信号的动态范围内,量化间距处处相等的量化称为均匀量化或线性量化。均匀量化时信噪比随输入信号动态幅度的增加而增加。采用均匀量化,在强信号时固然可把噪声淹没掉,但在弱信号时,噪声的干扰就十分显著。为改善弱信号时的信噪比,量化间距应随输入信号幅度而变化,大信号时进行粗量化,小信号时进行细量化,也就是采用非均匀量化。

如图所示,设信号的整个动态变化范围为A,共分为M个量化等级;每个量化层距为∆A,采用均匀量化,则有:∆A=A/M。量化等级通常用二进制的位数b表示,它与十进制数M之间的关系为:M=2b或b=log2M。b通常称为量化位数。例如,对于8位量化,相应的十进制量化等级M为:M=2b=256。MA∆A123均匀量化将[z0,zk)均分成k个子区间后,每个区间的长度各子区间以它的中心位置作为量化值当待量化值在[z0,zk)区间内均匀分布时主要思想:p(z)不等于常数,使总误差平方最小;样本值在某个取值范围内较频繁出现,而在另外一些范围内出现不多;可对样本值较频繁出现的取值范围采用较小的量化区间,而在其它地方用较大的量化区间;这样就可在不增加量化级数k的条件下,降低平均误差,减少量化噪声。非均匀量化为使总误差最小,令其对zi和qi的偏导数为0,可得步骤:初始化所有的量化电平qi;更新所有的判决电平zi,并计算总误差的初始值;更新所有的量化电平qi;再次计算总误差的值;如果两次计算的总误差之差小于某个阈值,则算法停止,否则转入第2步。LloydMax量化器Max量化器在误差平方和最小的意义上是最优的。取样点数和量化级数的选取假定一幅图像取M×N个采样点,对样点值进行Q级分档取整。那么对M、N和Q如何取值呢?首先,Q一般总是取2的整数次幂,如Q=2b,b为正整数,通常称为对图像进行b比特量化。

M、N可以相等,也可以不等。若取相等,则图像距阵为方阵,分析运算方便一些。其次,量化过程相当于由输入值找到它所在的区间号,反量化过程相当于由量化区间号得到对应的量化电平值。量化处理是把一批输入量化到一个输出级上,量化区间总数远远小于输入值的总数,所以量化能实现数据压缩。很明显,反量化后并不能保证得到原来的值,因此量化过程是一个不可逆过程,用量化的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表法实现。对b来讲,取值越大,量化区间总数越接近于输入值总数,所引起的量化失真就越小。在实际应用中,如果图像的总比特数M×N×b给定,对M×N和b的分配往往是根据图像的内容和应用要求以及系统本身的技术指标来选定的。例如,若图像中有大面积灰度变化缓慢的平滑区域(如人的特写照片等),则M×N取样点可以少些,而量化比特数b多些,这样可使重建图像灰度层次多些。若b太少,在图像平滑区往往会出现“假轮廓”。反之,对于复杂景物图像,如群众场面的照片等,量化比特数b可以少些,而取样点数M×N要多些,这样就不会丢失图像的细节。究竟M×N和b如何组合才能获得满意的结果很难讲出一个统一的方案。不同采样点数对图像质量的影响(a)256×256(b)128×128(c)64×64(d)32×32(e)16×16(f)8×8不同量化级别对图像质量的影响(a)256色

(b)64色

(c)32色(d)16色

(e)4色

(f)2色图像处理时要考虑三个因素:分辨率、图像深度和显示深度。分辨率指图像的清晰度。有屏幕分辨率、图像分辨率和像素分辨率。屏幕分辨率:指计算机显示器屏幕显示图像的最大显示区,以水平和垂直像素点表示。图像分辨率:指数字化的图像的大小,以水平和垂直像素点个数表示。例如:在640×480屏幕上显示320×240个像素点的图像。

像素分辨率:指像素的宽高比,一般为1:1。2.3图像的基本属性2.3图像的基本属性图像深度(颜色深度):表示数字位图图像中每个像素上用于表示颜色的二进制数字位数。目前黑白图像为8比特,彩色为24比特。显示深度:表示显示器上每个点用于显示颜色的二进制数字位数。若显示深度小于图像深度,则图像失真。图像文件大小的计算(Byte):图像数据量大小=像素总数×图像深度÷8例如:一幅640×480的256色图像为:

640×480×8÷8=307200Bytes2.3图像的基本属性真彩(Truecolor)彩色图像直接采用包含R、G、B三基色分量的像素值。伪彩(Pseudocolor)Colorlook-uptable,原图像的灰度值按一定的数学关系同各种颜色对应起来获得彩色图像的色调。直接色每个像素值分为R、G、B分量,这些分量再作为单独索引值,通过相应的彩色变换表找出基本色调。这样产生的RGB强度值构成的彩色称为直接色。用这种系统产生颜色与真彩色系统相比,相同之处是都采用RGB分量决定基色强度,不同之处是后者的基色强度直接用RGB决定,而前者的基色强度由RGB经变换后决定。因而这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图像看起来更真实自然。2.4数字图像种类表达方法矢量图(vectorgraphics)(图形)点阵图(bitmappedgraphics)

(图像)

利用点、线、矩形、多边形、圆和弧线等描述;采用数学计算方式,通过计算机语言编程表达简单、小块图像时有效,适合做各种变换

用像素表示像素具有颜色、亮度和属性扫描仪、摄像机、录像机、激光视盘、视频信号数字卡等获得优点:适合表现大量的图像细节,可以很好的反映明暗的变化、复杂的场景和颜色,表现逼真的图像效果。缺点:文件比较大,放大时清晰度会降低并出现锯齿。

通过数学公式计算获得描述图形的直线和曲线,文件一般较小,例如文字、线条。优点:无论放大、缩小或旋转等都不会失真。缺点:难以表现色彩层次丰富的逼真图像效果,而且显示矢量图也需要花费一些时间。矢量图点阵图亮度等级二值图像灰度图像色调等级黑白图像彩色图像空间的维数平面二维图像立体三维图像2.4数字图像种类灰度图(gray-scaleimage)

256级灰度图,每个像素1Byte二值图,每个像素1bit256色彩色图及其转换的256级灰度图24位真彩色图及其转换的256级灰度图

彩色图(colorimage)2.5彩色图像信号的表示和编码彩色的三参量(HIS)是视觉系统对一个区域呈现的颜色的感觉,即对物体辐射或者反射的光波波长的感觉。有一千万种以上,颜色专业人士可辨认出三百至四百种颜色。混合相邻颜色时,可以获得在这两种颜色之间连续变化的色调。色调(hue):表征各颜色(具有不同频率或波长)饱和度是指色彩的鲜艳程度,即颜色的纯洁性。当一种颜色渗入其它光(比如白光)成分愈多时,颜色愈不饱和。饱和度为零时,图像变成一灰度图像。饱和度(saturation):表征颜色的浓度亮度是视觉系统对可见物体辐射或者发光多少的感知属性。

亮度是主观感觉,例如,一根点燃的蜡烛在黑暗中看起来要比白炽光下亮。亮度的单位是坎德拉/平方米(cd/m2)亮度是用反映视觉特性的光谱敏感函数加权之后得到的辐射功率。亮度(intensity或brightness):表征总能量,明暗效果,与颜色无关。另外一个常见概念--对比度对比度指不同颜色之间的差异,对比度越大,两种颜色之间的反差就越大。比如对一幅灰度图像,提高对比度会更加黑白分明,反之,则得到一幅灰色的图像。HIS颜色圆锥空间模型2.5.1彩色图像信号的分量表示黑白图像信号(灰度级,8比特,人眼对灰度的最大分辨力为26。)

彩色视频信号(彩色的三基色原理,RGB混合而成,24比特,不便于传输和存储。)

利用人的视觉特性降低彩色图像的数据量,将RGB转换到别的彩色空间,转换后每一种彩色都产生一个亮度分量和两个色度分量信号。

RGB

YUV,YIQ,YCbCr颜色空间(彩色空间)RGB型/计算机图形颜色空间电视机和计算机的颜色显示系统CMY型/彩色印刷及打印模型与RGB三基色互补YUV型/电视系统颜色空间(Luminanceandchrominance)广播电视需求,以压缩色度信息有效传输电视图像

YCbCr(数字电视采用的颜色空间)XYZ型/CIE颜色空间国际照明委员会定义的国际性颜色空间标准,是YUV的前身RGB彩色空间

在多媒体计算机中,用得最多的是RGB彩色空间表示,因为显示器的输入需要RGB三个彩色分量。不管多媒体系统中使用什么彩色空间,最后输出一定要转换为RGB。配色方程:F=r[R]+g[G]+b[B],r、g、b为三色系数。白光的亮度公式:PAL,Y=0.22[R]+0.707[G]+0.071[B]NTSC,Y=0.299[R]+0.587[G]+0.114[B]系数不同是因为三基色波长选择不同。RGB彩色空间

彩色图像描述示例RGB彩色空间

自然界中任何一种光都可由R、G、B三基色按不同的比例相加混合而成,当三基色分量都为0(最弱)时混合为黑色光,当三基色分量都为k(最强)时混合为白色光。任一颜色F是这个三维坐标中的一点,调整三色系数r、g、b中的任一系数都会改变F的坐标值,也即改变了F的色值。RGB颜色空间采用物理三基色表示,因而物理意义很清楚,适合彩色显像管工作。然而这一体制并不适应人的视觉特点,因而产生了其他不同的颜色空间表示法。

RGB图像亮度信号Y和色差信号U、V亮度信号表示了单位面积上反射光线的强度色差信号(所谓色差信号,就是指基色信号中的三个分量信号R、G、B与亮度信号之差)决定了彩色图像信号的色调。最后发送端将Y、U、V三个信号进行编码,用同一信道发送出去,这就是在PAL(德、英、中、朝)彩色电视制式中使用的YUV彩色空间。YUV彩色空间úúúûùêêêëéúúúûùêêêëé----=úúúûùêêêëéBGRVUY100.0515.0615.0436.0289.0147.0114.0587.0299.0YUV与RGB彩色空间变换Y=0.299[R]+0.587[G]+0.114[B]Y和U、V相互独立。即黑白灰度图与单色图是相互独立的,因此可以对这些单色图分别进行编码。这也解决了彩色电视机与黑白电视机的兼容问题。降低数字彩色图像数据量。利用人眼视觉特性可把几个相邻像素不同的色彩值当做相同的色彩值来处理(即大面积着色原理),从而减少了所需的数据量。在PAL彩色电视制式中,亮度信号的带宽为4.43MHz,用以保证足够的清晰度,而把色差信号的带宽压缩为1.3MHz,达到了减少带宽的目的。优点视频采集卡得到的图像Y和U、V分别采用不同的采样频率。目前常用的Y、U、V采样频率的比例有4∶4∶4、4∶2∶2、4:1:1、4:2:0。如要存储RGB彩色图像,每分量用8个比特表示,图像的大小为640×480像素,那么所需要的存储容量为640×480×3×8/8=921600字节;如果用Y∶U∶V=4∶1∶1来表示,对于Y每个像素仍用8比特表示,而对于色差信号U、V,每4个像素用8比特表示,则存储量变为640×480×(8+2+2)/8=460800字节。尽管数据量减少了一半,但人眼察觉不出有明显变化。YUV图像在NTSC彩色电视制式中选用YIQ彩色空间,其中Y表示亮度,I、Q是两个彩色分量。

I、Q与U、V是不相同的。人眼的彩色视觉特性表明,人眼对红、黄之间颜色变化的分辨能力最强;而对蓝、紫之间颜色变化的分辨能力最弱。所以把相角为123度的橙色(红黄之间的颜色)及其相反相角303度的青色定义为I轴。与I正交的色度信号轴叫Q轴。即色彩信号I表示人眼最敏感的色轴,Q表示人眼最不敏感的色轴。YIQ彩色空间úúúûùêêêëéúúúûùêêêëé---=úúúûùêêêëéBGRQIY311.0523.0212.0321.0275.0596.0114.0587.0299.0YIQ与RGB彩色空间变换的对应关系:在NTSC制式(美、加)中,传送人眼分辨能力较强的I信号时,用较宽的频带(1.3~1.5MHz);而传送人眼分辨能力较弱的Q信号时,用较窄的频带(0.5MHz)。Y分量的带宽是4.2MHz。YCbCr彩色空间是由ITU-R(国际电联无线标准部,原国际无线电咨询委员会CCIR)制定的彩色空间。按照CCIR601-2标准,将非线性的RGB信号编码成(数字化)YCbCr,编码过程开始是先采用符合SMPTE-CRGB(它定义了三种荧光粉,即一种参考白光,应用于演播室监视器及电视接收机标准的RGB)的基色作为r校正信号。YCbCr彩色空间YCbCr与RGB彩色空间变换的对应关系如下所示。YCbCr是针对数字图像压缩提出的彩色空间。实际上很多时候,我们是把YUV和YIQ/YCrCb模型混为一谈的。YUV模型用于PAL制式的电视系统,Y表示亮度,UV并非任何单词的缩写。YIQ模型与YUV模型类似,用于NTSC制式的电视系统。YIQ颜色空间中的I和Q分量相当于将YUV空间中的UV分量做了一个33度的旋转。YCbCr颜色空间是由YUV颜色空间派生的一种颜色空间,主要用于数字电视系统中。从RGB到YCbCr的转换中,输入、输出都是8位二进制格式。úúúûùêêêëé+úúúûùêêêëé-----=úúúûùêêêëéBG081.0419.0500.0500.0331.0169.0114.0587.0299.0RCCYrbúúúûùêêêëé1281280CMY颜色空间彩色印刷或彩色打印的纸张是不能发射光线的,因而印刷机或彩色打印机就只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料。油墨或颜料的三基色是青(Cyan)、品红(Magenta)和黄(Yellow),简称为CMY。青色对应蓝绿色,品红对应紫红色。理论上说,任何一种由颜料表现的颜色都可以用这三种基色按不同的比例混合而成,这种颜色表示方法称为CMY颜色空间表示法。彩色打印机和彩色印刷系统都采用CMY颜色空间。CMY颜色空间相减混色:它减少了为视觉系统识别颜色所需要的反射光。在CMY相减混色中,三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。RGB空间与CMY空间的互补关系CMY空间正好与RGB空间互补,也即用白色减去RGB空间中的某一颜色值就等于同样颜色在CMY空间中的值。2.5.2彩色图像信号编码对于彩色图像信号数字压缩编码,可以采用两种不同的编解码方案:一种是复合编码,它直接对复合图像信号进行采样、编码和传输;另一种是分量编码,它首先把复合图像中的亮度和色度信号分离出来,然后分别进行取样、编码和传输。分量编码是图像信号压缩编码的主流(图像压缩国际标准)。Q:什么是彩色的三参量,什么是彩色的三基色,RGB、YUV、YIQ、CMY等彩色空间那些实现了亮色分离?彩色图像信号分量编码系统的基本框图为了便于国际节目的交换及数字设备的互操作,CCIR(ITU-R)颁布了分量电视信号数字编码标准ITU-RBT.601(CCIR601)(俗称D1,标清)。组成:亮度、色差信号8比特均匀量化采样频率13.5MHZPAL:fs=625(行/帧)25(帧/s)864(样点数/行)NTSC:fs=52529.97858每一行有效样本数均为720个2.6数字视频的分量传输ITU-RBT.601推荐亮度采样结构2.6.1图像子采样4:2:2(ITU-RBT.601推荐)Y:Cb:Cr:取样点的位置:525行系统:

M=720,N=480,60Hz刷新频率Y=720480,Cb=Cr=360480625行系统:

M=720,N=576,50Hz刷新频率

Y=720576,Cb=Cr=36057612345M水平像素123N垂直像素像素

电视演播室应用的国际标准4:2:0123N垂直像素12345M水平像素像素与4:2:2具有相同亮度分辨率,色度分辨率降低为前者一半隔行扫描用于数字广播电视525行系统:Y=720480,Cb=Cr=360240625行系统:Y=720576,Cb=Cr=360288问题:这两种采样格式下,彩色电视信号数字化后,存储每帧所需的存储容量及1小时电视/电影所需的存储容量?SIF(源中间格式)水平和垂直分辨率为4:2:0格式的一半(亚取样)刷新速率(时间分辨率)减半:30/25Hz接收时进行插值计算主要用于存储CIF(通用中间格式)结合625行系统的空间分辨率、525行系统的时间分辨率Y=352288,Cb=Cr=176144,30Hz取样点与SIF同主要用于电视会议为转换到CIF格式,则525行系统需要行频转换器,而625行系统需要帧频转换器。QCIF(四分之一通用中间格式)水平和垂直分辨率为CIF的1/2时间分辨率为CIF的1/2或1/4Y=176144,Cb=Cr=8872,15Hz/7.5Hz用于可视电话S-QCIF(标准四分之一通用中间格式)更低分辨率用于调制解调器和PSTN提供的信道Y=12896,Cb=Cr=64482.7.1傅里叶变换二维连续傅里叶变换定义:设f(x,y)是独立变量x和y的函数,且在±∞上绝对可积,则定义积分 为二维连续函数f(x,y)的傅里叶变换,并定义

为F(u,v)的逆变换。f(x,y)和F(u,v)为傅里叶变换对。2.7图像信号变换2.7.1傅里叶变换二维离散傅里叶变换尺寸为M×N的离散图像函数f(x,y)的DFT反变换可以通过对F(u,v)求IDFT获得

2.7.1傅里叶变换二维离散傅里叶变换

F(u,v)即为f(x,y)的频谱,通常是复数:幅度谱

相位谱

2.7.1傅里叶变换幅度谱的特点

①频谱的直流成分为,说明在频谱原点的傅里叶变换F(0,0)等于图像的平均灰度级。②幅度谱|F(u,v)|关于原点对称,即

。③图像f(x,y)平移后,幅度谱不发生变化,仅有相位发生变化。2.7.1傅里叶变换

(a)原始图像(b)图像的频谱图(c)中心化的频谱图傅里叶变换2.7.2离散余弦变换一维离散余弦变换

保证变换基的规范正交性,引入常量C(k),定义:其中DCT逆变换为2.7.2离散余弦变换

二维离散余弦变换

正变换:逆变换:线性组合2.7.2离散余弦变换二维离散余弦变换

(a)wpeppers2图像(b)wpeppers2图像的DCT系数

离散余弦变换

2.7.3沃尔什-哈达玛变换

哈达玛矩阵:元素仅由+1和-1组成的正交方阵。正交方阵:指它的任意两行(或两列)都彼此正交,或者说它们对应元素之和为零。哈达玛变换要求图像的大小为N=2n

。一维哈达玛变换核为其中,bk(z)代表z的二进制表示的第k位值。2.7.3沃尔什-哈达玛变换

一维哈达玛正变换一维哈达玛逆变换二维哈达玛正变换二维哈达玛逆变换2.7.3沃尔什-哈达玛变换

正反变换都可通过两个一维变换实现。高阶哈达玛矩阵可以通过如下递推公式求得:N=8的哈达玛矩阵为2.8.1基本统计分析量2.8图像的统计特性图像熵图像的灰度平均值(mean)2.8.2直方图2.8图像的统计特性直方图的横坐标是图像的各灰度级,纵坐标是各个灰度出现的像素个数。归一化的直方图(histogram)定义为灰度级出现的相对频率。即

式中,N表示像素的总数;nk表示灰度级为k的像素的数目。2.8.2直方图2.8图像的统计特性直方图(a)lena图像(b)lena图像的直方图2.9.1空域增强2.9图像增强技术灰度分段线性变换对整个灰度区间进行分段,采用分段线性函数进行变换。这种变换突出了感兴趣的目标或灰度区间,相对抑制那些不感兴趣的灰度区间。常用的是三段线性变换。三段线性变换为了将图像灰度级的整个范围或一段范围扩展或压缩到记录或显示设备的动态范围内,可以采用灰度变换方法,使图像动态范围增大,图像对比度扩展。2.9.1空域增强2.9图像增强技术灰度分段线性变换对灰度区间[a,b]进行了线性拉伸,而灰度区间[0,a]和[b,fmax]则被压缩。调整折线拐点的位置并控制分段直线的斜率,可以对图像的任一灰度区间进行拉伸或压缩。在遥感图像分类中,感兴趣的地貌特征可能有明显的灰度变化,而那些过黑或过白的像素往往对应于玄武岩、水、冰等。2.9.1空域增强2.9图像增强技术灰度分段线性变换三段线性变换实例

(a)原始图像(b)增强效果2.9.1空域增强2.9图像增强技术灰度非线性变换

当用某些非线性函数如对数、指数函数等作为映射函数时,可实现灰度的非线性变换。对数变换的一般表达式为:

g

=a+clg(f+1)对数变换可以增强低灰度级的像素,扩展低灰度区,压制高灰度级的像素,使灰度分布与人的视觉特性相匹配。2.9.1空域增强2.9图像增强技术灰度非线性变换

对数变换后的Couple图像2.9.1空域增强2.9图像增强技术直方图均衡化

通过对原图像进行某种变换,使得图像的直方图变为均匀分布的直方图。灰度级连续的灰度图像:当变换函数是原图像直方图的累积分布函数时,能达到直方图均衡化的目的。对于灰度级离散的数字图像,用频率来代替概率。2.9.1空域增强2.9图像增强技术直方图均衡化

直方图均衡2.9.1空域增强2.9图像增强技术均值滤波

大部分的噪声都可以看作是随机信号,对图像的影响可以看作是孤立的。某一像素,如果它与周围像素点相比,有明显的不同,则可以认为该点被噪声感染了。图像f(x,y)邻域S的平均g(x,y)可以表示为

2.9.1空域增强2.9图像增强技术均值滤波

3×3模板平滑处理示意图2.9.1空域增强2.9图像增强技术均值滤波

常用的模板

2.9.1空域增强2.9图像增强技术均值滤波

平滑处理的实例

(a)原始图像(b)有噪声的图像(c)用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论