《数字图像处理》第2章课件_第1页
《数字图像处理》第2章课件_第2页
《数字图像处理》第2章课件_第3页
《数字图像处理》第2章课件_第4页
《数字图像处理》第2章课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像处理第二章数字图像处理基础视觉感知要素图像感知和获取图像取样和量化数字图像的类型数字图像文件格式简介象素间的一些基本关系线性和非线性操作

2.1视觉感知要素眼睛的构造:

(人眼包含有三层膜)眼角膜与巩膜外壳脉络膜(前面睫状体虹膜晶状体)视网膜(视网膜表面的分离光接收器提供图案视觉,分为锥状体、杆状体)锥状体:位于视网膜中间,对颜色灵敏度高,分辨图像细节.白昼视觉杆状体:分布在视网膜表面,无彩色感觉,在低照明度下对图像较敏感,用来给出视野内一般的总体图像.夜视觉

2.1视觉感知要素视网膜上锥状体和杆状体的分布人眼对不同亮度的适应亮度适应范围:1010量级10-6mL到104mL实验表明,主观亮度是进入眼睛亮度的对数函数亮度适应现象:

人眼并不能同时在整个范围内工作,而是利用改变整个灵敏度来完成这一大变动的.

亮度适应级:视觉系统当前的灵敏度级别

2.1视觉感知要素人眼辨别光强度变化的能力

韦伯比可辨别增量的50%

典型实验

图2.5用于描述亮度辨别特性的基本实验

图2.6作为强度函数的典型韦伯比当背景光保持恒定时,改变其他光源亮度,从不能察觉到总可以察觉之间变化,一般观察者可以辨别12到24级不同强度的变化.

2.1视觉感知要素人眼感觉亮度并不是简单的强度函数例1:马赫带(毛边带)

2.1视觉感知要素视觉错觉

2.1视觉感知要素电磁波谱可以用波长()、频率()或能量来描述c光速h普朗克常量

2.2光和电磁波谱

2.2光和电磁波谱电磁波是能量的一种,任何有能量的物体,都会释放电磁波。

灰度和色彩彩色模型:RGB加色法CMY,CMYK减色法HSB(色泽,饱和度,明亮度)

2.2光和电磁波谱

2.3图像感知和获取

我们感兴趣的各类图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收相结合而产生的。

2.3图像感知和获取把照射量变为数字图像的传感器装置

2.3图像感知和获取用带状传感器获取图像

只需一维扫描,就能形成二维图像。

2.3图像感知和获取用传感器阵列获取图像

不需要扫描,就能形成二维图像。图像形成模型

2.3图像感知和获取

2.4图像取样和量化获取图像的目标是从感知的数据中产生数字图像,但多数传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式。这一过程由图像的取样与量化来完成。

数字化坐标值称为取样,数字化幅度值称为量化。

2.4图像取样和量化

2.4图像取样和量化

2.4图像取样和量化黑白图像的数字化

2.4图像取样和量化灰度图像的数字化

2.4图像取样和量化数字图像的表示

本书中表示数字图像所用坐标的约定M,N必须为正数,灰度级取值为2的整数次幂L=2k,为k位图像

图像存储量b=M*N*k

2.4图像取样和量化数字图像的表示

2.4图像取样和量化空间分辨率:由取样值决定,图像中可辨别的最小细节。一般用单位长度上采样的像素数目或单位长度上的线对数目表示。灰度级分辨率:灰度级中可分辨的最小变化。一般用灰度级或比特数表示。

当没有必要对涉及像素的物理分辨率进行实际度量和在原始场景中分析细节等级时,通常把大小为M×N,灰度为L级的数字图像称为空间分辨率为M×N像素,灰度级为L级的数字图像。

2.4图像取样和量化灰度级为256,空间像素从1024×1024到32×32的一组图像2.4图像取样和量化所有图像放大到1024×10242.4图像取样和量化灰度级分别为256,128,64,32的数字图像256128643216824灰度级从256到2的数字图像2.4图像取样和量化同时改变N(空间分辨率NxN)和k(2k级灰度)值facecameramancrowd等偏爱线2.4图像取样和量化同时改变N和k值2.4图像取样和量化同时改变N和k值2.4图像取样和量化同时改变N和k值总结:A、图像质量一般随N和k的增加而增加。在极少数情况下对固定的N,减小k能改进质量。最有可能的原因是减小k常能增加图像的视觉反差。B、对具有大量细节的图像只需很少的灰度级数就可较好地表示。C、N×k为常数的图像主观看起来可以有较大的差异。2.4图像取样和量化

采样和量化的原则当限定数字图像的大小时,为了得到质量较好的图像,一般可采用如下原则:(1)对缓变的图像,应该细量化,粗采样,以避免假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。

2.4图像取样和量化2.4图像取样和量化香农定理:如果一个函数以等于或大于其最高频率的2倍取样,那么就能从取样完全复原原函数。如果函数被亚取样,则混淆的现象将恶化取样。摩尔纹采用高分辨率传感器时未出现摩尔纹2.4图像取样和量化图像的放大与收缩

最近邻域内插方法

在原图像上寻找最靠近的像素并把它的灰度值赋给栅格上的新像素。

双线性内插方法2.4图像取样和量化用最近邻域内插法(上一行)和双线性内插法(下一行)得到的放大图像分别将128×128,64×64,32×32放大到1024×1024

数字图像类型

静态图像可分为矢量(Vector)图和位图(Bitmap),位图也称为栅格图像。

1矢量图

(1)矢量图的表示方法是用一系列绘图指令来表示一幅图。这种方法的本质是用数学(更准确地说是几何学)公式描述一幅图像。

(2)

矢量图的优点:A、它的文件数据量很小;B、图像质量与分辨率无关,这意味着无论将图像放大或缩小了多少次,图像总是以显示设备允许的最大清晰度显示。

数字图像类型(3)矢量图的缺点:不易制作色调丰富或色彩变化太多的图像,绘出来的图像不是很逼真,同时也不易在不同的软件间交换文件。

数字图像类型2位图是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。位图的优缺点:与矢量图正好相反。位图又可以分成如下四种:二值图像(binaryimage)、灰度图像(gray-scaleimage)、索引颜色图像(indexcolorimage)和真彩色图像(truecolorimage)。

数字图像类型(1)二值图像只有黑白两种颜色。

数字图像类型(2)灰度图像在灰度图像中,像素灰度级一般用8bit表示,这样每个像素灰度值都是介于黑色(0)和白色(255)之间的256(28=256)种灰度中的一种。

数字图像类型

数字图像类型(3)真彩色图像每一个像素由红、绿和蓝三个字节组成,每个字节为8bit,表示对应颜色分量的0到255之间的某亮度值,这三个字节组合可以产生1670万种不同的颜色。

数字图像类型(4)索引图像在RGB真彩色图像出现之前,由于技术上的原因,计算机在处理时并没有达到每像素24位的真彩色水平,为此人们创造了索引颜色(于调色板)。在索引颜色(也称为映射颜色)模式下,颜色都是预先定义的,并且可供选用的一组颜色也很有限,索引颜色的图像最多只能显示256种颜色。

数字图像类型图像文件格式

数字图像有多种存储格式,每种格式一般由不同的开发商支持。因此,要进行图像处理,必须了解图像文件的格式,即图像文件的数据构成。每一种图像文件均有一个文件头,在文件头之后才是图像数据。1BMP图像文件格式

第一部分为位图文件头BITMAP,它是一个结构体,其定义如下:

typedefstructtagBITMAP{WORD bfType;//文件类型,在WINDOWS系统中为“BM”DWORDbfSize;//文件大小WORD bfReserved1;//保留字WORDbfReserved2;//保留字DWORDbfOffBits;//从文件头到实际位图的偏移字节数}BITMAP;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。第二部分为位图信息头BITMAPINFOHEADER,也是一个结构:typedefstructtagBITMAPINFOHEADER{DWORDbiSize;//该结构的长度,为40字节LONG biWidth;//图像的宽度,单位为像素LONG biHeight;//图像的高度,单位为像素WORD biPlanes;//位平面数,必须是1WORD biBitCount;//指定颜色数,1为二值,4为16色,8为256色,16、24、32为真彩色DWORDbiCompression;//指定是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE16,BI_BITFIELDSDWORDbiSizeImage;//实际的位图数据占用的字节数LONG biXPelsPerMeter;//目标设备水平分辨率LONG biYPelsPerMeter;//目标设别垂直分辨率

DWORDbiClrUsed;//实际使用的颜色数,若该值为0,则使用的颜色数为2的biBitCount次方种。DWORDbiClrImportant;//图像中重要的颜色数,若该值为0,则所有的颜色都是重要的。}BITMAPINFOHEADER;其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多,今后仅讨论biCompression的有效值为BI_RGB,即不压缩的情况。

第三部分为调色板(Palette),只是对那些需要调色板的位图文件而言的。调色板实际上是一个数组,共有biClrUsed个元素(如果该值为零,则有2的biBitCount次方个元素)。数组中每个元素的类型是一个RGBQUAD结构,占4个字节,其定义如下:

typedefstructtagRGBQUAD{BYTErgbBlue; //该颜色的蓝色分量BYTErgbGreen; //该颜色的绿色分量BYTErgbRed; //该颜色的红色分量BYTErgbReserved; //保留值}RGBQUAD;第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。下面就2色、16色、256色和真彩色位图分别介绍。对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。对于16色位图,用4位可以表示一个像素的颜色,所以一个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。

下面两点请读者注意:(1)每一行的字节数必须是4的整数倍,如果不是,则需要补齐。(2)BMP文件的数据存放是从下到上,从左到右的。也就是说,从文件中最先读到的是图像最下面一行的左边第一个像素,然后是左边第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面一行的最右边的一个像素。DIB(DeviceIndependentBitmap)图像格式是设备无关位图文件,描述图像的能力基本与BMP相同,并且能运行于多种硬件平台,只是文件较大。2.TIF图像文件格式标记图像文件格式TIF(TagImage),它是现存图像文件格式中最复杂的一种,它提供存储各种信息的完备的手段,可以存储专门的信息而不违反格式宗旨,是目前流行的图像文件交换标准之一。3.GIF图像文件格式CompuServe开发的图形交换文件格式GIF(GraphicsInterchangeFormat),目的是在不同的系统平台上交流和传输图像。它是在Web及其他联机服务上常用的一种文件格式,用于超文本标记语言(HTML)文档中的索引颜色图像。

图像文件格式

4.JPEG图像格式JPEG(JointPhotographer’sExpertsGroup)即联合图像专家组,是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。由于JPEG的高压缩比和良好的图像质量,使得它广泛应用于多媒体和网络程序中。JPEG和GIF成为HTML语法选用的图像格式。

图像文件格式

2.5像素间的一些基本关系像素p,其坐标为(x,y)的邻居

2.5像素间的一些基本关系相邻像素对于像素p,其坐标为(x,y)4邻域(x+1,y),(x-1,y),(x,y+1),(x,y-1)

N4(p)

对角邻域(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)

ND(p)8邻域N4(p)+ND(p)

N8(p)

4邻域对角邻域8邻域2.5像素间的一些基本关系像素的连通性--像素的连通性这个基本概念,可用来简化许多其它数字图像概念的定义,如区域、边界等;--为确定两个像素是否连通,必须看它们是否相邻以及它们的灰度值是否满足特定的相似性准则(如灰度值是否相等)。令V是用于定义邻接性的灰度值集合,为使具有V中数值的两个像素p

和q是邻接的,则它们的邻接性需符合以下三种类型之一:(1)4邻接:如果q在N4(p)集中;(2)8邻接:如果q在N8(p)集中;(3)m邻接(混合邻接):如果(I)q在N4(p)中,或者(II)q在ND(p)中,且集合N4(p)∩N4(q)中像素灰度值均不是V中的值。2.5像素间的一些基本关系m邻接可以消除8邻接所带来的二义性像素安排(b)中心像素的8邻接像素(c)m邻接

(虚线表示两像素之间是8邻接的)

(虚线表示两像素之间是m邻接的)pq1pq1q2q22.5像素间的一些基本关系对于两个图像子集S1和S2,如果S1中的某些像素与S2中的某些像素相邻,则称S1和S2是邻接的。根据邻接性情况,S1与S2的邻接可以分为4邻接,8邻接和m邻接2.5像素间的一些基本关系像素p(x,y)到像素q(s,t)的通路(path),满足:存在特定的像素序列(x0,y0),(x1,y1),…,(xn,yn),其中(x0,y0)=(x,y),(xn,yn)=(s,t),且像素(xi,yi)和(xi-1,yi-1)(对于1≤i≤n)是邻接的。称n是通路的长度。若(x0,y0)=(xn,yn),则通路是闭合通路。m通路8通路根据邻接性情况,通路可以分为4通路,8通路和m通路随堂练习:以下p-q通路各是什么通路?

2.5像素间的一些基本关系8通路m通路4通路8邻接,有非m邻接全为m邻接可以仅通过4邻接连通2.5像素间的一些基本关系令S表示一幅图像中的像素子集,两个像素p和q在S中是连通的指的是,存在一条全部由在S中的像素组成的p、q之间的通路。对于S中的任何像素p,S中连通到该像素的像素集叫做S的连通分量(connectedcomponent)。如果S仅有一个连通分量,则集合S叫做连通集。令R是图像中的像素子集,若R是连通集,则称R为一个区域region。一个区域R的边界boundary(也称为边缘border或轮廓contour)是指R中一些像素的集合,这些像素都具有一个或多个不在R中的邻点。如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论