版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像处理与模式识别ImageProcessingandPatternRecognition版权所有:钱瑛图像处理与模式识别ImageProcessingand1OutlineofLecture2人眼视觉特性色度学与彩色模型图像的数字化数字图像的基本类型图像的文件格式图像的输入图像的存储与输出OutlineofLecture2人眼视觉特性2人眼视觉特性人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围。最外层是坚硬的蛋白质膜,其中,位于前方的大约1/6部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。其余5/6为白色不透明组织,称为巩膜,作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。人眼视觉特性人眼是一个平均半径为20mm的球状器官。3除了三层薄膜,在瞳孔后面还有一个扁球形的透明水晶体。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。用眼睛看建筑物侧面的图解,C点是晶状体的光心除了三层薄膜,在瞳孔后面还有一个扁球形的透明水晶体。水4视觉低级感知层次视觉系统从外界获取图象,就是在眼睛视网膜上获得周围世界的光学成象,然后由视觉接收器(杆状细胞和锥状细胞在视网膜上作为视觉接收器),将光图象信息转化为视网膜的神经活动电信息,最后通过视神经纤维,把这些图象信息传送入大脑,由大脑获得图象感知。100m15m2.55mm17mm中心凹(成像区)x/17=15/100x=2.55mm视觉低级感知层次视觉系统从外界获取图象,就是在眼睛视网膜上获5视网膜上有杆状细胞和锥状细胞两类视觉接收器:杆状细胞(Rods):细长而薄,数量上约7500万~1亿5000万,它们提供暗视,即在较低数量级亮度时的视觉响应,其光灵敏度高。锥状细胞(Cons):结构上短而粗,数量少,约600万~700万,光灵敏度较低,它们提供昼视,其响应光亮度范围比杆状细胞要高5~6个数量级。在中间亮度范围是两种视觉细胞同时起作用。锥状细胞集中分布在视网膜中心小凹里。视网膜上有杆状细胞和锥状细胞两类视觉接收器:杆状细胞(Rod6人类视觉系统在对物体的识别上有特殊强大的功能;但在对灰度、距离和面积的绝对估计上却有某些欠缺;以传感器单元的数目比较:视网膜包含接近1亿3000万至1亿5000万个光接收器,这远远大于一般数字成像系统CCD片上的传感器单元数;和它每次执行运算的数目比较:和计算机的时钟频率相比,神经处理单元的开关时间将比之大约慢104倍;总体而言,人类的视觉系统还是比计算机视觉系统要强大得多。它能实时分析复杂的景物以使我们能即时的反应。人类视觉系统在对物体的识别上有特殊强大的功能;但在对灰度、距7假设一个平面如磨砂玻璃一样散光,被1个强度为I且可以变化的光源从背后照亮,1个照度增量为△I,像短促闪光一样加在均匀照明的平面上,可使人感到平面中间像1个圆形亮点,如图所示如果△I不够亮,实验者没有感知上的变化,当△I逐步增强,感知上发生变化。如果50%的机会感知亮度变化,则量△I50/I为韦伯率,小的韦伯率表示可区分强度的小变化,有较好的亮度区分能力;大的韦伯率表示只有大的强度变化才能区分,有较差的亮度区分能力亮度适应性假设一个平面如磨砂玻璃一样散光,被1个强度为I且可以变化的光8人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实验证明,这一非线性接近1/3的幂指数函数。人眼通过这一对数性质,达到宽达108的视觉亮度范围。但在固定背景光的条件下,适应范围并不宽,约几十个灰度级。眼睛对光强的响应是非线性的。一块光强为I+∆I的小块被背景强度I所包围,则可觉察的差值∆I是I的函数,即对视觉敏感的是对比度,而不是亮度值本身。韦伯定理:如果一个物体的亮度与其周围背景I有刚刚可觉察得到的差别,则它们的比值是I的函数。其在一定的亮度范围内,近似不变,为常数值0.02,这称为韦伯比。即:∆I/I=0.02(常数)人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实9视觉范围是指人眼所能感觉到的亮度范围。这一范围非常宽,大约从百分之几cd/m2到几百万cd/m2。事实上,在人眼适应了某一平均的亮度环境之后,它能感受的亮度范围要小得多。即使是客观上相同的亮度,当平均亮度不同时,主观感觉的亮度也不相同。人眼分辨率视觉范围是指人眼所能感觉到的亮度范围。这一范围非常宽,大约从10马赫带效应人眼对于图像上不同空间频率的成分具有不同的灵敏度。视觉系统对空间高频和空间低频的敏感性较差,而对空间中频则有较高的敏感性,因而在亮度突变处产生亮度过冲现象,这种过冲对人眼所见的景物有增强其轮廓的作用。每个条带内部的亮度是常数,但仍然有强烈的边缘效应马赫带效应每个条带内部的亮度是常数,但仍然有强烈的边缘效应11色度学与彩色模型光波:光是一种按波长辐射的电磁波。光的物理性质:波长(光速,频率)和幅度下页图:可见光谱颜色视觉系统对可见光的感知 视网膜上锥状光敏细胞:光强与颜色。视网膜上杆状光敏细胞:光强。颜色度量:色调、亮度、饱和度色调——波长亮度——幅度饱和度——色光的纯度色度学与彩色模型光波:光是一种按波长辐射的电磁波。12500600紫400700750紫蓝蓝蓝绿绿绿黄黄橙橙红红350可见光0.005nm5nm350nm750nm
0.4mmγ射线χ射线紫外线红外线无线电波0.01nm
10km电磁波波长范围很大,使人产生视觉,感到明亮和颜色的电磁波叫可见光。可视光区的波长在400nm~700nm,当光谱采样限制到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一幅彩色图像。500600紫400700750紫蓝蓝蓝绿绿黄黄橙橙红红3513色调Hue:人眼感觉到物体反射或发射光波的波长。色调就是颜色的分类。如七色:红、橙、黄、绿、青、蓝、紫在色谱中,色调连续变化。饱和度Saturation:指颜色的纯正程度。与亮度有关:某一色调参入白光,色调不变但饱和度降低与参入其它颜色的光有关:饱和度与色调都会改变。亮度Intensity:人眼感受到的颜色的光的强度同一种色块,在不同强度的白光照射下,反射的光波波长一样(色调相同),但人眼感觉到的颜色不同。某一颜色的光,量度很弱,趋于黑色,反之,趋于白色。色调Hue:人眼感觉到物体反射或发射光波的波长。色调就是颜14彩色的表示
彩色的表示是基于TomasYoung提出的三基色原理:“任何彩色可以用合适的三种基本色混合而再生”。生理学已证明,视网膜中有三种视锥体,具有不同的吸收光谱,SR(λ),SG(λ),SB(λ)其中:λMIN≤λ≤λMAX、λMIN≈400nm、λmax≈780nm吸收光谱响应的峰值分别在光谱的红、绿、兰区域。而且,吸收曲线有相当多的部分是相互重叠的。这是三基色原理的生理基础。彩色的表示彩色的表示是基于TomasYoung提出15人眼中红绿蓝锥状体的波长吸收函数人眼中红绿蓝锥状体的波长吸收函数16国际照度委员会(CIE)在1931年规定3种基本色的波长为:R:700nm,G:546.1nm,B:435.8nm三基色相加混色:红、绿、兰三基色(RGB)三基色相减混色:黄、青、品红(CMY)国际照度委员会(CIE)三基色相加混色:红、绿、兰三基色(R17设组成某种颜色C所需的三个刺激量分别用R、G、B表示每种刺激量的比例系数为r、g、b,有1931年CIE根据此原则制定了一个色度图:舌型图设组成某种颜色C所需的三个刺激量分别用R、G、B表示每种刺激18每一点对应一种颜色边界点代表纯颜色任意两点连线表示线上的颜色可由两点颜色混合形成任意三点形成的三角形内的颜色可由三点颜色混合形成每一点对应一种颜色19R、G、B各用一个字节可表示:28x28x
28=1677万色RGB全为1为白色RGB全为0为黑色RGB数值相等为灰色RGB哪个数值大就偏向哪种颜色RGBR、G、B各用一个字节可表示:RGB20彩色模型也称为彩色空间或彩色系统,是描述色彩的一种方法。目前表达颜色的彩色模型有许多种,它们是根据不同的应用目的而提出的。在数字图像处理中,实际上最常用的彩色模型是RGB(红、绿、蓝)模型,HSI(色调、饱和度、亮度)模型。前者主要用于彩色显示器和彩色视频摄像机;后者则更符合人类描述和解释颜色的方式。彩色模型
彩色模型也称为彩色空间或彩色系统,是描述色彩的一种方法。目前21在RGB模型中,每种颜色出现在红、绿、蓝的原色光谱分量中,这个模型基于笛卡尔坐标系统。图中R、G、B位于3个角上;青、深红和黄位于另外三个角上,黑色在原点处,白色位于RGB彩色模型
离原点最远的角上。在该模型中,灰度等级沿着主对角线从原点的黑色到点(1,1,1)的白色分布。
黄(1,1,0)黑(0,0,0)绿(0,1,0)青(0,1,1)蓝(0,0,1)品红(1,0,1)白(1,1,1)红(1,0,0)在RGB模型中,每种颜色出现在红、绿、蓝的原色光谱分量中,这22彩色模型彩色模型23HSI(Hue,Saturation,Intensity)颜色空间HSI能减少彩色图像处理的复杂性。合乎人对彩色的认识:色彩:色调、饱和度亮度:非彩色属性,对应黑白图像的灰度。HSI(Hue,Saturation,Intensity24HIS彩色模型——双三棱锥模型形(74年)这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。I:双三棱锥中心线;表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。H:表示色度,由角度表示。反映了该颜色最接近什么样的光谱波长。0o为红色,120o为绿色,240o为蓝色。0o到240o覆盖了700nm~435.8nm的可见光谱颜色,240o到360o是400nm~435.8nm的可见光谱颜色。S:饱和度,饱和度参数是沿双棱锥中心线垂直方向到彩色点的长度。在双棱锥的外表面是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(灰色)影调,即饱和度为0。HIS彩色模型——双三棱锥模型形(74年)这种彩色系统格式的25HIS彩色模型HIS彩色模型26彩色模型之间的转换RGB到HSI的彩色变换:彩色模型之间的转换RGB到HSI的彩色变换:27HSI到RGB的转换:
由HIS到RGB的转化公式有些不同,它取决于要转换的点落在原始色所分割的哪个扇区。HSI到RGB的转换:28色度学与彩色模型RGB模型HIS模型色度学与彩色模型RGB模型HIS模型29图像的数字化一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,λ,t)。当一幅图像为平面单色静止图像时,空间坐标变量z,波长λ和时间变量t可以从函数中去除,一幅图像可以用二维函数f(x,y)来表示:f(x,y)=i(x,y)r(x,y)
这里0<i(x,y)<0<r(x,y)<1
反射分量限制在0和1之间。i(x,y)的性质取决于照射源,而r(x,y)取决于成像物体的特性。图像的数字化一幅图像实际上记录的是物体辐射能量的空间分布,这30数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样和量化。数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离31采样
采样(Sampling):对图像空间坐标的离散化,它决定了图像的空间分辨率。用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值;或者把方格的交叉点处模拟图像的亮度值作为该方格交叉点上的值。
图像的采样采样采样(Sampling):对图像空间坐标的离散化,它决32分辨率
分辨率
是指映射到图像平面上的单个像素的景物元素的尺寸。
单位:像素/英寸,像素/厘米
(如:扫描仪的指标300dpi)
或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。
单位:像素*像素
(如:数码相机指标30万像素(640*480))分辨率分辨率是指映射到图像平面上的单个像素的景物元素33常用的几种分辨率屏幕分辨率(screenresolution)
也称光栅分辨率,CRT在水平和垂直方向上能显示的最大光点数。显示分辨率(displayresolution)
计算机显示控制器所能提供的显示模式。图象分辨率(imageresolution)每英寸图象含有多少个象素点。图象尺寸大小、图象分辨率、图象文件大小常用的几种分辨率屏幕分辨率(screenresolutio34分辨率(续)位分辨率(bitsresolution)
也称位深,用来衡量每个象素存储的信息位数。如2位、8位、24位。输出分辨率(outputresolution)
打印机等输出设备每英寸所产生的点数(dpi)。分辨率(续)位分辨率(bitsresolution)35以多大的采样间隔进行采用为好?以多大的采样间隔进行采用为好?36取样与量化点阵采样的数学描述取样与量化点阵采样的数学描述37取样与量化点阵采样的的耐奎斯特准则vc、uc为截止频率取样与量化点阵采样的的耐奎斯特准则vc、uc为截止频率38量化把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化,它决定了图像的幅度分辨率。量化把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像39量化的方法包括:分层量化、均匀量化和非均匀量化。分层量化是把每一个离散样本的连续灰度值只分成有限多的层次。均匀量化是把原图像灰度层次从最暗至最亮均匀分为有限个层次,如果采用不均匀分层就称为非均匀量化。量化的方法包括:分层量化、均匀量化和非均匀量化。40(a)量化(b)量化为8bit量化示意图(a)量化(b41(a)256级灰度图象(b)子图(c)子图对应的量化数据图像量化实例(a)(b)(c)(a)256级灰度图象图像量化实例(a)(b)(c)42对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差。量化级数最小的极端情况就是二值图像,图像会出现假轮廓。采样点数和量化级数的关系:对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影43
(a)采样点256×256时的图像(b)采样点64×64时的图像(c)采样点32×32时的图像(d)采样点16×16时的图像
采样点数与图像质量之间的关系(a)(b)(c)(d)
采样点数与图像质量之间的关系(a)(b)(c)(d)44(a)量化为2级的Lena图像(b)量化为16级的Lena图像(c)量化为256级的Lena图像
量化级数与图像质量之间的关系(a)量化为2级的Lena图像量化级数与图像质量45数字图像的基本类型计算机一般采用两种方式存储静态图像:位映射(Bitmap),即位图存储模式;向量处理(Vector),也称矢量存储模式。位图也称为栅格图像,是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。矢量图只存储图像内容的轮廓部分,而不是存储图像数据的每一点。数字图像的基本类型计算机一般采用两种方式存储静态图像:46二值图像二值图像也叫黑白图像,就是图像像素只存在0,1两个值。二进制的lenna图像二值图像二值图像也叫黑白图像,就是图像像素只存在0,1两个值47灰度图像灰度图像是包含灰度级的图像,如64级,256级等。如当像素灰度级用8bit表示时,每个像素的取值就是256种灰度中的一种,即每个像素的灰度值为0到255中的一个。通常,用0表示黑,255表示白,从0到255亮度逐渐增加。灰度图像灰度图像是包含灰度级的图像,如64级,256级等。48索引图像索引图像把像素值直接作为索引颜色的序号。根据索引颜色的序号就可以找到该像素的实际颜色。当把索引图像读入计算机时,索引颜色将被存储到调色板中。调色板是包含不同颜色的颜色表,每种颜色以红,绿,蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色,相应的调色板就有256个单元。索引图像索引图像把像素值直接作为索引颜色的序号。49RGB彩色图像RGB图像是一类图像的总称。这类图像不使用单独的调色板,每一个像素的颜色由存储在相应位置的红、绿、蓝颜色分量共同决定。RGB图像是24位图像,红、绿、蓝分量分别占用8位,理论上可以包含16M种不同的颜色。RGB彩色图像RGB图像是一类图像的总称。50数字图像的基本文件格式每一种图像文件均有一个文件头,在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIFF文件以及GIF文件等。数字图像的基本文件格式每一种图像文件均有一个文件头,在文件51常用图像文件格式.BMP位图文件(bitmap),数据量大1位:2值黑白4位:16灰度或16色8位:256灰度或256色16位:65536色(增强色)24位:1677万色(真彩色)常用图像文件格式.BMP位图文件(bitmap),52常用图像文件格式.JPG用JPEG标准压缩的图像文件,数据量最小.GIF无损压缩,1/2~1/4,CompuServe.TIF工业标准,最复杂,最灵活.PSDAdobe公司Photoshop用.PCX最早支持彩色图像的,256色,不支持真彩色常用图像文件格式.JPG用JPEG标准压缩的图像文件,53图像的文件格式
1.GIF格式(GraphicsInterchangeFormat)GIF是美国CompuServe公司于1987年制定的格式,目的是能够在不同平台上交流使用,是Internet上WWW中的重要文件格式之一,支持64000像素的图像。图像的文件格式1.GIF格式(Gra542.BMP格式(Bitmap)BMP是一种与设备无关的图像文件格式,它是随微软Windows软件推出的一种位图形式的图像格式,Windows软件的图像资源多数以该格式存储。其文件分三部分:文件头、信息头和图像数据。文件头用来说明文件类型、实际图像数据长度和起始位置、分辨率等,信息头是彩色映射。2.BMP格式(Bitmap)553.PCX格式PCX是E-soft公司为其图像处理软件PaintBrush(画笔)配套推出的一个图像格式,是经过压缩的格式,多数位图文件都能转换成这种格式。它包括三类文件:各种单色的PCX文件,不超过16色的彩色PCX文件,共有256种颜色的PCX文件。大多数图像编辑软件均能处理这种格式的文件,各种扫描仪的输出也能生成PCX文件。3.PCX格式564.TIFF格式(TaggedImageFileFormat)TIFF也缩写成TIF它是由原Aldus和微软公司合作开发的用于扫描仪和桌面出版系统的文件格式,称为标记图像文件格式。其有压缩和不压缩的两种格式,以其灵活而获得青睐,多数应用程序都支持这种格式。5.JPG格式这是一种较新的格式,称为JPEG文件交换格式,采用JPEG方法压缩而成,其压缩比高,并可在压缩比和图像质量之间平衡,用最经济的存储空间得到较好的图像质量。4.TIFF格式(TaggedIm57图形/图像的获取与输入1.用图形工具软件生成利用PaintBrush、Photoshop等图形软件去创作所需要的图形,它们都具有大致相同的功能,能用鼠标(或数字化仪)描绘各种形状的图形,并可填色、填图案、变形、剪切、粘贴,也可标注各种文字符号。用这种方法可以很方便地生成一些小型简单的画面,如图案、标志等,设计修改都很方便,成本较低。图形/图像的获取与输入1.用图形工具软件生成582.图像扫描图像扫描仪主要应用在图纸之类平面的图像采集的场合,根据其外形和产生图像的方式通常将其分为手持式、平板式和滚筒式等三种类型,根据其对颜色的辨别能力又分为单色、灰度和彩色三种。滚筒式扫描仪多用于输入较大尺寸的图像。平板式扫描仪带有感应窗的自动移动装置,只需将扫描对象平放在扫描面板上即可,是投资较低并能获得较高质量图像的较理想的选择。手持式扫描仪造价低廉,可直接对书本杂志上的图像进行扫描,而不必将图像裁剪下来,因而在MPC中使用较多。2.图像扫描59
3.数字摄像输入利用电视摄像机或数字式照相机,可把照片、艺术作品甚至实际场景输入计算机来产生一幅数字图像。这种方式与普通照相机、录像机相比,省去了胶片及冲洗过程,可以直接将采集的数字图像信息保存在内部存储器中。摄像机与扫描仪的差别是:扫描仪只能输入平面的图像,而摄像机可以捕获三维空间的景物,即使是输入平面的图像,速度也比扫描仪快。扫描仪只能输入静止的图像,而摄像机既可输入静止图像,也能输入活动图像。3.数字摄像输入60摄像机的基本组成框图摄像机的基本组成框图61第二章-数字图像表示及其处理ppt课件62单CCD原理
单CCD在感光点上加上滤镜,只能接收三原色的其中一种色彩
单CCD原理
单CCD在感光点上加上滤镜,只能接收三原色633CCD原理
3CCD机以三块CCD分别接收红、绿、蓝三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年河砂运送协议3篇
- 2024年股东权益转让合同:企业股权内部调整协议3篇
- 二零二四年度防火门窗品牌授权与代理合同3篇
- 预付款采购合同
- 二零二四年度碳排放交易合同:碳汇项目开发与合作协议3篇
- 生物科技研发工程中心管理办法
- 水族馆参观管理办法
- 福州市停车场安全防护设施
- 舞蹈练习时间表
- 高铁经济圈企业管理办法
- 两家公司合作合同范本关于项目合作细节
- 大型设备安装合同模板
- 《新零售实务》课程标准
- 2024冬季安全十防措施专题培训
- 2024年度医疗器械采购与销售合同具体条款
- 《机械基础》试题集
- 人工智能技术应用专业调研报告
- 33 《鱼我所欲也》对比阅读-2024-2025中考语文文言文阅读专项训练(含答案)
- 移动通信网基站配套设备配置[详细]
- 电梯维保方案
- 外科护理学配套光盘 性传播疾病病人的的护理
评论
0/150
提交评论