数字图像表示及其处理_第1页
数字图像表示及其处理_第2页
数字图像表示及其处理_第3页
数字图像表示及其处理_第4页
数字图像表示及其处理_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像表示及其处理第1页,课件共80页,创作于2023年2月2.1人眼成像过程人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围。最外层是坚硬的蛋白质膜,其中,位于前方的大约1/6部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。其余5/6为白色不透明组织,称为巩膜,作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。第2页,课件共80页,创作于2023年2月除了三层薄膜,在瞳孔后面还有一个扁球形的透明水晶体。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。用眼睛看建筑物侧面的图解,C点是晶状体的光心第3页,课件共80页,创作于2023年2月图像的形成视觉亮度范围和分辨率视觉亮度范围指人眼所能感觉到的亮度范围。人眼的分辨率是指人眼在一定距离上能区分开相邻两点的能力。和环境照度有关和被观察对象的相对对比度有关第4页,课件共80页,创作于2023年2月视觉适应性和对比灵敏度暗适应性明适应性对比度(反差)和相对对比度——描述图像亮度的差异对比度:相对对比度:第5页,课件共80页,创作于2023年2月亮度感觉与色觉人眼对亮度差别的感觉取决于相对亮度的变化。人眼在适应某一平均亮度是,黑白感觉对应的亮度范围较小。重现图像亮度不必等于实际图像亮度;人眼不能感觉出的亮度差别,重现图像时不必精确复制。第6页,课件共80页,创作于2023年2月色觉:人辨别颜色的能力。色觉光谱范围:400nm紫色——760nm红色消色物体:黑、白和灰色物体对各种波长的入射光等量吸收白光照射,反射率>75%(<10%)有色物体对入射光中各种波长吸收不等量白光照射,反射或透射的光线与入射光相比,亮度减弱,光谱成分变少。第7页,课件共80页,创作于2023年2月光源的光谱成分对物体颜色的影响有色光照到消色物体反射光的光谱成分与入射光的光谱成分相同两种以上有色光,物体呈加色法效应有色光照到有色物体物体颜色呈减色法效应第8页,课件共80页,创作于2023年2月马赫带奥地利物理学家E马赫发现的一种明度对比现象明暗交界处,亮度更亮,暗处更暗主观的边缘对比效应人类的视觉系统有增强边缘对比度的机制第9页,课件共80页,创作于2023年2月2.2简单的图像形成模型一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,λ,t)。当一幅图像为平面单色静止图像时,空间坐标变量z,波长λ和时间变量t可以从函数中去除,一幅图像可以用二维函数f(x,y)来表示:

f(x,y)=i(x,y)r(x,y)

这里0<i(x,y)<0<r(x,y)<1

反射分量限制在0和1之间。i(x,y)的性质取决于照射源,而r(x,y)取决于成像物体的特性。第10页,课件共80页,创作于2023年2月2.3图像的数字化数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样和量化。第11页,课件共80页,创作于2023年2月第12页,课件共80页,创作于2023年2月2.3.1采样采样(Sampling):对图像空间坐标的离散化,它决定了图像的空间分辨率。用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值;或者把方格的交叉点处模拟图像的亮度值作为该方格交叉点上的值。图像的采样第13页,课件共80页,创作于2023年2月对一幅图像采样时,若每行(即横向)像素为N个,每列(即纵向)像素为M个,则图像大小为M×N个像素,从而f(x,y)构成一个M×N实数矩阵:每个元素为图像f(x,y)的离散采样值,称之为像元或像素。第14页,课件共80页,创作于2023年2月2.3.1量化把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化,它决定了图像的幅度分辨率。第15页,课件共80页,创作于2023年2月量化的方法包括:分层量化、均匀量化和非均匀量化。分层量化是把每一个离散样本的连续灰度值只分成有限多的层次。均匀量化是把原图像灰度层次从最暗至最亮均匀分为有限个层次,如果采用不均匀分层就称为非均匀量化。第16页,课件共80页,创作于2023年2月(a)量化(b)量化为8bit量化示意图第17页,课件共80页,创作于2023年2月(a)256级灰度图象(b)子图(c)子图对应的量化数据图像量化实例(a)(b)(c)第18页,课件共80页,创作于2023年2月对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差。量化级数最小的极端情况就是二值图像,图像会出现假轮廓。采样点数和量化级数的关系:第19页,课件共80页,创作于2023年2月

(a)采样点256×256时的图像(b)采样点64×64时的图像(c)采样点32×32时的图像(d)采样点16×16时的图像

采样点数与图像质量之间的关系(a)(b)(c)(d)第20页,课件共80页,创作于2023年2月(a)量化为2级的Lena图像(b)量化为16级的Lena图像(c)量化为256级的Lena图像

量化级数与图像质量之间的关系第21页,课件共80页,创作于2023年2月第22页,课件共80页,创作于2023年2月灰度直方图灰度直方图是灰度值的函数,它描述了图像中各灰度值的像素个数。通常用横坐标表示像素的灰度级别,纵坐标表示对应的灰度级出现的频率(像素的个数)。频率的计算公式为:p(r)=nrnr是图像中灰度为r的像素数。第23页,课件共80页,创作于2023年2月常用的直方图是规格化和离散化的,即纵坐标用相对值表示。设图像总像素为N,某一级灰度像素数为nr,则直方图表示为:p(r)=nr/N第24页,课件共80页,创作于2023年2月直方图表明每一个灰度有多少个象素第25页,课件共80页,创作于2023年2月灰度直方图反映了一幅图像的灰度分布情况。

(a)(b)(a)大多数像素灰度值取在较暗区域,图像肯定较暗.一般在摄影过程中曝光过弱就会造成这种结果。(b)图像的像素灰度值集中在亮区,图像将偏亮.一般在摄影中曝光太强将导致这种结果。从两幅图像的灰度分布来看图像的质量均不理想。第26页,课件共80页,创作于2023年2月灰度直方图的性质空间信息丢失第27页,课件共80页,创作于2023年2月整个图像的直方图是部分之和概率分布函数积分灰度直方图可以得到图象的面积:通过除以图象的面积来归一化灰度图象的概率密度函数(PDF)--与图象本身的象素个数无关。对面积函数进行同样的归一化处理可得到图象的累积分布函数(CDF)第28页,课件共80页,创作于2023年2月灰度直方图的应用1.数字化参数

观察直方图可以看出不合适的数字化第29页,课件共80页,创作于2023年2月边界阈值选择第30页,课件共80页,创作于2023年2月计算图像中物体的面积第31页,课件共80页,创作于2023年2月计算图像信息量H(熵)熵反映了图像的平均信息量灰度范围为[0,L-1],各灰度级出现概率Pi。各灰度级具有的信息量分别为-log2Pi第32页,课件共80页,创作于2023年2月2.5数字图像处理算法的形式1基本功能形式按图像处理的输出形式:单幅图像单幅图像多幅图像单幅图像单(多)幅图像数字或符号等第33页,课件共80页,创作于2023年2月2几种具体算法局部处理邻域——4邻域、8邻域点处理大局处理第34页,课件共80页,创作于2023年2月迭代处理反复对图像进行某种运算直到满足给定的条件,从而得到输出图像的处理形式跟踪处理对某个象素的处理依赖于以前的处理结果限定处理范围用于边界线、等高线等的跟踪第35页,课件共80页,创作于2023年2月窗口处理和模板处理对图象中选定矩形区域内的象素进行处理单独对图像任意形状的区域进行处理准备和输入图像相同大小的二维数组,存储该区域信息;参照二维数组对图像进行处理。任意形状的区域称作模板二维数组称作模板平面第36页,课件共80页,创作于2023年2月串行处理和并行处理后一象素输出结果依赖于前面象素的处理结果,且只能依次处理各象素而不能同时对各象素进行处理对图像内的各象素同时进行相同形式运算第37页,课件共80页,创作于2023年2月2.6图像的数据结构与图像文件格式1图像的数据结构组合方式一般一个象素的灰度占一个字节组合方式是一个字长存放多个象素灰度值节省内存计算量增加、处理程序复杂第38页,课件共80页,创作于2023年2月比特面方式对图像各象素灰度按比特位存取所有象素灰度的相同比特位用一个二维数组表示,形成比特面能充分利用内存空间对灰度图像处理耗时多第39页,课件共80页,创作于2023年2月分层结构由原始图像开始构成象素越来越少的系列图像锥形结构树结构对一幅二值图像的行、列接连不断二等分,若图像被分割部分中的全部象素都变成具有相同的特征,不再分割。特征提取、信息压缩第40页,课件共80页,创作于2023年2月多重图像数据存储多波段图像逐波段存储逐行存储逐象素存储第41页,课件共80页,创作于2023年2月数字图像的基本类型计算机一般采用两种方式存储静态图像:位映射(Bitmap),即位图存储模式;向量处理(Vector),也称矢量存储模式。位图也称为栅格图像,是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。矢量图只存储图像内容的轮廓部分,而不是存储图像数据的每一点。第42页,课件共80页,创作于2023年2月

二值图像二值图像也叫黑白图像,就是图像像素只存在0,1两个值。二进制的lenna图像第43页,课件共80页,创作于2023年2月

灰度图像灰度图像是包含灰度级的图像,如64级,256级等。如当像素灰度级用8bit表示时,每个像素的取值就是256种灰度中的一种,即每个像素的灰度值为0到255中的一个。通常,用0表示黑,255表示白,从0到255亮度逐渐增加。第44页,课件共80页,创作于2023年2月索引图像索引图像把像素值直接作为索引颜色的序号。根据索引颜色的序号就可以找到该像素的实际颜色。当把索引图像读入计算机时,索引颜色将被存储到调色板中。调色板是包含不同颜色的颜色表,每种颜色以红,绿,蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色,相应的调色板就有256个单元。第45页,课件共80页,创作于2023年2月RGB彩色图像RGB图像是一类图像的总称。这类图像不使用单独的调色板,每一个像素的颜色由存储在相应位置的红、绿、蓝颜色分量共同决定。RGB图像是24位图像,红、绿、蓝分量分别占用8位,理论上可以包含16M种不同的颜色。第46页,课件共80页,创作于2023年2月

数字图像的基本文件格式每一种图像文件均有一个文件头,在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIFF文件以及GIF文件等。第47页,课件共80页,创作于2023年2月BMP图像文件格式第48页,课件共80页,创作于2023年2月第一部分为位图文件头BITMAPFILEHEADER,它是一个结构体,其定义如下:typedefstructtagBITMAPFILEHEADER{WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits;}BITMAPFILEHEADER;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。第49页,课件共80页,创作于2023年2月第二部分为位图信息头BITMAPINFOHEADER,也是一个结构,其定义如下:typedefstructtagBITMAPINFOHEADER{DWORD biSize;

LONG biWidth;

LONG biHeight;

WORD biPlanes;

WORD biBitCount;

DWORD biCompression;

DWORD biSizeImage;

LONG biXPelsPerMeter;LONG biYPelsPerMeter;

DWORD biClrUsed;

DWORD biClrImportant;

}BITMAPINFOHEADER;第50页,课件共80页,创作于2023年2月

这个结构的长度是固定的,为40个字节(LONG为32位二进制整数)。其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS。第51页,课件共80页,创作于2023年2月第三部分为调色板(Palette)。真彩色图像不需要调色板。调色板实际上是一个数组,共有biClrUsed个元素。数组中每个元素的类型是RGBQUAD结构,占4个字节,其定义如下:typedefstructtagRGBQUAD{BYTErgbBlue; //该颜色的蓝色分量

BYTErgbGreen; //该颜色的绿色分量

BYTErgbRed; //该颜色的红色分量

BYTErgbReserved; //保留值}RGBQUAD;第52页,课件共80页,创作于2023年2月第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。对于16色位图,用4位可以表示一个像素的颜色,所以1个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。第53页,课件共80页,创作于2023年2月TIFF图像文件格式标记图像文件格式TIFF(TagImageFileFormat)是目前图像文件格式中最复杂的一种,也是目前流行的图像文件交换标准之一。TIFF格式文件的设计考虑了扩展性、方便性和可修改性,因此非常复杂,要求用更多的代码来控制它,结果导致文件读写速度慢,TIFF代码也很长。TIFF文件由文件头、参数指针表与参数域、参数数据表和图像数据4部分组成。第54页,课件共80页,创作于2023年2月参数指针由一个2字节的整数和其后的一系列12字节参数域构成,最后以一个长整型数结束。若最后的长整型数为0,表示文件的参数指针表到此为止,否则该长整数为指向下一个参数指针表的偏移。

第55页,课件共80页,创作于2023年2月第56页,课件共80页,创作于2023年2月GIF图像文件格式GIF(GraphicsInterchangeFormat)文件的全称是图形交换文件格式。该形式存储的文件主要是为不同的系统平台交流和传输图像提供方便,是在Web及其他联机服务上常用的一种文件格式,用于HTML文档中的索引颜色图像。图像最大不能超过64M,颜色最多为256色。GIF图像文件采取LZW压缩算法,存储效率高,支持多幅图像定序或覆盖,交错多屏幕绘图以及文本覆盖。GIF主要是为数据流而设计的一种传输格式,而不是作为文件的存储格式。第57页,课件共80页,创作于2023年2月GIF有五个主要部分以固定顺序出现,所有部分均由一个或多个块(block)组成。每个块第一个字节中存放标识码或特征码标识。这些部分的顺序为:文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块(调色板)、各图像数据块(或专用的块)以及尾块(结束码)。第58页,课件共80页,创作于2023年2月第59页,课件共80页,创作于2023年2月PCX图像文件格式PCX文件格式由ZSoft公司设计,是最早使用的图像文件格式之一。PCX支持256种颜色,结构较简单,存取速度快,压缩比适中,适合于一般软件的使用。PCX格式支持RGB、索引颜色、灰度和位图颜色模式,支持RLE压缩方法,图像颜色的位数可以是1、4、8或24。PCX图像文件由三个部分组成:文件头、图像数据和256色调色板。第60页,课件共80页,创作于2023年2月JPEG图像格式JPEG(JointPhotographer’sExpertsGroup)即静止图像压缩标准,是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。JPEG格式支持24位颜色,并保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。第61页,课件共80页,创作于2023年2月2.7图像的特征与噪声1.特征类别自然特征光谱特征不同类型景物在各个波段的数字成像,构成数字图象光谱特征几何特征空间分辨率、图像文理结构、图像变形时相特征不同时间获取同一目标的各图像间存在差异第62页,课件共80页,创作于2023年2月人工特征直方图特征灰度边缘特征角点与线特征纹理特征第63页,课件共80页,创作于2023年2月实际应用中,按描述特征范围大小分为:点特征局部特征区域特征整体特征第64页,课件共80页,创作于2023年2月2特征提取与特征空间获取图像特征信息的操作——特征提取特征向量特征空间第65页,课件共80页,创作于2023年2月3图像噪声妨碍人的视觉器官或系统传感器对所接收图像信息进行理解或分析的各种因素。图像噪声种类产生原因外部噪声内部噪声光电的基本性质引起的机械运动产生的元器件噪声系统内部电路噪声第66页,课件共80页,创作于2023年2月统计理论平稳噪声非平稳噪声噪声幅度分布形态正态分布的高斯型瑞利分布的锐利噪声脉冲噪声频谱分布形态频谱均匀分布的白噪声频谱能量呈正态分布的高斯噪声产生过程量化噪声和椒盐噪声第67页,课件共80页,创作于2023年2月噪声的特征常用统计特征来描述噪声均值方差总功率第68页,课件共80页,创作于2023年2月噪声模型加性噪声模型噪声和图像光强大小无关乘性噪声模型噪声和图像光强大小相关,随亮度大小变化而变化第69页,课件共80页,创作于2023年2月图像系统常见的噪声光电管噪声通常噪声频谱是白噪声摄像管噪声前置放大器噪声光学噪声第70页,课件共80页,创作于2023年2月2.8用VC++实现BMP图像文件的显示本节介绍如何在VC++6.0中编程实现BMP图像的显示。下面介绍具体步骤:第71页,课件共80页,创作于2023年2月步骤一、打开VC++6.0,选择File|New进入界面在Projects中选择MFCAppWinzard(exe),在Projectname中输入项目名称,本例为ReadBMP,在Location中输入项目要保存的文件夹。点击“OK”进入下一步。第72页,课件共80页,创作于2023年2月步骤二、选择文档类型在本例中使用的是单文档视图结构,所以这里选择Singledocument。其余部分设置使用VC++6.0的默认设置,点击“Finish”完成项目创建。第73页,课件共80页,创作于2023年2月步骤三、为了将BMP中的数据读入到内存中,在项目中建立专门处理BMP文件头和数据的文件:DIBAPI.H和DIBAPI.CPP,在其中实现对BMP文件的大部分处理。选择File|New从弹出界面Files选项中选择C/C++HeaderFile,建立一个新的头文件。在右边的File输入框中输入文件名,这里命名为DIBAPI,默认后缀为.H。第74页,课件共80页,创作于2023年2月同上类似,选择C++SourceFile

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论