第七章 计算机图像处理基础_第1页
第七章 计算机图像处理基础_第2页
第七章 计算机图像处理基础_第3页
第七章 计算机图像处理基础_第4页
第七章 计算机图像处理基础_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章计算机图像处理基础第一页,共八十四页,2022年,8月28日本章要点:介绍计算机图像处理的基本内容和方法介绍计算机图像增强的基本方法介绍图像复原、重建、分割及图像特征提取的概念本章学习目标:掌握BMP格式文件的存储和读取了解空域增强与频域增强的基本原理掌握图像锐化的方法2第二页,共八十四页,2022年,8月28日7.1概论数字图像处理(DigitalImageProcessing)是指用计算机对数字图像进行的处理,因此也称为计算机图像处理(CompeerImageProcessing)。计算机图像处理主要有两个目的:其一,为了便于分析而对图像信息进行改进;其二,为使计算机自动理解而对图像数据进行存储、传输及显示。3第三页,共八十四页,2022年,8月28日数字图像处理的发展图像是人类获取信息、表达信息和传递信息的重要手段。因此,数字图像处理技术已经成为信息科学、计算机科学、工程科学、地球科学等诸多方面的学者研究图像的有效工具。数字图像处理发展历史并不长,起源于20世纪20年代。当时,人们通过Bartlane海底电缆图像传输系统,从伦敦到纽约传输了一幅经过数字压缩后的照片,从而把传输时间从一周多缩短至3小时。为了传输图片,该系统首先在传输端进行图像编码,然后在接收端用特殊打印设备重构该图片。尽管这一应用已经包含了数字图像处理的知识,但还称不上真正意义的数字图像处理,因为它没有涉及计算机。数字图像处理的历史与计算机的发展密切相关,数字图像处理的真正历史是从数字计算机的出现开始的。数字图像处理技术在20世纪60年代末70年代初开始用于医学图像、地球遥感监测和天文学等领域。其后军事、气象、医学等学科的发展也推动了图像处理技术迅速发展。4第四页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念数字图像处理相关的基本概念包括图像、数字图像和数字图像处理,以及数字图像的基本组成单元——像素、灰度。1.数字图像及其组成要素图像是对客观对象的一种相似性的、生动的描述或表示。在其自然的形式下图像并不能直接由计算机进行分析。从人眼的视觉特点看,图像分为可见图像和不可见图像。其中可见图像又包括生成图(通常称为图形和图片)和光图像两类。图形侧重于根据给定的物体描述模型、光照及想象中的摄像机的成像几何,生成一幅图或像的过程。光图像侧重于用透镜、光栅和全息技术产生的图像。我们通常所指的图像是后一类图像。不可见的图像包含不可见光成像和不可见量,如温度、压力及人口密度的分布图等。5第五页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念按波段多少,图像可分为单波段、多波段和超波段图像。单波段图像在每个点只有一个亮度值;多波段图像上每一个点不止一个特性,例如红、绿、蓝三波段光谱图像或彩色图像在每个点具有红、绿、蓝三个亮度值,这三个值表示在不同光波段上的强度,人眼看来就是不同的颜色;超波段图像上每个点具有几十或几百个特性,如遥感图像等。按图像空间坐标和明暗程度的连续性,图像可分为模拟图像和数字图像。模拟图像指空间坐标和明暗程度都是连续变化的、计算机无法直接处理的图像。数字图像是一种空间坐标和灰度均不连续的、用离散的数字表示的图像。这样的图像才能被计算机处理。因此,数字图像可以理解为图像的数字表示,是时间和空间的非连续函数(信号),是为了便于计算机处理的一种图像表示形式。它是由一系列离散单元经过量化后形成的灰度值的集合,即像素(pixel)的集合。6第六页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念2.图像处理对图像进行一系列的操作以达到预期目的的技术称作图像处理。图像处理可分为模拟图像处理和数字图像处理两种方式。利用光学、照相和电子学方法对模拟图像的处理称为模拟图像处理。人类最早的图像处理是光学的处理,如放大、缩小、显微等,这些都属于模拟图像的处理。这种处理最明显的特点是处理速度快。目前,许多军用、宇航的处理仍采用光学模拟处理。尽管光学图像处理理论日臻完善,且处理速度快,信息容量大,分辨率高,又非常经济,但处理精度不高、稳定性差、设备笨重、操作不方便和工艺水平不高等原因限制了它的发展速度。此外,由于其处理过程采用光学器件,如镜头、棱镜等,它的不灵活性就较为突出,而且一个光学器件从设计到加工直到成品需要很长时间,其加工过程也难以保证精度。7第七页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念所谓数字图像处理,就是利用计算机对数字图像进行系列操作,从而获得某种预期结果的技术。数字图像处理离不开计算机,因此又称计算机图像处理。“计算机图像处理”与“数字图像处理”可视为同义词。通常,也将数字图像处理简称为图像处理。在本书中,如无特殊说明,“图像处理”即指“数字图像处理”。图像处理的内容相当丰富,包括狭义的图像处理、图像分析与图像理解。狭义的图像处理着重强调在图像之间进行的变换,是一个从图像到图像的过程,是比较低层的操作。它主要在像素级进行处理,处理的数据量非常大。虽然人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要满足对图像进行各种加工,以改善图像的视觉效果,并为自动识别打基础,或对图像进行压缩编码,以减少所需存储空间或传输时间,达到传输通路的要求。8第八页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念3.图像分析图像分析主要是对图像中感兴趣的目标进行检测和测量,从而建立对图像的描述。图像分析是一个从图像到数值或符号的过程,主要研究用自动或半自动装置和系统,从图像中提取有用的测度、数据或信息,生成非图像的描述或表示。图像分析并不仅仅是给景物中的各个区域进行分类,还要对千变万化和难以预测的复杂景物加以描述。因此,图像分析常常依靠某种知识来说明景物中物体与物体、物体与背景之间的关系。利用人工智能技术在分析系统中进行各层次控制和有效地访问知识库,正在被越来越普遍地采用。图像分析的内容分为特征提取、符号描述、目标检测、景物匹配和识别等几个部分。图像分析是一个从图像到数据的过程。这里数据可以是对目标特征测量的结果,或是基于测量的符号表示。它们描述了图像中目标的特点和性质。因此图像分析可以看作是中层处理。9第九页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念4.图像理解图像理解是由模式识别发展起来的,该处理输入的是图像,输出的是一种描述。这种描述不仅仅是单纯的用符号做出详细的描绘,而且要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图像所表现的内容。图像理解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。如果说图像分析主要是以观察者为中心研究客观世界,那么图像理解在一定程度上则是以客观世界为中心,并借助知识、经验等来把握和解释整个客观世界。因此图像理解主要是高层操作,其处理过程和方法与人类的思维推理有许多类似之处。图像理解有时也叫景物理解。在这一领域还有相当多的问题需要进行深入研究。10第十页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念5.与相关学科的关系数字图像处理是一门系统地研究各种图像理论、技术和应用的新的交叉学科。从它的研究方法来看,与数学、物理学、生物学、心理学、电子学、计算机科学等许多学科可以相互借鉴;从它的研究范围来看,与模式识别、计算机视觉、计算机图形学等多个专业又互相交叉。图7-1给出了数字图像处理与相关学科和领域的联系和区别。另外,数字图像处理的研究进展与人工智能、神经网络、遗传算法、模糊逻辑等理论和技术都有密切的联系,它的发展应用与医学、遥感、通信、文档处理和工业自动化等许多领域也是不可分割的。11第十一页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念图7-1图像处理与相关学科的联系和区别从图7-1可以看到数字图像处理3个层次各自不同的输入输出内容以及它们与计算机图形学、模式识别、计算机视觉等的关系。计算机图形学研究的是如何利用计算机技术来产生图形、图表、绘图等形式表达数据信息的科学。与图像分析相比,两者的处理对象和输出结果正好相反。12第十二页,共八十四页,2022年,8月28日7.1.2数字图像处理的相关概念计算机图形学试图从非图像形式的数据描述来生成逼真的图像。另一方面,模式识别与图像分析则比较相似,只是模式识别是试图把图像分解成可用符号较抽象地描述的方式。它们有相同的输入,而不同的输出结果可以比较方便地进行转换。计算机视觉则主要强调用计算机实现人的视觉功能,这中间实际上用到数字图像处理3个层次的许多技术,但目前的研究内容主要与图像理解相结合。

由此看来,以上学科互相联系,覆盖面有所重合。事实上这些名词也常混合使用,它们在概念上或实用中并没有明显的界限。在许多场合和情况下,它们只是专业和背景不同的人习惯使用的不同术语。它们虽各有侧重但常常是互为补充的。另外,以上各学科都得到了包括人工智能、神经网络、遗传算法、模糊逻辑等新理论、新工具、新技术的支持,因此,它们又都在近年得到了长足进展。总的来说,数字图像处理既能较好地将许多相近学科兼蓄并容,也进一步强调了图像技术的应用。13第十三页,共八十四页,2022年,8月28日数字图像处理方法数字图像的处理方法种类繁多,根据不同的分类标准可以得到不同的分类结果,例如根据对图像作用域的不同,数字图像处理方法大致可分为两大类,即空域处理方法和变换域处理方法。1. 空域处理方法空域处理方法是指在空间域内直接对数字图像进行处理。在处理时,既可以直接对图像各像素点进行灰度上的变换处理,也可以对图像进行小区域模板的空域滤波等处理,以充分考虑像素邻域像素点对其的影响。一般来说,空间域处理算法的结构并不算太复杂,处理速度也还是比较快的。这种方法是把图像看作是平面中各个像素组成的集合,然后直接对这一二维函数进行相应的处理。空域处理法主要有以下两大类:14第十四页,共八十四页,2022年,8月28日数字图像处理方法(1)领域处理法邻域处理法是对图像像素的某一邻域进行处理的方法。如均值滤波法、梯度运算、拉普拉斯算子运算、平滑算子运算和卷积运算。(2)点处理法点处理法是指对图像像素逐一处理的方法。例如,利用像素累积计算某一区域面积或某一边界的周长等。15第十五页,共八十四页,2022年,8月28日数字图像处理方法2. 变换域处理方法数字图像处理的变换域处理方法首先是通过傅里叶变换、离散余弦变换、沃尔什变换或是比较新的小波变换等变换算法,将图像从空间域变换到相应的变换域,得到变换域系数阵列,然后在变换域中对图像进行处理,处理完成后再将图像从变换域反变换到空间域,得到处理结果。由于变换域的作用空间比较特殊,不同于以往的空域处理方法,因此可以实现许多在空间域中无法完成或是很难实现的处理,广泛用于滤波、编码压缩等方面。由于各种变换算法在把图像从空间域向变换域进行变换以及反变换中均有相当大的计算量,所以目前虽然也有许多快速算法,但变换域处理算法的运算速度仍受变换和反变换处理速度的制约而很难提高。这类处理包括滤波、数据压缩及特征提取等。16第十六页,共八十四页,2022年,8月28日数字图像处理的主要研究内容数字图像处理概括地讲主要包括如下几项内容:图像变换,图像增强,图像编码与压缩,图像复原,图像重建,图像识别以及图像理解。1. 图像变换图像变换是图像处理和图像分析的一个重要分支,它是将图像从空间域(二维平面)变换到另一个域(如频率域),然后在变换域对图像进行处理和分析。变换的目的是根据图像在变换域的某些性质对其进行加工处理,而这些性质在空间域很难甚至无法获取,然后将处理结果再反变换到空间域。图像变换是许多图像处理和图像分析技术的基础,是图像增强、图像复原的基本工具,也是图像特征提取的重要手段。多年来,变换理论自身的发展为信号处理和图像处理提供了强有力的支持和重要手段。常用的图像变换有傅里叶变换、DCT变换、小波变换等。17第十七页,共八十四页,2022年,8月28日数字图像处理的主要研究内容2. 图像增强图像增强处理是指根据一定的要求,突出图像中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强的信息处理方法。根据增强处理过程所在的空间不同,图像增强技术可分为基于空间域的增强方法和基于频率域的增强方法两类。前者直接在图像所在的二维空间进行处理,即直接对每一像元的灰度值进行处理;后者则是先将图像从空间域按照某种变换模型(如傅里叶变换)变换到频率域,然后再频率域空间对图像进行处理,再将其反变换到空间域。图像增强的主要方法有直方图增强法、空域滤波法、频率域滤波法以及彩色增强法等。18第十八页,共八十四页,2022年,8月28日数字图像处理的主要研究内容3. 图像编码与压缩二维形式呈现的数字图像,其信息量很大,给传输、处理、存储、显示等都带来了不少问题。图像编码就是利用图像信号的统计特性及人类视觉的生理学和心理学特性,对图像信号进行高效编码,以解决数据量大的矛盾。一般来说,图像编码的目的有3个:1、尽量减少表示数字图像时需要的数据量;2、降低数据量以减少传输带宽;3、压缩信息量,便于特征抽取,为识别作准备。根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无误差编码和有误差编码两大类。根据编码方法作用域不同,图像编码又分为空间域编码和变换域编码两大类。19第十九页,共八十四页,2022年,8月28日数字图像处理的主要研究内容4. 图像复原图像复原,也叫图像恢复。其目的是找出图像降质的起因,并尽可能消除它,使图像恢复本来面目。常用的恢复有纠正几何失真、从已知图像信号和噪声的统计特性入手,用Wiener滤波等方法来改善信噪比等。典型的例子如去噪就属于复原处理。去模糊也是复原处理的任务。这些模糊来自透镜散焦、相对运动、大气湍流以及云层遮挡等。这些干扰可用维纳滤波、逆滤波、同态滤波等方法加以去除。20第二十页,共八十四页,2022年,8月28日数字图像处理的主要研究内容5. 图像重建几何处理、图像增强、图像复原都是从图像到图像的处理,即输入的原始数据是图像,处理后输出的也是图像,而重建处理则是从数据到图像的处理。也就是说输入的是某种数据,而处理结果得到的是图像。该处理的典型应用就是CT技术。图像重建的主要算法有代数法、迭代法、傅里叶反投影法、卷积反投影法等,其中以卷积反投影法运用最为广泛。值得注意的是三维重建算法发展得很快,而且由于与计算机图形学相结合,可以把多个二维图像合成三维图像,并加以光照模型和各种渲染技术,从而生成各种具有强烈真实感及纯净的高质量图像。三维重建技术是当今颇为热门的虚拟现实和科学可视化技术的基础。21第二十一页,共八十四页,2022年,8月28日7.2基于MATLAB的图像处理1. MATLAB基础

MATLAB是一个交互式系统,其基本数据元素是无需定义的数组。与高级语言相比,它只需极少的代码就可以解决众多的数值问题。因此,特别适合解决需要矩阵运算的工程问题,在数字图像处理领域有重要的用途。MATLAB是一种面向数组(array)的编程语言,其数据类型的最大特点是每一种类型都以数组为基础,从数组中派生出来。事实上,MATLAB把每种类型的数据都作为数组来处理。MATLAB有6种基本的数据类型,即:字符(char)、双精度数值(double)、稀疏数据(sparse)、存储型(storage)、单元数组(cell)和结构(struct)。数据类型间的关系如图7-2所示。7.2.1MATLAB简介22第二十二页,共八十四页,2022年,8月28日7.2.1MATLAB简介图7-2MATLAB的数据结构在图7-2中,存储型是一个虚拟数据类型,是MATLAB5.3版以后新增的定义,它包括int8(8位整型)、uint8(无符号8位整型)、int16(16位整型)、uint16(无符号16位整型)、int32(32位整型)和uint32(无符号32位整型)。23第二十三页,共八十四页,2022年,8月28日7.2.1MATLAB简介最常用的数据类型只有双精度型和字符型,所有MATLAB计算都把数据当作双精度型处理。其他数据类型只在一些特殊条件下使用。例如,无符号8位整型一般用于储存图像数据;单元数组和结构数组一般用在大型程序中;稀疏数据一般用于处理电路、医学、有限元素法及偏微分方程中出现的稀疏矩阵(一个矩阵中,如果包含许多零元素,此矩阵即可称为稀疏矩阵)。存储型数组一般只用于内存的有效储存,可对这些类型的数组进行操作,但不能进行任何数学运算,否则必须使用double函数把它转换为双精度类型。24第二十四页,共八十四页,2022年,8月28日2. MATLAB的运行

MATLAB有两种常用的工作模式:一种是在命令窗口中直接输入简单的命令;另一种是.m文件的编程工作方式。前者适用于命令行这种比较简单的情形,而后者则适用于进行大量的复杂计算的情形。图7-3是MATLAB启动后桌面布置方式的默认设置,包含1个工具栏、3个区域、5个工作窗口,这5个工作窗口分别为发射台(LaunchPad)、工作区(Workspace)、命令历史(CommandHistory)、当前路径(CurrentDirectory)和命令窗口(CommandWindows)。MATLAB的工作窗口是一个标准的Windows界面,可以利用菜单命令完成对工作窗口的操作,使用方法与一般的Windows应用程序相同。其中最为重要的是命令窗口,如图7-3中最右端的子窗口所示。7.2.1MATLAB简介25第二十五页,共八十四页,2022年,8月28日图7-3MATLAB工作环境7.2.1MATLAB简介26第二十六页,共八十四页,2022年,8月28日(1)命令行输入方式MATLAB是以矩阵为基本运算单元的,因此,以矩阵的乘法运算为例介绍MATLAB命令行输入的工作模式。【例7-1】求解矩阵A=乘以矩阵B=的结果。在MATLAB命令窗口(commandwindows)内提示符号()之后输入如下表达式,并按下Enter键即可:7.2.1MATLAB简介27第二十七页,共八十四页,2022年,8月28日MATLAB会将运算结果直接存入默认变量ans,代表MATLAB运算后的答案(answer),并在屏幕上显示其运算结果。若不想让MATLAB每次都显示运算结果,只需在表达式最后加上分号(;)即可。此时MATLAB只会将运算结果直接存入默认变量ans内,而不会显示在屏幕上。使用者也可以将运算结果储存于自己设定的变量C内,如键入如下表达式回车。7.2.1MATLAB简介28第二十八页,共八十四页,2022年,8月28日MATLAB会直接输出矩阵相乘的结果。7.2.1MATLAB简介通过这一例子可以发现:一般高级语言需要编写4次循环才能求的矩阵乘法,在MATLAB中只需使用一行代码。由此可以看到MATLAB在矩阵运算方面的强大功能,这为图像处理提供了丰富、准确、快捷的运行环境。29第二十九页,共八十四页,2022年,8月28日(2)m文件的编程工作方式MATLAB提供了m文件编辑器作为编制和调试m文件的工作界面。在MATLAB的运行环境中,用鼠标单击菜单栏上的[File][open]命令,选择[m-file]项,或者直接单击工具栏的[新建]按钮,进入MATLAB的m文件编辑器,如图7-4所示。7.2.1MATLAB简介图7-4MATLAB的m文件编辑器30第三十页,共八十四页,2022年,8月28日利用m文件可以自编函数和命令,也可以对已经存在的函数和命令进行修改和扩充,因此对MATLAB的二次开发非常方便。在MATLAB中,m文件有两种形式,一种是命令文件(脚本文件script-file);另一种是函数文件(function-file)。下面将通过具体实例较为详细地说明命令文件(脚本文件)的建立和运行。【例7-2】建立命令文件,并绘制宝石项链图。

(1)进入MATLAB的m文件编辑器

(2)在编辑器窗口中输入文件内容:t=(0:0.02:2)*pi;%(0:0.02:2)表示(0,2)之间以0.02为间隔的向量x=sin(t);y=cos(t);z=cos(2*t);7.2.1MATLAB简介31第三十一页,共八十四页,2022年,8月28日plot3(x,y,z,'b-',x,y,z,'bd')view([-80,60])boxonlegend('链子','宝石');(3)单击[Fi1e]->[save]命令,将所写文件自动保存在磁盘目录D:\MATLAB\work上,并取名为diamond.m。(4)在MATLAB命令窗口中直接输入文件名diamond回车,运行结束后即可得到如图7-5所示的宝石项链图。7.2.1MATLAB简介32第三十二页,共八十四页,2022年,8月28日图7-5用MATLAB绘制的宝石项链图7.2.1MATLAB简介33第三十三页,共八十四页,2022年,8月28日计算机编程语言允许程序员根据某些结构来控制程序的执行次序。MATLAB和大多数计算机语言一样,提供了设计程序所必需的程序结构,即顺序结构、循环结构和分支结构。在MATLAB中,循环结构由for-end循环语句和while-end循环语句实现,分支结构由if-end语句和switch-case-end实现。现仅以if-end语句为例,说明它的具体用法。【例7-3】绘制函数的图形。其程序为:%-----------------------------------------------------7.2.1MATLAB简介34第三十四页,共八十四页,2022年,8月28日forx=-3:0.01:3,ifx>=1,y=8*x^2+1;holdon;plot(x,y);elseif-1<=x,y=0;holdon;plot(x,y);else,y=-x^3;holdon;plot(x,y);endend7.2.1MATLAB简介35第三十五页,共八十四页,2022年,8月28日%-----------------------------------------------------其执行结果如图7-6所示。图7-6用MATLAB绘制的图形7.2.1MATLAB简介36第三十六页,共八十四页,2022年,8月28日3. MATLAB图像处理功能

MATLAB提供了强大的矩阵运算功能。如特征值和特征向量计算、矩阵求逆等都可以直接通过MATLAB提供的函数求出。MATLAB还提供了许多用于小波分析、图像处理、信号处理、虚拟现实、神经网络等的工具包。其中,图像处理工具包提供了许多可用于图像处理的相关函数。按功能可以分为以下几类:图像显示,图像文件输入与输出,几何操作,像素值和统计,图像分析与增强,图像滤波,线性二维滤波器设计,图像变换,领域和块操作,二值图像操作,颜色映射和颜色空间转换,图像类型和类型转换,工具包参数获取和设置等。常用的函数包括如下几种。(1)函数名:uint8格式:uint8(A);功能:将数据A转换为8位无符号整数类型数据7.2.1MATLAB简介37第三十七页,共八十四页,2022年,8月28日例如:watermarked_image_uint8=uint8(watermarked_image_round);(2)函数名:double格式:double(A);

功能:将数据A转换为64位双精度浮点类型数据例:double(imread('lena.bmp'));在MATLAB中,灰度图像由一个uint8、uint16或一个双精度类型double的数组来描述。由于MATLAB不支持uint8类型数据的矩阵运算,所以在进行某些图像点运算处理时,首先要将图像数据转换为双精度类型参加运算,计算完以后再将其转换为uint8类型存储或显示图像。7.2.1MATLAB简介38第三十八页,共八十四页,2022年,8月28日(3)函数名:imread格式:imread(‘文件名’,文件格式)功能:读取图像文件数据例:Z=imread('lena.bmp')

其功能为将文件格式为bmp的图像文件lena.bmp图像数据读取出来,并作为无符号8位整型数据(unit8)放入二维数组变量Z中。(4)函数名:imwrite格式:imwrite(A,‘文件名’,文件格式)功能:保存图像文件数据例:imwrite(ZA,'watermarked.bmp','bmp')其功能为将变量ZA中的图像数据写入文件名为watermarked.bmp的文件中,保存格式为bmp。7.2.1MATLAB简介39第三十九页,共八十四页,2022年,8月28日(5)函数名:imshow格式:imshow(I,[LOWHIGH])功能:显示灰度图像例:imshow(ZA,[])其功能为显示灰度图像ZA,并指定灰度级范围[LOWHIGH],若如不确定数据的范围[LOWHIGH],可使用空矢量作为参数显示图像,即imshow(ZA,[])。Imread、imwrite、imshow可以将格式为bmp的图像文件转换为只含图像数据的矩阵,也可以将处理过的数据矩阵转换成图像文件,并能对处理前后的图像文件进行显示,因而,可以很方便地用于数字图像中数字水印的嵌入与检测。7.2.1MATLAB简介40第四十页,共八十四页,2022年,8月28日(6)函数名:subplot格式:subplot(m,n,p)功能:将一个图形窗口划分为多个显示区域例:subplot(2,2,1);其功能将图形窗口划分为2×2个矩形显示区域,并激活第1个显示区域,常与imshow函数并用可以将多幅图像显示在同一个单独的图形窗口中。(7)函数名:fft2功能:对矩阵A做二维快速傅立叶变换格式:B=fft2(A,[M,N])其中,A表示要变换的矩阵,M和N是可选参数,通过补0元素或截取多余元素,使A成为M×N阶矩阵,然后计算其二维FFT。B表示变换后得到的二维FFT系数矩阵。7.2.1MATLAB简介41第四十一页,共八十四页,2022年,8月28日(8)函数名:fftshift格式:B=fftshift(A)功能:把傅立叶变换结果中的直流分量移到中间位置若A为向量,则fftshift将其左、右半部互换,若A为矩阵,则交换A的1,3象限和2,4象限。对多维阵列,fftshift对每一维的两个“半空间”进行交换。fftshift常用于FFT结果的可视化。(9)函数名:ifft2格式:A=ifft2(B,[M,N])功能:对矩阵B做二维快速逆傅立叶逆变换其中,B表示要变换的矩阵,M和N是可选参数,通过补0元素或截取多余元素,使B成为M×N阶矩阵,然后计算其二维FFT。A表示经过二维傅立叶逆变换后的系数矩阵。7.2.1MATLAB简介42第四十二页,共八十四页,2022年,8月28日【例7-4】计算并显示图像的傅立叶变换FFT及逆变换IFFT。I=imread('lena.bmp');subplot(1,3,1),imshow(uint8(I));%显示原始图像J=fft2(I);%图像FFT变换B=fftshift(J);%显示FFT变换结果subplot(1,3,2),imshow(log(abs(B)),[]);H=ifft2(J);%使用逆变换复原图像并显示结果subplot(1,3,3),imshow(uint8(H));执行结果如图7-7所示。7.2.1MATLAB简介43第四十三页,共八十四页,2022年,8月28日(a)lena原图(b)经过FFT变换后的频谱图像(c)经IFFT后的图像图7-7原始图像与FFT和IFFT变换后的图像比较7.2.1MATLAB简介44第四十四页,共八十四页,2022年,8月28日(10)函数名:dct2格式:B=dct2(A,[M,N])功能:求矩阵A的DCT变换系数其中,A表示要变换的矩阵,M和N是可选参数,通过补0元素或截取多余元素,使A成为M×N阶矩阵,然后计算其二维离散余弦变换。B表示变换后得到的离散余弦变换系数矩阵。【例7-5】调用dct2函数计算二维图像的DCT系数并显示结果。由于离散余弦变换DCT会产生负系数,为了显示离散余弦变换DCT的系数幅值大小,可以使用绝对值函数abs(x)。程序代码如下:I=imread('lena.bmp');J=dct2(I);%计算二维图像的DCT系数7.2.1MATLAB简介45第四十五页,共八十四页,2022年,8月28日subplot(1,2,1),imshow(uint8(I));subplot(1,2,2),imshow(uint8(abs(J)));%显示二维图像的DCT系数的大小执行结果如图7-8所示。

(a)lena原图(b)经DCT变换后的图像图7-8离散余弦变换前后图像显示效果比较7.2.1MATLAB简介46第四十六页,共八十四页,2022年,8月28日在灰度图像中,0表示黑色,255表示白色。从图7-8(b)可以看出:图像经过全局DCT变换后,数值较大的DCT系数基本上都集中在左上角的低频分量中,数值较小的DCT系数大都集中在右下角的高频分量中。(11)函数名:idct2格式:A=idct2(B,[M,N])功能:计算逆DCT变换其中,B表示要变换的矩阵,M和N是可选参数,通过补0元素或截取多余元素,使B成为M×N阶矩阵,然后计算其二维离散余弦逆变换。A表示B经过二维离散余弦逆变换后得到的系数矩阵。7.2.1MATLAB简介47第四十七页,共八十四页,2022年,8月28日【例7-6】计算并显示图像的离散余弦变换DCT及逆变换IDCT。变换后的DCT系数的幅度值大部分较小(0代表黑色,如图7-9(b)所示),这就为图像压缩提供了一种途径。例如通过设置一个阈值,把绝对值小于的DCT系数置为0,即去掉一些微不足道的系数;再将这些处理过的DCT系数通过离散余弦变换生成重构图像;重构图像(图7-9(c))与原始图像(图7-9(a))往往不存在任何视觉差异。这样,通过上述对系数的处理就可极大地减少图像数据的存储、传输,完成图像的压缩。数字水印技术亦是如此。通过一定的算法,修改分解后的DCT系数,以达到其相应的保护目的。7.2.1MATLAB简介48第四十八页,共八十四页,2022年,8月28日(a)lena原图(b)经过DCT和IDCT(c)=10的重构图像(d)=100的重构图像后的图像图7-9原始图像与DCT和IDCT变换后的图像比较程序代码如下:I=imread('lena.bmp');subplot(1,4,1),imshow(uint8(I);)%显示原始图像J=dct2(I);%图像DCT变换7.2.1MATLAB简介49第四十九页,共八十四页,2022年,8月28日K=idct2(J);subplot(1,4,2),imshow(uint8(K));%使用逆变换复原图像J(abs(J)<10)=0;%将较小的系数设置为0M=idct2(J);subplot(1,4,3),imshow(uint8(M));%使用逆变换部分复原图像J(abs(J)<100)=0;%将较小的系数设置为0N=idct2(J);subplot(1,4,4),imshow(uint8(N));%使用逆变换部分复原图像(12)函数名:randrand函数共8种,与图像处理相关的主要有两种。因此仅对这两种做一个简要的介绍。格式:rand('state',J);rand(N,M)7.2.1MATLAB简介50第五十页,共八十四页,2022年,8月28日功能:rand(‘state’,J)将随机数生成器设置到第J个状态,其值可以任意设定。不同的状态J将生成不同的随机矩阵,而设定了相同的状态J,就可生成相同的随机数矩阵。rand(N,M)产生元素值在(0.0,1.0)内的N×M阶均匀分布随机矩阵。通常rand('state',J)与rand(N,M)联合使用。如在命令窗口输入如下表达式:回车后显示:B=0.23810.03880.93200.5062即通过表达式将随机数生成器的当前状态设定为J=7;表达式rand(1,4)根据当前的状态J的数值生成一个基于状态J的14的随机矩阵,其元素值在(0.0,1.0)内均匀分布。7.2.1MATLAB简介51第五十一页,共八十四页,2022年,8月28日ImageProcessingToolbox™(图像处理工具箱)提供一套全方位的参照标准算法和图形工具,用于进行图像处理、分析、可视化和算法开发。可进行图像增强、图像去模糊、特征检测、降噪、图像分割、空间转换和图像配准。该工具箱中的许多功能支持多线程,可发挥多核和多处理器计算机的性能。图像处理工具箱支持多种多样的图像类型,包括高动态范围、千兆像素分辨率、ICC兼容色彩和断层扫描图像。图形工具可用于探索图像、检查像素区域、调节对比度、创建轮廓或柱状图以及操作感兴趣区域(ROI)。工具箱算法可用于还原退化的图像、检查和测量特征、分析形状和纹理并调节图像的色彩平衡。7.2.2图像处理工具箱(ImageProcessingToolbox:ITP)简介52第五十二页,共八十四页,2022年,8月28日主要特性: 图像增强、滤波和去模糊 图像分析,其中包括分割、形态、特征提取和测量 空间转换和图像配准 图像变换,其中包括FFT、DCT、Radon和扇束投影 用于处理、显示和浏览任意大图像的工作流程 模块化交互式工具,其中包括ROI选择、柱状图和距离测量

ICC色彩管理 多维图像处理 图像序列和视频显示

DICOM导入和导出7.2.2图像处理工具箱(ImageProcessingToolbox:ITP)简介53第五十三页,共八十四页,2022年,8月28日7.3图像的获取,存储及表示计算机中的数字图像按其生成方法可以分为两大类,一类是从现实世界中通过数字化设备获取的图像,它们称为取样图像(sampledimage)、点阵图像(dotmatriximage)、位图图像(bitmapimage),以下简称图像(image);另一类是计算机合成的图像(syntheticimage),它们称为矢量图形(vectorgraphics),或简称图形(graphics)。从现实世界中获得数字图像的过程称为图像的获取(capturing),所使用的设备通称为图像获取设备。例如对印刷品、照片或照相底片等进行扫描输人,用数字相机或数字摄像机对选定的景物进行拍摄。图像的获取54第五十四页,共八十四页,2022年,8月28日图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤大体分为四步:(1)扫描。将画面划分为M×N个网格,每个网格称为一个取样点,用其亮度值来表示。这样,一幅模拟图像就转换为M×N个取样点组成的一个阵列。(2)分色。将彩色图像的取样点的颜色分解成3个基色(例如R,G,B三基色),如果不是彩色图像(即灰度图像或黑白图像),则每一个取样点只有一个亮度值。(3)取样。测量每个取样点的每个分量(基色)的亮度值(4)量化。对取样点的每个分量进行A/D转换,把模拟量的亮度值使用数字量(一般是8位至12位的正整数)来表示。通过上述方法所获取的数字图像称为取样图像(sampledimage),它是静止图像(stillimage)的数字化表示形式,通常简称为“图像”(image)。图像的获取55第五十五页,共八十四页,2022年,8月28日图7-10图像的数字化过程数字图像获取设备的功能是将现实的景物输人到计算机内并以取样图像的形式表示。2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化,3D扫描仪则能获取包括深度信息在内的3D景物的信息。图像的获取56第五十六页,共八十四页,2022年,8月28日BMP(Bitmap-File)图形文件是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持BMP图象文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。BMP位图文件默认的文件扩展名是BMP或者bmp。位图文件可看成由4个部分组成:位图文件头(bitmap-fileheader)、位图信息头(bitmap-informationheader)、彩色表(colortable)和定义位图的字节阵列。图形文件的所有数值在存储上都是按“高位放高位、低位放低位的原则”(littleendian),如12345678h放在存储器中就是78563412。下图是导出来的一个例子。424D4690000000000000460000002800000080000000900000000100*10000300000000900000A00F0000A00F00000000000000000000*00F80000E00700001F00000000000000*02F184F104F184F184F106F284F106F204F286F206F286F286F2……。7.3.2BMP文件格式57第五十七页,共八十四页,2022年,8月28日下面来看看位图文件(*.BMP)的格式,位图文件主要分为如下3个部分:表7-11、文件信息头BITMAPFILEHEADER结构体定义如下:typedefstructtagBITMAPFILEHEADER{/*bmfh*/UINTbfType; 7.3.2BMP文件格式块名称对应Windows结构体定义大小(Byte)文件信息头BITMAPFILEHEADER14位图信息头BITMAPINFOHEADER40RGB颜色阵列BYTE*由图像长宽尺寸决定58第五十八页,共八十四页,2022年,8月28日DWORDbfSize;UINTbfReserved1;UINTbfReserved2;DWORDbfOffBits;}BITMAPFILEHEADER;其中:表7-27.3.2BMP文件格式bfType说明文件的类型,该值必需是0x4D42,也就是字符'BM'。bfSize说明该位图文件的大小,用字节为单位bfReserved1保留,必须设置为0bfReserved2保留,必须设置为0bfOffBits说明从文件头开始到实际的图象数据之间的字节的偏移量。这个参数是非常有用的,因为位图信息头和调色板的长度会根据不同情况而变化,所以你可以用这个偏移值迅速的从文件中读取到位数据。59第五十九页,共八十四页,2022年,8月28日2、位图信息头BITMAPINFOHEADER结构体定义如下:typedefstructtagBITMAPINFOHEADER{/*bmih*/DWORDbiSize;LONGbiWidth;LONGbiHeight;WORDbiPlanes;WORDbiBitCount;DWORDbiCompression;DWORDbiSizeImage;LONGbiXPelsPerMeter;LONGbiYPelsPerMeter;7.3.2BMP文件格式60第六十页,共八十四页,2022年,8月28日DWORDbiClrUsed;DWORDbiClrImportant;}BITMAPINFOHEADER;其中:7.3.2BMP文件格式61第六十一页,共八十四页,2022年,8月28日表7-37.3.2BMP文件格式biSize说明BITMAPINFOHEADER结构所需要的字数。biWidth说明图象的宽度,以象素为单位。biHeight说明图象的高度,以象素为单位。注:这个值除了用于描述图像的高度之外,它还有另一个用处,就是指明该图像是倒向的位图,还是正向的位图。如果该值是一个正数,说明图像是倒向的,如果该值是一个负数,则说明图像是正向的。大多数的BMP文件都是倒向的位图,也就是时,高度值是一个正数。biPlanes为目标设备说明位面数,其值将总是被设为1。biBitCount说明比特数/象素,其值为1、4、8、16、24、或32。但是由于我们平时用到的图像绝大部分是24位和32位的,所以我们讨论这两类图像。biCompression说明图象数据压缩的类型,同样我们只讨论没有压缩的类型:BI_RGB。biSizeImage说明图象的大小,以字节为单位。当用BI_RGB格式时,可设置为0。biXPelsPerMeter说明水平分辨率,用象素/米表示。biYPelsPerMeter说明垂直分辨率,用象素/米表示。biClrUsed说明位图实际使用的彩色表中的颜色索引数(设为0的话,则说明使用所有调色板项)。biClrImportant说明对图象显示有重要影响的颜色索引的数目,如果是0,表示都重要。62第六十二页,共八十四页,2022年,8月28日3、RGB颜色阵列有关RGB三色空间我想大家都很熟悉,这里我想说的是在Windows下,RGB颜色阵列存储的格式其实BGR。也就是说,对于24位的RGB位图像素数据格式是:表7-4对于32位的RGB位图像素数据格式是:表7-57.3.2BMP文件格式蓝色B值绿色G值红色R值蓝色B值绿色G值红色R值透明通道A值63第六十三页,共八十四页,2022年,8月28日透明通道也称Alpha通道,该值是该像素点的透明属性,取值在0(全透明)到255(不透明)之间。对于24位的图像来说,因为没有Alpha通道,故整个图像都不透明。下一步要实现文件加载。加载文件的目的是要得到图片属性,以及RGB数据,然后可以将其绘制在DC上(GDI),或是生成纹理对象(3D:OpenGL/Direct3D)。这两种用途在数据处理上有点区别,我们主要按前一种用法讲,在和3D有不同的地方,我们再提出来。1、加载文件头

BITMAPFILEHEADERheader; memset(&header,0,sizeof(header)); inf.read((char*)&header,sizeof(header)); if(header.bfType!=0x4D42) returnfalse;7.3.2BMP文件格式64第六十四页,共八十四页,2022年,8月28日

2、加载位图信息头

BITMAPINFOHEADERinfoheader; memset(&infoheader,0,sizeof(infoheader)); inf.read((char*)&infoheader,sizeof(infoheader)); m_iImageWidth=infoheader.biWidth; m_iImageHeight=infoheader.biHeight; m_iBitsPerPixel=infoheader.biBitCount;这里我们得到了3各重要的图形属性:宽,高,以及每个像素颜色所占用的位数。7.3.2BMP文件格式65第六十五页,共八十四页,2022年,8月28日

3、行对齐。由于Windows在进行行扫描的时候最小的单位为4个字节,所以当图片宽X每个像素的字节数!=4的整数倍时要在每行的后面补上缺少的字节,以0填充(一般来说当图像宽度为2的幂时不需要对齐)。位图文件里的数据在写入的时候已经进行了行对齐,也就是说加载的时候不需要再做行对齐。但是这样一来图片数据的长度就不是:宽X高X每个像素的字节数了,我们需要通过下面的方法计算正确的数据长度:intiLineByteCnt=(((m_iImageWidth*m_iBitsPerPixel)+31)>>5)<<2;m_iImageDataSize=iLineByteCnt*m_iImageHeight;7.3.2BMP文件格式66第六十六页,共八十四页,2022年,8月28日

4、加载图片数据对于24位和32位的位图文件,位图数据的偏移量为sizeof(BITMAPFILEHEADER)+sizeof(BITMAPINFOHEADER),也就是说现在我们可以直接读取图像数据了。

if(m_pImageData)delete[]m_pImageData; m_pImageData=newunsignedchar[m_iImageDataSize]; inf.read((char*)m_pImageData,m_iImageDataSize);如果你足够细心,就会发现内存m_pImageData里的数据的确是BGR格式,可以用个纯蓝色或者是纯红色的图片测试一下。

7.3.2BMP文件格式67第六十七页,共八十四页,2022年,8月28日

5、绘制GDI绘制代码。voidCImage::DrawImage(HDChdc,intiLeft,intiTop,intiWidth,intiHeight){ if(!hdc||m_pImageData==NULL) return; BITMAPINFObmi; memset(&bmi,0,sizeof(bmi)); bmi.bmiHeader.biSize=sizeof(BITMAPINFO); bmi.bmiHeader.biWidth=m_iImageWidth;7.3.2BMP文件格式68第六十八页,共八十四页,2022年,8月28日 bmi.bmiHeader.biHeight=m_iImageHeight; bmi.bmiHeader.biPlanes=1; bmi.bmiHeader.biBitCount=m_iBitsPerPixel; bmi.bmiHeader.biCompression=BI_RGB; bmi.bmiHeader.biSizeImage=m_iImageDataSize; StretchDIBits(hdc,iLeft,iTop,iWidth,iHeight, 0,0,m_iImageWidth,m_iImageHeight, m_pImageData,&bmi,DIB_RGB_COLORS,SRCCOPY);}7.3.2BMP文件格式69第六十九页,共八十四页,2022年,8月28日

图像表示是图像信息在计算机中的表示和存储方式。图像表示和图像运算一起组成图像模型,是模式分析中的重要组成部分。更高一级的图像表示是描述图像中的物体和物体间的关系。这样一种图像常常称为逻辑图像。可以在图像信息的不同等级上对图像进行表示。最基本的物理图像是根据矩形网格抽样原理从连续图像域中抽取二维灰度阵列(矩阵)得到的。也可以用向量表示二维灰度矩阵,它是按列(或行)扫描灰度矩阵,把下一列(或行)的头和前一列(或行)的尾相接而成。它们的线性可逆变换同样可以用来表示图像。图像的每一行由行程序列所组成,因此也可以用行程长度编码表示图像。7.3.3图像的表示70第七十页,共八十四页,2022年,8月28日7.4常用的图像处理方法图像增强(imageenhancement)的目的是增强图象中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果。针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。图像增强可分成两大类:频率域法和空间域法。前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。具有代表性的空间域算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。7.4.1图像增强71第七十一页,共八十四页,2022年,8月28日常用的图像增强方法有:(1)直方图均衡化有些图像在低值灰度区间上频率较大,使得图像中较暗区域中的细节看不清楚。这时可以通过直方图均衡化将图像的灰度范围分开,并且让灰度频率较小的灰度级变大,通过调整图像灰度值的动态范围,自动地增加整个图像的对比度,使图像具有较大的反差,细节清晰。(2)对比度增强法有些图像的对比度比较低,从而使整个图像模糊不清。这时可以按一定的规则修改原来图像的每一个象素的灰度,从而改变图像灰度的动态范围。7.4.1图像增强72第七十二页,共八十四页,2022年,8月28日(3)平滑噪声有些图像是通过扫描仪扫描输入、或传输通道传输过来的。图像中往往包含有各种各样的噪声。这些噪声一般是随机产生的,因此具有分布和大小不规则性的特点。这些噪声的存在直接影响着后续的处理过程,使图像失真。图像平滑就是针对图像噪声的操作,其主要作用是为了消除噪声,图像平滑的常用方法是采用均值滤波或中值滤波,均值滤波是一种线性空间滤波,它用一个有奇数点的掩模在图像上滑动,将掩模中心对应像素点的灰度值用掩模内所有像素点灰度的平均值代替,如果规定了在取均值过程中掩模内各像素点所占的权重,即各像素点所乘系数,这时就称为加权均值滤波;中值滤波是一种非线性空间滤波,其与均值滤波的区别是掩模中心对应像素点的灰度值用掩模内所有像素点灰度值的中间值代替。7.4.1图像增强73第七十三页,共八十四页,2022年,8月28日(4)锐化平滑噪声时经常会使图像的边缘变的模糊,针对平均和积分运算使图像模糊,可对其进行反运算采取微分算子使用模板和统计差值的方法,使图像增强锐化。图像边缘与高频分量相对应,高通滤波器可以让高频分量畅通无阻,而对低频分量则充分限制,通过高通滤波器去除低频分量,也可以达到图像锐化的目的。7.4.1图像增强74第七十四页,共八十四页,2022年,8月28日图像模式识别就是分析图像内容,找出图像中有哪些东西。其步骤包括:(1)图像分割(物体分离),其任务是检测出各个物体,并把它们的图像和其余景物分离,(2)特征抽取:对物体进行度量,通过计算对物体的一些重要特性进行量化表示,(3)分类,目的是确定每个物体应该归属的类别。图像模式识别的应通非常广泛,如字符识别,有清华的尚书OCR识别软件,邮局信函自动分拣机。生物特征识别有指纹识别,人像识别等。遥感应用如卫星云图,地面导弹、飞机场等设施的卫星图像识别处理。医学辅助诊断如CT等图像的识别处理,辅助诊断等。图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分7.4.2图像模式识别75第七十五页,共八十四页,2022年,8月28日类,常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论