版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
利用常见数字图像处理方法对照片进行图像的预处理研究摘要从照片中得到的物体三维信息是多个学科相互交叉并且范围极其广大的研究领域,它已经广泛地涉及到了门类众多的基础理论和学科,而根据图像测距则是目前在这些研究领域中逐步发展起来的重要课题。经过对于图像中所有物体的辨识,用数字图像分割等技术寻找得到物体的三维轮廓,再依靠几何学的原理,对于照片中所有物体都进行三维轮廓重建来快速恢复一张照片中的目标或者是物体的三维轮廓信息。本文主要是利用常见数字图像处理方法对照片进行图像的预处理,如彩色照片灰度二值化、照片锐化、图像平滑处理、腐蚀膨胀、滤波去除噪声、轮廓提取等操作,对照片中的物体三维尺寸识别问题展开了技术性的探讨。关键词:边缘检测;轮廓提取;尺寸测量目录第一章引言 第一章引言近年来,随着计算机科学和计算机图形学的发展,图像处理倍受青睐,而照片之中由于携带着丰富的信息而深受研究者喜爱,在数字图像处理这个庞大的领域之中,图像处理技术在大小尺度测量和形态识别等技术上就有着广泛的应用前景。当照片从传统的光学成像进步到现代化的传感器成像,照片已经不再是存储在底片上的黑乎乎的灰度背影,而是演化成为了数字存储在存储器当中,随着传感器技术的不断进步,照片的清晰度也越来越高,被数字化的图像在存储器中存储为一个个的像素点,每一个像素点上保存着它的或灰度,或颜色,或明度等特征,最终再通过数模转换投影到手机电脑显示屏上提供给我们人类的视觉系统,也就是我们平时双眼所看到的“像”,我们人眼看到的身边的景物,那些或短暂或长期存留在我们大脑中的叫做模拟物像,而存储在存储器中的电子照片被称作数字图像。传统的照片可以被认为是用小孔成像原理“拍”出来的,但是有了计算机和传感器的出现,在近几年它们的飞速发展之下,我们不得不说,我们的照片不再是被拍摄出来的,可以说是用传感器的数字化感知计算得出的,计算机数字化进程的加快,物象越来越清晰,在拍摄技术和科学数字化发展的过程当中,数字化趋势是显而易见的。伴随着计算机视觉等图像数字化技术的发展,人们对物体尺寸信息的获取越来越方便。传统的三坐标测量机多采用的接触式测量,虽然可以相对准确地获得三维数据值,但是存在需要实地对物体进行操作,不利于测量,准确度较低而且速度也比较慢、这样一来还特别容易破坏物体的完整性,总之是存在着非常多的人为破坏因素等缺点,如果知道拍摄照片时相机的拍摄焦距,通过照片就能够测量出物体轮廓的三维尺寸,再通过物体轮廓的提取,坐标的建立,得出目标物体在照片中所占像素点多少,进而对所需要的特征尺寸进行估算,从而实现被摄物体的三维尺寸测量。在我们的现实世界中,除了各种可以由规则的几何学表达的物体外,还存在着大量不规则或者说不容易计算尺寸的形状,如工业零件中的圆、曲线和曲面等,这些都属于不好计算尺寸的部件,更有甚者,自然界中存在的各种不规则物体,如石头,树叶等,这一类就属于及其不利于计算尺寸的物体了,但是没有什么不是可以用矩形将其框入的,正如阿基米德所说只要一个支点就能够翘的动地球,那么在这一领域,只要我们能够通过图像处理得到物体的轮廓,没有什么不是矩形可以包容的,即使是圆、椭圆和形状及不规则形状的物体,在矩形中依然可以利用几何学中的性质将它们的圆心,焦点等位置算出,要想更好地获得一张照片中的对象或者是物体的三维轮廓信息,就必须针对不止一张的照片和数据库进行一系列的分析和处理,因此对这些不规则物体的尺寸进行测量具有十分重要而深远的意义。另外,虽然这一研究可以这么做,去根据物象去计算出其尺寸,但它也有非常苛刻的前提条件,即获得物体的尽可能多的清晰的照片,这样才能够比较精确的得出它们的尺寸,也就是说,图片中的物体必须是完整的,确定的形状,并且拍摄条件还需要足够的清晰,防止许多噪声和不利于研究分析图像的干扰。本文作者水平有限,利用数字图像处理技术对照片中的显性物体进行处理,尽最大可能提取其二维轮廓,得出物体本身所具有的,并对其三维尺寸的测量方法进行探讨,愿意与各位研究者分享其方法。第二章图像预处理相关技术图像处理是个很广泛的概念,有时候我们仅仅需要对一幅图像做一些简单的处理,即按照我们的需求将它加工成我们想要得效果的图像,比如图像的降噪和增强、灰度变换等等。更多时候我们想要从一幅图像中获取更高级的结果,比如图像中的目标检测与识别。如果我们将输出图像中更高级的结果视为目的的话,那么我们可以把输入输出都是一幅图像看作是整个处理流程中的预处理。预处理过程几乎是每一项科学研究或者实验都需要用到的一种方法,它的目的在于确定和筛选输入数据或者过程的有效性,在图像处理这一领域中,预处理可以说是存在于其领域的方方面面,这样不仅有助于我们去对数据进行更深层次的提取或者分析,也有利于扫除在后面研究时所引发的一些障碍。这种预处理的目的就是为了改善图像的质量,使的图像的质量变得更明显,细节更明显,也就是使的人们对所要处理的特征值较其他特征更加凸显,方便人们对图像接下来的处理。2.1图像增强与去噪2.1.1滤波器的设计方法我们可以在频域用函数来保留或减弱去除相应频率分量,再变换回空间域,得到频域滤波[1]的结果,而空间滤波和频域滤波有着一定的联系。滤波器在图像增强[2]方面有着相当的可靠性。频域滤波就是在表述一系列的空间像素也就是所谓的平滑和锐化,就是对某个特定的频率的颜色变化信息的处理,同时要保持对其他颜色信息不加以处理而保持不变。空间滤波器的实现要在频域滤波器的基础上进行。(1)频域滤波使用二维离散傅里叶变换[3](DFT)变换到频域,由式(2-1)给出:(2-1)使用二维离散傅里叶反变换(IDFT)变换到空间域,由式(2-2)给出:(2-2)在图像处理的实际应用中,由于该过程时间复杂度过高,通常会使用快速傅里叶变换(FFT)来加速这个过程。必须了解的是,图片中灰度变化剧烈的地方即细节部分对应着频率分布出现较高的分量,照片中变化较少的地方对应着频率分布出现较低的分量。图像中的周期性噪声对应着某一个频率区域,那么在频域使用合适的滤波器就能去除相应的频率分量,再使用傅里叶反变换就能得到我们实际想要的结果。(2)空间滤波空间滤波的基础便是卷积,实现过程中可以用一个滤波器对图像做卷积。卷积的离散定义如下,由式(2-3给出):(2-3)所以,空间滤波就是将图片依据像素点大小分块,再利用使用设计好的滤波器去逐像素块扫描图像,对图像的每一处都进行卷积操作,计算得到的结果就是经过滤波后的图像。我们必须知道,关于空间滤波器的设计有着很明显的意义,在空间滤波器没那么容易直接设计的时候,其实它的设计是和频域滤波密切相关的。首先我们介绍一下卷积定理,由式(2-4给出):(2-4)式中双箭头代表傅里叶变换对,即两个函数在空间里的卷积的傅里叶变换等价于它们各自傅里叶变换的乘积。由卷积定理可以知道,在频域进行滤波的时候,滤波的结果等于频域滤波器的傅里叶反变换在空间域对图像进行卷积。也就是说我们可以通过频域的滤波器得到相应的空间滤波器。在这个对应的过程中,需要对相应的空间函数进行取样,并保证模板中的系数之和为零。2.1.2图像平滑(1)均值滤波均值滤波是非常典型的一种线性滤波算法,是将模板赋予所要求的图像,这种模板是以相似的像素来代替所要求的像素,同时要对相似的像素求其平均值,这个平均值就是所谓的均值滤波算法的产物。均值滤波算法的原理是将所要求的像素点周围的像素点通过遍历使其相加,同时设定一个变量通过自加来作为遍历数,再将遍历过的像素点的值相加的值除以遍历数,所求出的这个值就是所谓的均值。求均值的时候,并不是一定要严格的算术平均值,邻域内像素点可以有不同的权值,但要系数之和为1。(2)中值滤波所谓的中值滤波就是将像素灰度值通过排序,然后用像素灰度值排序中的中位数来代替原先的像素灰度值。中值滤波算法的原理就是先通过缓冲区将所要处理的图像的像素点,通过排序算法使其周围的像素点从小到大排序,然后循环遍历排序之后,将周围所有的像素点求出之后,用其中值数来代替所要求的像素点的值。中值滤波是一种非线性平滑滤波器,能将与周围差别过大的像素值替代成为与周围像素值相似的值,可以有效去除椒盐噪声。(3)双边滤波双边滤波就是将像素求其加权平均数,然后用加权平均数来代替某个像素值,这种滤波处理可以有效的达到对图像处理之后保持边缘,降噪平滑的效果。其算法原理就是所求的像素是由其周围像素的值所决定的,也就是将所求像素值分别赋予不同的高斯权重值,并且将其求出的加权平均值来代替所求的像素值。双边滤波器比较于经典的低通滤波器来说,具有保持边缘细节的最大优点,同时有不错的图像去噪能力。2.2图像锐化图像在某些具体的操作之后,某些特征值会变得模糊,为了减少这种模糊,人们就引入了一个新的概念,即图像锐化[4]技术,这种技术的引入大大地改善了上面所发现的问题,使的图像变得更加的清晰。主要的锐化技术处理方法有两种,一种是空间域[7]处理,一种是频域处理。虽然说这是两种方法,但是这两种方法是同一个目的,就是减少图像的模糊,使得图像的特征值更加明显,也就是突出图像上物体的轮廓,以及某些特定要素的像素值。这就是所谓的图像锐化技术[5],这种技术的出现,使得人们能够处理更多现实生活中的问题。最贴合身边的例子,就是在照相馆中,我们照完照,照相师会利用Photoshop工具,将照片进行锐化处理之后,拍出的照片明显比未处理的照片更加好看。这次我所做的图像的三维立体识别,就是要将图像经过锐化处理,使得图像更加清晰以方便后面的操作。主要采取的处理方法,就是通过调用空间域处理方法函数来对图像进行处理。2.3图像特征提取在数字图像处理中,要想对一幅图像做更高级的处理,即不再是输入输出都是图像的话,就需要对图像转换成利于计算机处理的形式。最基本的思想是将图像的特征提取[6]出来,这一个个特征值组合成一个特征向量,用以标识一幅图像。检测形状的时候,通常是通过找到边缘轮廓来确定对象的轮廓,轮廓基本上是轮廓找到了物体的形状或者形式,检测多个形状每个形状有多少个轮廓点和几个角点。值得一提的是,在特征提取的过程中,其所用的方法一般是基于问题的,也就是说,某种问题的最优求解方法似乎就只有那么几种,例如在汽车的车型识别过程中,就可以通过识别其本身具有的规格,也就是长宽的比值来确定车型;在指纹识别中,指纹所特有的特征就成了我们所关注的焦点问题;在人脸识别中,其特征值又发生了变化,一种最简单的办法便是直接选取鼻尖所在的位置,嘴角,耳朵和眼球这些显而易见的特诊点;识别一个物体是不是苹果,那么可以选取它的形状,纹理,颜色等等诸如此类额特征。总的来说,在解决一系列图像问题的时候,就需要用具体的方法去求解具体的问题。第三章图像处理的实现3.1图像读取和显示数据来自手机拍摄的墨水瓶图像,该图像拍摄时为一倍焦距,镜头距基准面25厘米,如图3-1是对墨水瓶的正面、侧面、顶面以及底面的拍摄结果,虽然说是彩色图像,在分析研究过程中尽量采用目标物体和图像的背景对比度较大的照片,这样有利于数据的处理和对数据整体性的把握和分析。图3-1图像读取和显示3.2图像处理3.2.1图像的预处理(1)彩色图像的预处理成像体系获得的图像因为受到了林林总总随机灯号的滋扰,从而恶化了图像的质量,使图像变的恍惚和不清晰,甚至有大概覆没图像的主要特点,给背面的阐发带来坚苦,以是,为了获得较好的图像处置结果,在图像处置前必要举行图像预处置,其目标是改良图像数据,按捺不必要的变形或加强某些对后续处置有效的图像特征。我们给图像添加了均值为0,方差为0.02的高斯噪声之后图像如下图3-2所示:图3-2添加高斯噪声后的墨水瓶分面图本文为了能有效的在图像中提取出轮廓,采用了图像平滑技术对图像进行预处理,使图像中墨水瓶的像素连续均匀。由于噪声源众多,所采用的平滑方法也不尽相同,综合比较了各种平滑算法,本文采用了3*3均值滤波。采用均值滤波后墨水瓶各面的图像如下图3-3所示:图3-3均值滤波后各二维平面图(2)彩色图像转为灰度图如上中得到是RGB彩色图像,它的视觉效果比较好,但是它的数据量大,需要的存储空间较大,对其处理时的速度也慢。所以在不要丢失主要信息的情况下,可以缩小它的数据量。这时灰度图像比较符合我们的要求,所以将彩色照片转化为灰度图像。转化结果如图3-4所示:图3-4彩色图转为灰度图3.2.2图像的锐化与边缘检测(1)图像的锐化本次试验针对墨水瓶的特点用Sobel算子锐化[8]的结果如下图3-5所示,可以看出虽然采用Sobel算子[9]可以增强了目标的边缘[10],从处理之后的图像效果来看,整体上已符合预期的效果。可以作为处理的模板,但是不足之处就是背景与目标的分界线仍然不够明显,图像效果一般,故需要进一步处理。通过进一步的锐化处理之后,图像的边缘已经可以看出明显的效果,在灰度值上的对比度显示效果也欲见明显。图3-5Sobel算子锐化结果(2)图像的边缘检测边缘检测可以在高斯滤波后采用Prewitt算子和Canny算子[11],其中使用Prewitt算子结果如图3-6所示,再用canny算子进行边缘检测的结果如图3-7所示图3-6prewitt边缘检测结果尽管可以利用Matlab自带的边缘检测函数得到墨水瓶的大体轮廓,但是目标的轮廓需要更加准确才能对接下来的三维重建有帮助,因此我们需要继续寻找其他解决办法即利用二值图像提取墨水瓶轮廓。图3-7canny边缘检测结果3.2.3灰度图像的二值化所谓灰度图像的二值化就是在一步步的滤波过程中,对灰度图像的阈值[12]T进行最佳的选择。根据灰度图像的直方图灰度分布,如图3-8所示,我们可以直观地看出目标灰度大概在180,背景灰度大概在90左右,所以论文中选取的阈值T均为125。大于T的像素直接置换为255,即为目标物体区域,小于T的像素直接置换为0,即为背景区域。图像二值化的结果由图3-9给出。图3-8墨水瓶各分面的直方图图3-9图像二值化的结果3.2.4二值图像的处理结合到本文中的侧面图与背面图来看,图中均有多个个连通域可能被标记,而且连通域中最大的一个为目标物体,所以针对这幅图也像上面的步骤那样进行连通域的滤波。滤波之后,仅仅保留像素最大的一个连通域,连通域标记示意图到滤波完成的效果分别如下图3-10和3-11所示,可见效果并不太理想。图3-10连通域标记示意图图3-11连通域滤波3.3提取墨水瓶分面的轮廓坐标3.3.1四个分面的二维坐标系提取出轮廓后,只是直观地得到了墨水瓶分面的轮廓线,要想在后续工作中进行三维重建[13],就必须得到墨水瓶分面的轮廓像素点坐标,而在一系列的图像处理后,得到的仅仅是轮廓的二维坐标[14],从二维到三维的变化,需要将墨水瓶四个分面分别建立坐标系,并根据这四个二维坐标系,从而推导出墨水瓶整体轮廓的三维坐标。本论文中,使用MATLAB[]建立坐标系,那么墨水瓶正面坐标系的建立过程如下图3-12与图3-13所示。图3-12正面和侧面的二维坐标系图3-13正面和顶面的二维坐标系3.3.2四个分面的三维坐标系建立坐标系后,需要根据二维坐标系映射出三维坐标系,这一步骤是根据以下思想来实现的:墨水瓶从顶面到正面再到底面其坐标系是分别逆时针旋转90°和180°,墨水瓶四个分面的三维坐标系关系如下图3-14所示。图3-14墨水瓶四个分面的三维坐标系3.3.3提取特征点及尺寸计算建立好坐标系后,需要根据坐标系求出其特征点即所谓角点的坐标,本论文中选取部分特征点进行研究,便可以推导出墨水瓶轮廓各点的三维坐标。各个面的特征点提取如图3-15,图3-16,图3-17,图3-18分别描绘如下。图3-15正面特征点的选取图3-16侧面特征点的选取图3-17顶面特征点的选取图3-18底面特征点的选取选好特征点后,使用MATLAB中的[x,y]=ginput(n)函数求出其二维坐标,在本论文中,各方位的视图均选用50个特征点。得到二维坐标后,即可利用上图中四个三维坐标系的关系即可确定出墨水瓶轮廓的三维像素点的个数[15],即三维像素点坐标值的差值,进而根据焦距值计算出墨水瓶实际的三维尺寸,另一种办法便是利用已知参考物体在图像中所占的像素和其在实际中对应的长度或者宽度,利用相似比便可以计算求得目标物体在实际中所占的尺寸。第四章误差分析与处理4.1仪器产生的误差4.1.1拍摄设备产生的误差由于手机是电子设备,那么它就必然受工作温度和环境因素的多重影响,这就不可避免地出现误差,即使摄影设备再怎么先进,它毕竟是电子产品,在数模和模数转换的过程中就不免会有能量损耗和噪声污染。即使是使用多种滤波方法去降低图片的噪声,这种客观因素导致的误差带来的影响依旧是不可避免的。4.1.2光源导致的误差顾名思义,自计算机产生以来,它的发展超乎我们人类的想象,传统的光成像原理被彻底改变,取而代之的是数字化的趋势,但无论如何,任何精密仪器所能呈现的光学物象无疑都深受拍摄时光源环境的影响,即使在科学领域已经证明了光具有波粒二象性,光是由磁场和电场的叠加,各种成像设备层出不穷,例如红外成像,遥感,各种射线等数以千计的成像方式,无疑它们的成像原理都是在电磁波的频率之间做出相应的调节,但是就本文而言,是放在大众化的角度下做的研究,用的拍摄仪器均是比较常见的设备,拍出的物象自然也是我们人可以“读”的懂的,并且在拍摄时还有可能出现黑色的背影,解决方法便是在测试环节中设置相对稳定的光源系统,采集图像时必须保证拍摄的角度不至于出现背影,尽可能的使照射到物体的光线均匀,以消除由光源引起的误差。4.2数字图像处理过程中的误差4.2.1彩色图转为灰度图产生的误差由于物体和拍摄时背景的灰度相似,所以导致了RGB图像灰度化以后出现了背景和目标物体相互连通的情况,从而使得目标物体识别边界不清楚,对边缘提取形成了干扰,不能形成封闭的图形。我们在直方图中也可以清晰的看到,每副图像中都有两个峰值,那么阈值的选取便有了一定的困难,而且这是造成图像边缘提取不准确,形成误差的重要来源。可以通过增强图像的对比度来减小轮廓提取相应的误差,这就需要我们对同一幅图像多次实验寻找到其最佳阈值。4.2.2图像平滑、锐化过程中产生的误差实际上图像的平滑以及锐化本身就是消除或者减小噪声的图像处理方法,但是即便如此,平滑过程中使用的均值滤波以及中值滤波均会使图像模糊,这样对在后续处理中,边界提取时就需要增强边缘,这样就会累积误差。4.2.3边缘检测以及轮廓提取中的误差在利用Canny算子和Sobel算了进行边缘检测时,图像的边缘出现了断断续续的情况,这是由于算子本身模板的局限造成的。同样,在对二值图像进行轮廓提取时,也会在视觉上出现断断续续的情况,这就需要在后续工作中通过其他办法进行弥补。可以尝试一下其他的边缘检测算子使用,或者调整模板,尽量使图像在视觉上美观而且突出所要研究区域的特征。第五章总结与展望本论文基于照片确定物体轮廓的三维尺寸,其实质便是以照片为中心,采用数字图像处理技术对已有的照片进行一系列可操作处理的过程,其中所采用的技术和方法均已成熟。借用数字图像处理的技术方法,深入来了解其底层原理,对图像的轮廓提取,边缘检测和图像锐化,以及各种算子的使用方法和原理都有了更深入的了解,利用相似比和特征点求得物体的相关尺寸,在计算机视觉和视觉测量的技术上又迈出了新的一步。随着数据的爆炸式增长,图像数据也在日益增多,而图像的种类更是纷繁复杂,而仅仅依靠人力去提取照片中人能够认知到得信息是远远不够的,不止是照片中的物体和它的三维尺寸,其中所包含的种种信息和资源都是我们研究者需要不断去攻克和挖掘的。虽然已经利用了相关的技术研究和掌握了一些基本的原理,利用代码实现了对图像的一系列操作处理,最终可以计算出物体轮廓的三维尺寸,总体来看,对处理方法和技术的掌握是有效的,但在有些高难度的理论和实践面前还存在着许多不足之处。如:对较难的理论理解的不够透彻,或许解决这一尺寸问题不止有这一种做法,在解决问题时利用了不太合理的技术和方法,在科学研究的过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 瓷砖工程维修合同范例
- 日间助餐合同模板
- 湿巾采购合同模板
- 毛豆买卖合同模板
- 2024年度环保项目合作协议:某城市垃圾分类处理项目合作协议
- 有几种施工合同范例
- 服装制造业劳动合同模板
- 2024年度物业托管合同
- 学校牛奶采购合同范例
- 材料安装服务合同范例
- 语文课前三分钟演讲西塘古镇课件
- qq仪表dcs-io表热水循环泵出口压力
- 病理产科 死胎 (妇产科学课件)
- 翻身拍背课件
- 全套课件-中文版AutoCAD-2020基础教程-完整
- 2022最新 冰壶教案
- 中医穴位养生保健课件
- 属地管理课件
- 可行性研究报告编制工作流程
- 国家开放大学《可编程控制器应用实训》形考任务2(实训二)参考答案
- 木薯淀粉预处理及其糖化工艺初步设计
评论
0/150
提交评论