版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ⅡⅠ摘要非真实感绘制是计算机图像学的一类,在动画、艺术等领域有着广泛的应用,而漫画作为一种具有特殊代表性的艺术表现形式受越来越多人欢迎。漫画的建图、描线、上色等操作都需要人来进行操作,消耗人力和物力。本论文以实现图像的漫画效果为目的,通过使用matlab对图像进行处理,简要阐述了开发背景与环境,在保证图像核心结构不改变的情况下进行以下几个操作:1根据需求,选择双边滤波器对图像进行滤波,达到去除噪声,提高图像质量方便特征提取的目的。2分别对RGB颜色空间和Lab颜色空间进行比较,选择更合适的进行量化处理,,减少图像中的颜色。3根据边缘完整性和速度的需求,选择DOG算子进行边缘检测,对边缘强度进行加强、开闭运算等操作,最后使图像具有漫画效果,实现非真实感绘制,与现有的其他相似方法进行比较,总结该方法达到了漫画效果。关键词:非真实感绘制双边滤波颜色量化边缘检测
ABSTRACTNon-photorealisticrenderingisonetypesofcomputericonography,itiswidelyusedinthefieldofanimation,artandotherfields.Cartoon,asaspecialrepresentativeofanartisticform,iswelcomedbymoreandmorepeople.DuetothedemandsofCartoon,whichhumanbeingsisneededtoworkonbuildpictures,DrawingLines,color,thisisthewasteofthemanpowerandthephysicalresource.Aimingatmakethephototobecartoon,thispaperbrieflydescribesthedevelopmentbackgroundandenvironmentofthewaytodealwithphotosbymatlab.Performthefollowingoperationswhileensuringtheimagewithoutchangingthecorestructureofthecase:1. Basedonneeds,abilateralfiltertoselecttheimageisfiltered,inordertoremovenoiseandimproveimagequalityforthepurposeofconveniencefeatureextraction.2. BycomparingwitheRGBcolorspaceandLabcolorspace,choosethebetteronetoachievecolorquantization,andreducethecolorsintheimage.3. Accordingtotheneedsofmarginalintegrityandspeed,Dogoperatorisusedtodoedgedetection,thenmaketheedgestrongeranduseimopenandimclose.Finallytomaketheimageseemstobecartoon,andrealizeofnon-photorealisticrendering.Comparewithotherexistingsimilarmethods,wecansumupthatthispaperachievemakingthephototobecartoon.Keywords:Non-photorealisticrendering,Bilateralfilter,Colorquantization,edgedetection.目录目录摘要 ⅠABSTRACT Ⅱ目录 1第一章绪论 31.1研究背景 31.2国内外研究状况 41.3研究意义 6第二章漫画效果图像处理 72.1漫画效果分析 72.2漫画效果流程图 7第三章双边滤波 83.1工具介绍 93.1.1Matlab简介 93.1.2Matlab优点 93.2滤波器简介及选择 103.3双边滤波原理 113.4实现双边滤波 133.5小结 13第四章颜色量化 154.1量化选择 154.2实现量化 174.3小结 17第五章边缘检测 195.1领域运算 195.2算子的比较选择 205.3边缘检测 215.4阈值处理 215.5开运算和闭运算 225.6图像合成 235.7小结 24第六章实验结果及对比 256.1水彩画比较 266.2与转描机技术比较 266.3与openCV卡通化比较 276.4与真实绘制的漫画对比 27第七章总结与展望 29参考文献 30致谢 32
第一章绪论1.1研究背景自从计算机图形学出现开始,真实感绘制便是人们研究的一部分。真实感绘制希望通过计算机产生和现实生活中相同的图像。而相对应的,脱离现实的非真实感绘制也越来越受到关注。两者共同发展,形成各种的属性和特点,对于不同场合,都可以发挥其特有的专长[1]。表1真实感与非真实感绘制的对比非真实感绘制是计算机图形学中的一个研究热点,通过使用计算机生成不具有照片的真实感,而是具有手绘风格的图形技术便是非真实感绘制研究的内容。可以方便的做出出富有艺术表现力的图像,近年越来越受到各方面的关注。它主要模拟画种有钢笔画、水彩画等等。研究非真实感绘制可以帮助我们在近来的漫画动画制作渲染过程中获得更多效果的体验,根据需求选择不同的绘制方法。随着技术不断的成熟,非真实感绘制可以运用到各个方面,如基础的图像美化、动画制作、景区风景宣传、商业娱乐欣赏等等。所以它的价值将会越来越高。漫画"一词是由英文中的"Cartoon"音译而来。也就是卡通,各国各地都有各自特殊的风格,随着时代的发展,漫画的风格也不断发生着改变。一般通过归纳,夸张,变形的手法来塑造各种形象。正好符合真实感绘制的特点,利用非真实感绘制相关技术完成图像具有漫画效果的绘制。19世纪末,美国漫画开始起步,一些周日报纸的副刊经常登载连环画,其中最早的连环漫画RichardFeltonOutcault的“TheYellowKid”(黄衣孩童)于1896年2月16日在纽约出版。从此以后,一个全新的阳光产业——漫画诞生了并蓬勃发展至今。如今,世界各国的漫画作品在中国青少年消费市场中影响越来越大。漫画作为一种艺术与视觉的综合艺术形式,凭借写实、夸张、幽默、形象拟人化等特征深受青少年喜爱。在我国的漫画市场消费结构调查中发现,欧美和日本的漫画几乎占据了我国绝大部分的市场,尤其在青少年中非常受欢迎[2]。目前几乎所有的卡通漫画都是由画师亲自绘制,特别是动画方面画师要绘画出每一个关键帧,再由其他人补全期间的其他帧,十分费事。在非真实感绘制中的另一种绘制,水彩化有部分相似的特点,在现有的基础上,可以利用相关研究资源借鉴发挥成为漫画图像,是一个可以考虑发展的方向。1.2国内外研究状况非真实感图形绘制的发展历史并非不很长久,从单纯处理图像到利用绘元绘制,从利用图像技术到利用图形技术,从二维到三维,从仅靠软件实现到现在开始利用硬件GPU,从不可交互到可交互,均在不断发展中。非真实感绘制最早出现在20世纪80年代的早期论文中,有影响力的如Strassmann(1986)和Sasada(1987)发表的论文。1990年,SaitoandTakahashi和Haeberli在Siggraph会议上发表了两篇非常有影响力的论文。1994年,随着几篇论文在Siggraph会议的发表(如WinkenbachandSalesin、Salisbury)和在Eurograph-ics会议的发表(如Strothotte),这一领域才逐渐显现出来。图示给出了一个非真实感绘制技术的发展历史图[3,4]。图1.1非真实感绘制的发展历史上图显示出,在发展初期非真实感绘制技术大多在2D平面上依靠用户交互式地实现,并主要集中在简单的划线技术上,上世纪90年代初,产生了一系列交互式的绘画系统,如Haeberli开发了一个交互式2D绘制系统[5],该系统由用户输入一幅原始图像,再通过用户交互式的操作来改变绘笔的轨迹、颜色和形状以达到一定效果;在之后开发的一系列对在定时曲线下的浓密间隔控制点进行数值滤波的有效工具,使得某些非真实感绘制技术从2D过渡到2D/2.5D,它在后期处理时通过利用某些附加信息来进行图像处理。作为非真实感绘制中的一支,卡通漫画的研究时间较短,较先由Decaudin提出了计算机自动完成卡通效果的3D场景的渲染算法,结合深度映像中的边缘检测得到的轮廓线,卡通着色通过OpenGL的Phong模型计算光照强度以及借助阴影图(ShadowMap)技术取到的阴影处理渲染对象的色调部分以获得最终的效果[6]。之后陈洪等人建立一种算法,在人脸图像上标识了一些特征点,利用这些特征点,捕捉各种不同外貌表情夸张的类型,从而学习卡通漫画的绘制的方法[7]。在之后的研究发展中,HolgerWinnem¨oller等人运用双边滤波器对目标图像进行抽象化处理,结合DoG算子进行滤波提取了图像的轮廓线完成卡通漫画的实时渲染[8]。在商业影视方面,去年饱受争议的《恶之华》采用的技术亦算是非真实感绘制的一种:转描机技术[9]。转描机技术是一种动画家用来逐祯的追踪真实运动的动画技术。这种技术最早是把预先拍好的电影投放到毛玻璃上,然后动画家将其描绘下来,意为将真实图像转换为动画图像。这个投影仪被称为转描机(Rotoscope)。1915年,MaxFleischer发明了“转描机”(Rotoscope),它可将真人电影中的动作,一五一十地转描在赛璐璐片或纸上。MaxFleischer在1916年到1929年创作的《墨水瓶人》(OutoftheInkwell)和《小丑可可》(KokotheClown)就是利用转描机绘画的动画片。到2001年后,理查德·林克莱特利用转描机技术完成了电影《梦醒人生》和《盲区行者》,这两部作品使得理查德重回巅峰并让转描机技术得以受到世人的注意[10]。虽然大众对《恶之华》的反响十分差,但同样也有人称赞其敢于创新,将这样的技术活用于现在动画。图1.2转描机技术具备卡通漫画部分特殊的水彩画作为具有中国特色的绘画风格,在我国已经发展成长相当长的时间,在计算机方面的实现也已经完成,最早提出水彩画模拟方法的是1991年Small的细胞自动机(CellularAutomata)理论[11],用来模拟颜料与水的交互作用,获得了较为逼真的水彩画模拟效果。随着时代的发展,这方面技术越加进步完善,Curtis在Small工作的基础上提出了一个经典的水彩画建模系统[12],可以取得接近于真正水彩画的效果,但它通常以较大的计算量为代价。而另一种算法利用图像的分割、滤波与合成等技术,可以简单绘制出自然纹理不强的水彩画。要实现漫画效果便要发现两者间的不同,漫画效果对象一般为人,人的细节特征与风景并非相差无几,正确发现不同并找出对应解决办法才能成功实现具备漫画效果的图像。1.3研究意义随着非真实感绘制的不断完善,非真实感绘制在各应用领域的使用也将不断增多[13]:(1)艺术领域。非真实感绘制技术给艺术家提供了艺术创作的工具,允许艺术家们在绘画过程中根据需求,强调某些细节的同时忽略其它细节。它可以生成各种不同风格的图像。借助非真实感绘制技术,艺术家们可以更加方便地完成艺术作品。(2)科学医学领域。图像是最简单的传送信息的方式,相比文字它有着许多优越性。非真实感绘制技术在表达图像时的简洁准确,常常被用来绘制精细程度较高的科学和医学的插图。(3)工业设计领域。在工业设计中如想要显示一个零件图形,关心的只是零件的轮廓尺寸等基本信息,而对其他的信息则不感兴趣。这时就可以使用NPR技术来强调突出主要信息,忽略次要信息。(4)娱乐行业。非真实感绘制技术同样可以广泛应用于动画、游戏、电影等娱乐产业。在游戏、电影中可以创造出许多艺术化的效果等,例如卡通风格的实时游戏等。在非真实感绘制发展完善的条件下,漫画也有很大的市场需求。或许近几年人们认为漫画卡通的发展缓慢停滞,但近期《冰雪奇缘》的完美成功打破这一说辞,说明这方面的发展还有很大空间,而此次的研究动机也是基于此。现在市面上有MicrosoftCartoonMaker和toonpaint等软件实现照片的卡通漫画化,说明可行性的情况下,学术性的实现图像漫画效果这一方法,对相关知识进行学习填补。
第二章漫画效果图像处理2.1漫画效果分析漫画是一种艺术形式,是用简单而夸张的手法来描绘生活或时事的图画。一般运用变形、比拟、象征、暗示、影射的方法,构成幽默诙谐的画面或画面组,以取得讽刺或歌颂的效果。是一种具有强烈的讽刺性或幽默感的绘画。常采用夸张、比喻、象征等手法,讽刺、批评或歌颂某些人和事,具有较强的社会性。漫画作为一种艺术形式存在,首先必须具有审美价值。漫画艺术的审美价值主要表现在思维美学形态和视觉美学形态两个方面,二者之间是不可分割的,他们相互依存,相互联系,构成了漫画艺术美的基本形态。1、思维美学形态,任何一类艺术是通过人的思维活动来完成的,漫画艺术也不例外。漫画通过夸张变形,诙谐幽默和荒诞不经等手段,表达事物的精神实质,并向人们传递文学和哲学理念。欣赏者通过思维活动对这种不协调和出乎意料的状态下,产生审美的愉悦和快感,并形成了审美情趣。2、视觉美学形态,众所周知,漫画又是视觉艺术,它囊括了一切绘画表现手段,通过对漫画作品的描绘,对漫画主题起到了渲染和烘托作用,使漫画主题思想深化。由于漫画表现手段丰富,形式多样化,不免使人产生误解或模糊的认识,分不清有多少绘画表现形式。因此,我们有必要对丰富多彩的绘画表现形式进行理性和科学划分,便于对漫画的表现手段有个清楚地认识,并了解和掌握视觉美学形态。一类注重于构思,把绘画手段当作表达思想的载体,另一类注重漫画的视觉艺术效果,通过细腻的刻画来烘托漫画的主题思想。在这次实验中,我们暂且更关注视觉美学形态方面,在了解漫画的基础之上,将普通图像修改增加特征,赋予它漫画独具的美学形态。2.2漫画效果流程图对图像分析我们必须知道我们想得到的是什么样的图像,它的特征应该是什么。漫画图像的特点可以归类为四个:1,变形夸张,这是卡通漫画艺术的最大特点,通过这一点与现实图像区分;2,高度的概括,细节的减少强调出特殊部分,更加具有视觉吸引力;3,颜色的泛用,图像颜色较为鲜明,同一大区域中,基本以一个颜色为主,没有细小的色块;4,边缘的强化,现实图像很多会因为光的原因边缘不清晰,而么漫画因为是绘制而来,所以边缘的保存能达到最好的效果。真实的图片完全变成漫画是十分艰巨的或者不可能的,而漫画效果则是在原始图像的基础上添加漫画的特点,使其看上去像是漫画。这些特点的添加便是我们所需完成的,输入图像时一般默认为Integer,为了保证进行处理时的精确,要强制转换为Double类型,制定流程图如下:输入图像双边滤波噪点处理颜色量化色彩处理边缘检测增强边缘输出图像图2.1实现图像漫画效果流程图
第三章双边滤波输入图像双边滤波噪点处理颜色量化色彩处理边缘检测增强边缘输出图像图2.1实现图像漫画效果流程图3.1工具介绍3.1.1Matlab简介论文围绕中心Matlab软件,通过其实现目的。MATLAB是一种专业的计算机程序,常被用于工程科学的矩阵数学运算。但在之后的几年,它逐渐发展为一种极其方便灵巧的计算体系,用于解决各种重要的技术问题。在70年代中期,CleveMoler博士和他同事在美国国家科学基金的资助下开发了调用EISPACK和LINPACK的FORTRAN子程序库。EISPACK是特征值求解FOETRAN的程序库,LINPACK是解线性方程的程序库。当时这两个程序库代表矩阵运算的最高水平。直到70年代后期,美国NewMexico大学计算机系系主任的CleveMoler,,在给学生讲授线性代数课程时,想教学生使用EISPACK和LINPACK程序库,但他发现学生用FORTRAN编写接口程序很费时间,于是他开始自己动手,为学生编写EISPACK和LINPACK的接口程序。最终CleveMoler给这个接口程序取名为MATLAB,次名字为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合。在以后的数年发展里,MATLAB在众多大学里作为教学辅助软件使用,MATLAB到今天已经历了近30年的发展过程。MATLAB分为总包和其他的工具箱,伴随着版本的不断升级,它具有越来越全面的数值计算能力,越卓越的数据可视化能力和良好的符号计算功能,逐渐发展成为了各种学科、多种工作平台下支持的功能强大的大型软件,获得广大科技工作者的普遍认可。一方面,MATLAB可以方便实现数值分析、优化分析、数据处理、自动控制、信号处理等领域的数学计算,另一方面,也可以快捷实现计算可视化、图形绘制、场景创建和渲染、图像处理、虚拟现实和地图制作等分析处理工作。3.1.2Matlab优点MATLAB语言相对于传统的科技编程语言有诸多的优点。主要包括:1.易用性MATLAB是种解释型语言,就像各种版本的BASIC。和BASIC一样,它简单易用程序可用作便笺簿求打在命令行处表达式的值执行预先写好的大型程序。在MATLAB集成开发环境下,程序可以方便的编写,修改和调试。这是因为这种语言极易使用,对于教育应用和快速建立新程序的原型,它是一个理想的工具。许多的编程工具使得MATLAB十分简单易用。这些工具包括:一个集成的编译/调试器,在线文件手册,工作台和扩展范例。2.平台独立性MATLAB支持许多的操作系统,提供了大量的平台独立的措施。在本书编写的时侯,windows98/2000/NT和许多版本的UNIX系统都支持它。在一个平台上编写的程序,在其它平台上一样可以正常运行,在一个平台上编写的数据文件在其它平台上一样可以编译。因此用户可以根据需要把MATLAB编写的程序移植到新平台。3.预定义函数MATLAB带有一个极大的预定义函数库,它提供了许多已测试和打包过的基本工程问题的函数。例如,假设你正在编写一个程序,这个程序要求你必须计算与输入有关的统计量。在许多的语言中,你需要写出你所编数组的下标和执行计算所需要的函数,这些函数包括其数学意义,中值,标准误差等。像这样成百上千的函数已经在MATLAB中编写好,所以让编程变得更加简单。除了植入MATLAB基本语言中的大量函数,还有许多专用工具箱,以帮助用户解决在具体领域的复杂问题。例如,用户可以购买标准的工具箱以解决在信号处理,控制系统,通信,图象处理,神经网络和其他许多领域的问题。4.机制独立的画图与其他语言不同,MATLAB有许多的画图和图象处理命令。MATLAB运当行时,这些绘图和图片将会出现在这台电脑的图象输出设备中。此功能使得MATLAB成为一个形象化技术数据的卓越工具。5.用户图形界面MATLAB允许程序员为他们的程序建立一个交互式的用户图形界面。利用MATLAB的这种功能,程序员可以设计出相对于无经验的用户可以操作的复杂的数据分析程序。6.MATLAB编译器MATLAB的灵活性和平台独立性是通过将MATLAB代码编译成设备独立的P代码,然后在运行时解释P代码来实现的。Matlab程序执行matlab语言,并提供了一个极其庞大的预定义函数库,高效的数值计算及符号计算功能,能使我们从繁重复杂的数学运算分析中解脱出来;完备的图形处理功能,实现了计算编程和结果的可视化;功能丰富的应用工具箱,提供了大量方便实用的处理工具;简单的界面及接近数学表达式的自然化语言,便于我们学习和掌握。Matlab的这些特点使得它十分适用于我们实现这次目的。3.2滤波器简介及选择图像滤波,即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,是图像预处理中不可缺少的操作,其处理效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性。下面简介几个常见滤波器。高斯滤波是一种线性平滑滤波,适用于滤除高斯白噪声,已广泛应用于图像处理的预处理阶段。对图像进行高斯滤波就是对图像中的每个点的像素值计算,计算的准则是,由该点本身灰度值以及其邻域内的其他像素灰度值加权平均所得,而加权平均的权系数由二维离散高斯函数采样并归一化后所得[14]。均值滤波也称为线性滤波,其采用的主要方法为邻域平均法。线性滤波的基本原理是用均值代替原图像中的各个像素值,即对待处理的当前像素点(x,y),选择一个模板,该模板由其近邻的若干像素组成,求模板中所有像素的均值,再把该均值赋予当前像素点(x,y),作为处理后图像在该点上的灰度值g(x,y),即g(x,y)=1/m∑f(x,y),m为该模板中包含当前像素在内的像素总个数。这样的方法可以平滑图像,速度快,算法简单。但是无法去掉噪声,这能微弱的减弱它[14]。中值滤波法是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。在图像处理中,中值滤波常用来保护边缘信息,是经典的平滑噪声的方法,该方法法对消除椒盐噪音非常有效,在光学测量条纹图象的相位分析处理方法中有特殊作用,但在条纹中心分析方法中作用不大[14]。双边滤波器(英语:BilateralFilter)是使图像平滑化的非线性滤波器,与传统的图像平滑化算法不同,双边滤波器除了使用像素之间几何上的靠近程度之外,还多考虑了像素之间的光度、色彩的差异,使双边滤波器能够有效的将图像上的噪声去除,同时保存图像上的边缘讯息。a.原图b.高斯滤波c.均值滤波d.中值滤波结果e.双边滤波结果图3.1各滤波器对比根据以上几幅图,可以看出高斯滤波和均值滤波模糊了边界,而中值滤波和双边滤波则能够较好的保存图像的边界信息。为此,选择双边滤波器进行实验。3.3双边滤波原理在文献BilateralFilteringforGrayandColorImages[15]中,详尽的解释了双边滤波。双边滤波方法(Bilateralfiltering)是基于Gsuss滤波方法提出的,主要是针对Gauss滤波中将Gauss权系数直接与图像信息作卷积运算进行图像滤波的原理,将滤波权系数优化成Gauss函数和图像亮度信息的乘积,优化后的权系数再与图像信息作卷积运算,这样就能在滤波的同时考虑到图像信息中的图像边缘信息,使图像在正常Gauss滤波后很模糊的边缘信息得以保持清晰,并且图像边缘更加平滑。此方法对于彩色和灰度图像的滤波均适用,具有很强的适用性。双边滤波与高斯滤波器相比,对于图像的边缘信息能过更好的保存。其原理为一个与空间距离相关的高斯函数与一个灰度距离相关的高斯函数相乘。零均值加性高斯噪声图像模型:gx,y=f式中,f表示无噪声图像,n是服从零均值高斯分布的噪声,g是噪声图像;g(x,y)表示图像g在位置(x,y)上的像素值。滤除噪声图像g中的噪声n,重建无噪声图像f。双边滤波器采用局部加权平均的方法获取复原图像的像素值:f=i,j公式中,Ss,y表示中心点(x,y)的(2N+1)*(2N+1)大小的领域。实际上,公式(2)右边就是中心像素点邻域内像素亮度值的加权平均。对该邻域内的每一个像素点g(i,j)由两部分因子的成绩组成,分别是下面的空间距离和灰度距离。空间距离:是当前目标点与中心点的欧式距离。空间域的高斯函数其数学形式为:e-其中(xi,yi)为当前点的位置,(xc,yc)为中心点的位置,sigma是空间域标准差。灰度距离:是当前目标点灰度与中心点灰度想差的绝对值。值域高斯函数其数学形式为:e-其中gray(xi,yi)为当前点灰度值,gray(xc,yc)为中心点灰度值,sigma为值域标准差。双边滤波中加入了对点灰度信息的权重:在邻域内,灰度值越是接近中心点灰度值的点的权重更大,而灰度值相差大的点权重越小。此权重大小,则由值域高斯函数来确定。两者权重系数相乘,可以得到最终的卷积模板。因为双边滤波需要每个中心点邻域的灰度信息以确定其系数,所以它的速度与比一般的滤波慢很多,并且计算量增长速度为核大小的平方。空间域sigma选取可以参考OpenCV参考文档所写:“对应高斯参数的Gaussiansigma(标准差),如果为零,则标准差由下面的核尺寸计算:sigma=(n/2-1)*0.3+0.8,其中n=param1对应水平核,n=param2对应垂直核”。而对值域sigma来说,Sigma越大,边缘越模糊,极限情况为simga无穷大,值域系数近似相等(忽略常数时,将近为exp(0)=1),与高斯模板(空间域模板)相乘后可认为等效于高斯滤波。sigma越小,边缘越清晰,极限情况为simga无限接近0,值域系数近似相等(接近exp(-∞)=0),与高斯模板(空间域模板)相乘后,可近似为系数皆相等,等效于源图像。3.4实现双边滤波选择使用的双边滤波器[16],由于要确保图像细节的完整,sigma的值不可以过大导致模糊失真,所以选择sigma小值,通过一次滤波后观察是否需要继续进行下一次。%读入图像,设定名字为testI=imread('test.bmp');%改变图像精度才能进行后续操作I=im2double(I);%设定w和sigma,为双边滤波做准备w=z;sigma=[xy];%进行多次双边滤波,双边滤波函数见[4]I1=bfilter2(I,w,sigma);I2=bfilter2(I1,w,sigma);I3=bfilter2(I2,w,sigma);I4=bfilter2(I3,w,sigma);I4=bfilter2(I4,w,sigma);I4=bfilter2(I4,w,sigma);I4=bfilter2(I4,w,sigma);I4=bfilter2(I4,w,sigma);3.5小结本章实现了双边滤波,下图中显示为原图与双边滤波1、2、3次后眼睛部位的对比。在sigma为[30.1]可以清晰看见原图中眼睫毛在一次滤波后便被滤出了大部分,之后2、3次中几乎不见眼睫毛了,对于要进行漫画化必须强化边缘的实验是不允许的。 a.0次 b.1次 c.2次 d.3次a.0次 b.1次 c.2次d.8次图3.2所以在对sigma的取值判断中,将值设定为[2400.05]进行操作,可以看到在0.05下眼睫毛是有所保存,但是对图像的去噪效果降低了,为了突出重点所以只能进行多次双边滤波,对每次的结果进行比较选择确定次数以达到需要的效果。
第四章颜色量化4.1量化选择颜色空间模型是指某个三维颜色空间的一个可见光子集合,它包含某个颜色区域的所有颜色。所有颜色都可以看作三个基本的颜色:红、绿、蓝的不同组合,即三基色原理。区分颜色还可以常使用三个基本的特征量:色调、饱和度和亮度。色调和混合光谱中的主要光波长相联系,饱和度则和一定色调的纯度有光,随着白光的加入饱和度会逐渐减少。一般,常见的颜色模型有rgb(红、绿、蓝)模型、HSV(色调、饱和度、亮度)模型,Lab(亮度、颜色对立维度)模型等等。 RGB颜色空间是图像处理中比较常见的颜色空间,当前许多现有的电子输入设备普遍采用都是RGB颜色空间,如电脑显示器、电视机、数码相机、数码摄像机等都是采用的RGB颜色空间。RGB颜色空间由是由红(Red)、绿(Green)、蓝(Blue)三基色构成的颜色空间,可以用一个由红、绿、蓝三个坐标轴构成的单位立方体来描述。坐标轴上的三个顶点表示RGB三个基色,坐标原点表示黑色,离原点最远的角表示白色,剩余的三个顶点对应于3个补色,即品红(红+蓝)、蓝绿(绿+蓝)和黄(红+绿)。为了直观表示RGB颜色空间,我们可以用如下图所示的一个单位立方体来描述RGB颜色空间。在这个颜色空间中从黑到白的灰度值分布在从原点到离原点最远顶点间的边线上,立方体内其余各点对应的不同颜色可以用该点到原点的向量来表示。RGB颜色空间是一种面向硬件设备的颜色空间,从RGB值中不容易判断出该值所表示颜色,它与人们对颜色的感知心理很不相符,两种颜色之间的知觉差异不能用该颜色空间中两个颜色点之间的距离来度量[17]。图4.1RGB颜色空间示意图Lab颜色空间是国际照明委员会(CIE)于1976年定义的一种近似的均匀彩色空间。Lab颜色空间是由亮度和两个色度分量组成。两个色度分量分别是a分量(从绿到红)和b分量(从蓝到黄)。Lab颜色空间是与设备无关的一种颜色空间模型,无论采用什么设备创建的图像或者输出的图像,由这种颜色模型产生的颜色都会保持一致。Lab颜色空间模型示意图如下图所示,在这一坐标系中,+a表示红色,-a表示绿色,+b表示黄色,-b表示蓝色,L的百分数表示颜色的明度[17]。图4.2Lab颜色空间模型示意图Lab颜色空间的特点是L通道没有颜色,对它进行处理不会影响对比度、饱和度,而对rgb颜色空间进行图像平滑的过程中会产生新的颜色,带来颜色混乱。所以Lab颜色空间是我们要进行量化抹匀的最佳执行环境,相反rgb空间则会因为量化大量失真,所以实现量化过程中,要将一般图像的rgb颜色空间转换为Lab颜色空间,可以利用Matlab自带的函数:makecform、applycform实现两者的相互转换。颜色量化即人工或根据某种特定的规律来选择多种颜色,从而组成新的调色板使用,最后根据新建的调色板来重建图像。颜色量化的好坏对于图像压缩,图像分割或者目标识别过程起着重要的作用,它是数字图像处理中一项基础而又非常重要的技术。在量化过程中,我们必须慎重选择量化时的颜色空间,不同颜色空间带来的量化结果可以截然不同。了解概念后,使用Lab空间颜色的亮度伪量化公式:Q=q式中qnearst是对图像的量化,而△q表示图像每个量化区间的宽度。由于双曲正切函数tanh具有双端抑制,中间过渡比较平滑的特征。在量化过程中,先对L空间进行等级的处理,结果四舍五入后再与等级想乘,为的是使结果尽量保持在[0,100]区间内[18],接下来在使用公式进行量化,使图像在不同的量化区间过渡相对比较平滑,更容易获得一种抹匀的效果。图4.3双曲正切函数曲线4.2实现量化%颜色量化B=im2double(I4);%选定量化等级quant_levels=x;dq=100/(quant_levels-1);qB=applycform(B,makecform('srgb2lab'));%对L空间进行量化后四舍五入在放入[0,100]的空间qB(:,:,1)=(1/dq)*qB(:,:,1);qB(:,:,1)=dq*round(qB(:,:,1));%量化公式qB(:,:,1)=qB(:,:,1)+(dq/2)*tanh((B(:,:,1)-qB(:,:,1)));ifexist('applycform','file')Q=applycform(qB,makecform('lab2srgb'));end4.3小结本章实现双边滤波结束后的颜色量化,量化的一个重要参数就是量化等级数quant_levels,由它来决定每个量化区间的宽度。以下为不同等级数的图像比较:a.7 b.9 c.11a.8b.8.6图4.4不同量化等级的比较由图中的后者进行比较:8分成的块域不多,但是太凸显,没有很好达到该分割的区域进行分割;而15的则分割太多导致出现类似波纹的层段,量化想要达到的效果已经消失。最后取值为8.6如图,算为比较好的量化,鼻子处的不同是由于量化等级的选择而凸显出来的一部分,可以视为夸张表示。这样颜色的量化基本实现。
第五章边缘检测5.1领域运算边缘检测是在领域计算的基础下实现的。邻域运算是指当当前输出图像中每个象素是由对应的输入象素和它一个邻域内的象素共同决定时的图像运算,一般情况邻域是远比图像尺寸小的一规则形状,像是正方形2x2、3x3、4x4或用来近似表达为圆及椭圆等形状的多边形。信号与系统分析过程中的基本运算相关与卷积,到实际的图象处理中都表现为邻域运算。邻域运算和点运算一起形成最基本、最重要的图象处理工具。边缘检测的目的是对数字图像中亮度变化明显的点进行标识。图像属性中的明显变化通常反映着属性的重要事件和改变。这些包括了深度上的不连续、表面方向的不连续、物质属性的变化和场景照明的变化。图像边缘检测大量减少了数据量,同时剔除了可以认为是不相关的信息,保留了图像重要结构属性。有很多方法用于边缘检测,绝大部分可以划分成两类:基于查找的一类和基于零穿越的一类。基于查找的方法是通过寻找图像一阶导数中的最大和最小值来检测边界,通常将边界定位在梯度最大的方向。基于零穿越的方法为通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。图5.1几只常见算子的比较5.2算子的比较选择由上图[19]总结:Roberts:采用对角线方向相邻两像素之差表示信号的突变,性能上检测水平和垂直方向边缘好于斜线方向,可是对噪声敏感,检测出的边缘比较细。Sobel:边缘检测算子是像素邻域的计算加权和,模板中心值比较大,结果不但产生较好的边缘效果,同时对噪声也具有平滑作用。但存在伪边缘,边缘较粗定位精度低。Prewitt:对噪声具有平滑作用,检测出的结果边缘比较粗,定位精度,但容易损失角点。Laplacian:算子二阶微分算子,对于图像中的阶跃性边缘点的定位较准确,并且对噪声非常敏感,但是丢失一部分边缘的方向信息,造成了一些不连续的检测边缘。LOG算子:首先使用高斯函数进行滤波,再使用Laplacian算子检测边缘,克服Laplacian算子抗噪声能力相对差的缺点,LOG算子中高斯函数的方差参数σ的选则很关键,σ越大越能避免虚假边缘的检出,但边缘也被平滑,造成边缘点的丢失。σ越小,噪声抑制能力则相对下降,容易出现虚假边缘。Canny:同样采用高斯函数对图像进行平滑处理,所以具有较强的噪声抑制能力;但同样该算子也会将一些高频边缘平滑掉,造成边缘丢失,采用双阈值算法进行检测和连接边缘,边缘的连续性较好。根据图象边缘处的一阶微分应该是极值点的事实,图像边缘处的二阶微分应为零,确定过零点的位置要比确定极值点容易得多也更加精确。但是显然二阶微分对噪声更为敏感。为抑制噪声,可先作平滑滤波然后再作二次微分,通常采用高斯函数作平滑滤波,故有LoG(LaplacianofGaussian)算子。在实现时一般用两个不同参数的高斯函数的差DoG(DifferenceofGaussians)对图像作卷积来近似。目的是使用二阶求导的LOG算子求取边缘可以得到比较清晰的图像,但是计算量较大。而DOG算子计算简单,只需要将两个高斯平滑后的图像F相减即能得到,执行效率较高;其次,DOG算子检测出的特征点稳定性较好,与LoG检测效果相近。作为一个增强算法,DOG可以被用来增加边缘和其他细节的可见性,大部分的边缘锐化算子使用增强高频信号的方法,但是因为随机噪声也是高频信号,很多锐化算子也增强了噪声。DOG算法去除的高频信号中通常包含了随机噪声,所以这种方法是最适合处理那些有高频噪声的图像。这个算法的一个主要缺点就是在调整图像对比度的过程中信息量会减少[20]。g=DOG*f(x,y)(6)[21]DOG算子:D(x,y,σ)=[G(x,y,kσ)−G(x,y,σ)]∗f(x,y)=F(x,y,kσ)−F(x,y,σ)(7)5.3边缘检测%边缘检测%读取双边滤波后x次的图像f1=im2double(Ix);f1=applycform(f1,makecform('srgb2lab'));两个高斯滤波相减求出Dog算子DoG=fspecial('gaussian',15,2)-fspecial('gaussian',15,1);使用Dog算子卷积得到边缘Edge=imfilter(f1(:,:,1),DoG,'conv','circular');利用的是DOG算子对图像进行卷积得到,如原理中所述,该实验中我们一再强调保留边缘,此时的DOG算子也是如此,而且处理的对象是刚双边过滤完的图像而不是量化完的图像,因为量化后产生的色差会多生产多余的边缘线条,这并不是我们想要的。边缘检测得到结果如图:图5.2边缘检测可以看到DOG算子卷积之后得到了十分好的效果,手指部分完全的保留了下来,甚至整张图像各处都有遗留下来的细浅条纹,特别是下巴部分,这些条纹会在恢复图像后出现,使图像变乱,不是我们想要的结果,我们将在接下来的操作中消除不需要的东西并进行其他的美化。5.4阈值处理在漫画中,每一条边缘都是清晰可见的,若要实现这一特点,就需要统一边缘的强度。在我们边缘检测的结果中,得到了整幅图像的边缘,但是由于强度不一,可以看到一些很白的边缘线,合成时它们会显得太硬,造成人对弱一点的边缘的忽视,而较黑的边缘线可能在合成过程中便消失了,没达到提取边缘的意义。阈值处理:“阈值”命令可以将灰度或彩色图像转换形成高对比度的黑白图像。可以指定某个色阶作为阈值。所有比阈值亮的像素转换为白色;所有比阈值暗的像素转换为黑色。“阈值”命令对确定图像的最亮与最暗区域很有用。在图像的二值化中常常使用阈值,并且结果严重依赖阈值的选择。此次实验中,将用阈值处理分开归一大值和小值,达到边缘增强,过滤细微处的效果。对图像进行强弱边缘的统一,在图像矩阵中高于max_gradient的数值设置为max_gradient,低于min_gradient的强制归0,这样使得边缘检测图像白色强边缘能够保留下来,而那些散布在各处的细小波纹会因为小于最小值而被过滤,中间还有一部分则不处理形成弱一点的边缘,让边缘图像更精致,如图。因为最后要叠加的是L空间,同时加强边缘的强度,所以用图像乘以一个大于L空间最大值(100)的数值,此次选取的为130。此时得到的边缘检测图像算是比较完整的了。%边缘强度统一%max_gradient=;min_gradient=;Edge1=im2double(Edge);%强统一Edge1(Edge>max_gradient)=max_gradient;%弱统一Edge1(Edge<min_gradient)=0;%整体强化black1=Edge1*x;black2=im2double(black1);图5.3强度统一后5.5开运算和闭运算膨胀和腐蚀运算是形态学图像处理的基础。我们之后的操作基于这两个运算方法[22]。A被B腐蚀后用B来膨胀结果称为开运算,形态学开运算可以完全删除不能包含结构元素的对象区域,达到平滑了对象的轮廓,断开狭窄的连接,去掉细小的突出部分的效果,用函数imopen实现;A被B膨胀后再腐蚀称为闭运算,闭运算一般将狭窄的缺口连接起来从而形成细长的弯口,并且填充比结构元素小的洞,用函数imclose实现。而对同一图像进行先开运算再闭运算能偶消除图像上的杂散点。%开闭运算%创建一个方形的结构元素se=strel('square',2);black3=imopen(black2,se);black3=imclose(black3,se);在直接使用图7处理后合成最终图,可以说是得到的预期想要的结果,但是仍有一点不足,可以看到眼眶、额头处还残留一些散乱的点,选择处理这些点的方法是使用开运算之后闭运算,达到消除这些杂散点的目的。在设置好算子后,在边缘检测强度统一的图像后,对该图像先开运算再闭运算。结果图因为是黑白灰度图不够清晰,所以展示最终结果图的对比:a.未处理的图像 b.经过开闭运算的图像图5.4去除杂散点5.6图像合成要将边缘图像加到经过颜色量化处理的图像上,必须将后者分离为不包含颜色图层,基于上文所述的Lab颜色空间,在这同样将图像分割为L、a、b3个图层,单独拿出L图层与边缘图像进行处理。照原理所述,L空间0为黑色,若想得到边缘(黑色)加强的图像,则要用原图像的L空间矩阵减去边缘检测图像(边缘检测图像中边缘为白色,即为大值),结果边缘被减后趋近于0值使得边缘突出。遵守目的之一要使图像变的更鲜明,我们在这一步骤中还让原图像L空间加上了一个数值(15),使得图像变得更亮一些。最后得到的L空间和之前分离的a、b空间合成为一个图像,最终结果如图,还有同样操作只缺少量化的图像,至此处理完成:%将图像分割成3个图层,取出亮度图层进行处理b=f2(:,:,1);x=f2(:,:,2);y=f2(:,:,3);b1=im2double(b);l1=b1+x-black3;m2=cat(3,l1,x,y);m3=applycform(m2,makecform('lab2srgb'));imshow(m3);5.7小结在本部分经过选择较优的边缘检测方法得到较清晰的边缘,再由阈值处理,开闭运算优化图像边缘,强化边缘和减少散乱的点,使图像整体质量提高,最后达到需求的效果,完成实验。
第六章实验结果及对比论文第二章分别讲述使用图像滤波、颜色量化、边缘提取强化及合成的方法,这几个步骤集合完成漫画效果的绘制,下面是部分实验结果:a.原图 b.结果图 图6.1a.原图 b.效果图图6.2a.原图 b.效果图图6.36.1水彩画比较在尽量保持参数一样的情况下使用[5]中提供的代码对同一幅图像进行处理,a.水彩效果 b.漫画效果图6.4水彩画就其本身而言,具有两个基本特征:一是画面大多具有通透的视觉感觉;二是绘画过程中水的流动性。可以看出,水彩画下的图像额头分层更明显,颜色的过度较柔较弱,头发部分实现了水彩画水散开的效果,对象为人,人脸没有展示出水流的轻重。而相反,本文实现的图像太强,对比度十分强,即使是高光部分,留白十分不自然,线条勾勒十分清楚,与水彩的柔和相区分。两者都实现了非真实感绘制的效果,选择时应根据需求所选。6.2与转描机技术比较a.原图b.转描机c.论文实现图6.5转描机由于是有动画家来处理,细节描绘十分准确相比下尤其是眼睛部位,人物表情还原。论文实现的图像人物除了头发细节和胡子部分不尽人意,其他部分保留在可以接受的范围内。背景基本丢失,不失为一种突出主题人物的漫画效果,对于单帧的图像实现效果不错,但是相比转描机实现的是视频影视作品,算法对背景的处理需要改善加强。6.3与openCV卡通化比较在没有openCV的支持下,直接使用书中[23]的例子结果图进行比较:a.原图 b.openCV c.Matlab图6.6若要实现前者,步骤为1使用拉普拉斯算子提取轮廓;2使用双边滤波器对图像进行平滑;3将第二步的结果填充到第一步提取到的轮廓上。两者比较边缘都得到放大强化,同样经过双边滤波图像去噪相似。前者颜色背景保留完善,加强了轮廓的深度,滤波器强度较弱,对原图的改变并不大,区分在于滤波器的次数不同,边缘提取方式的不同,虽然拉普拉斯算子与dog算子都能保留较好的边缘,但是前者的算法没有对边缘强化,轮廓并没有后者的清晰。但本文的结果图由于是在量化还对杂散点进行了消除,可以看出图像的颜色变化更大,背景上的树枝等几乎变成了新的杂散点,人物的手指、五官显示更为夸张,左上方的光线也由于去噪量化变成了额头的一部分。两者都实现漫画效果,但在观赏应用不同的角度上,选择也应不尽相同。6.4与真实绘制的漫画对比在网络上有人对图像进行真实绘制的漫画图像,对比如下:a.原图 b.真实绘制 c.论文绘制图6.7真实绘制的图像有着计算机无法模拟的特征,对比算法绘制的图像,色彩更加鲜艳,各处细节完美再现。算法绘制的图像此刻缺点尽现,由于边缘检测衣服上和座位上方出现的杂散点让图像看上去很乱,有很好纹理的头发没有保存下来,人物表情变形等等。可以改进的方法是修改饱和度,寻找更细致有效的边缘检测方法,减小边缘的宽度。经过调整,缩小dog算子的sigma差值以缩小边缘,通过matlab自带函数rgb2hsv将图像转换到hsv颜色空间,对饱和度空间进行处理,增大它的值,使图像更加鲜艳。改良后的图像以更多的操作消耗为代价,与真实绘制的图像相比更加接近,也更具有漫画效果。图6.8经改良的图像
第七章总结与展望本文采用图像处理中的双边滤波、颜色量化、边缘检测等方法,使用Matlab2010b在window7环境下执行代码可行,可以看出,经过处理的图像具备了漫画的部分特点,可以算是实现了漫画效果。双边滤波方法是近年来一种较新的信号处理技术,它在图像的去噪,图像重建,边缘检测,图像复原等等领域有着了广泛的应用。双边滤波器既可以平滑图像,又保持了图像边缘,因而能够获得图像修改良好的效果。为了减少计算量,颜色量化和边缘检测都选择计算量相对少的方法,Dog算子不仅满足相对计算量小,而且能够获得较为清晰的边缘,是十分实用的边缘检测算子。双边滤波和颜色量化完成了图像漫画效果中高度概括,抹匀颜色突出夸张,边缘检测强化边缘,显示漫画独特的边缘描绘。本文实验采用了图像图形学中热点研究方法和一些基础方法有机结合达到实验目的,但这其中仍有不足可以探讨改进:颜色量化后然后可能出现一些色块,这些色块的颜色梯度促成它们没有能与附近的其他颜色融合,但实际情况下我们是希望能够融合的,如实验中鼻子部分的亮色块。漫画的主题是人,但因为背景的存在以及人各部位的不同,会因为各种函数的实现而出现不同等级的新噪点,无法达到完美的整洁效果,想要清楚便需要对图像进行分割,对不同位置进行不同的去噪处理,但这样不仅增大计算量,不同地方的数值选择还会增加十分大的复杂度。双边滤波器作为文中计算量最大的方法,单一次便十分耗时,但为了达到较好的去噪效果,实验中共重复了8次,消耗的时间过多,在普通生活中对照片进行一次这样的完整运算没人会愿意等待那么久。而toonpaint这样的软件,通过各种各样具备特色的滤镜,可以快速完成图像的处理,数值特效根据需求改变添加,更适合日常应用。不仅是漫画效果,非真实感绘制整体具备着十分广阔的发展空间,随着技术的不断完善,实现的效果也越将完美,不仅包括在二维图像,也包括三维图像视频的处理,如同北京电影学院的《联合作业》一般。在这次毕业论文设计中,我更加了解了数字图像处理的相关咨询,结合Matlab的使用,锻炼了运用相关专业知识、检索相关资料用以处理问题的能力,培养了自己设计统筹额能力,是对我专业知识和基础知识的检验和巩固。在这次设计中暴露的自己的不足缺陷,对知识的不尽了解,遇问题都无法独立处理,没能改善算法达到十分完美。这些不足和遗憾会鞭策我前行,今后我更会加强自身锻炼,关注相关方面新算法新思路,并争取尽快的掌握这些先进的知识,一步步完整充实自己。
参考文献苏延辉,韦欢,费广正非真实感绘制技术研究中国传媒大学学报自然科学版第13卷第二期2006年6月桂斌非真实感绘制技术的研究微计算机信息2008年15期BermanDF,BartellJT,SalesinDH.MultiresolutionPaintingandCompositing[A]∥Proceedingsofthe21stannualconfe-renceoncomputergraphicsandinteracti
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44596-2024中文域名编码技术要求
- 关注食品安全的演讲稿
- 国旗下讲话稿荐
- 关于新学期的计划模板集合七篇
- 天英学校家政服务员(中级)理论练习卷附答案
- 2017年四川省绵阳市中考语文试卷(教师版)
- 2024-2025学年上海外国语大学附属外国语学校松江云间中学八年级(上)月考数学试卷(10月份)(含解析)
- 语文统编版(2024)一年级上册汉语拼音-⑪ɑo ou iu 教案
- 第3章 水与膳食纤维课件
- 会计数据分析 TestBank Richardson1e-Chapter07-TB-AnswerKey
- 小学数学一年级下册第4单元《100以内数的认识》教材分析 教研探究 谈《100以内数的认识》的教学策略
- 学科学习与跨学科学习
- 通用电子嘉宾礼薄
- 仓库保管工国家职业标准
- 创业机会的认知与开发
- 感染性心内膜炎-标准完整课件
- 重庆大学版信息科技五年级上册全册教案教学设计
- 《广告法概述》课件
- 2024政务服务综合窗口人员能力与服务规范考试试题
- 舆情应对课件
- 渔业资源增殖放流苗种采购投标方案
评论
0/150
提交评论