




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
绪论选题背景及研究意义计算机技术广泛的应用极大方便了人们的日常生活。在计算机图像技术方面,计算机视觉、数字图像处理等得到鼎力发展,成功运用于生物工程、医学医疗、工业生产、卫星遥感、地理测绘等领域(黄炜杰,赵雪琪,2022)[1]。通过这点可以看出但是在图像摄制和收集过程中,由于诸多不确定因素,会带给图像质量伤害性的信息丢失问题。为此,以提高图像的质量为目的,推动图像处理技术发展成为热点(魏睿琪,刘晓宇,2023)。现今,研究者们致力于探究如何运用图像修复技术高效高质的完成图像修复。传统的数字图像复原技术主要有两个研究方向:基于纹理的复原和偏微分复原[2,3]。而随着图像处理技术的不断提升,以大数据应用为背景的万物互联、云端计算等技术融入并改造升级了传统产业。通过这些细节可以看出在图像处理领域中的深度学习应用不同于传统数字图像处理,其在图像分类识别中有着超高的准确率,已经成为图像处理技术发展的热点(韩磊阳,王悦晨,2021)。因此我们在目前阶段的图像修复算法研究中,急需把传统算法与深度学习的图像修复的核心思维的修复算法相结合。用传统图像修复技术与深度学习进行结合来实现传统图像技术向深度学习图像处理技术的过渡,在传统算法优势中引进VGG模型针对修复难点的为古画、壁画、老照片、特殊照片等提出新的有效的修复方案意义非凡。课题研究现状我们可以这样说:人类的科学技术是随着时代的发展而相辅相成蓬勃起来的,就数字图像处理本身的发展而言,其也是随着其他学科的进步而发展。其中,计算机作为数字图像处理最重要的计算机器,在此状态下在上个世纪取得了长足的进步,使得依赖于强大计算能力和大存储容量的数字图像处理得到了发展。随着科技的发展和人们生活物质的完备,数字化的图像融入人们生活成为主流(李文博,张欣悦,2021)[4]。图像修复的技术越来越成为人们所关注的重点之一,越发的成为人们深入研究的热门话题(王浩然,刘雅婷,2020)。传统的图像修复方法有两大类:其中一类为基于结构模型的修复方法。BSCB模型是传统数字图像处理方面中基于结构模型的图像修复算法的代表(陈俊熙,李芝和,2019)[5]。另一类就是利用纹理合成的方法进行图像修复。于这种情景里最为经典的关于样本块的修复算法是2003年Criminisi等人提出的(赵宇辰,孙雨萱,2022)[6]。该算法最具有特点的就是最佳匹配块选取,通过全局搜索的方式来确定与破损区域匹配度最大的目标块来作为最佳匹配项。近年来,深度学习在图像处理领域引起了轰动,大部分的深度学习结构都附带图像处理功能。在这一局势下图像处理俨然成为深度学习的一个重要研究领域,深受研究者热议(周泽楷,吴佳怡,2023)[7,8]。在过去的十年里,深度机器学习技术发展速度最快的十年里。主要有两个促进因素:一是计算机硬件的改朝换代,在硬件性能的提升的加持下,大规模神经网络的开发时间大大缩短(郑博文,冯晓萱,2020)。二是神经网络的流程化设计和训练门径的改进化。在深度学习图像处理方面,鉴于这种情况的存在依靠着行之有效的特征可视化能力和从图片基础数据中一层一层的提取信息的能力,促进深度学习在图像的特征提取等应用中加快发展。图像处理中深度学习的发展日新月异,未来空间巨大[9]。一方面,深度学习积极促进图像处理的研究进展(黄睿哲,曹梦琪,2021);从理论角度出发,只要方案接收的输入信息与预期相符,其输出就有望满足设计目标。具体来说,若起始条件与参数配置准确无误,且所采用的模型或方法论构建合理,则其成果将具有高度的信赖度和实用性。这既取决于输入数据的精确性,也取决于分析框架的合理性、技术手段的前沿性以及研究途径的恰当性。同时,还需考虑外部因素的干扰,以保证研究过程的可控性和可重复性,为结论的广泛应用提供可靠支撑。另一方面,按照这种局势发展各种与图像处理相关的应用更是助长深度学习的快速发展。深度学习相关的方法在图像恢复领域得到了广泛的应用,并在图像修复方面取得了较好的成果[10]。根据近年来图像复原的研究趋势,随着人们需求的增加,深度学习图像处理与传统图像处理的结合必将优缺互补带给人们更好地图像修复效果(杨子淳,许婉婷,2019)。本文中将利用该算法优先权的算法结合深度学习对Criminisi算法进行研究改进,用卷积神经网络对图像进行特征提取信息来替代传统算法中的评判准则,对破损图像进行修复处理。在此情境的作用下我们盼望在不久的未来,更多的学者能够研究如何利用深度学习获得的图像特征来促进各方各面的快速进步,实现工业发展提高生活质量。论文主要研究内容及组织安排论文主要研究内容本文的算法基于传统Criminisi算法发进行改进,针对其匹配准则进行改进,对其中各改进重点展开分析研究,其主要研究内容如下:(1)在Criminisi算法中加入VGG19卷积神经网络进行图片特征提取问题。在深度学习图像处理中进行图像分类涉及很多步骤,最为重要的就是提取图像特征,其决定了最终结果的好坏[11]。按照这状况来进行调用VGG19提取图像特征可获得大量特征数据,通过图像特征可视化我们可以直观了解到图像的特征之间的不同,并且我们利用这些数据就可以选取出最佳匹配块(徐铭杰,郭静宜,2022)。(2)匹配块大小与VGG19卷积神经网络输入大小相符问题。当待修复块确定之后,与之相同大小的待匹配块都仅为9×9。但输入VGG19卷积网络的图片大小要求为224×224。故我们需要把待修复块和匹配块的大小均调节到合适大小且图片色彩质量不能下降,以保证VGG19卷积神经网络能够正确完整的提取出图片特征。这样就能让修复效果有保障(宋豪,蒋欣妍,2023)。对于上述方案的调试,本文从理论阐释与实践检验两个角度进行。理论阐释阶段,详细阐述了方案设计的核心原理与预期效果,通过理论模型的搭建与推理过程的展开,为后续的实验提供了强有力的理论支撑。随后,在实践检验阶段,本文精心组织了一系列测试,以验证方案的有效性和稳健性。测试过程中,采用了严格的数据收集与分析方法,确保结果的准确无误。此外,为了全面考察方案在多种条件下的适用性,本文还涵盖了若干典型应用场景,并针对每种场景对系统参数进行了优化。这一过程不仅证实了方案的正确性和实用性,也为未来的研究提供了重要的参考。(3)VGG19网络选取卷积层或池化层问题。在VGG19卷积神经网络中,底层的卷积层拥有大量卷积核,根据现有的结果分析可以得出如下结论通过大量且不同的卷积核我们可以提取到更多图像特征(胡景云,秦雪晴,2020)[12]。而高层的池化层则把经过卷积层的数据进行激活得到更具有识别性的特征。两个不同网络层的数据是不同的,我们通过对比比较可以为以后图像修复选取更合适的网络层,提高图像修图性能。(4)最佳匹配块选取中特征差的计算问题。对于Criminisi算法来说,匹配准则是误差平方和算法。但针对于VGG19提取出来的特征要进行特征差计算,需要合适的算法更准确的计算特征差。论文的组织安排第一章主要介绍图像修复的研究背景和意义,并梳理传统图像修复算法发展历史,分析深度学习方面图像修复处理技术发展现状。第二章简述图像修复的概念、图像修复的视觉效果、评价指标、深度学习相关概念。并分析VGG19网络结构,在此类条件下不难推断出总结卷积神经网络图片特征提取优势的原因。第三章内容为基于Criminisi算法进行改进的研究。梳理传统Criminisi算法流程,针算法存在的一些亟待解决的问题,提出了一种解决方案,提供改进思路及实现理论依据。第四章安排为实际运用中的改进算法图像修复效果及分析。选取三组待修复区域纹理程度不一的破损图进行修复实验,通过这点可以看出分析改进算法的修复效果,给出实验效果对比数据。第五章总结了本文改进算法研究工作,并指出改进的图像修复算法存在的问题并对该领域未来的发展方向提出了展望。图像修复的理论知识及修复技术介绍图像修复的相关理论图像修复问题概述我们可以通过相应的数学语言来对某一事物进行数学描述,以提供严谨、合理的表达形式。针对于图像修复问题,其数学描述如下图2.1所示,图中I表示目标图像整体,通过这些细节可以看出其包含了U所表示的破损区域和S表示未受损的区域。用实际不存在的箭头表示修复方向(修复方向不唯一)(罗嘉诚,程思琪,2021)。需要注意的是,传统图像恢复中修复受损区域所需的信息仅来自原始图像,并且其修复方向大体由破损边界向破损中心延伸(朱启瑞,梁依诺,2019)。在此状态下然而图像复原方法中存在诸多不确定性因素,复原过程中数据微小的变化都可能造成整个整体修复效果的不确定性,因此图像修复结果不是唯一的。图2.1图像修复数学模型图像修复与视觉效果视觉效果指的是某一事物给人带来直观的视觉感受。一份未受损的图像带来的视觉效果往往总是令人满意的,我们可以直观了解到图像所包含的信息。但不完整的图像则会带来一种不好的视觉效果,人们看不全图像甚至无法理解图像。并且在视觉心理上,于这种情景里人们会因破损部分信息的缺失而不断去猜测以至于部分人会产生烦恼情绪(谢秉泽,潘美琳,2022)。上述结果也考虑到理论设计与实践中存在的差异性,因此本文进行了细致的分析与调整。为了确保理论模型能够更贴近实际操作环境不仅对理论框架进行了严谨的推导和验证,还深入实践领域通过更加多元化的研究方法等等方式收集了大量的同行内的其他第一手资料。这些实践数据使研究能够识别并理解理论模型在应用于实际情况时可能遇到的挑战和偏差。并在此基础上引入修正迭代优化来构建适应性更强的研究过程,并被应用于修正和完善现阶段的成果,以提高其预测准确性和实用性,确保了研究结果的可信度和泛化能力。通过这些综合考量本文不仅深化了对研究主题的理解也为相关领域的研究者和从业者提供了更具操作性和指导意义的理论工具。著名的格式塔理论就指出了人会利用已知信息去推断未知信息。因此图像复原跟视觉心理效果是密切相关。在做图像修复时,一定要从视觉心理和视觉效果出发。做出符合人类视觉心理和具有视觉效果的修复图(韩旭东,牛紫悦,2023)。图像修复的评价方法从主观和客观来区分图像复原的评价方法。主观评价法,指通过人类观察,用视觉效果来评价图像复原的效果(董明轩,叶芷昕,2020)[13]。在这一局势下客观评价法,以计算机为评价工具,用其进行相应数学计算并得出一个处理数据并视之为评分,评分越高则说明经过修复的图像还原度就越高越合理,修复效果越好(傅晨皓,康若曦,2021)。主观评价法:人们通过自己的直观感受直接判断图像修复的是否合理[14]。仅凭人们的主观判断,不同的人对事物有不同的理解,故评价结果往往存在存在很高的不确定性其有违科学的严谨性。鉴于这种情况的存在当然主观评价也有其突出优点,首先是可肉眼观察图像整体上是否符合人的视觉效果的(钟翰林,苗心语,2019);其次是细节观察,人眼观察修复完成图中破损边界的恢复情况、纹理走向等细节问题更能评价修复结果的好坏。客观评价法:用修复后图像与原图像之间的相似程度来确定修复结果的好坏。客观评价的方法有均方误差评价法(MSE)、峰值信噪比评价法(PSNR)、信噪比评价法(SNR)这三种[15]。各评价法的数学表达式如下(姜柏成,卢可昕,2022):按照这种局势发展设图像的大小尺寸为M*N,函数f0(x,y)代表修复前的图像,f1(x,y)代表原图经过修复的结果,其中(x,y)表示图像中像素点坐标[16]。均方误差评价法(MSE)数学表达式(吕致远,邓雅芝,2023):MSE=1M∗N信噪比评价法(SNR)数学表达式:SNR=10∗lgx=1峰值信噪比评价法(PSNR)数学表达式:PSNR=10∗lg255客观评价法通过科学算法对修复完成的图像进行评价,一方面可以从提供客观的评价,在此情境的作用下另一方面可以大幅度降低人工评价工作量。对上面三种评价方法来说,均方误差的值越低说明修复完成结果越好,而信噪比和PSNR值越大,恢复效果越好(崔锦程,谭小雅,2020)。基于纹理的图像修复技术纹理修复的概念在计算机图形学中,纹理不仅指的是我们所认为的东西表面的花纹,即物体表面呈现不均匀的沟槽,包含物体光滑表面上的颜色及颜色分布规律信息。而基于本体的复原方法就是基于纹理合成原理。按照这状况来进行通过分析图像中的纹理信息,用已知区域的纹理信息填充图像中的破损区域纹理信息(唐君浩,彭楚嫣,2021)[17]。此结果与文献中的先前结论相契合,为前期研究中的理论构思提供了有力的实证背书。这一发现不仅增强了本文对该领域知识体系的信心,还为跨学科合作提供了共识基础。它鼓励不同背景的学者从各自的专业视角出发,共同探索该领域的边界,推动理论创新与实践应用的融合。基于纹理的图像修复及特点一般来说,图像中往往包含着大量的纹理信息,对于纹理复杂的图仅用基于结构的算法难以达到理想的效果。因此在理论上,把图像的重要特征——纹理作为图像修复的重点,优先考虑利用纹理信息来修复图像可以取得较好的修复结果。并且在无数次的实验中,我们验证了针对于纹理特征明显的图像,利用其纹理信息进行修复可以增强图像的整体视觉性,得到更符合人的视觉感官的理想修复结果(雷振邦,褚伊凡,2019)[18,19]。Criminisi算法是最为经典的纹理图像修复算法。根据现有的结果分析可以得出如下结论其工作原理简述为:找到破损边缘,确定待修复块优先级,从一个受损图像未修复受损的图像区域中,找到一个与正在待重新修复的图像区域最大值相匹配的受损像素块,将其受损信息直接填补到已经修复受损的图像区域中,更新迭代,最终实现图像修复(顾泽昊,董婉清,2022)[20-22]。通过这些细节可以看出其主要优点是适合破损区域较大图像,且修复纹理清晰。基于深度学习的图像处理相关概念深度学习的概念人为命令计算机进行执行某些任务并让其自主在任务中学习,且利用层次化的概念让计算机通过构建简单的概念来学习复杂的概念。这种“自我学习”的学习模型被我们统统为深度学习(魏羽佳,江紫悦,2023)(deeplearning)[23,24]。简单的说,神经网络属于深度学习的一个模块,于这种情景里深度学习的涉及领域广泛,研究层次深。研究人员的目标是让机器能够像人类识别文字、图像、声音等一样进行分析和学习[25,26]。图2.2人工智能不同学科间的关系卷积神经网络传统模仿生物结构的人工神经网络并没有在人工智能的潮流中成为主流的神经网络,反而是其中一种比较特殊的深层前馈网络在很多领域取得了成功,这种必将在未来得到长足发展的网络就是卷积神经网络(CNN)。与人工神经网络相比,训练中参数计算量过大,训练麻烦等缺点,在这一局势下卷积神经网络的训练已经得以规范流程化并且其训练模式更加简单。卷积式神经网络现已成为当代应用较多的训练网络模型之一(陶文博,章雅楠,2020)。它已被广泛地应用到了计算机和视觉技术领域的图像划分、物件检测、人脸识别、图像超分辨率、人体运动和图像检查等方面(陆承言,高诗雅,2021)。图2.4卷积神经网络示意图VGG19卷积神经网络特征提取的优势最著名的一种深度卷积视觉神经网络之一是也就是VGGnet,它于2014年由来自牛津大学的一个计算机科学视觉研究小组和来自谷歌大脑研究所的人员共同合作开发(严泽坤,方慧玲,2019)。我们也或许可以这么好地理解,按照这种局势发展卷积法和神经网络的技术深入应用程度是否会直接大大影响它们的工作性能,即网络深度越深性能越差。VGGnet是目前能够处理网络深度与性能关系的最好的卷积神经网络。以重复叠加3*3个小卷积核和2*2个最大池化层的方法,在此情境的作用下最终实现了16-19层的深度卷积神经网络的构建(施铭扬,苏雅雯,2022)[28,29]。在后续的研究中,本文将建立长期跟踪机制,对研究对象进行持续的观察和记录,以捕捉其动态变化的过程和规律。同时,也会根据研究进展和实际情况,对研究方法和研究设计进行适时的调整和优化,以确保研究的科学性和有效性,会积极拓展国际视野,加强与国际同行的交流与合作。通过参与国际会议、发表国际论文等方式借鉴国际先进的研究方法和经验,为提升我国在该领域的研究水平和国际影响力做出贡献。与之前的网络结构相比,不但正确率大幅度提升,并且VGG对新鲜数据的适应能力更好。故我们常常用VGG网络来提取目标图像的特征。图2.5VGG19网络模型结构不同的VGG模型并没有本质上的区别,只是网络深度不一样[30]。在网络结构改进优化策略中,为保证网络深度且保证泛化能力,我们经常采用堆叠小卷积核的方法进行优化(夏子淳,马欣妍,2023)。按照这状况来进行这是因为堆叠起来的小卷积内核比大卷积内核更好。此策略所需参数更少但却能显著提升网络的深度,并且小的卷积核有利于更好地保持图像性质。根据现有的结果分析可以得出如下结论本文中所介绍使用的VGG19包含16个卷积数据层和3个完整的数据连接层,是目前VGG网络模型中网络深度最大的网络(骆家辉,温婉莹,2020)。一般来说深度越来越大,准确度越高,所以我们可以说VGG19用来提取图片特征是最佳选择。表2.1不同网络深度的网络结构ConvNetConfigurationAA-LRNBCDE11weightlayers11weightlayers13weightlayers16weightlayers16weightlayers19weightlayersInput(224*224RGPimage)conv3-64conv3-64LRNconv3-64Conv3-64conv3-64conv3-64conv3-64conv3-64conv3-64conv3-64maxpoolconv3-128conv3-128conv3-128conv3-128conv3-128conv3-128conv3-128conv3-128conv3-128conv3-128conv3-128maxpoolconv3-256conv3-256conv3-256conv3-256conv3-256conv3-256conv3-256conv3-256conv1-256conv3-256conv3-256conv3-256conv3-256conv3-256conv3-256conv3-256maxpoolconv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv1-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512maxpoolconv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv1-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512conv3-512maxpoolFC-4096FC-4096FC-1000soft-max本章小结本章节主要介绍了图像修复的相关概念,简述深度学习在图像修复领域的相关现状。开始为图像修复的数学描述和图像修复中的评价指标。然后介绍了深度学习的概念。总结卷积神经网络图片特征提取优势的原因。基于Criminisi图像修复算法的改进研究Criminisi算法概述Criminisi算法原理Criminisi算法的基本原理和定义如下,Ω表示一个图像要被修复的区域,I是待修复图像,∂Ω被修复和未受损两个区域的目标边界,点p为目标像素点,Φ表示样本区域[31],∇I_p等照度线的切线方向,n_p是受损边界切线的法向量,φ_p是以p中心的目标块(龚启元,柳舒畅,2021)。算法核心原理分四步走:1.待修复块的优先权计算。2.寻找最佳匹配块。3.填充破损区域。4.置信项更新。图3.1Criminisi原理图Criminisi算法流程(1)待修复块的优先权计算。在此类条件下不难推断出设p是待修复区与为破损区的边界∂Ω上的某一个点,其优先权P(p)的计算公式如下:P(p)=C(p)·D(p)(3-1)其中:C(p)为置信项;D(p)为数据项,计算公式分别如下(管世杰,邹雅琪,2019):Cp=qϵΨpΦCDp=|∇Ι1(2)寻找一个最优的匹配块。优先级计算结果后,确定所有需要修复的模块,此后便需以SSD作为匹配准则在完好区域进行搜索寻找合适的匹配块。SSD匹配准则定义如下(孟子凡,唐韵竹,2022):SSD(p,q)=argmindΨp,式中dΨdΨp,式中R、G、B代表着p、q两个像素点颜色的分量值。 填充破损区域。通过这点可以看出用最佳匹配的信息填充要修复的区域,完成对像素点p所处待修复块的修复。并对破损边界∂Ω进行更新(费明达,辛子凡,2023)。 置信项的更新。搜索到最佳匹配块后,随着图像的修复,目标块已被修复,所以需要更新置信项,其更新公式如下所示[32]:Cp'=Cp∀如此循环以上四个步骤,会使得边缘范围的缩小,如此迭代直至修复边缘上的像素点全部被修复,则表明修复完成,然后输出修复完成的图片。Criminisi算法流程图如下图3.2中所示(荣泽凯,沈雅菲,2020):图3.2Criminisi算法流程图改进Criminisi算法的内容研究VGG19卷积神经网络提取图片特征及特征可视化特征提取的概念是计算机视觉和图像处理中提取图像的数字信息,并判断和归类图像中的每一个点(姚瀚墨,郝欣怡,2021)。在深度学习研究中我们可以通过VGG网络模型提取到图片的特征并通过可视化特征图的方法,通过这些细节可以看出以图片的形式将网络结构中某一层特征图显示出来,直观的展现的我们面前。在此状态下我们可用MATLAB平台中的activations函数来提取特征。从上可以可以看出该方案相比于其他方案具有更好的性价比,同时在灵活性和可扩展性方面也表现出色。这意味着它可以轻松适应不断变化的市场需求和技术进步,为企业提供持续的竞争优势。A为输出输出,net为调用网络,IM为输入图像,Layer则为要提取特征的网络层。然后通过矩阵变化即可实现特征的可视化(谭景尧,赵雅琪,2019)。函数:activations。功能:提取图片特征。用法:A=activations(net,IM,'Layer')。其中A为输出输出,net为调用网络,IM为输入图像,Layer则为要提取特征的网络层。然后通过矩阵变化即可实现特征的可视化(薛志勇,宋子璇,2022)。图3.3VGG19实验中可视化的特征图待匹配块的大小调节为什么VGG网络要指定输入图片大小?因为权重文件的参数数量是提前预设好了的,改变输入尺寸会使得后面结果发生变化从而改变结果。在这一局势下而在本次实验中依照传统Criminisi算法实现的目标块与待匹配快尺寸均不符合VGG网络输入要求尺寸(白书豪,范伊人,2023)。为使得能够调用VGG提取特征,我们需修改尺寸且尺寸修改方法需要合理有效而不是简单的放大或缩小。函数:Padarray。功能:填充图像或填充数组。用法:B=padarray(A,padsize,padval,direction)。其中A为输入图像,B为填充后的图像(金宇航,苗雅琴,2020)。图3.4匹配块大小调节示意图卷积层与池化层概念在卷积过程中,使用了卷积核(Filter),根据步长大小连续扫描每一层的像素矩阵(石泽恺,龚诗雅,2021)。扫描值乘以卷积核中对应位置的个数,然后相加求和生成新的矩阵。卷积核相当于卷积操作中的一个过滤器,鉴于这种情况的存在用于提取我们图像的特征。卷积核里每个值就是我们需要训练模型过程中的神经元参数(权重)(温子淳,麻雅琪,2019)。权重为卷积神经网络(CNN)中独特的网络结构,按照这种局势发展作用是以卷积核的局部感知机制来进行图像特征的提取,权值共享卷积核深度与输入特征矩阵深度保持一致,输出的特征矩阵channel(深度)与卷积核个数相同在卷积操作过程中,矩阵经过卷积操作后的尺寸计算方法如下:N=(W−F+2P)/S+1(3.6)其中输入图片大小为WW;卷积核(filter)大小为F*F,步长(Stride)为S,padding的像素数为P。图3.5卷积过程示意图池化的降维操作即为卷积降维运算,因为卷积进行运算之后我们在其中直接提取出来得到的信息是一些特征运算信息,在其之间相邻的每个区域我们都会发现存有相似的一些特征运算信息,在此情境的作用下并且它们之间信息是完全一样可以用卷积运算信息相互进行替换的,若全部都需要保留那些具有特征值的信息将来就会导致存在较大的特征信息冗余,按照这状况来进行增加了降维计算的复杂难度(霍明轩,楼婉婷,2022)。当我们通过数据池化层次的时候数据会不断地增大减小每当数据的池化空间值和尺寸及其大小时,参数的空间计算和变量和我们测试到的数据就可能会不断发生交互相应的空间减少和效率下降,在一定的很大程度上直接控制了整个过程模拟的耦合(浦景天,龚雅萱,2023)。经过深入研究现状,并结合现有资源与技术,这一优化设计得以完成。相比旧有模式,此模式在几个关键点上体现出巨大优势。首要的是,借助更新颖的设计概念,它不仅提升了工作效率,而且减少了错误发生,极大地增强了项目实施的可能性。其次,考虑到成本效果,新的规划削减了执行与维护开支,防止了资源的浪费,促进了经济效益的增长。与此同时,这种改进也强化了系统的整合力和扩展潜力,便于应对未来的变革与发展需求。主要池化类型分别有:maxpooling(最大最小池化)和:maveragepooling(平均最小池化)。maxpooling:从窗口中抉择选取最大的,我们已经重新定义了一个最大的修正空间邻域(就是例如,2*2的窗口),根据现有的结果分析可以得出如下结论并且从窗口内的两个修正元素特征图中选择一个得到最大的空间元素,最大的元素池化被普遍认为修正效果较佳。averagepooling:平均的,我们已经精确定义了一个二维空间的邻域(就是例如,2*2的窗口),并且从窗口内的另一个邻域修正后的特征图中可以计算出所得到的邻域平均值(秦淳,陶婉莹,2020)[33,34]。特征差的计算与SSD算法结合我们提取到目标块与待匹配块的特征数据时,需要进行特征差计算。但我们提取到的数据为多维数组,目前还没有特定计算多维数组相似性的函数。为此我们在MATLAB中调用reshape函数来将指定的矩阵变换成特定维数矩阵,在此类条件下不难推断出该函数可以把高维矩阵转化为低纬矩阵且矩阵中元素个数不变(袁泽昊,蒋雅琪,2021)。函数:reshape功能:矩阵维度转换用法:B=reshape(A,size)其中,返回与元素A相同的n维数组,但重建数组的大小由向量的大小决定。当我们有了维度合适大小的特征矩阵数据时,我们便可以使用corr2函数返回两个数组之间的二维相关系数R,从而计算出特征差。使用以下公式计算相关系数。corr2使用一下公式计算相关系数:r=mnA其中A=mean2(A),且`B=mean2(B)计算出特征差后我们还可以与传统算法中的SSD算法相结合,采用不同的权值会产生不同的修复效果,需要不断尝试研究实验以求达到理想的修复效果。本章小结本章中主要将本文所研究的内容进行详细的叙述。对传统Criminisi算法的原理、流程进行了详细的介绍,之后对于改进算法相关的关于深度学习特征提取、特征差计算等的重点理论知识及实验原理进行了详细分析研究。改进的Criminisi算法修复实验结论实验仿真本论文实验平台的配置如表4.1:计算机操作系统:MicrosoftWindows10教育版(64位)硬件配置:RAM12GB,(英特尔)Intel(R)Core(TM)i5-6300HQCPU@2.30GHz(2301MHz),NVIDIAGeForceGTX960M实验软件平台:MATLAB2018b(装有DeepNetworkDesigner工具箱)MATLAB在深度学习方面是具有其独特优势的。其支持的卷积神经网络模型非常多,包括GoogLeNet、VGG-16、VGG-19、AlexNet等模型。通过这点可以看出针对深度学习庞大数据集,其支持NVIDIA®GPU加速并且其早有完备的算法,无需开发者自行编程,直接调用即可(赵宇昊,李佳琳,2021)。本设计在优化时特别注重了财务可行性和方案的可扩展性,从而相较于最初的构思,在几个关键点上做出了调整。首要的是,通过削减不必要的操作环节、采用性价比更高的选项,有效地控制了总成本,让方案变得更加经济。另外,为了加强其广泛应用的可能性,在设计中充分考虑了跨地区的适应性,保证此方案能够在不同条件下顺利执行,易于其他组织或个人采纳。而MATLAB在应用深度机器学习中最大的技术优势就是充分利用了基于MATLAB的所有应用程序与所有可视化分析工具(黄炜杰,赵雪琪,2022)。,通过这些细节可以看出可视化工具极大方便了我们创建、修改、分析复杂网络架构。还有一点就MATLAB的联通性,我们可以在平台上使用Caffe和TensorFlow-Keras的结构模型[35]。图4.1MATLAB与其他框架连接示意图实验结果分析为保证实验结果数据多样性并验证改进算法在纹理修复的方面的改进性,我们选取三组纹理特点不同的图片为实验对象。其修复图像结果分别如下所示:(b)(c)(d)(e)(f)图4.2如图4.2所示,该实验对象为破损区域纹理特征复杂的图像。其中(a)为采集到的原图,(b)有手动注释的图像(魏睿琪,刘晓宇,2023),(c)为改进算法的修复中图像,(d)传统Criminisi修复图像,(e)为改进算法中VGG19卷积神经网络中卷积层结合传统算法的修复效果图,(f)为改进算法中VGG19卷积神经网络中池化层结合传统算法的修复效果图。在此状态下由实验结果我们可以看到待修复区域中的车身和阴影是被修复的。传统算法存在修复不好,有匹配信息不准确等问题,而改进的算法修复结果更好,能直观的感受到改进算法所带来的修复效果的提升(韩磊阳,王悦晨,2021)。(a)(b)(c)(d)(f)(e)图4.3如图4.3所示,该实验对象为破损区域纹理特征一般的图像。其中(a)为采集到的原图,(b)有手动注释的图像,(c)为改进算法的修复中图像,(d)传统Criminisi修复图像,(e)为改进算法中VGG19卷积神经网络中卷积层结合传统算法的修复效果图,(f)为改进算法中VGG19卷积神经网络中池化层结合传统算法的修复效果图(李文博,张欣悦,2021)。文中引用了一些现有的理论基础来构造计算模式,并做出相应调整以增加其实用性和易用性。经过对现有计划的全面审查和分析,清除了其中过于复杂且非必要的步骤,改进了流程结构,产生了一个更加简明有效的计算模型。这不仅节省了资源使用,也减少了处理时间,使得该方案既保持了原有的效率,又方便实施和传播,设立了多种验证和品质监控手段。根据实验图,在这一局势下我们直观看到传统算法在修复边缘时,过于单调,以至于修复完成图边缘缺乏纹理,图像修复边缘过于平滑缺乏真实性。但改进的算法也存在修复局部模糊等问题,按照这种局势发展最终通过客观评价法的Psnr数据可以对修复效果评价(王浩然,刘雅婷,2020)。(b)(c)(d)(f)(e)图4.4如图4.4所示,该实验对象为破损区域纹理特征难以辨别的图像。其中(a)为采集到的原图,(b)有手动注释的图像,(c)为改进算法的修复中图像,(d)传统Criminisi修复图像,(e)为改进算法中VGG19卷积神经网络中卷积层结合传统算法的修复效果图,(f)为改进算法中VGG19卷积神经网络中池化层结合传统算法的修复效果图(陈俊熙,李芝和,2019)。表4.2各修复算法PSNR数据实验对象传统Criminisi修复结果conv_1结合Criminisi修复结果Pool4结合Criminisi算法修复结果纹理复杂的汽车35.933743.337543.3375纹理一般的红叶30.665631.109831.1098纹理简单的绿叶37.701338.233738.2337结合以上三个部分实验结果图和PSNR图可以发现:(1)改进的Criminisi算法相较于传统算法,按照这状况来进行在视觉效果和客观评价数据都体现了图像修复性能的提升。(2)针对于传统Criminisi算法来说,如果待修复区域以颜色特征为主特征的话即待修复区域颜色纹理特征明显更突出其性能。而改进的算法除了颜色还有其他诸多的纹理特征是可以用来进行数据对比,以达到合理修复特征的。(3)根据PSNR图,基于VGG19卷积层结合传统算法的改进算法在一定程度上优于基于VGG19池化层结合传统算法的算法。根据现有的结果分析可以得出如下结论其原因在于底层的卷积层能提供更多的图片特征。但高层的池化层能够减少一定的计算量,且对于某些特有特征能有更高的选取正确率。总结与展望工作总结数字图像复原的概念提出至今已近20年,研究者们不断引入各种数学修复模型并总是超前的提出各种理论,极大的推动了图像恢复技术的不断发展。在深度学习领域,基于深度学习的图像复原方法研究备受追捧。但不论是传统数字图像修复还是深度学习在图像修复领域的应用,始终各有优缺。本文针对于传统数字图像修复算法任务中,修复后区域模糊混乱、修复区域边缘结构不合理等问题,研究基于深度提取图像特征结合传统算法的改进型图像修复方法,主要研究内容包括以下三个方面:1.概述图像修复中的纹理修复概念及经典算法修复原理。梳理图像修复发展史,在辩证思维下思考了图像修复存在的意义及亟待解决的问题。对经典纹理修复算法中的Criminisi算法的算法优缺点进行分析评价。从客观立场上看待图像修复技术发展趋势并顺应发展潮流在经典Criminisi算法分析中提出传统算法与深度学习优缺互补理念。2.基于传统Criminisi算法进行改进,对改进算法提供可行性理论支持。解析传统Criminisi算法的流程,简述深度学习的概念和相关算法原理。针对改进算法中的如输入图片尺寸调节、特征提取函数调用、特征可视化研究、匹配准则等问题逐一分析并提出解决方案。3.基于改进进行破损图像修复实验。搭建实验环境,选取实验平台编写实验代码并选取合适图片组进行实验验证。分析对比实验结果并根据实验结果来不断优化算法流程改进实验代码。以实际实验结果来检验改进的Criminisi算法修复效果,实验结果证明改进算法相较于传统算法具有一定的改良性,传统算法与深度学习优缺互补理念是可行的是具有意义的。未来展望虽然本文提出的改进算法在实验中证实了修复效果的提升性,但该领域的改进算法研究还需要深入。并且由于个人能力、研究环境和实验设备有限等,本文仅为初步探讨研究,本文算法仍然存在一些值得改进和研究的地方,比如:(1)图像修复算法中的程序编写语言选取问题。本文基于传统Criminisi算法进行改进采用MATLAB编程实现,但目前针对深度学习的研究学习大部分是选用Python语言。并且传统图像修复算法也大都选用C++,这就说明了图像修复算法的编程语言是丰富但难以选取的。故我们需要平台之间的互通构建,也需要编程语言能够有互联的接口,以程序调用方便来实现算法的更新与发展。(2)适合于图像修复的卷积神经网络模型的选取问题。深度学习快速发展,各种卷积神经网络模型网络深度或深或浅,针对应用领域进行了优化了调节。但对于图像修复领域来说,目前比较著名的模型都存在一个问题,那就是网络模型的网络
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030锂电池定制行业发展分析及前景趋势与投资研究报告
- 2025-2030铝基中间合金行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030针灸行业发展分析及投资战略研究报告
- 2025-2030金属双极板行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030运动图形行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030血糖仪塑料条行业市场现状供需分析及投资评估规划分析研究报告
- 2025年中国网络测试仪表行业市场发展前景及发展趋势与投资战略研究报告
- 2025-2030苹果行业并购重组机会及投融资战略研究咨询报告
- 2025-2030芝麻籽行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025年中国净化美白化妆品行业市场发展前景及发展趋势与投资战略研究报告
- 人教版高中物理选择性必修三 第5章第1节原子核的组成课件
- CCEA GC 11-2019 工程造价咨询企业服务清单
- 8.建筑施工设备设施清单
- DB11_T1630-2019 城市综合管廊工程施工及质量验收规范
- 教练技术一阶段讲义(共59页)
- 小学科技社团活动电子版教(学)案20篇
- 露天矿石土方剥离工程施工组织设计
- 公司管理创新工作管理办法
- 轮胎式装载机检测报告
- 部编版四年级语文下册《亲爱的汉修先生》整本书导读课件(共38张PPT)
- 主动脉球囊反搏术(IABP)监测及护理
评论
0/150
提交评论