碎纸复原模型与算法_第1页
碎纸复原模型与算法_第2页
碎纸复原模型与算法_第3页
碎纸复原模型与算法_第4页
碎纸复原模型与算法_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高教社杯大学生数学建模竞赛区评阅编号(由赛区评阅前进行编号赛区评阅记录(可供赛区评阅时使用统一编号(由赛区送交前编号评阅编号( 评阅前进行编号11本文围绕碎纸片拼接问题,建立了碎纸距离模型、复原TSP模型,并设计了一维碎纸复原算法、二维碎纸复原算法、三维碎纸复原算法等算法,利用实现对问针对问题一,设计了一维碎纸复原算法(4.1.7),12碎纸的像素矩阵,并对其进行二值化处理,然后利用提取碎纸的文字特征,通过字符大小、行距等文字特征构造识别序列,并且利用识别序列的吻合度建立了碎纸距离模型(4.1.4),进而将碎纸复原问题转化为复原TSP题(4.1.5),并用模拟退火法进行求解,得到了正确的复原图形及序列(详见附录一)。针对问题二,设计了二维碎纸复原算法(见4.2.5首先对附件3和附件4的碎纸图片进行标准化对化误的修正后层次特征,利用层次特征对进行初步分类,对于机器不能分类的,通过编制GUI程序提高了人工判别效率,得到相应11类行特征相同的碎纸,进而将问题转化为11个一维碎纸复原问题并进行求解,得到了正确的复原图形及序列(详见附录二)。针对问题三,设计了三维碎纸复原算法(4.3.2),5的a面与b进行整合,得到416张三维碎纸,同样对进行标准化、提取层次特征、分类等操作,将问题维度降为一维并进行求解,得到附件5正的正确复原及序列(详见附录三)考虑到算法的量化评价问题,本文在模型改进处提出最小干预度算法,即通过计算机识别顺序与复原顺序的序列逆序数,实现了最小人工干预次数对算法优劣进行刻画。:碎纸复原算法、TSP、模拟退火法、分类降维、GUI设计一、问题重对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切,建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进34型与算法,并就附件5的碎片数据给出拼接复原结果.二、问题分析本题是研究碎纸复原问题,问题一至三,分别研究一至三维三种不同情况的碎纸复原,本文对问题的解答也是沿着这样的思维路线,即通过降维,使高维度问题转化为低维度问题。问题一是一个一维碎纸复原问题,首先从中提取出像素矩阵,并对其进行二值化处理,然后根据附件碎纸均为大小、形状一致矩形选择提取其文字特征得到基于文字特TSP问题二是一个二维碎纸复原问题,碎纸经过横切纵切之后碎片间的文字特征减少,继续沿用第一问模型求解计算复杂度降呈指数级递增,计算精度也将下降,考虑分析碎纸片文字行间距、大小等特点提出对应准则模型对碎纸片进行识别分类,运用问题一模型与算法先对每一类内碎纸片进行拼接复原,而后再对得到部分拼接复原图进行拼接复原,分类、复原过程适当进行人工干预提高复原精度。问题三是一个三维碎纸复原问题,需要在问题二的基础上考虑碎纸片的正问题。通此外,本题是个实际问题,现实中需要考虑的因素远远多于题目本身,如何使模型更加贴近实际,并提供有效的拼接信息是本文的一大,通过查阅大量资料与文献,3344三、符号说明与模型假设符号说碎片AC碎片A到碎片B碎片BDnTSP模型假假设正打印的页边距等格式相假设说假设3.2.1是为了保证问题一中识别序列的有效性,与实际中大多数情况相符。假设3.2.2是为了简化问题三,当页边距等打印格式相同时,正的层次特征会相同,可以进行降维,与实际中大多数情况是相符四、模型的建立与求解一维碎纸复原模图像的预处般是通过灰度化,将像素值定位为[0,255]区间内,再通过设定阀值,区分空白位置和字体,最后进行二值化。但对于非彩色的,仅需区分空白与非空白两种情况即可。为了使能够清晰地描述空白位置与字符位置,首先利用数学软件对图像进行预处理。首先将导入,得到对应的像素矩阵,由计算机图形学相关知识可知,空白位置的像素值 式中,qijPij

通过对每张进行二值化,得到一系列的像素矩阵,可用于图像的特征提取碎纸特征的提行拼接,如文献[12,另一类是通过提取碎纸上的文字特征,基于文字特征进行拼接,如文献[3][4]一维碎纸,是指切割时,仅进行横或纵的切割,形状如图4-1所示。4-1一维碎纸示意图通过观察图4-1和行距等,见图4-4-2字符的特征步骤一:对进行二值化,文字为白色,空白为黑步骤二:找出所有行距、上空、下空,并标记其为灰色步骤三:找出中所有的字距,并标记其为灰色步骤四:通过行距、上空、下空、字距等特征计算出字符宽度取(代码见附录四getLandR.m).基于文字特征的识别序通过分析汉字与英文字母被分割的情况可以发现,对于每个被切割开的字符,如图4-3所示,记字符的宽度为C,被分割后的两部分宽度分别为CRR,而对于没被切割的字符,依旧保留宽度C。4-3字符分割示意图基于汉字分割的定义,可构造基于文字特征的识别序列,如图4-4所示。PAGEPAGE12 4-4识别序列示意图对于图4-4中的识别序列,其中无字符位置数值为0,其它数字节点代表对应的字符长度(完整的为C,不完整的为CRR)。碎纸距离的定基于4.1.3识别序列的定义,本文定义碎纸A到碎纸Bd

(LiRiCXi

Xi0或式中,dabA到碎纸BLiB的左识别序列RiA的右识别序列C为字符的宽度Xi为表示序列L或R的第in想状况下,当两个识别序列完全吻合时,距离为0(实际情况中,由于二值化,损失了部0TSP问题是数图论中最著名的问题之一,即“已给一个n个点的完全图,每条边都若将每个碎纸看成一个点,由4.1.4距离的定义可知,点与点之间存在距离,可以看出,两张碎纸如果吻合度低,那对应的距离也大,所以寻找吻合率最高的组合方式,实质就是寻找总距离最小的路径,也就是寻找一条最佳TSP路径。4-5TSP将碎纸复原抽象成复原TSP问题,即

minD (LRCX

XS.T.X

式中DTSP路径的总距

idii1i到碎纸i+1通过求解复原TSP问题,可以得到每个点的顺序,即碎纸片的拼接序列,最后利用图像拼接,得到复原了的纸片。模拟退火模拟退火法是一种通用概率算法,用来在一个大的搜寻空间内寻找问题的最优解,具有能有效地解决NP难问题、避免陷入局部最优、对初值没有强依赖性等特点,在各领域已获得了广泛地应用。算法步骤[5]步骤一:令当前温度TT0x0,并计算相应的目标函数值E(x0)。步骤二:令T等于冷却进度表的下一个值Ti步骤三xixjE(xj),得到EE(xj)E(xi)。步骤四

E0

E0eTiMetropoilsTi

TiLk次扰动和接受过程(LkMarkov步骤六:判断温度T是否等于 利用模拟退火法求解求解TSP问题,将一个序列当成一个解,每个解对应一个目标一维碎纸复原算综上所述,通过一维碎纸复原算法,可以实现一维碎纸的自动复原,相应的算法步骤如下:算法步骤步骤一:提取出碎纸图像的像素矩阵,并进行二值化处理步骤二:提取出二值化处理后碎纸图像的文字特征步骤三TSP步骤四:利用模拟退火法求解TSP问题模型求利用 对像素进行分析,得到汉字大小4040(单位:像素),考虑到英文字符的特殊性,受文献[3]的启示,将其视为3030(单位:像素);通过模拟退火法求解TSP问题,取初始温度为97,停止温度为3,衰减系数为0.9,链长度为10000,利用进行运算,得到结果如表4-1所示.4-1121234567899564738 4-1附表1。二维碎纸复原模对于二维碎纸,本文的定义是切割纸片时,进行横和纵的切割,形状如图4-6所示.4-6二维碎纸片示意图3411TSP19208碎纸标准化与层次特征提fi式中,fi为像素矩阵的第i行具体做法如图4-7所示4-7碎纸片的标准化考虑到本文对碎纸进行标准化的方式,对某些字母不能有效地分层,如图4-8所示.如图4-9,一些字符会使分层数增加,但是会导致提取层次特征有误,故应该对这些特殊字符进行修正,即令其中间的空白行也变为黑色。对于标准化后的,其层次特征明显,可提取出的层次特征,本文通过提取文字层的层次特征对进行分类,提取的步骤如下(程序见附录四):提取步骤步骤一:对进行标准化步骤二:对标准化后的进行修步骤三:遍历标准化后的像素矩阵,记录每个文字层的起始位置和结束位置;例如图4-8的,提取的层次特征如图4-9所示.4-9层次特征提取4.2.3通过层次特征分通过4.2.2的层次特征提取,每张都得到一组对应的层次特征,可利用这些特步骤一:对比每张的特征值,若有3-4个特征值相同,那么两张归为一类步骤二:对于无法分类的,记为一个集合步骤三:利用GUI程序,对于无法分类的集合,人为地逐个与已知类别进行对比,三对比程序的设计(代码见附录四SingleMatch.m),GUI界面如图4-10所示.4-10GUI程4.2.5二维碎纸复原算根据4.2.4设定的分类方法,可以将将二维碎纸片复原问题转化为多个一维碎纸片复原问题,但是由于文字特征只有原本的一小部分,且空白区域占碎纸片大部分比例,导致一维碎纸复原模型复原程度不高,需要对结果进行人工干预,如图4-11所示.4-11转化后的一维碎纸复原情况4-11步骤一:对二维碎纸进行标准化;步骤二:提取二步骤三:利用层次特征,进行机器划分和小部分人工干预,实现分类;步骤四:构造多个一维碎纸问题,并进行求解;步骤五:根据步骤四的结果,进行适当的人工4.2.6模型求解利用4.2.5的碎纸复原算法分别对附件3、附件4为11个一维碎纸复原问题,并利用4.12234567894-3423456789三维碎纸复原模对于三维碎纸,本文的定义是切割纸片时,不仅进行横和纵的切割,还需区分正面与,其形状如图4-12所示.4-12三维碎纸片示意图与二维碎纸相比,三维碎纸需要区分正,算法复杂度更高三维模型的降假设3.2.2假设了正打印的页边距等格式相同,基于此假设,正反两面的层次特征是相同的,所以进行分类时,可以分为一类,所以问题三可转换为问题二,只是同样的,利用4.2.3的分类方式,可以将问题转化为多个一维碎纸复原问题,并利用一碎纸复原算法进行复原。而关于GUI程序,也需要进行适当修改,使之能同时对比多张(代码见附录MultMatch.m),如图4-13所示.4-13三维碎纸复原算根据4.2.4设定的分类方法,可以将将二维碎纸复原问题转化为多个一维碎纸复原问题,但是由于文字特征只有原本的一小部分,且空白区域占碎纸大部分比例,导致一维碎纸复原模型复原程度不高,需要对结果进行人工干预,如图4-14所示.4-14转化后的一维碎纸复原情况图4-14中,红圈区域代表拼接成功的碎纸,由图可看出,一维碎纸复原模型能将大部步骤一:对三维碎纸进行标准步骤二:提取三维碎纸两面的层次特征,并进行合并,转化成二维碎纸复原问题;步骤三:利用层次特征,进行机器划分和小部分人工干预,实现分类;步骤四:构造多个一维碎纸问题,并进行求步骤五:根据步骤四的结果,进行适当的人工模型求4.3.25的三维碎纸进行复原,得到结果如表4-44-54-45表4-5附件5结果通过三维碎纸复原模型,能比较有效地实现三维碎纸的复原,附件5的复原见模型优

五、模型改进与推本文采用的碎纸复原模型,综合利用了计算机高速计算能力以及人的文字图像识别和理解能力,拼接效率比纯人工高,拼接准确性也好于纯计算机拼接法。二维碎纸复原模型避免了模拟退火法解的长度过长而导致的算法复杂度快速增加,以分类降维,从而简化问题;在人工干预部分使用GUI程序帮助人工识别,比纯粹的人工干预更为高效;模型缺三维碎纸模型基于正打印的页边距等格式相同的假设,所以当正打印格式模型改适用彩片的改在4.1中,考虑到只有黑白两种情况,所以并未指定阀值,而对于彩片的处理,需根据具体情况制定阀值,以便更好地二值化,若需提取更加明显的,还需进最小干预度算在二维碎纸复原算法和三维碎纸复原算法中都需要适用人工干预,人工干预的次数代表了算法的好坏,本文在此提出一个量化人工干预程度的方式,如图5-1所示5-1正确序列与机器识别顺序由图5-1所示,记机器识别得到的顺序为T{2,1,453},而正确的顺序式G12345,此处定义序列逆序数为最小人工干预次数,即为得到正确序列,需要做2。模型推模拟退火法是是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解,是解决TSP问题的有效算法,也可以较高的效率求解最大截问题、0-1背包问题、图问题、调度问题等等碎纸复原模型实质是基于边缘像素的吻合度的,这种思想同样适用于音频、的参考文张欣,卜彦龙,朱良家,周宗 物证复原系统中的碎纸轮廓提取技术研究PatrickButler,PrithwishChakraborty,NarenRamakrishan,TheDeshredder:AVisualyticApproachtoReconstructingShredded s[J].DepartmentofComputerScienceand yticsCenter,VirginiaTech,Blacksburg,VA207-HeiWangChan,EvanGillespie,DelfinoLeong,DesignandImplementationofaPaperDe-shredder.ECE412TermProjectReport.P.2-4December6,2010 在数学建模中的应用[M],:航天航空大学,,数学建模算法与应用[M],:国防工业,2011,,,, 智能算法30个案例分析[M],:航天航空大学,2011,基于块匹配和特征点匹配的图象拼接算法研究[D],,西南交通大学附附录一1、附2原结1121234567899564738 附录二3、附4原结22345678923456789附录三附件5正复原结正 455 附录四程序代forifa(i)==0&&b(i)==0forforifp000(i,j)==255forifsum(p000(i,:))==mforj=1:mforiffori=1:n-if(temp(i)==1&&temp(i+1)==0)||(temp(i)==0&&temp(i+1)==1)

fori=1:2:nnforifsum(p000(record(i):record(i+1)-1,j))==record(i+1)-record(i);fork=record(i):record(i+1)-1

fori=1:nifp000(i,1)==150forj=1:m-if

fori=1:nifp000(i,m)==150forj=m:-ifp000(i,j-r(i)=m-fori=j- clearp000;forfora=0.98;%衰减系数初始温tf=3;%停止温度tt0;%初始化温度Markov_length= 链长amountsize(x,2);%解的长度sol_new=x;%产生新解E_current=inf;%当前解的值E_best=inf;%最佳解的值sol_currrentsol_new;%当前解等于新产生的解sol_best=sol_new;%whiletforrr=1:Markov_lengthind1=0;ind2=0;while(ind1==tmp1=sol_new(ind1);sol_new(ind2)=tmp1;ind1=0;ind2=0;ind3=0;while(ind1==ind2)||(ind1==ind3)...||(ind2==ind3)||(abs(ind1-ind2)==1)ind1=ceil(rand.*amount);tmp1=ind1;tmp2=ind2;tmp3=ind3;ind2=tmp3;ind3=tmp2;ind1=tmp2;ind2=tmp1;ind1=tmp2;ind2=tmp3;ind3=tmp1;ind1=tmp3;ind2=tmp1;ind3=tmp2;ind1=tmp3;ind2=tmp2;ind3=

tmplist1=sol_new((ind1+1):(ind2-1));sol_new((ind1+ind3-ind2+2):ind3)=...fori=1:amount-1ifE_current=E_new;ifE_new<E_bestE_best=E_new;ifrand<exp(-(E_new-E_current)./t)E_current=E_new;sol_new=

t=forifsum(l(:,i))==0forifsol_best(i)==firstfori=sol_best(j)- clearp000;globalstart;globalhave;globalnum;globalstart;globalhave;globalnum;result(1:209)=-(hObject,eventdata,functionvarargout=varargout{1}=gui_State.gui_Callback=if[varargout{1:nargout}] (gui_State,(gui_State,functionun handles.output=hObject;guidata(hObject,[],...ifnargin&&,,','''functionvarargout=gui_Singleton=gui_State= mfilename,'gui_Singleton',gui_Singleton,functionpushbutton1_Callback(hObject,eventdata,handles)globalhave;globalp000;globale;iffori=istart:size(have,2)ifhave(i)==0functionpushbutton2_Callback(hObject,eventdata,handles)globalhave;globale;globalstart;functionpushbutton3_Callback(hObject,eventdata,handles)globalstart;globalhave;globalp000;fori=1:size(have,2)fori=1:size(have,2)ifhave(i)==0functionfunction (hObject,eventdata,handles,handles.output=hObject;guidata(hObject,gui_State.gui_Callback=if[varargout{1:nargout}] (gui_State,(gui_State,[],ifnargin&&,,','''functionvarargout=gui_Sing

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论