版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规 则的行为,我们将受到严肃处理。我们参赛选择的题号是(从 A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名
2、):参赛队员(打印并签名):1.2. 3.指导教师或指导教师组负责人 (打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评 阅 人评 分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原问题摘要重要文件碎纸片的拼接复原具有至关重要的作用,关键词:问题复述破碎文件的拼接在司法物证复原、 历史文献修复以及军事情报获取等领域都有着重 要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当 碎片数量巨大, 人工拼
3、接很难在短时间内完成任务。 随着计算机技术的发展, 人们试图 开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片 (仅纵切),建立碎纸片 拼接复原模型和算法,并针对附件 1、附件 2 给出的中、英文各一页文件的碎片数据进 行拼接复原。 如果复原过程需要人工干预, 请写出干预方式及干预的时间节点。 复原结 果以图片形式及表格形式表达。2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对 附件 3、附件 4 给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需 要人工干预,请写出干预方式及干预的时间节
4、点。3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文 件的碎纸片拼接复原问题需要解决。 附件 5 给出的是一页英文印刷文字双面打印文件的 碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法, 并就附件 5 的碎片数据给出 拼接复原结果,结果表达要求同上。二 问题的分析问题一,这是将纵向粉碎的纸片拼接复原的问题,考虑到汉语和英语都较为复杂, 我们可以将问题简化为基于灰度的统计匹配算法问题。首先对附件1、2 中的纸片进行初步分析,用 matlaB 软件将灰度图转化为以像素为单元的数字矩阵,分别选取矩阵中 第一列和最后一列形成两个新矩阵并记为矩阵 A, B,将矩阵A中的每一
5、列i分别与B中 的每一列j做平方差度量比较,在B中匹配出与A中每一列元素相似性最大的一组,依 次分析比较结果,可以找出最佳匹配组合,利用 matlab 软件将原图复原。在匹配时应 提前根据比较分析将边缘的碎纸片找出并做特殊处理。问题二, 这是碎纸片即横切也纵切的拼接复原问题, 考虑到情况更加复杂, 我们分 部进行。首先我们将问题转换为行间距位置相同的方问题对碎纸片进行分类,利用matlab软件将灰度图转换成数字矩阵的形式,我们对数字矩阵的每一行进行求和。由 于行间距的位置灰度值相同,所以求和之后所得的值一样。依据此方法,将碎纸片聚合 成十一行。由于,聚合之后碎纸片的顺序是打乱的,所以我们沿用问
6、题一使用的方法, 对各行进行拼合,构成完整的顺序。之后我们再对第一行到第十二行使用此方法进行平 方差度量,找出相似度最大的,最终完整碎纸片的复原。三问题的假设四符号说明附件一中所给图片名称依次为018,其余附件中类似;an 表示图片灰度值转化的矩阵,i= 1,2,18 ;Aki表示矩阵A中第k列第i个元素,BH表示矩阵B中第I列第i个元素(k G);五 模型的建立和求解5.1问题一模型的建立和求解主要利用基于灰度的统计匹配算法进行求解。5.1.1图片信息的二值化处理。由于附件1中的碎纸片均为纵向直线切割,每个碎纸片都是一个规则的矩形,所以 将图片转化为二值化的矩阵是合适的。首先将附件一中所给的
7、19张图片形式的碎纸片进行预处理,实现图片的二值化,第i个图片对应的二值化矩阵为an(i),可以得到每个an(i)均为1980*72的矩阵,例如第9个碎纸片的二值化矩阵为:255 255255(其中有部分数据属于0-255之间)255 255 255 an(9)=:.255 255 255一同理,将附件二中的19张图片进行二值化处理,得到相应的二值化矩阵。从而实 现将题目提供的图片信息转化为可以处理的数字矩阵。5.1.2边缘化模型得到边界纸片数据通过对纸片转化的数据矩阵的处理,得到完整文件两个边缘的碎纸片。首先分别对 附件一和附件二的19个图片二值化矩阵进行初步分析,一般文件的左右两个边缘应以
8、 空白为主,即原文件中最左端的纸片的二值化矩阵中第一列数据,最右端的纸片的二值化矩阵中最后一列数据中绝大部分应为 255。对数据矩阵二值化分析得出在附件一中第 9张碎纸片二值化矩阵的第一列数据和第 7张碎纸片二值化矩阵的最后一列数据,再经过看图分析得到第9张碎纸片和第7张碎纸片分别为原文件的最左端和最右端的纸片。 在附件二中第四张和第五张符合边缘数据的标准,进一步分析得到第四张和第五张分别 为第二张原文档的最左边和最右边的数据图片。5.1.3处理模型,匹配除两边缘外的纸片数据。我们将每个图片提取出的二值化矩阵作如下简化, 将除位于最左端碎纸片之外的每 个图片二值化矩阵中的第一列提取出来,组成边
9、缘矩阵an(1) “an( 2)“an (19)“A=an2,1an(2)2,119 ,1an(2) 19,1an (19)2,1aan (19)19,1an (19)1,72 1an (19) 2,72an (19) 19,72类似的将除位于最右端碎纸片之外的每个图片的二值化矩阵的最后一列提取出来, 组成边缘矩阵:_an( 1)1,72an 1,72an( 1)2,72an (2) 2,72B =?n(1) 19,72an( 2)19,72由此碎纸片之间的匹配转化为各二值化矩阵边缘列向量的匹配, 即利用边缘矩阵A 中的每一列向量与边缘矩阵B的每一列向量分别匹配。为方便边缘矩阵A与边缘矩阵B
10、中的列向量进行比较。弓I入平方差度量 Xkli =(人-BQ2( k式丨),这样对于19个k值1919都可以得到一个相应的1980*19的矩阵Xki,建立求和模型Dk丨工二:Xkii,(k= l),应i =1 1=1用matlaB求解(见附录一)将矩阵中每一列的元素相加得到19个1*19的矩阵, 这样就可以将原来的多维矩阵转化为一维矩阵,实现了降维和提高速度的目的。再通过矩阵Dkl中元素大小评价两组列向量是否匹配,若两个碎纸片之间相互匹配,则在边缘矩阵A和边缘矩阵B中对应的列向量各元素之间求得差平方变量Xkl的之和即相应的Dkl最小,最小值为m,同时返回求的最小值对应的矩阵 A和矩阵B中列向量
11、的索引最终得到附件一中数据处理得到顺序为:8-14-12-15-3-10-2-16-1-4-5-9-13-18-11-7-17-0-6附件二中数据处理得到顺序为:3-6-2-15-18-11-0-5-1-9-13-10-8-12-14-17-16-4。(图片整理见附录二,整合数据编号见附录三)5.2问题二模型的建立与求解5.2.1简单分析问题二要求对即纵切又横切的碎纸片情进行复原, 我们对附件3中的209个碎纸片 进行分析,得出碎纸片来源于同一文件,纸片是纵横两个方向上分割的。首先将碎纸片 由图片形式转化为计算机可以识别的语言, 即读取出每个图片对应的二值化矩阵(具体 数据见附件X)5.2.2
12、分析横向切割我们可以知道在横向切割之后,形成的每一条横向的长形纸片文字的位置是在同一 高度上的,但是由于每个碎纸片上面的文字是不一样的,并不能代表每一条横向长形纸片的共性。通过观察发现组成每一条横向长形纸片碎纸片的空白部分的分布在每个碎纸 片上是几乎相同,因此,我们建立如下算法找出横向切割后的 11条长形纸片的组成:我们以图片“ 000.bmp”为例,在初步分析中得到碎纸片的对应的二值化矩阵,我 们对二值化矩阵的每一行求和,如果碎纸片无字的地方(即此处的灰度值为255)对应行向量的均和为255* 72 =18360。前面分析中已经提到组成每一条长方形纸条的碎纸片 的共性就是相应的空白部分是相同
13、,因此我们选取“000.bmp”对应二值化矩阵中每一行求的和中几组连续等于18630的行数,为27行到56行、98行到123行、166行到 180 行。接下来我们通过matlab编程(程序见附件X)在剩余207个碎纸片中寻找在27行 到56行、98行到123行、166行到180行中和为18360的碎纸片,分别为18、23、26、 30、41、50、62、76、86、87、100、120、142、147、168、179、191、195 行。5.3问题三模型的建立与求解5.3.1问题三中所给的数据时一页英文印刷文字双面打印文件的碎片数据,了如第一个碎片的两面分别对应文件 000a、000b。问题三
14、相比较于问题二又近一步的复杂化,问题三是一个的数学问题。我们采取 的数学模型求解。为方便起见,将双面的打印的文件分成两个单面文件。分析原文件切割的过程。原文件在被横向切割之后得到的22个长形纸条,再每个长形纸条纵向切割成19个碎纸片。求解原文件的复原过程。Step1通过matlab读取每个碎纸片的灰度值矩阵。对灰度值矩阵进行初步的处理,求得每个灰 度值矩阵的每一行数据的元素的平方和。Step2在原文件边缘位置的纸片具有如下特性:位于原文件的左端的碎纸片所对应的灰度值矩 阵的前三列元素的值大部分为255,位于原文件的右端的碎纸片所对应的灰度值矩阵的最后三列元素的值大部分为 255,位于原文件的上
15、端的碎纸片所对应的灰度值矩阵的前三行元素的值大部分为255,位于原文件的下端的碎纸片所对应的灰度值矩阵的最后三行元素的值大部分为255。根据这一特性首先将位于原文件左、右、上、下端的碎纸片找出,再根据碎纸片对应灰度值矩阵边缘化关系 进行匹配,可以得到按正常顺序排列的位于原文件左、右、上、下端长形纸片。Step3 因为每个长形纸条纵向切割得到的碎纸片的行间距所在的位置是一样的,根据这一特性可以将Step2中剩余的碎纸片分成 20类,对每一类中碎纸片进行匹配形成完整顺序的 20类长形纸 片。Step4 在这 20 类匹配六 模型的评价问题一: 基于边界交点距离,该方法不依赖与集合特征、实现简单,可
16、靠性比较高。七 模型的改进八 参考文献参考文献按正文中的引用次序列出,其中书籍的表述方式为: 编号 作者,书名,出版地:出版社,出版年。参考文献中期刊杂志论文的表述方式为: 编号 作者,论文名,杂志名,卷期号:起止页码,出版年。参考文献中网上资源的表述方式为: 编号 作者,资源标题,网址,访问时间(年月日)。九 附录附录一clear,clc an=cell(1,19);A=;B=;for n=0:18 ann+1=imread(D:MATLABR2013abin,num2str(n),.bmp);A=A,ann+1(:,1);B=B,ann+1(:,72);endm=;maxval=;inde
17、x=;c=;for i=1:19ai=A(:,i);for j=1:19if(i=j)bj=B(:,j);c=(ai=bj); m=m,sum(c,1);endendendm=reshape(m,19,18); maxval1,index1=max(m);maxval=maxval;maxval1 ;index=index;index1;index;maxval附录二诚上层楼叠WL城下清淮古汴。举手揖吴云人与暮天俱远。魂断。 魂断后夜松江月满。簌簌衣巾莎枣花。村里村北响缥车口牛衣古柳卖黄 瓜。海棠珠缀一重重。清晓近帘拢。胭脂谁与匀淡偏向脸边浓。小郑非 常疆记.二南依旧能诗口更有鲸鱼堪切脍儿辈莫
18、教知。自古相从休务 日何妨低唱微吟。天垂云重作春阴勺坐中人半醉帘外雪将深。双鬟绿 坠。娇眼横波眉黛翠。妙舞骗82。掌上身轻意态妍口碧雾轻笼两凤寒烟 淡拂双鸦。为谁流睇不归家。错认门前过马。我劝髯张归去好.从来自己忘情口尘心消尽道心平。江南与塞北何 处不堪行。闲离阻。谁念萦损襄王,何曾梦云雨。旧恨前欢心事两无据。 要知欲见无由痴心犹自倩人道、一声传语。风卷珠帘自上钩。萧萧乱 叶报新秋。独携纤手上高楼。临水纵横回晚輕。归来转觉情怀动乜梅笛烟 中闻几弄。秋阴重。西山雪淡云凝冻。凭高眺远见长空万里云无留迹。 桂魄飞来光射处F冷浸一天秋碧。玉宇琼楼,乘鸾来去人在清凉国。江 山如画,望中烟树历历。省可清言
19、挥玉尘真须保器全真。风流何似道家 纯.不应同蜀客,惟爱卓文君。自惜风流云雨散。关山有限情无限*待君 重见寻芳伴d为说相思.目断西楼燕拯莫恨黄花未吐。且教红粉相扶。酒 阑不必看茱5L俯仰人间今古出玉骨那愁瘴雾冰姿自有仙风。海仙时遣 探芳丛。倒挂绿毛么凤。俎豆庚桑真过矣#凭君说与南荣。愿闻吴越报丰登。君王如有问”结 袜赖王生师唱谁家曲,宗风嗣阿谁。借君拍板与门槌。我也逢场作戏、 莫相疑。晕腮嫌枕印。印枕嫌腮晕。闲照晚妆残。残妆晩照闲。可恨相逢 能几日,不知重会是何年口茱萸仔细更重看。午夜风翻幔.三更月到床。 篁纹如水玉肌凉。何物与侬归去、有残妆.金炉犹暖麝煤残j惜香更把宝 钗翻口重闻处余熏在这一番
20、、气味胜从前。菊暗荷枯一夜需n新苞绿 叶照林光。竹篱茅舍出青黄C霜降水痕收。浅碧鳞鳞露远洲C酒力渐消凤 力软,飕飕.破帽多情却恋头。烛影摇风一枕伤春绪。归不去口凤楼何 处芳草迷归路汤发云职娜白盏浮花乳轻圆人间谁敢更争妍。斗取 红窗粉面口炙手无人傍屋头。萧萧晩雨脱梧楸。谁怜季子敝貂裘口fair of face.The customer is always right. Eastz west, homes best. Lifes not all beer and skittles. The devil looks a仕er his own. Manners maketh man. Many a m
21、ickle makes a muckle. A man who is his own lawyer has a fool for his client.You cant make a silk purse from a sows e且匸 As thick as thieves. Clothes make the man. All that glisters is not gold. The pen is mightier than sword* Is fair and wise and good and gay. Make love not war. Devil take the hindmo
22、st The female of the species is more deadly than the male. A place for everything and everything in its place. Hell hath no fury like a woman scorned. When in Rome, do as the Romans do. To err is human; to forgive divine. Enough is as good as a feast. People who live in glass houses shouldnt throw stones. Nature abhors a vacuum Moderation in all:hings.Everything comes to him who waits. Tbmorrow is another day. Better to light a candle than to curse the darkness*Two is company, but threes a crowd* Its the sque
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年建筑安装工程项目合同
- 力课件教学课件
- 2024年广告代理合作协议
- 2024年工程咨询与技术服务合作协议
- 2024年度公司用车管理协议
- 2024年度建筑工程设计、施工购销合同
- 2024年度35kv高压线路施工合同
- 2024年度某影视公司与某投资公司关于某电影项目融资的合同
- 公司年会的演讲稿模板八篇
- 为世界无车日活动宣传标语(155句)
- 民用无人机操控员执照(CAAC)考试复习重点题及答案
- 疼痛科整体规划和发展方案
- 2024年中国南水北调集团水网水务投资限公司及下属单位社会招聘高频难、易错点500题模拟试题附带答案详解
- (新版)食品生产企业食品安全员理论考试题库500题(含答案)
- 七年级语文上册第13课《纪念白求恩》公开课一等奖创新教案
- 统编版语文六年级上册第八单元大单元整体教学设计
- 教师个人业务学习笔记(41篇)
- 2025年高考语文复习备考复习策略讲座
- 数学史上的三次数学危机
- 2024年水电暖安装承包合同
- 缺乳(乳汁淤积)产妇的中医护理
评论
0/150
提交评论