碎纸片拼接复原数模论文b

合集下载

基于图像处理的碎纸片拼接数学模型分析

基于图像处理的碎纸片拼接数学模型分析

基于图像处理的碎纸片拼接数学模型分析【摘要】本文基于图像处理技术,通过建立数学模型分析碎纸片拼接的过程。

首先介绍研究背景和研究意义,接着详细阐述数学模型的建立和图像处理方法的应用。

通过实验结果分析和误差分析,发现现有模型存在一定的问题,并提出模型优化方法。

总结研究成果,展望未来可能的研究方向。

通过本文的研究,可以更加深入地理解碎纸片拼接的数学模型,为相关领域的研究提供参考和帮助。

【关键词】碎纸片、图像处理、数学模型、拼接、实验结果、误差分析、模型优化、研究背景、研究意义、研究成果、未来展望。

1. 引言1.1 研究背景碎纸片拼接是一种常见的问题,它在实际生活和工程应用中具有重要意义。

碎纸片拼接可以用于恢复损坏的文件或图像,也可以用于数字化文物等领域。

在实际操作中,由于碎片形状、大小、颜色等的多样性,导致碎纸片拼接过程复杂且耗时。

基于图像处理的碎纸片拼接方法能够有效地解决这一问题,通过利用计算机视觉技术对碎纸片进行识别、匹配和拼接,实现自动化碎纸片拼接的目的。

目前,针对碎纸片拼接问题的研究已经取得了一定的进展,但仍然存在一些挑战和问题。

碎纸片的形状复杂多样,容易出现匹配错误或漏配现象;碎纸片之间可能存在重叠或遮挡情况,导致图像处理的难度增加。

有必要建立一个有效的数学模型,结合图像处理方法来对碎纸片拼接进行深入研究和分析。

本研究旨在探讨基于图像处理的碎纸片拼接数学模型,提出相应的算法和优化方法,为解决碎纸片拼接问题提供新的思路和方法。

1.2 研究意义碎纸片拼接是一个常见的问题,它涉及到图像处理、数学建模等多个领域。

通过对碎纸片进行拼接,可以恢复原始图像,这在很多场景下都具有重要的应用意义。

对于破损的文件进行修复、对于涂抹的照片进行修复等。

碎纸片拼接数学模型的建立和图像处理方法的应用,可以帮助我们更好地理解碎纸片拼接问题的本质,并且为实际问题的解决提供重要的理论支持。

通过对实验结果进行分析和误差分析,可以不断优化模型,并且为碎纸片拼接问题的应用提供更加精确和稳定的解决方案。

2013全国数学建模竞赛B题优秀论文

2013全国数学建模竞赛B题优秀论文

基于最小二乘法的碎纸片拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。

针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。

经计算,得到附件1的拼接结果为:08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。

附件2的拼接结果为:03,06,02,07,15,18,11,00,05,01 ,09,13, 10,08,12,14,17,16,04。

针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。

我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。

针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。

经计算,附件5的拼接结果见表14和表15该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。

关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。

近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

2013年全国数学建模大赛获奖论文碎纸片的拼接复原.

2013年全国数学建模大赛获奖论文碎纸片的拼接复原.

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1. 卢丽丹2. 王雪梅3. 国占飞指导教师或指导教师组负责人(打印并签名):指导教师组(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文主要研究碎纸片拼接复原的问题,它实质上是建立特征数组并利用C语言进行比较。

在问题1中,建立了以每个边缘像素到原点距离的特征数组;通过比较边缘像素,以距离比较的方法得到各个图象的特征数组相似度的大小并以此建立模型1。

具有最大相似度的图片认为其匹配。

对于问题2,由于出现精度太低的情况,所以我们对问题1进行了改进,由于问题2图片横纵切。

关于碎纸片自动拼接的数学模型_大学生数学建模竞赛优秀论文 精品

关于碎纸片自动拼接的数学模型_大学生数学建模竞赛优秀论文 精品

关于碎纸片自动拼接的数学模型摘要本文针对生活中破碎文件的拼接难度大,效率低等现象,从题目所给的情形出发,利用计算机软件把碎纸片图像转化为数字图像,综合运用matlab 软件中的数字图像处理方法,建立了以图与图之间的相似程度为基准的数学模型。

这个模型的评价标准很简单,就是相似度函数的值。

通过比较图像与图像之间的相似度函数的值的大小,就可以得出碎纸片的具体拼接序列。

对于问题(1),首先,用matlab 软件的imread 函数对图像的进行读取,得到数据矩阵为),(y x F i 。

其次,根据模型的假设(1),找到最右端的碎纸片,并记为),(1y x F 。

然后,以数据矩阵),(y x F i 为基础,引入相似度函数)(b sim ,并求 出相似度函数值。

最后,用matlab 工具箱中的sort 函数把所得到的相似度函数值进行排序,所得到的相似度函数值最小的图像即为与最右端的碎纸片匹配的图像。

如此重复18次,即可得附件1的中文图像的排列序号,结果如表1所示。

同理可得附件2的英文图像排列序号,结果如表2所示。

复原结果图片见论文附件的图1和图2。

对于问题(2),同样先找到最右端的11张图像和最上方的19张图像,根据图像的页边距特性确定原图像右上角的第1张图像。

利用问题(1)的算法可得最右端的11张图像和最上方的19张图像的排列序号。

然后,在问题(1)的算法的基础上,利用图像中的文字的固定间距去改进算法,缩小搜索范围,并在拼接完一行后显示一次结果,由于近似距离计算公式与人主观视觉差异,所以需要人机交互调整结果。

如此重复18次,即可得附件3的中文图像的排列序号,结果如表3所示。

同理可得附件4的英文图像排列序号,结果如表3所示。

对于问题(3),与问题(2)相似,只是碎纸片由单面变为双面。

因此在匹配图像时,引入两重相似度函数)(Q sim ,以确保正反两面能同时匹配。

同时每匹配5张图像显示一次结果,以增加人工干预次数。

2013 数模国赛 B题 碎纸片的拼接复原

2013 数模国赛 B题  碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛B题碎纸片的拼接复原首先分析问题:对于第一问分析如下对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

求matlab图像拼接程序clear;I=imread('xingshi32.bmp');if(isgray(I)==0)disp('请输入灰度图像,本程序用来处理128 *128的灰度图像!');elseif (size(I)~=[128,128])disp('图像的大小不合程序要求!');elseH.color=[1 1 1]; %设置白的画布figure(H);imshow(I);title('原图像');zeroImage=repmat(uint8(0),[128 128]);figure(H); %为分裂合并后显示的图设置画布meansImageHandle=imshow(zeroImage);title('块均值图像');%%%%%设置分裂后图像的大小由于本图采用了128像素的图blockSize=[128 64 32 16 8 4 2];%%设置一个S稀疏矩阵用于四叉树分解后存诸数据S=uint8(128);S(128,128)=0;threshold=input('请输入分裂的阈值(0--1):');%阈值threshold=round(255*threshold);M=128;dim=128;%%%%%%%%%%%%%%%%% 分裂主程序%%%%%%%%%%%while (dim>1)[M,N] = size(I);Sind = find(S == dim);numBlocks = length(Sind);if (numBlocks == 0)%已完成break;endrows = (0:dim-1)';cols = 0:M:(dim-1)*M;rows = rows(:,ones(1,dim));cols = cols(ones(dim,1),:);ind = rows + cols;ind = ind(:);tmp = repmat(Sind', length(ind), 1);ind = ind(:, ones(1,numBlocks));ind = ind + tmp;blockValues= I(ind);blockValues = reshape(blockValues, [dim dim numBlocks]);if(isempty(Sind))%已完成break;end[i,j]=find(S);set(meansImageHandle,'CData',ComputeMeans(I,S));maxValues=max(max(blockValues,[],1),[],2);minValues=min(min(blockValues,[],1),[],2);doSplit=(double(maxValues)-double(minValues))>threshold;dim=dim/2;Sind=Sind(doSplit);Sind=[Sind;Sind+dim;(Sind+M*dim);(Sind+(M+1)*dim)];S(Sind)=dim;end对于第二问于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

碎纸片拼接复原数模论文B

碎纸片拼接复原数模论文B

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆XX大学参赛队员(打印并签名) :1. 祝XX2. 冯XX3. 周XX指导教师或指导教师组负责人(打印并签名):张XX(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 20XX 年 X 月 XX 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要图像碎片自动拼接复原是需要借助计算机把大量碎片重新拼接复原成初始图像的完整模型,这一研究在考古、刑侦犯罪、古生物学、医学图像分析、遥感图像处理以及壁画保存复原等方面具有广泛、实际的应用[1].本文主要解决碎纸机破碎文档的自动拼接复原问题.我们利用图像数字化技术,借助Matlab软件将图像转化为矩阵.通过建立数学模型,运用矩阵论、聚类分析方法、自定义相似度方法、遗传算法、字符分割和字符识别等方法,对数据进行处理,实现对图像碎片自动拼接,从而将所给碎片拼接复原为完整图像.问题一,我们首先把碎片图形进行二值化处理,根据所给纵切黑白碎片边缘的像素关系(相邻两张碎片,一张碎片矩阵右边的像素与另一张碎片左边的像素相同 ),我们采和自定义相似度算法,利用附件一和附件二求出碎片间的相似度,然后根据所需要满足的条件即相似度最大原则,建立了纵切碎片拼接模型一及其算法,运用Matlab编程实现该模型,并得到碎片复原结果(见表一表二).问题二,要实现快速准确的拼接复原纵横切碎片,在问题一的思路基础上,我们采用了模糊C的均值聚类方法,先对附件三所有碎片进行初步的分类,然后在自定义相似度算法上增加了约束条件,以此来排除有若干碎片在匹配时相似度相同的情形,建立了改进的中文纵横切碎片拼接模型二,同样利用Matlab软件求得碎片的复原结果(见表三).对于英文纵横切碎片的拼接问题,我们采用了字符切割和字符识别思想,即在碎片的二值化矩阵中选取适当大小的行与列,对碎片边缘的英文字母进行切割,与其他图片匹配合并,提取切割字母的特征(统计特征或结构特征),再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符,将两张碎片拼接在一起,先一行一行地进行拼接,再利用模型二横切碎片方法,利用Matlab软件求得碎片的复原结果(见表四).问题三,在处理双面打印纵横切碎片时,经分析发现两面图片最大的区别在于光滑度的不同,纸张的正面比反面要光滑,因此在模型二的基础上还需增加一步筛选工作,就是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”,再根据不同页面的频率范围,设定一段频率值,借助计算机将双面打印的碎片进行分类,分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可,通过这种方法求得碎片的复原结果.关键词:碎片拼接均值聚类方法相似度模型傅里叶变换一、问题重述背景:破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础,而且图像配准算法的计算量一般非常大,因此图像拼接复原技术的发展很大程度上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.重述:该题研究的是如何对碎纸片进行拼接复原.传统上,拼接复原工作需由人工完成,准确率较高,但是效率低.随着计算机技术的发展,当碎纸片数量巨大的时候,人们试图开发碎纸片的自动拼接技术,以提高拼接复原的效率.问题1 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。

碎纸片的拼接复原分析(最终)甄选范文

碎纸片的拼接复原分析(最终)甄选范文

碎纸片的拼接复原分析(最终).(优选)基于多耦合规则的人机交互拼接模型摘要随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

本题就是求解破碎文件自动拼接问题,实际上就是通过数字处理技术将碎纸信息转化成计算机可以识别的数字图像信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的全自动或半自动拼接还原。

题目共分为三个问题,第一个问题是对同一页单面印刷文字文件仅纵切的碎纸片进行拼接复原。

第二个问题是对同一页单面印刷文字文件既纵切又横切的碎纸片进行拼接复原。

第三个问题是对同一页双面打印文件既纵切又横切的碎纸片拼接复原问题。

前两个问题的文件又分为中英文两种情况。

三个问题由简到难,层层深入。

在求解问题过程中,首先利用图论概念与定义描述了图片的拼接问题,将问题转化为最优树寻找问题。

根据对中、英字符的分析,总结出中、英字符在书写上的异同,分别建立基线耦合、字宽耦合、边缘耦合、字符耦合、双边耦合、三边耦合等六种耦合拼接准则,尽量使得每一块碎片都有多种可用的耦合拼接方式。

将耦合准则根据关联程度进行优先级排序,每一块碎片的信息依次按照耦合准则优先级进行量化,从而多方式量化每一块碎片之间拼接的耦合程度,进而实现了碎片的自动最优拼接。

本题所建立的耦合准则拼接算法只需要随机选取一块碎片作为种子,经过不同耦合方式的筛选,可找到与之某一边具有较高耦合度的另一块碎片,拼接成为一块具有较大可信度的图像,再通过人工识别,判断所得的图片是否正确,并建立确定拼接集和排除拼接集,实现拼接图像的进化,再与用户交互。

对于碎片拼接过程的提出了交互审查式、人机交互式和混合式三种模式,并建立了包括拼接模式、拼接识别、拼接控制、信息显示等多种用户指令在内的指令库,即可通过简单的人工指令对程序进行控制,进而利用计算机对碎片进行正确的复原。

利用耦合准则拼接算法及人机交互过程实现了碎片复原过程的简化。

且本题所建立的模型可广泛应用与解决一维、二维、双面等问题。

2021全国大学生数学建模比赛B题 答案

2021全国大学生数学建模比赛B题 答案
图1中左边矩阵第一列与右边矩阵第二列匹配的原那么与上述一样,不再重述。
如图2,当图片出现倒置情况时,正常情况下应是左边矩阵的第二列元素与右边矩阵的第一列元素进展两两匹配,假设倒置后,那么应该是左边矩阵的第二列元素与右边矩阵的第二列元素倒置顺序进展比拟,同样记录一样元素的个数并计算匹配度。
图2中左边矩阵第一列元素与右边矩阵第一列元素的匹配原那么与上述一样,不再重述。
日期:2021年9月13日
赛区评阅编号〔由赛区组委会评阅前进展编号〕:
2021高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号〔由赛区组委会评阅前进展编号〕:
赛区评阅记录〔可供赛区评阅时使用〕:







全国统一编号〔由赛区组委会送交全国前编号〕:
全国评阅编号〔由全国组委会评阅前进展编号〕:
针对问题三考虑到双面问题以及问题二中英文碎纸片的情况,我们把碎纸片两面匹配度之和作为判断碎纸片是否连接的评价标准,在问题一方法的根底上,在计算机每一步的匹配结果加以人工选择与判断,这样再次处理得到的结果,可以得到同问题二中一样的横行碎纸片,在根据新的横行碎纸片的两面边缘匹配度之和进展同样的操作处理可以将原纸张拼接复原。
两张图片匹配的原那么可以根据下面的图1、图2来表示。
如图1,当图片未出现倒置情况时,即题目中的图片均是正常摆放,将左边矩阵的第二列元素与右边矩阵的第一列元素进展两两匹配。记录元素一样的个数,个数除以1980为左边矩阵第二列对右边矩阵第一列的边缘匹配度,记为:
将所有碎纸片的二值化矩阵做如上匹配可依次选取与其匹配的碎纸片。
观察下面的图3可以发现,通过查阅资料分析[2]基于文字特征的文档碎纸片半自动拼接,每一行的绝大多数中文文字均可认为拥有同一上界、同一下界〔图3最右端出现了“一〞字,但是同行还存在其他文字,可以认为同一行文字有同一上界与同一下的碎纸片归类为一组。方法为:搜索每一张碎纸片转化后二值化矩阵 的每一行,假设矩阵该行中存在数值1,那么将该行全部赋值为1,假设这一行元素全为0,那么将该行全部赋值为0,其中1表示本行存在灰度小于255的像素,0表示不存在灰度小于255的像素,这样将209张碎纸片做出[4]新的二值化矩阵 ,之后同4.1的分析取边缘做边缘匹配得修改后的[6]边缘匹配度矩阵 ,匹配度高那么说明碎纸片的文字信息处于同一程度位置,见下列图图4,之后再人工干预,得到较优的结果。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

碎纸片拼接复原数模论文bRevised as of 23 November 20202013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆XX大学参赛队员 (打印并签名) :1. 祝XX2. 冯XX3. 周XX指导教师或指导教师组负责人 (打印并签名):张XX (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 20XX 年 X 月 XX 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要图像碎片自动拼接复原是需要借助计算机把大量碎片重新拼接复原成初始图像的完整模型,这一研究在考古、刑侦犯罪、古生物学、医学图像分析、遥感图像处理以及壁画保存复原等方面具有广泛、实际的应用[1].本文主要解决碎纸机破碎文档的自动拼接复原问题.我们利用图像数字化技术,借助Matlab软件将图像转化为矩阵.通过建立数学模型,运用矩阵论、聚类分析方法、自定义相似度方法、遗传算法、字符分割和字符识别等方法,对数据进行处理,实现对图像碎片自动拼接,从而将所给碎片拼接复原为完整图像.问题一,我们首先把碎片图形进行二值化处理,根据所给纵切黑白碎片边缘的像素关系(相邻两张碎片,一张碎片矩阵右边的像素与另一张碎片左边的像素相同 ),我们采和自定义相似度算法,利用附件一和附件二求出碎片间的相似度,然后根据所需要满足的条件即相似度最大原则,建立了纵切碎片拼接模型一及其算法,运用Matlab 编程实现该模型,并得到碎片复原结果(见表一表二).问题二,要实现快速准确的拼接复原纵横切碎片,在问题一的思路基础上,我们采用了模糊C的均值聚类方法,先对附件三所有碎片进行初步的分类,然后在自定义相似度算法上增加了约束条件,以此来排除有若干碎片在匹配时相似度相同的情形,建立了改进的中文纵横切碎片拼接模型二,同样利用Matlab软件求得碎片的复原结果(见表三).对于英文纵横切碎片的拼接问题,我们采用了字符切割和字符识别思想,即在碎片的二值化矩阵中选取适当大小的行与列,对碎片边缘的英文字母进行切割,与其他图片匹配合并,提取切割字母的特征(统计特征或结构特征),再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符,将两张碎片拼接在一起,先一行一行地进行拼接,再利用模型二横切碎片方法,利用Matlab软件求得碎片的复原结果(见表四).问题三,在处理双面打印纵横切碎片时,经分析发现两面图片最大的区别在于光滑度的不同,纸张的正面比反面要光滑,因此在模型二的基础上还需增加一步筛选工作,就是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”,再根据不同页面的频率范围,设定一段频率值,借助计算机将双面打印的碎片进行分类,分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可,通过这种方法求得碎片的复原结果.关键词:碎片拼接均值聚类方法相似度模型傅里叶变换一、问题重述背景:破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础,而且图像配准算法的计算量一般非常大,因此图像拼接复原技术的发展很大程度上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.重述:该题研究的是如何对碎纸片进行拼接复原.传统上,拼接复原工作需由人工完成,准确率较高,但是效率低.随着计算机技术的发展,当碎纸片数量巨大的时候,人们试图开发碎纸片的自动拼接技术,以提高拼接复原的效率.问题1 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,写出干预方式及干预的时间节点.问题2 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、4给出的中、英文各一页文件的碎片数据进行拼接复原.如果复原过程需要人工干预,写出干预方式及干预的时间节点.问题3 对于双面打印文件的碎纸片拼接复原问题设计碎纸片拼接复原模型和算法,并针对附件5给出的一页英文印刷文字双面打印文件的碎片数据进行拼接复原,结果表达同上.二、问题分析碎纸机破碎纸片的拼接复原,都需要经过获取图像,导入图像,图像预处理,图像配准,和图像的拼接复原步骤.其中图像配准是碎纸片拼接复原技术中最重要的环节之一.针对本题中给出的三种不同的情况,需采用不同的模型和算法来提高拼接复原的效率和准确度[2]:对于问题1 所需要拼接复原的碎纸片为纵向切割的小纸条,通过Matlab软件将所给图片转换成为198072⨯的二值矩阵,先随机选择一个碎片的矩阵作为基本矩阵,将剩余矩阵与基本矩阵作比较,通过matlab软件计算出相比较矩阵的相似度,再根据模型一的匹配方法将碎纸片进行拼接复原,此拼接模型不需要人工干预.对于问题2 对于碎纸机既横切又纵切的情形,所得碎片的像素较低,采用模型一的算法无法完全拼接复原1911⨯个碎片,需要先对碎片进行聚类分析,筛选出特征相同的碎片,再根据二重判别标准的相似度刻画原则,将碎片进行横向和纵向的拼接复原.对中文碎片进行拼接时,先通过二值矩阵找出字间距和一个字的间距,通过聚类分析法先将所有碎片分行找出,把横纵切拼接问题转化为横切碎片拼接,再利用行间距和字的行高约束条件,运用遗传算法拼接复原整个图片.英文碎片拼接与中文碎片拼接不同,在拼接碎片时,需要采用字符切割的方法,提取英文字母的特征,根据碎片边缘字母的特征,再利用字符识别的方法,寻找相匹配的碎片,根据这一原则运用遗传算法的匹配方法拼接复原英文碎片.对于问题3 要想拼接复原双面打印碎片,必须先将所有碎片进行分类.把同一页的碎片分离出来.经过分析可得,两面打印的纸张的粗糙度不同,正面比反面光滑,根据这一特征,需要采用傅里叶变换处理图像,从而得到碎纸片的“频率”图.高频代表图像的细节、纹理信息,低频代表图像的轮廓信息.对所有碎纸片进行高频滤波.滤波后可得图像的纹理信息.运用Matlab软件计算若干碎纸片的频率信息,设定频率范围,将所有碎纸片分为正反页面图片两类.再采用模型二的算法拼接复原整个图片.三、基本假设1、碎纸机破碎的每个纸片的长、宽和厚度均相同;2、所有碎片是黑白图片,图片清晰;3、碎片完整没有缺损缺失,可以完全拼接复原;4、碎纸片的正反两方面的印刷效果都一样,互不影响;5、扫描图片没有变异,文字与图片上边界平行;6、文件页边距和行距固定;7、碎片中的文字方向相同,不需要考虑碎片拼接时需要旋转拼接复原. 表示两个碎纸片像素边界矩阵元素相同的数目 通过我们建立的自动拼接模型,在图片拼凑过程中,我们可以预测图片的拼接大致需进行图片处理、边界比较、图片输出等步骤.通过我们所得的模型预测,可以得出预测方程.具体流程图如图5-1所示:图5-1 模型方法预测(一)问题一模型的建立与求解5.1.1 图像的导入 运用Matlab 软件采用二值法原理将碎片的图像转换成为198072⨯的(0,1)矩阵,记为i A )19,,2,1( =.5.1.2图像的去噪边缘处理 采用中值滤波的原理对图像边缘进行去噪.中值滤波就是用相邻像素的中值来替代该像素的值,利用Matlab 对图像所成二值矩阵进行光滑处理,以此提高碎片匹配时的相似度.中值滤波法是一种非线性平滑技术,它将每一象素点的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值.中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个拎域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。

方法是去某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。

二维中值滤波输出为)},(),,({),(w l k l y k x f med y x g ∈--=,其中,),(y x f ,),(y x g 分别为原始图像和处理后图像。

W 为二维模板,通常为33,22⨯⨯区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等中值滤波的函数为:5.1.3图像的配准1)遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种有效的解最优化问题的方法.借助计算机选取第一张碎片作为第一张图,采用遗传算法,将该图片的右边缘矩阵与剩下的18张图的相对应的左边缘矩阵随机的根据相似度进行比较,然后把相似度最高的图片作为第二张图并与第一张图片拼接起来.将第一张图作为基准图,向右匹配,若右方向的匹配完成,再朝左方向匹配,以此类推,直到将所有图片拼接复原完成.问题一不需要进行人工干预.图5-2 遗传算法流程图2)相似度的计算方法:计算机自动选择一张碎片为第一张碎片(此处就以为第一张),具体实现算法为用嵌套循环,第一重循环取出每张图片最右边(第72列)的像素矩阵,第二重循环取出每张图片最左边(第1列)的像素矩阵,然后作这两个矩阵的比较,结果相同为1不同为0,对其结果矩阵求和作为刻画相似度的标准,如果是自身比较则置为0,当结果中出现1980(说明两张图片是100%匹配,可以判断出第一张和最后一张),用这种方法就可以得到完整的拼接图像,剩余图片的矩阵随机编号为i A ,利用Matlab 软件选取矩阵中的n 行运用同或运算法则进行相似度的计算.假设 100010100A ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦ 01101101i A ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦. 让1A 的最右列与i A 的最左列的元素一一对应作比较,同行的两元素相同则为,1,不同记为0,从第一行开始累加,累加的结果记为i m . 相似度记为:100%ib nm =⨯ (n=1980). 5.1.4图像的导出1)根据配准结果进行矩阵的拼接.2)运用Matlab 软件编程实现图像的导出.问题二为纵横切有1119⨯个碎片,每个碎纸片的边缘像素相对于问题一来说要少很多,无法直接利用模型一求解问题二.在模型一的基础上,我们首先对中文碎片进行拼接复原,根据图片的特征对图片进行分类,然后再采用双重标准定义相似度的算法来进行图片的拼接.拼接英文碎片时,采用字符切割和字符识别的方法,问题二需要人工介入.5.2.1 图像导入同样采用二值法,运用Matlab 软件将碎纸片的图像转换为18072⨯的(0,1)矩阵.5.2.2图像边缘处理采用模型一的中值滤波的方法对209张图片的边缘进行光滑处理,以提高图片在匹配时的相似度,排除噪声对图片的影响.5.2.3图像配准(拼接中文碎片)1)采用模糊C 均值聚类方法根据同行图片的特征,同一行图片的同列字间的间距相同,缺损字的上边缘或下边缘与碎片的边缘之间的距离相同.还可以根据字的最左端到图片边缘之间的距离相等筛选出文章最左列碎片,运用Matlab 软件编程将209张碎片进行初步分类,再利用Matlab 软件建立元胞数组,将碎片分行导入元胞数组,同行碎片不分顺序[3].模糊C 均值聚类:设R X X X P N X ⊂=},,,{21 ,R P表示P 维实数向量空间.令u ik 表示第k 个样本属于第i 类的隶属度,10≤≤u ik ,∑=c i ik u 1=1,N Nk ik u <<∑=10,c i N k ≤≤≤≤1,1。

相关文档
最新文档