规则碎纸片的拼接复原

合集下载

B题碎纸片的拼接复原

B题碎纸片的拼接复原(总28页)页内文档均可自由编辑，此页仅为封面B题碎纸片的拼接复原摘要图像碎片拼接复原是借助计算机把大量的图像碎片重新拼接成初始图像的完整模型。

这一问题在考古、刑侦、古生物学以及壁画保存等方面具有广泛的应用。

要从成千上万的图像碎片中找到相互邻接的图像碎片，并最终拼接成完整的模型，需要用计算机和人工干预辅助相结合的方式来完成。

本文就对碎纸片的拼接复原问题进行分析研究，针对单面纵切，单面既纵切又横切，双面既纵切又横切纸片等情况的拼接复原问题，建立了相应的数学模型，并运用Excel、MATLAB等数学软件，分别对题目所提出的问题进行求解。

对于问题一，我们将碎纸片信息导入MATLAB软件中，得到每个碎纸片的像素值，并利用该像数值计算出碎纸片间拼接的候选权重C，再以该权重值)i,(j为依据对碎纸片进行配对，得到了碎纸片的拼接顺序，进而实现了仅纵切纸片时中、英文碎片的拼接复原。

对于问题二，我们首先筛选出了左右两侧有空白的碎片,并把剩余碎片的信息导入MATLAB中,按照问题一中的方法计算出候选权重；利用该候选权重对碎片的编号进行定位，得到了一个定位矩阵并将其导入到Excel中，在Excel中分析该矩阵，可得到一个最优的拼接次序；再进行人工干预，找到左页边的碎片编号并将其置于第一位，然后按照最优连接次序将碎片进行拼接，得一个完整的行碎片。

再对行碎片进行拼接，最优选择标准为：同一段落内行间距相同。

可以得到按段落划分的几个碎片。

此时进行人工干预，人为拼接为完整图片。

在本问中，由于中、英文字的差异，在对英文碎片拼接时本文只采用了候选权重法进行处理。

对于问题三，考虑到英文双面的数据过于庞大，本文先对数据进行分类，用MATLAB软件将处于同一行的碎片提取出来，分别存放在不同的文件夹中；然后再对文件夹内的数据进行候选权重的处理，按照问题二中的方法得到最优排列次序，按该排列次序拼接碎片得到了22个横向碎片，其中有11对正反面，再对这些横向碎片进行计算候选权重的处理，然后确定一个最优排列次序，完成图片的拼接。

碎纸片拼接复原的数学方法

碎纸片拼接复原的数学方法拼图游戏，一种看似简单却富含深度的游戏，给人们带来了无穷的乐趣。

然而，大家是否想过，这样的游戏其实与数学有着密切的？让我们一起探索碎纸片拼接复原背后的数学方法。

碎纸片拼接复原，其实就是一个计算几何问题。

在数学领域，欧几里得几何和非欧几里得几何是两个基本而又重要的分支。

欧几里得几何主要研究的是在平面上两点之间的最短距离，这是我们日常生活中常见的几何学。

而非欧几里得几何则研究的是曲面上的几何学，这种几何学并不符合我们日常生活中的直觉。

碎纸片拼接复原的问题就是一种非欧几里得几何问题。

在计算机科学中，图论是研究图形和网络的基本理论。

其中，图形遍历算法可以用来解决碎纸片拼接复原问题。

这种算法的基本思想是：从一点出发，尽可能多地遍历整个图形，并在遍历的过程中对图形进行重建。

对于碎纸片拼接复原问题，我们可以将每一张碎纸片看作是图中的一个节点，当两张碎纸片拼接在一起时，它们就形成了一个边。

通过这种方式，我们可以将所有的碎纸片连接起来，形成一个完整的图形。

在计算机科学中，碎纸片拼接复原问题被广泛应用于图像处理、数据恢复等领域。

例如，在数字图像处理中，如果一张图片被切割成若干块，我们可以通过类似的方法来恢复原始的图片。

在数据恢复领域，当一个文件被删除或格式化时，我们也可以通过类似的方法来恢复文件。

碎纸片拼接复原的问题不仅是一个有趣的拼图游戏，更是一个涉及计算几何、图论等多个领域的数学问题。

通过运用这些数学方法，我们可以有效地解决这个问题，从而更好地理解和应用这些数学理论。

在我们的日常生活中，我们经常会遇到一些破碎的物品，例如碎镜子、破碎的瓷器，或是碎纸片等。

这些物品的复原过程都需要一种科学的方法来帮助他们重新拼接起来。

这种科学方法就是碎纸片拼接复原技术。

碎纸片拼接复原技术是一种基于数学模型的方法，它通过比较碎纸片边缘的形状、纹理、颜色等特征，来找到碎纸片之间的相似性和关联性，从而将它们拼接起来。

碎纸片自动拼接复原模型的实现

式）ａ＝（ａ，１， …，口：）与ａ，＝（日，以１一，），我们定义相似度：
通过对图中碎片的观察与分析，我们发现这些碎片具有共同的
特征。如图４６）中碎片上被标记的部分所示。ｌ８Ｏ ∑ｎ０ｎ由图４６）可以看出，这些图片都是有一行缺少英文字符，使得碎片（，Ｚ）这些特殊的５＇，－￣ｌｔ图片都是可以人工干预处理的。（２）对应的模式比较异常。在此基础上考虑碎片拼接过程，先对分类的碎片左右拼接，匹配仅其中为临界值。若，ｘｏ则我们认为与同属一类，对于在所在行匹配合成。上下匹配还要考虑行内其他元素的上下匹配。合成那些存在特殊情况的碎片，我们在分好类的基础上，再进行人工干预处时整行都要合成。综合考虑以上因素，我们对所有可以拼接的数据进行理。ｃ同类碎片拼接。按照单面纵向拼接方法对每—类中的所有碎片进拼接整合。（图５）行拼接，则可得到同一类中碎片的拼接方案，进而得到横向的 “ 大碎在这里，处理特殊碎片需遵循的原则：以第二次拼接的图片为底片” 。ｃＬ不同类“ 大碎片” 的拼接。“ 大碎片” 为横向的，但此问题－仍属于单图，剩下的１８块依次和底图匹配，匹配原则包含经此处理之后便于观面单向的拼接问题，因此可采用计算灰度值耦合度的方法进行拼接。察整体拼接隋况，但是拼接后在合成部分已做断开划线处理，这样便于２．２．２英文单面纵横切碎片拼接。考虑到英文的特殊陛，根据英文的将剩下的碎片进行拼接分析。经过此次拼接过程，可以观察已组合部分书写版式原则，可以将整篇文章放在带有英文四线格的底面中。既然可是否匹配正确，若不匹配的话，可以暂时先将那块碎片剔除，放到第三以放在四线格中，这里我们把一行四线格看成一行，可以确定每相邻行部分再进行匹配组合。碎片四边都要依次匹配，匹配度最高的就是缺少的行间距是一定的。行宽也是一定的，考虑字母仅占有上中、中、中下、块部分。按以上方法对样本文件４中的碎片进行拼接，结果见图５所上中下等几种情况，可以确定每一个字母都是在中间有书写笔画的，四不。线格中上下行都具有英文笔画的是少数。结束语基于这种考虑，可以对每一行四线格的中间内容进行求和，当其和通过研究规则切割碎纸片的拼接复原问题，我们针对单面中英文的值小于某一值的时候我们忽略四线格上面和下面的内容，进而只考纵向切割碎片以及单面中英文纵横双向切割碎片提出了不同的拼接复虑四线格的中间部分。对于那些特殊的碎片，我们可采用人工干预的方原模型以及方法。该方法将一张张碎片文件转换成了一个个像素点值式将其挑出，所以将英文中四线格的上半部分和下半部分的内容忽略，矩阵，对于计算机来说，碎片文件的处理就变成了矩阵集合的操作；另可以采取中文碎片模式转换的类似方法，从而到英文碎片的模式。外引入欧式距离将图像的拼接转化为耦合度的计算；接着考虑到印刷３实验结果及分析文本文件的排版特点，引入模式识别的概念，可以将大量杂乱碎片进行实验是在ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ７系统上进行，内存限定是２ＧＢ，算分类，然后逐类拼接，最终将双向拼接问题转化为单向拼接问题；最后法实现语言为ＭＡＴＬＡＢ７．０版本。根据不同的样本文件使用相应的拼所建立的模型效率好，精度高，从实验结果上可以看出该模型的可行性接算法，从而得到下面的模拟结果。和有效胜。３．１中英文单面纵切拼接实验。样本文件１和２分别为中英文单面致谢纵切碎片数据，其中每页纸被切为１９条碎片，分别用Ｏ００．ｂｍｐ一０１８．感谢对此项研究工作提供基金资助的西北民族大学中央高校基本ｂｍｐ编号命名。利用ＭＡＴＬＡＢ工具中的自带函数ｉｍ２ｂｗ和ｉｍｒｅａｄ，将科研业务费专项资金Ｎｏ．３１９２０１３０００８）ｔ）２及西北民族大学科研创新团图像转化为仅包含０和１的向量，接着根据中英文单面纵切算法可以队计划，同时感谢参与本论文讨论的赵习猛、任宗秀和王本涛。得到碎片的耦合度矩阵，由此可得样本文件１，即中文单面纵切碎片的参考文献拼接复利ｌ赙为：

纸张撕碎重新复原的方法

纸张撕碎重新复原的方法
将纸张撕成小块后，可以试用以下方法重新复原：
1. 拼图法：根据纸张上的图案或文字的特征，将撕碎的纸张小块一一拼接在一起。

可以使用胶水或透明胶带将小块粘接在一起，直到整张纸张还原为完整的状态。

2. 粘贴法：将所有纸张小块按照纸张上的线条方向，粘贴在一张背景纸上。

根据纸张上的文字或图案特征，可以推测纸张的排列顺序。

3. 数字法：对每个纸张小块进行编号，然后根据编号重新排列纸张小块。

4. 计算机辅助法：使用扫描仪或相机将撕碎的纸张进行扫描或拍照，然后使用图像处理软件将图像还原，最后打印出完整的纸张。

请注意，纸张撕碎再复原的难度取决于撕碎的程度和纸张的特性。

有些纸张可能不易复原或需要特殊的技术手段，如复印纸、碎纸机处理后的纸张等。

碎纸片的拼接还原研究

碎纸片的拼接复原摘要碎纸片的拼接复原是一门借助计算机，把大量碎纸片重新拼接成初始纸张的技术。

针对问题一，本文首先利用碎纸片图像灰度矩阵的边缘矩阵，建立了两个碎纸片之间的匹配度函数，求得了每一张图片之间左右边缘匹配度矩阵。

然后根据左边边缘位置的碎片的左边空白部分最多的特点，确定了左边位置的碎纸片。

接着根据拼接碎纸片的拼接复原时，所有碎纸片匹配度之和取极大值的原则，采用贪心算法，得到了所有碎纸片的初始位置，拼接复原了附件1和附件2中纸片。

针对问题二，由于附件3碎片数量太多，并且碎片的拼接复原，是一个以碎纸片总匹配度为目标函数的组合优化问题。

所以本文采用遗传算法将碎纸片的编号作为基因，并将基因均匀分成19段，按顺序每一段对应一个初始纸片列位置，进行了求解。

然后，根据边缘碎纸片某些边的空白部分多的特征，对初始基因进行了优化。

接着，根据碎纸片的黑色像素密度不同的特点，将碎纸片分成三类，根据同类纸片优先匹配的原则，对遗传算法的运行过程进行了优化，拼接复原了附件3和附件4中纸片。

针对问题三，随着碎纸片量的增多，计算量急剧增加。

在上述拼接复原碎纸片的基础上，又引进了同行位置碎纸片的上部（或下部）空白位置宽度相近的聚类思想。

先对每个类内部拼接，在合并所有类并做一次整体拼接。

由于时间有限，我们未能完成最后一次的整体的拼接，但我们会在比赛后继续探究。

关键词：边缘矩阵匹配度函数遗传算法聚类一、问题重述碎片拼接实际用途已经越来越广泛，传统上拼接复原工作由人工完成，碎片拼接的准确率较高，但效率很低。

并且当碎片数量很大时，人工短时间内拼接出来几乎是不可能的。

所以开发碎纸的拼接技术，以提高拼接复原效率已成为越来越多人的期望。

现在,在碎纸片是规则的情况下，题目要求我们在以下条件建立碎纸片拼接复原模型和算法。

1.来自同一页印刷文字文件（中文、英文各一页）的碎纸机破碎纸片（仅纵切）拼接复原，并将附件1和附件2复原。

2.对碎纸机既纵切又横切文件的情形，将碎纸片拼接完整。

基于规则碎纸片文字特征的拼接复原算法

基于规则碎纸片文字特征的拼接复原算法承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：中国人民解放军第三军医大学参赛队员(打印并签名) ：1. 王家*2. 黄嘉*3. 邵*指导教师或指导教师组负责人(打印并签名)：周*（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。

以上内容请仔细核对，提交后将不再允许做任何修改。

如填写错误，论文可能被取消评奖资格。

）日期：年月日赛区评阅编号（由赛区组委会评阅前进行编号）：编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（由全国组委会评阅前进行编号）：基于规则碎纸片文字特征的拼接复原算法摘要目前对于碎纸片的拼接问题，大多数方法是基于不规则碎纸片的几何边缘特征进行拼接，而本题是基于规则碎纸片的文字特征进行的。

我们首先提取各碎纸片的像素边缘特征，然后通过寻找最大匹配率和少量人工干预，得到碎片拼接方案。

碎纸片的拼接复原

碎纸片的拼接复原摘要本文研究了碎纸片的复原问题。

对已有的碎纸片，我们利用Matlab求碎纸片边各侧边线的灰度值，通过最小偏差平方和法进行碎纸片间的相互匹配，中间加入人工干预进行筛选，将附件中的碎纸片全部还原。

之后，我们将该方法进行推广，可用以处理更复杂形状碎图片的的还原问题。

对问题一：首先假定附件一所给仅纵切的碎纸片的行文方向与各碎纸片两侧边线垂直，在此基础上先人工干预，根据碎纸片的剪切规范，甄选出原始图片的第一张和最后一张碎纸片，编号分别为008和006。

其次通过Matlab求出图片边线处各小网格点的灰度值，采用最小偏差平方和法，对编号008碎片右边线处的灰度值和其它碎纸片的左边线处的灰度值进行对应网格点的数值匹配，找到最匹配的碎纸片。

附件二碎片的处理进行了类似处理，给出的复原图片见附表4。

对问题二：附件三文本既纵切又横切，同样我们假设所给附件三中碎纸片的行文方向与碎纸片的上下左右边线分别平行或垂直。

在问题一的算法基础上，通过Matlab求出各碎纸片的4条边线的边界灰度值，然后利用最小偏差平方和法，对上下左右四边进行灰度值匹配，当结果多个时，我们进行了人工干预。

附件四依照附件三的方法类似处理，最终的复原见附表7和附表9。

对问题三：附件五中的图片既纵切又横切而且是正反面。

我们参照问题一、二的处理方法，加入反面的灰度值测算，随机选择一张碎纸片与其他碎纸片进行遍历匹配，得出4张匹配的碎纸片后，以这4张碎纸片为下一起点，扩张匹配，最终给出的复原图见附表12。

为适应更一般的情形，我们在模型改进部分，给出了当碎纸片的文字行文方向与碎纸片两侧边线不垂直时的处理方法（只处理了边线为直线的情形）。

首先是通过测算出的碎纸片灰度值确定出碎纸片的边缘线，其次定出碎纸片边缘线附近网格点的灰度值，最后完成边线的的匹配。

关键词：人工干预灰度矩阵灰度值最小偏差平方和法一问题重述1.1问题背景纸片文字是人们获取和交换信息的主要媒介，尤其是在计算机技术飞速发展、数码产品日益普及的今天。

基于欧氏距离的规则碎纸片拼接复原模型

２０４１１０８ｌｌ６１３６７３３６２０７１３５１５７６４３１９９４５ｌ７３７９１６１ｌ７ｇ１４３
其中，Ｄ中第ｉ行第Ｊ列元素表示第ｉ号二值
矩阵所属的碎片的左边缘和第Ｊ号二值矩阵所属的
ｄ一０＝
，ｊ等于１或２
（５）
ｄ一＝
，ｊ等于１或２
（４）
氏距离（ｉ，ｌ＝０，１，２， …，ｎ）。
其中，ｄｕ－Ｕ表示列向量磊与列向量之间的欧
３－３分割横向复原图片并纵向拼接
根据已知每横行碎片个数，分割碎片横向拼接
图片，仅取各个横向复原拼接图片的第一个碎片二值矩阵的第一行与最后一行，组成矩阵ｓ ’ ，转置得到
矩阵ｓｉＴ计算中各列向量间的欧氏距离。记第ｉ幅分割后的横向拼接图片中第一个碎片
一
列之间的排列顺序，继而得到碎片的复原顺序。由于些碎片的边缘全为白色，无法确定其位置，此时需
虑将碎纸片横向复原，得到横向呈带状的拼接图片；然后根据附件５的每横行碎片个数，分割横向拼接图片并进行纵向复原，最后对无法判定的碎片进行
人工干预。
要人工干预。
运用Ｍａｔｌａｂ软件，得到附件５所有碎片数据的
二值矩阵。
记碎片的正面的二值矩阵为第１号至第ｎ号，碎片的反面的二值矩阵为第ｎ＋ｌ号至ｎ＋２号，将所有读人碎片的二值矩阵的第一列和最后一列取出，组成矩阵ｓ，计算ｓ中各列向量间的欧氏距离。记第ｉ号二值矩阵的第一列为，最后一列为

碎纸片的拼接复原数学模型的构建

碎纸片的拼接复原数学模型的构建摘要院本文讨论在碎纸机以不同方式破碎纸片的情况下建立碎纸片的拼接复原模型，以解决碎片数量巨大时人工拼接的难题，本文建立了三个具有针对性的模型。

模型一：方差分析法下的碎纸片拼接模型。

在以纵切方式破碎纸片的情况下，提取碎纸片左右边缘的灰度列向量，利用碎纸片边缘处为单边同宽空白区域的特殊性对碎纸片进行定位，再利用方差分析法和欧式距离解决了纵切碎纸片的拼接复原问题。

模型二：文字行间距一致性的碎纸片拼接模型。

以纵横方式破碎纸片，利用同行文字行间距一致性的主要特性可解决横向碎纸片的拼接复原问题，简化了模型，将离散的像素灰度矩阵平均化处理，进而利用欧氏距离对碎纸片进行匹配，得到了碎纸片复原后的完整图片。

模型三：二值化Otsu 算法的碎纸片拼接复原模型。

本文从双面纵横破碎纸片的问题出发，建立了纸片二值化Otsu 法拼接模型，先对碎纸片分组预处理，为将复杂模型简单化，再利用全局阈值方法中典型的Otsu 法求取碎纸片的最佳阈值，以该阈值对碎纸片中所含灰度值信息进行划分实现二值化处理，将边缘区域明显化，利用统计学方法求取拼接后的纸片间成功匹配的像素点占纸片边缘的概率，最终双面纵横破碎纸片的拼接复原问题得以解决。

Abstract: This paper discusses the construction of splicing scrap recovery model under the condition of shredder breaking paper intopieces in different ways, so as to solve the problem of artificial splicing when there is a great amount of pieces. This paper establishes threecorresponding model.Model One: Paper Scrap Splicing Model under Analysis of Variance.Shredding paper through longitudinal mode, the paper selects the gray scraps of paper around the edge extraction column vector,locates the paper scrap by using edge of paper scraps as blank area with same width, then solves the problem of reconstruction of thelongitudinal cutting paper splicing through analysis of variance method and Euclid Distance.Model Two: Paper Scrap Splicing Model with Consistency of Text Line Spacing.Shredding paper through vertical and horizontal mode, its main characteristics of peer text line spacing consistency can solve theproblem of reconstruction of splicing transverse paper scraps, simplifies the model, processes the pixel matrix of discrete in average andmatches the paper scraps through Euclid Distance and then gets the complete picture of paper scrap afterrecovery.Model Three: Paper Scrap Splicing Model Based on Binaryzation Otsu Algorithm.This paper firstly expounds the double side's vertical and horizontal mode, establishes the paper scrap splicing model based onbinaryzation Otsu algorithm. The paper firstly does preconditioning for paper scraps into groups, simplifies the complex model, and then getsthe optimal threshold of the paper scraps by using typical Otsu algorithm of global threshold method. The paper classifies the gray valueinformationof paper scraps through this threshold to realize binaryzation processing, specifies the edge area, evaluates the probability ofsuccessful matching pixels on edge of splicing paper, and finally solves the mosaic and restoration problems of double side's vertical andhorizontal mode.关键词院离散；方差分析；置信区间；阈值；Otsu 算法Key words: discrete；analysis of variance；confidence interval；threshold；Otsu algorithm中图分类号院TQ018 文献标识码院A 文章编号院1006-4311（2014）25-0238-031模型一考虑以为空间拼接情况，为了获取拼接图像所必须的数据，文章以像素为单位离散所得碎片：利用VC++使用了Windows.H 头文件并调用RGB 等结构定义获得不同像素点的g 值[1]，生成了多个灰度矩阵。

碎纸片的拼接还原研究

碎纸片的拼接复原摘要碎纸片的拼接复原是一门借助计算机，把大量碎纸片重新拼接成初始纸张的技术。

针对问题一，本文首先利用碎纸片图像灰度矩阵的边缘矩阵，建立了两个碎纸片之间的匹配度函数，求得了每一张图片之间左右边缘匹配度矩阵。

然后根据左边边缘位置的碎片的左边空白部分最多的特点，确定了左边位置的碎纸片。

针对问题二，由于附件3碎片数量太多，并且碎片的拼接复原，是一个以碎纸片总匹配度为目标函数的组合优化问题。

所以本文采用遗传算法将碎纸片的编号作为基因，并将基因均匀分成19段，按顺序每一段对应一个初始纸片列位置，进行了求解。

然后，根据边缘碎纸片某些边的空白部分多的特征，对初始基因进行了优化。

针对问题三，随着碎纸片量的增多，计算量急剧增加。

在上述拼接复原碎纸片的基础上，又引进了同行位置碎纸片的上部（或下部）空白位置宽度相近的聚类思想。

先对每个类内部拼接，在合并所有类并做一次整体拼接。

由于时间有限，我们未能完成最后一次的整体的拼接，但我们会在比赛后继续探究。

并且当碎片数量很大时，人工短时间内拼接出来几乎是不可能的。

所以开发碎纸的拼接技术，以提高拼接复原效率已成为越来越多人的期望。

现在,在碎纸片是规则的情况下，题目要求我们在以下条件建立碎纸片拼接复原模型和算法。

1.来自同一页印刷文字文件（中文、英文各一页）的碎纸机破碎纸片（仅纵切）拼接复原，并将附件1和附件2复原。

2.对碎纸机既纵切又横切文件的情形，将碎纸片拼接完整。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

论文检测报告报告编号： 5d95e0aadf5149a5a9ef1ecb397c466d送检文档：规则碎纸片的拼接复原论文作者：陈芳芳文档字数： 2981检测时间： 2015-01-07 12:39:34检测范围：论文库，中文期刊库（涵盖中国期刊论文网络数据库、中文科技期刊数据库、中文重要学术期刊库、中国重要社科期刊库、中国重要文科期刊库、中国中文报刊报纸数据库等），Tonda论文库（涵盖中国学位论文数据库、中国优秀硕博论文数据库、部分高校特色论文库、重要外文期刊数据库如Emerald、HeinOnline、JSTOR等），资源共享库。

一、检测结果：总相似比： 36.05% [即复写率与引用率之和]检测指标：自写率 63.95%复写率 36.05%引用率 0.0%相似比：互联网 36.05% 学术期刊 0.0% 学位论文 0.0% 资源共享 0.0%其他指标：表格 0 个脚注 0 个尾注 0 个章节抄袭比36.05% 规则碎纸片的拼接复原二、相似文献汇总：序号标题文献来源作者出处发表时间11213年碎纸片拼接复原数模论文互联网互联网213年碎纸片拼接复原数模论文-豆丁网互联网互联网32013年全国大学生数学建模竞赛国家一等奖论文B题碎纸片的拼接...互联网互联网4【图】科密碎纸机深圳碎纸机黑金刚碎纸机可碎光碟 - 罗湖办公...互联网互联网5一种碎纸自动拼接中的形状匹配方法-《计算机仿真》2006年11期-...互联网互联网6国家奖碎纸片的拼接还原_百度文库互联网互联网7基于蚁群优化算法的碎纸拼接-豆丁网互联网互联网8求2013数学建模题B题(2)的中文原题以及附件3不胜感激_百度知道互联网互联网9沈阳建筑大学_徐俊杰.郭书恒.唐杰_百度文库互联网互联网10碎纸机批发,厂家,图片,商贸城-马可波罗网互联网互联网三、全文相似详情：（红色字体为相似片段、浅蓝色字体为引用片段、深蓝色字体为可能遗漏的但被系统识别到与参考文献列表对应的引用片段、黑色字体为自写片段）碎纸机，是用来切碎销毁纸张的机器，为了达到废弃文件保密的目的，要把纸张分割成很多的细小纸片，碎纸机切割的纸粒工整利落，能达到保密的效果。

随着数据时代发展，大量的政府机关、企事业单位都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。

碎纸方式是指当纸张经过碎纸机处理后被碎纸刀切碎后的形状。

市面上有些碎纸机可选择两种或两种以上的碎纸方式。

不同的碎纸方式适用于不同的场合，如果是一般性的办公场合则选择段状、粒状、丝状，条状的就可以了。

但如果是用到一些对保密要求比较高的场合就一定要用沫状的。

随着现代技术的不断发展和市场的需求，现在的碎纸机，除了对纸张的处理，也可以对信用卡、光盘等进行切割。

本文研究的只是针对印刷文字文件在碎纸机中被切割的碎片，它是规则的黑白图片，对于非印刷文字文件的碎纸片、彩色碎纸片、形状不规则或边缘有破损的碎纸片等都是该碎纸片拼接技术的重要影响因素。

随着科学技术的不断发展，人们对信息交流、存储和销毁的需求也不断的增加。

目前，大量政府机关、企事业单位都是用打印机来打印文件，也都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。

当遇到误销毁的文件时，就要靠人工对碎纸片进行拼接，而人工拼接工作量大，不仅费力耗时，可能还会出现拼接错误等情况。

如果应用当前的图像处理与模式识别技术来开发碎纸片的自动拼接技术，用计算机对所有碎片进行搜索和筛选，对能够在某种指标上匹配的碎片进行拼接复原。

这样会大大的提高拼接复原的效率，从而降低了人工的工作量和难度。

目前在情报资料碎片整理、司法技术鉴定等领域中, 碎纸的拼接工作大部分都是靠人工的方式完成。

虽然国外对这项工作有进行了一些研究, 但是由于碎纸的自动修复技术应用背景的特殊性, 目前几乎没有公开的研究资料可以参考。

类似的研究主要是集中在文物碎片的自动修复、虚拟考古、故障分析以及计算机辅助设计、医学分析等领域。

所以对规则碎片自动拼接问题的研究，不仅具有广阔的应用前景，而且具有很强的理论意义。

问题1：对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（纵切），建立碎纸片拼接复原模型和算法，针对附件1、附件2针对文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

分析：针对问题1，在附件一及附件二中，碎纸片仅纵切，则纸片边缘的字有可能出现完整、残缺、标点符、空格四种情况，每个字又由多个像素点组成，故我们利用Matlab图像处理函数imread（）将各个碎片文字像素二值化，并取出代表各个碎片左右两边缘的像素点的列向量，如此在每张碎片左右两边缘所获的值都可组成一组向量，且分别设左边缘 ,右边缘（）。

设复原图像的第1列像素为向量，第72列像素为向量列，以此类推直到最后一列像素为。

因为原图像的第一列像素全为255（白色），所以可找出，从而可以确定和对应的和，将该碎纸片数据放入向量A中，再将列向量逐一与剩下的所有图片的列向量元素作差，列方向绝对值求和，则和最小的就是能与匹配的碎片，以此类推。

匹配完成后用Matlab图像处理函数imshow（）将向量A转换成图片。

问题2：对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

分析：针对问题2，加入横向分割后，各碎片便出现上下左右四个边缘，此时，需要多提取碎片图像上边缘及下边缘像素的向量（），图片处理方法同问题1；因为原图像的左上角碎片具有左边、上边全白的特点，右上角碎片具有右边、下边全白的特点，左下角碎片具有左边、下边全白的特点，右下角碎片具有下边、右边全白的特点，所以可以先找出左上角的第一块碎纸片，接下来用二叉树搜索方法进行匹配，此时有两个匹配方向：一是先向右进行匹配，完成一行，再向下匹配完成下一行直至匹配完成；二是先向下匹配，完成一列，再向右匹配完成下一列直至匹配完成；考虑到原图除了第一行的碎纸片会出现上边缘为全白，最后一行的碎纸片会出现下边缘全白的情况，中部也有可能出现全白的情况，若选第一个匹配方法匹配的精准率不大理想，有可能出现不能匹配而中断，所以本文选择第二种匹配方法：用问题1的匹配模型将第一块碎纸片的下边缘与剩下的碎纸片上边缘进行匹配直至下侧边缘碎片完成第一列碎纸片拼接。

再将左上角碎纸片右边缘逐一与剩下的所有碎纸片的左边缘进行匹配，确定第二列第一张碎纸片，再向下进行匹配，可以得到第二列碎纸片，以此类推直至匹配完成，用Matlab图像处理函数imshow（）将向量A转换成图片。

针对问题1，在附件一及附件二中，碎纸片仅纵切，则纸片边缘的字有可能出现完整、残缺、标点符、空格四种情况，每个字又由多个像素点组成，故我们利用Matlab图像处理函数imread（）将各个碎片文字像素二值化，并取出代表各个碎片左右两边缘的像素点的列向量，如此在每张碎片左右两边缘所获的值都可组成一组向量，且分别设左边缘 ,右边缘（）。

设复原图像的第1列像素为向量，第72列像素为向量列，以此类推直到最后一列像素为。

匹配完成后用Matlab图像处理函数imshow（）将向量A装换成图片。

针对问题2，加入横向分割后，各碎片便出现上下左右四个边缘，此时，需要多提取碎片图像上边缘及下边缘像素的向量（），图片处理方法同问题1；因为原图像的左上角碎片具有左边、上边全白的特点，右上角碎片具有右边、下边全白的特点，左下角碎片具有左边、下边全白的特点，右下角碎片具有下边、右边全白的特点，所以可以先找出左上角的第一块碎纸片，用问题1的匹配方法将第一块碎纸片的下边缘与剩下的碎纸片上边缘进行匹配直至下侧边缘碎片。

接下来用二叉树搜索方法进行匹配，将左上角碎纸片右边缘逐一与剩下的所有碎纸片的左边缘进行匹配，确定第二列第一张碎纸片，再向下进行匹配，可以得到第二列碎纸片，以此类推直至匹配完成，用Matlab图像处理函数imshow（）将向量A转换成图片。

本论文针对不同碎纸片的类型和尺寸，具体问题具体分析，为每一种情况设计了不同的算法来实现碎纸片的复原。

对匹配率相近的碎纸片，采用人工干预的方法提高精准度。

本论文针对不同碎纸片的类型和尺寸，具体问题具体分析，为每一种情况设计了不同的算法来实现碎纸片的复原。

对匹配率相近的碎纸片，采用人工干预的方法提高精准度。

规则碎纸片的拼接复原是数学建模中一个特殊的案例。

以数学中的相似度的基本原理为基础，以计算机图像处理技术为手段，根据读取的图片文字特征值，建立匹配模型，在适当的算法下寻求最优的匹配方案。

利用最优匹配方法对碎纸片进行拼接复原。

在较强的理论基础，以及相应的MATLAB软件支持下，自动拼接技术不仅匹配度高，而且简单易行。

比用其他软件或人工拼接，在拼接效率上就占有较大优势，使得自动拼接得到的结果准确又省时，该技术不仅具有广阔的应用前景，而且具有很强的理论意义。

四、指标说明：1. 总相似比即类似于重合率。

总相似比即送检论文中与检测范围所有文献相似的部分（包括参考引用部分）占整个送检论文的比重，总相似比=复写率+引用率。

2. 引用率即送检论文中被系统识别为引用的部分占整个送检论文的比重（引用部分一般指正确标示引用的部分）。

3. 自写率即送检论文中剔除雷同片段和引用片段后占整个送检论文的比重，一般可用于论文的原创性和新颖性评价，自写率=1-复写率-引用率。

4. 复写率即送检论文中与检测范围所有文献相似的部分（不包括参考引用部分）占整个送检论文的比重。

5. 红色字体代表相似片段；浅蓝色字体代表引用片段、深蓝色字体代表可能遗漏的但被系统识别到与参考文献列表对应的引用片段；黑色字体代表自写片段。

五、免责声明：鉴于论文检测技术的局限性以及论文检测样本库的局限性，网站不保证检测报告的绝对准确，相关结论仅供参考，不做法律依据。

Gocheck论文检测服务中使用的论文样本，除特别声明者外，其著作权归各自权利人享有。

根据中华人民共和国著作权法相关规定，Gocheck网站为学习研究、介绍、评论、教学、科研等目的引用其论文片段属于合理使用。

除非经原作者许可，请匆超出合理使用范围使用其内容和本网提供的检测报告。