碎纸片的拼接复原

合集下载

碎纸片自动拼接复原模型的实现

碎纸片自动拼接复原模型的实现

式) a =( a , 1 , …, 口 : ) 与a , =( 日 , 以 1一 , ), 我们定义相似度:
通过对图 中碎片的观察与分析 , 我们发现这些碎片具有共同的
特征。 如图 4 6 ) 中碎片上被标记的部分所示。 l 8 O ∑n 0 n 由图 4 6 ) 可以看出, 这些图片都是有一行 缺少英文字符 , 使得碎片 ( , Z ) 这些特殊的5 ' , -  ̄ l t 图片都是可以人工干预处理的。 ( 2 ) 对应的模式比较异常。 在 此基 础上 考虑 碎 片拼接 过程 , 先 对分 类 的碎 片左 右 拼接 , 匹配 仅 其中 为临界值。若 , x o 则我们认为 与 同属一类, 对于 在所在行匹配合成 。 上下匹配还要考虑行内其他元素的上下匹配。 合成 那些存在特殊情况的碎片 , 我们在分好类的基础上 , 再进行人工干预处 时整行都要合成。 综合考虑以上因素 , 我们对所有可以拼接的数据进行 理。c 同 类碎片拼接。 按照单面纵向拼接方法对每—类中的所有碎片进 拼接整 合 。( 图5 ) 行拼接 ,则可得到 同一类中碎片的拼接方案 ,进而得到横 向的 “ 大碎 在这里,处理特殊碎片需遵循 的原则 :以第二次拼接 的图片为底 片” 。c L 不同类“ 大碎片” 的拼接。“ 大碎片” 为横向的, 但此 问题- 仍 属于单 图, 剩下的 1 8 块依次和底图匹配 , 匹配原则包含经此处理之后便于观 面单向的拼接问题 , 因此可采用计算灰度值耦合度的方法进行拼接。 察整体拼接隋况, 但是拼接后在合成部分已做断开划线处理 , 这样便于 2 . 2 . 2英文单面纵横切碎片拼接。 考虑到英文的特殊 陛, 根据英文的 将剩下 的碎片进行拼接分析。 经过此次拼接过程 , 可以观察已组合部分 书写版式原则 , 可以将整篇文章放在带有英文四线格的底面中。 既然可 是否匹配正确 , 若不匹配 的话 , 可 以暂时先将那块碎片剔除, 放到第 三 以放在 四线格中, 这里我们把一行四线格看成一行, 可以确定每相邻行 部分再进行匹配组合。 碎片四边都要依次匹配 , 匹配度最高的就是缺少 的行间距是一定的。行宽也是一定的, 考虑字母仅占有上中、 中、 中下 、 块部分。按 以上方法对样本文件 4中的碎片进行拼接 ,结果见图 5所 上中下等几种情况 , 可 以确定每一个字母都是在中间有书写笔画的, 四 不 。 线格中上下行都具有英文笔画的是少数。 结束 语 基于这种考虑, 可以对每一行四线格的中间内容进行求和, 当其和 通过 研究 规 则切割 碎 纸片 的拼 接复原 问题 ,我们 针 对单 面 中英 文 的值小于某一值的时候我们忽略四线格上面和下面的内容 ,进而只考 纵向切割碎片以及单面中英文纵横双向切割碎片提 出了不同的拼接复 虑 四线 格 的中 间部 分 。 对 于那些 特殊 的碎 片 , 我们 可采用 人 工干预 的方 原模型以及方法。该方法将一张张碎片文件转换成 了一个个像素点值 式将其挑出, 所以将英文中四线格的上半部分和下半部分的内容忽略 , 矩阵, 对于计算机来说 , 碎片文件 的处理就变成了矩阵集合 的操作 ; 另 可以采取中文碎片模式转换的类似方法, 从而到英文碎片的模式。 外引入欧式距离将图像的拼接转化为耦合度的计算 ;接着考虑到印刷 3 实验 结果 及分析 文本文件的排版特点 , 引入模式识别的概念 , 可 以将大量杂乱碎片进行 实验是在 Mi c r o s o f t Wi n d o w s 7系统上进行 ,内存限定是 2 G B , 算 分类 , 然后逐类拼接 , 最终将双向拼接问题转化为单 向拼接问题 ; 最后 法实现语言为 M A T L A B 7 . 0版本。根据不同的样本文件使用相应的拼 所建立的模型效率好 , 精度高, 从实验结果上可以看 出该模型的可行性 接算 法 , 从 而得到 下面 的模拟 结果 。 和有 效 胜。 3 . 1 中英文单面纵切拼接实验。 样本文件 1 和2 分别为中英文单面 致谢 纵切碎片数据 ,其中每页纸被切为 1 9 条碎片 ,分别用 O 0 0 . b mp 一 0 1 8 . 感谢对此项研究工作提供基金资助的西北民族大学 中央高校基本 b mp 编号命名。利用 MA T L A B工具中的 自 带 函数 i m2 b w和 i m r e a d , 将 科研业务费专项资金 N o . 3 1 9 2 0 1 3 0 0 0 8 ) t ) 2 及西北民族大学科研创新 团 图像转化为仅包含 0和 1 的向量 ,接着根据中英文单面纵切算法可以 队计划 , 同时感谢参与本论文讨论的赵习猛 、 任宗秀和王本涛。 得到碎片的耦合度矩阵 , 由此可得样本文件 1 , 即中文单面纵切碎片的 参考 文献 拼接 复 利l 赙 为:

纸张撕碎重新复原的方法

纸张撕碎重新复原的方法

纸张撕碎重新复原的方法
将纸张撕成小块后,可以试用以下方法重新复原:
1. 拼图法:根据纸张上的图案或文字的特征,将撕碎的纸张小块一一拼接在一起。

可以使用胶水或透明胶带将小块粘接在一起,直到整张纸张还原为完整的状态。

2. 粘贴法:将所有纸张小块按照纸张上的线条方向,粘贴在一张背景纸上。

根据纸张上的文字或图案特征,可以推测纸张的排列顺序。

3. 数字法:对每个纸张小块进行编号,然后根据编号重新排列纸张小块。

4. 计算机辅助法:使用扫描仪或相机将撕碎的纸张进行扫描或拍照,然后使用图像处理软件将图像还原,最后打印出完整的纸张。

请注意,纸张撕碎再复原的难度取决于撕碎的程度和纸张的特性。

有些纸张可能不易复原或需要特殊的技术手段,如复印纸、碎纸机处理后的纸张等。

碎纸片的拼接还原研究

碎纸片的拼接还原研究

碎纸片的拼接复原摘要碎纸片的拼接复原是一门借助计算机,把大量碎纸片重新拼接成初始纸张的技术。

针对问题一,本文首先利用碎纸片图像灰度矩阵的边缘矩阵,建立了两个碎纸片之间的匹配度函数,求得了每一张图片之间左右边缘匹配度矩阵。

然后根据左边边缘位置的碎片的左边空白部分最多的特点,确定了左边位置的碎纸片。

接着根据拼接碎纸片的拼接复原时,所有碎纸片匹配度之和取极大值的原则,采用贪心算法,得到了所有碎纸片的初始位置,拼接复原了附件1和附件2中纸片。

针对问题二,由于附件3碎片数量太多,并且碎片的拼接复原,是一个以碎纸片总匹配度为目标函数的组合优化问题。

所以本文采用遗传算法将碎纸片的编号作为基因,并将基因均匀分成19段,按顺序每一段对应一个初始纸片列位置,进行了求解。

然后,根据边缘碎纸片某些边的空白部分多的特征,对初始基因进行了优化。

接着,根据碎纸片的黑色像素密度不同的特点,将碎纸片分成三类,根据同类纸片优先匹配的原则,对遗传算法的运行过程进行了优化,拼接复原了附件3和附件4中纸片。

针对问题三,随着碎纸片量的增多,计算量急剧增加。

在上述拼接复原碎纸片的基础上,又引进了同行位置碎纸片的上部(或下部)空白位置宽度相近的聚类思想。

先对每个类内部拼接,在合并所有类并做一次整体拼接。

由于时间有限,我们未能完成最后一次的整体的拼接,但我们会在比赛后继续探究。

关键词:边缘矩阵匹配度函数遗传算法聚类一、问题重述碎片拼接实际用途已经越来越广泛,传统上拼接复原工作由人工完成,碎片拼接的准确率较高,但效率很低。

并且当碎片数量很大时,人工短时间内拼接出来几乎是不可能的。

所以开发碎纸的拼接技术,以提高拼接复原效率已成为越来越多人的期望。

现在,在碎纸片是规则的情况下,题目要求我们在以下条件建立碎纸片拼接复原模型和算法。

1.来自同一页印刷文字文件(中文、英文各一页)的碎纸机破碎纸片(仅纵切)拼接复原,并将附件1和附件2复原。

2.对碎纸机既纵切又横切文件的情形,将碎纸片拼接完整。

碎纸片的拼接复原分析最终

碎纸片的拼接复原分析最终

碎纸片的拼接复原分析最终引言碎纸片的拼接复原是一项有趣且具有挑战性的任务。

无论是为了还原重要文件还是拼接有意义的图像,我们都需要使用各种技巧和方法来完成这项任务。

本文将介绍一种基于分析的碎纸片拼接复原方法,通过对碎纸片的形状、颜色和纹理等特征进行分析,最终达到拼接复原的目标。

碎纸片的特征提取在进行碎纸片的拼接复原之前,首先需要提取碎纸片的特征。

这些特征包括碎纸片的形状、颜色和纹理等。

形状特征提取为了提取碎纸片的形状特征,可以通过计算碎纸片的边界和角度来获得。

首先,使用图像处理技术,如Canny边缘检测算法,将碎纸片的边缘提取出来。

然后,使用霍夫变换来检测碎纸片的直线和角点,从而计算出角度和边界。

颜色特征提取碎纸片的颜色特征可以通过计算图像的颜色直方图来得到。

颜色直方图表示了图像中每个颜色的像素数量。

我们可以使用像素级别的颜色分布来比较不同碎纸片的颜色特征,并找到相似的碎纸片来进行拼接。

纹理特征提取碎纸片的纹理特征可以通过计算图像的纹理描述符来得到。

纹理描述符是用于描述图像纹理的数值特征。

其中,最常用的纹理描述符包括灰度共生矩阵(GLCM)和局部二值模式(LBP)。

通过计算碎纸片的纹理描述符,我们可以比较不同碎纸片之间的纹理相似度,并选择相似的碎纸片进行拼接。

碎纸片的拼接策略在完成碎纸片特征提取后,接下来需要制定碎纸片的拼接策略。

拼接策略将基于碎纸片的特征相似度和拼接的整体目标来确定。

相似度匹配根据碎纸片的形状、颜色和纹理特征,我们可以计算两个碎纸片之间的相似度。

一种常用的相似度计算方法是使用余弦相似度,它衡量两个向量之间的夹角。

通过计算碎纸片之间的相似度,我们可以找到最相似的碎纸片来进行拼接。

拼接顺序在进行碎纸片的拼接时,需要制定一个拼接顺序。

一种常用的策略是首先选择与已拼接部分最相似的碎纸片进行拼接,然后逐渐增加已拼接部分的面积,直到最终完成拼接。

拼接约束为了保证拼接的准确性,我们需要制定一些拼接约束。

碎纸片的拼接复原数学模型1

碎纸片的拼接复原数学模型1

碎纸片的拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。

本文主要研究了规则碎纸片的拼接复原问题。

首先利用二值法、环形像素点匹配等算法建立基于像素点数值匹配模型,然后利用MATLAB软件对碎纸片像素点进行数字化处理,得到各碎纸片的像素点数值矩阵,再利用MATLAB 软件编程进行矩阵特征优化匹配得到复原图。

针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。

经计算,得到附件1的拼接结果为:9,15,13,16,4,11,3,17,2,5,6,10,14,19,12,8,18,1,7附件2的拼接结果为:4,7,3,8,16,19,12,1,6,2,10,14,11,9,13,15,18,17,5针对问题二:本文采用聚类分析方法建立优化模型。

将所有图片的像素转化为矩阵,其次采用人工干预的方式找出第一行第一张碎纸片,然后将所有图片灰度二制化,将灰色像素值转化为黑色像素值,然后由上至下找出黑白像素的分界线,根据分界线位置的差异值最小聚合出第一行所有的图片,同理聚合出第一列所有的图片,将第一行所有图片利用问题一的拼接算法求解出第一行图片拼接顺序。

以第一行第一张碎纸片下侧像素点与其他碎纸片上侧像素点像素匹配差异值最小为目标函数,依次穷举第一列所有的碎纸片,从而找出第二行第一张碎纸片。

根据第一行排好顺序的碎纸片以及第二行第一张碎纸片,采用上下侧边缘像素匹配以及左右侧边缘匹配,依次找出并排列好第2行,其他行依理重复步骤(2)、(3)即可。

完成匹配后,进行适当的人工干预即可确定碎纸片的复原图。

(见附录3、4图11,图12)。

最后,本文对所建模型的优点和缺点进行了客观的评价,认为本文研究的结果在图像拼接问题中有一定的参考价值。

关键词:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。

碎纸片的拼接复原的数学模型

碎纸片的拼接复原的数学模型

碎纸片的拼接复原摘要本文主要采用了模糊模型识别、灰度相关、傅里叶变换等方法对碎纸自动拼接进行了深入探讨。

文中主要结合司法物证复原、历史文献修复、军事情报获取这一背景,针对横纵切碎自动拼接展开探究。

提出一种基于最大梯度和灰度相关的全景图拼接法。

同时采用边界提取法使图像预处理达到最好的效果,期间采用傅里叶变换对图像进行处理,最后再利用匹配准则等方法处理图像的拼接。

最终应用模糊模型识别法建立模型,通过隶属函数的建立实现最终的碎纸拼接。

期间有些碎纸片计算机无法识别,需要进行人工干预,从而才能得到一副完整的复原图。

图像拼接的主要工作流程可以概括为以下三个步骤:(1) 对图像碎片进行预处理,即对物体碎片数字化,得到碎片的数字图像。

(2) 图像碎片匹配,通过匹配算法找到相互匹配的图像碎片。

(3) 图像碎片的拼接合并,将相互匹配的图像碎片拼接在一起得到最终结果。

针对问题一:将图像导入MATLAB 进行相应的转化,由于数据量较大,所以对数据进行优化提取。

计算提取数据的均值与方差,找出其模糊集,建立符合题意的隶属函数。

由于模糊集的边界是模糊的,如果要把模糊概念转化为数学语言,需要选取不同的置信水平(01)λλ≤≤ 来确定其隶属关系,从而实现纵切图像的全景拼接。

(如表一、表二)针对于问题二:由于是横纵切碎纸片,所得图像较多,采用提取像素法对图片进行灰度分析,通过中介量阈值的确定来找出像素点的差别,梯度值在这一过程中也是作为衡量两张碎纸片是否匹配的标准。

从而对数据进行处理,最后导入MATLAB 软件实现拼接。

(如表三、表四)针对问题三:它是在问题一和问题二上加深了难度,采用提取像素点,傅里叶变换,灰度相关、模糊相似优先比等方法对问题进行分析,通过(0,1)矩阵的简化运算以及傅里叶变换得到最后的结果,但对于傅里叶变换需说明一点,变换之后的图像在原点平移之前四角是低频,最亮,平移之后中间是低频最亮,也就是说幅角比较大。

此过程中同时也需要人工干预,最终实现拼接。

碎纸片的拼接复原

碎纸片的拼接复原

碎纸片的拼接复原摘要本文研究了碎纸片的复原问题。

对已有的碎纸片,我们利用Matlab求碎纸片边各侧边线的灰度值,通过最小偏差平方和法进行碎纸片间的相互匹配,中间加入人工干预进行筛选,将附件中的碎纸片全部还原。

之后,我们将该方法进行推广,可用以处理更复杂形状碎图片的的还原问题。

对问题一:首先假定附件一所给仅纵切的碎纸片的行文方向与各碎纸片两侧边线垂直,在此基础上先人工干预,根据碎纸片的剪切规范,甄选出原始图片的第一张和最后一张碎纸片,编号分别为008和006。

其次通过Matlab求出图片边线处各小网格点的灰度值,采用最小偏差平方和法,对编号008碎片右边线处的灰度值和其它碎纸片的左边线处的灰度值进行对应网格点的数值匹配,找到最匹配的碎纸片。

附件二碎片的处理进行了类似处理,给出的复原图片见附表4。

对问题二:附件三文本既纵切又横切,同样我们假设所给附件三中碎纸片的行文方向与碎纸片的上下左右边线分别平行或垂直。

在问题一的算法基础上,通过Matlab求出各碎纸片的4条边线的边界灰度值,然后利用最小偏差平方和法,对上下左右四边进行灰度值匹配,当结果多个时,我们进行了人工干预。

附件四依照附件三的方法类似处理,最终的复原见附表7和附表9。

对问题三:附件五中的图片既纵切又横切而且是正反面。

我们参照问题一、二的处理方法,加入反面的灰度值测算,随机选择一张碎纸片与其他碎纸片进行遍历匹配,得出4张匹配的碎纸片后,以这4张碎纸片为下一起点,扩张匹配,最终给出的复原图见附表12。

为适应更一般的情形,我们在模型改进部分,给出了当碎纸片的文字行文方向与碎纸片两侧边线不垂直时的处理方法(只处理了边线为直线的情形)。

首先是通过测算出的碎纸片灰度值确定出碎纸片的边缘线,其次定出碎纸片边缘线附近网格点的灰度值,最后完成边线的的匹配。

关键词:人工干预灰度矩阵灰度值最小偏差平方和法一问题重述1.1问题背景纸片文字是人们获取和交换信息的主要媒介,尤其是在计算机技术飞速发展、数码产品日益普及的今天。

碎纸片拼接复原matlab程序

碎纸片拼接复原matlab程序

碎纸片拼接复原是一个有趣的图像处理问题,通常需要使用计算机视觉或图像处理技术。

下面是一个简单的 MATLAB 程序示例,用于演示碎纸片拼接复原的基本思路。

请注意,这只是一个简单的示例,实际应用中可能需要更复杂的算法和技术。

这个简单的 MATLAB 程序包含了三个函数:
1.shredImage: 将原始图像切成碎片。

2.shufflePieces: 随机打乱碎纸片的顺序。

3.reconstructImage: 进行拼接复原。

请注意,这只是一个基本的示例,实际应用中可能需要更复杂的图像处理技术,例如特征匹配、拼接算法等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全国大学生数学建模竞赛论文格式规范本科组参赛队从A、B题中任选一题,专科组参赛队从C、D题中任选一题。

(全国评奖时,每个组别一、二等奖的总名额按每道题参赛队数的比例分配;但全国一等奖名额的一半将平均分配给本组别的每道题,另一半按每题论文数的比例分配。

)论文用白色A4纸打印;上下左右各留出至少2.5厘米的页边距;从左侧装订。

●论文第一页为承诺书,具体内容和格式见本规范第二页。

●论文第二页为编号专用页,用于赛区和全国评阅前后对论文进行编号,具体内容和格式见本规范第三页。

●论文题目、摘要和关键词写在论文第三页上(无需译成英文),并从此页开始编写页码;页码必须位于每页页脚中部,用阿拉伯数字从“1”开始连续编号。

注意:摘要应该是一份简明扼要的详细摘要,请认真书写(但篇幅不能超过一页)。

●从第四页开始是论文正文(不要目录)。

论文不能有页眉或任何可能显示答题人身份和所在学校等的信息。

●论文应该思路清晰,表达简洁(正文尽量控制在20页以内,附录页数不限)。

●引用别人的成果或其他公开的资料(包括网上查到的资料) 必须按照规定的参考文献的表述方式在正文引用处和参考文献中均明确列出。

正文引用处用方括号标示参考文献的编号,如[1][3]等;引用书籍还必须指出页码。

参考文献按正文中的引用次序列出,其中书籍的表述方式为:[编号] 作者,书名,出版地:出版社,出版年。

参考文献中期刊杂志论文的表述方式为:[编号] 作者,论文名,杂志名,卷期号:起止页码,出版年。

参考文献中网上资源的表述方式为:[编号] 作者,资源标题,网址,访问时间(年月日)。

●在论文纸质版附录中,应给出参赛者实际使用的软件名称、命令和编写的全部计算机源程序(若有的话)。

同时,所有源程序文件必须放入论文电子版中备查。

论文及源程序电子版压缩在一个文件中,一般不要超过20MB,且应与纸质版同时提交。

(如果发现程序不能运行,或者运行结果与论文中报告的不一致,该论文可能会被认定为弄虚作假而被取消评奖资格。

)●本规范中未作规定的,如排版格式(字号、字体、行距、颜色等)不做统一要求,可由赛区自行决定。

●在不违反本规范的前提下,各赛区可以对论文增加其他要求(如在本规范要求的第一页前增加其他页和其他信息,或在论文的最后增加空白页等)。

●不符合本格式规范的论文将被视为违反竞赛规则,无条件取消评奖资格。

●本规范的解释权属于全国大学生数学建模竞赛组委会。

[注] 赛区评阅前将论文第一页取下保存,同时在第一页和第二页建立“赛区评阅编号”(由各赛区规定编号方式),“赛区评阅纪录”表格可供赛区评阅时使用(各赛区自行决定是否在评阅时使用该表格)。

评阅后,赛区对送全国评阅的论文在第二页建立“全国统一编号”(编号方式由全国组委会规定,与去年格式相同),然后送全国评阅。

论文第二页(编号页)由全国组委会评阅前取下保存,同时在第二页建立“全国评阅编号”。

全国大学生数学建模竞赛组委会2013年8月26日修订承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):吉林农业大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 2013 年 9 月 15 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文根据对问题的分析和数据的总结,通过matlab软件将碎纸片的拼接复原问题转化为对数字图像的拼接问题。

对图像进行数字化处理并对其二值化,根据问题建立了三个数学模型。

针对问题1,建立了二值化边界匹配模型,通过该模型使用我们成功实现了附件1、附件2的拼接复原。

针对问题2,在问题1的基础上,通过人工的干预选出纸的边界,再通过纸片边界对碎纸片进行边界像素点匹配,最终实现了附件3、附件4的拼接复原。

针对问题3,建立了特征点对匹配算法,通过人工与计算机的结合,最终也实现了附件5的碎纸片的拼接复原。

关键词:纸片拼接、二值化、点对匹配1、问题的提出1.1问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

请建立数学模型分析研究下面的问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。

2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。

【数据文件说明】(1)每一附件为同一页纸的碎片数据。

(2)附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。

(3)附件3、附件4为纵横切碎片数据,每页纸被切为11×19个碎片。

(4)附件5为纵横切碎片数据,每页纸被切为11×19个碎片,每个碎片有正反两面。

该附件中每一碎片对应两个文件,共有2×11×19个文件,例如,第一个碎片的两面分别对应文件000a、000b。

【结果表达格式说明】复原图片放入附录中,表格表达格式如下:(1)附件1、附件2的结果:将碎片序号按复原后顺序填入1×19的表格;(2)附件3、附件4的结果:将碎片序号按复原后顺序填入11×19的表格;(3)附件5的结果:将碎片序号按复原后顺序填入两个11×19的表格;(4)不能确定复原位置的碎片,可不填入上述表格,单独列表。

1.2问题分析本题是破碎文件的拼接复原问题,传统的破碎文件拼接工作需要人工完成,准确率高,但效率低。

当碎片数量巨大,手动的拼接很难在短时间内完成。

本题要求利用计算机开发破碎文件纸片的自动拼接技术,建立碎纸片拼接复原模型和算法,提高复原效率。

针对本文中附件中给出的中英文内容进行分析可知,破碎纸片是来自同一页的印刷文件由碎纸机纵切而成。

由纵切形成碎纸边缘而产生的文字痕迹可手动找出边缘纸张的两条。

剩余17条文字图像可对其进行二值化处理。

通过数字化处理即可将图像转化为数字匹配问题。

假设任意两条碎纸片匹配,则边缘特征就越相似。

取一条文字图像的右边界与另一条文字图像的左边界进行与运算。

如个数相同且占两边界的总数比例越高,则越匹配.2、模型假设为了简化解题步骤,需要对模型进行合理的假设和简化,具体如下:(1)假设忽略用灰度值二值化处理像平面产生的误差。

(2)假设本题给定的附件中碎纸片的文字具体规格如字体、字号、文字间间距等一致。

(3)假设本题给定的附件文件纸张大小规格一致。

3、模型中使用的主要参数说明为了便于描述问题,我们用一些符号来代替问题中涉及的一些基本变量。

如下表所示。

其他一些变量将在文中陆续说明。

4、建立模型4.1 模型Ⅰ的建立根据附件1、附件2的数据,可以发现碎纸片都是通过摄像机拍摄下来的图片,所以我们可以把碎纸片的拼接复原转化为图像的拼接复原模型。

4.1.1图片预处理预处理阶段的目的是求出待处理图像的轮廓线上各点的坐标, 保证匹配的成功率和精度。

首先,读取附件1中的碎纸片图像,使用matlab软件将图片数字化处理得到一个二维矩阵,。

其中M是图像的宽度; N是图像的高度。

为了便于检测图像的轮廓,其次是将待处理图像二值化,即将待拼合图像的部分(即文字)设置为黑色0,背景设置为白色255, 设待匹配图像的灰度级是256, 且背景为白色,则对待匹配图像进行二值化处理的数学表达式为:()提取图像的左边界L和右边界R::,提取矩阵,的第一列:,提取矩阵,的最后一列每一列就表示一个图像的一个边界,每个碎纸片图像都有左右边界,边界的值要么为1,1代表纸条边界为白色,要么为0代表有边界有文字。

4.1.2 图片配准算法在碎片拼接复原的过程中,匹配策略也是非常重要的,直接关系到匹配的正确性和效率,在问题一中,我们根据以下步骤进行匹配:第一步:因为根据对碎纸片和问题的分析,我们知道碎纸片是由碎纸机通过纵切获取到的,而且每页纸被切为19条碎片。

所以通过对二值化以后的图像矩阵分析有:为第个碎纸片()为第个碎纸片为其他的碎纸片第二步:将第一个碎纸片作为基准,从剩下的17个图片中随机找一个碎纸片的R 与第一个碎纸片的L作与运算,判断黑白色像素点相同的个数Num。

第三步:计算相似度S,问题采用加权平均的方法,则有数学表达式:(5-3)第四步:判断匹配是否成功:如果相似度S大于给定的阈值T,我们就认为匹配成功,反之,继续匹配其他的碎纸片,直到所有的碎纸片都匹配完成。

4.1.3 模型1的求解根据上述的算法使用matlab编写程序,根据测试,设置阈值T=0.9,对附件1中的4.2 模型Ⅱ的建立4.2.1图片预处理在问题一的基础做了改进,问题是对图像二值化再取图像矩阵的边界,而在问题二中,因为只对图像的边界进行匹配,所以没有必要把所有的像素点都进行二值化处理,只对使用的边界R和L进行二值化,其数学表达式为:表示矩阵的最后一列;表示矩阵的第一列4.2.2 图像配准算法第一步:读取附件3中的碎纸图像,将R或者L等于1的图片(即左边界和右边界全是白色图片)识别出来。

相关文档
最新文档