CUMCM2013-碎纸片的拼接复原(全国一等奖)

格式：pdf
大小：1.37 MB
文档页数：32

下载文档原格式

碎纸片的拼接复原

碎纸片的拼接复原刘啸泽;李璞;陈香【期刊名称】《电子测试》【年(卷),期】2014(000)007【摘要】本文通过使用Euclidean距离来衡量两张碎纸片之间的相似程度来实现碎纸片的拼接还原问题。

首先使用贪心模型和TSP模型来分别完成仅纵切的碎纸片的还原问题并相互印证结果。

然后又推广使用了TSP模型并完成了同时纵切和横切的碎纸片拼接复原。

%In this paper,by using the Euclidean distance to measure the similarity between the two pieces of scraps of paper to realize mosaic scraps of paper reduction problem.First use the reduction problem greedy model and TSP model respectively complete the scraps of paper only longitudinal and corroborated the results.Then use the TSP model and finished at the same time scraps of paper splicing longitudinal and transverse restoration.【总页数】3页(P46-48)【作者】刘啸泽;李璞;陈香【作者单位】西安电子科技大学，陕西西安，710126;西安电子科技大学，陕西西安，710126;西安电子科技大学，陕西西安，710126【正文语种】中文【相关文献】1.基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题 [J], 刘铁2.基于MATLAB的碎纸片拼接复原技术研究 [J], 唐巧玲;陈佳3.基于MATLAB的碎纸片拼接复原技术研究 [J], 唐巧玲;陈佳4.基于量子算法的碎纸片拼接复原问题 [J], 王彦超;刘鑫磊;武良隆;刘晓东;范兴奎5.碎纸片的拼接复原研究 [J], 赵辰;乔振宇;李思漫因版权原因，仅展示原文概要，查看原文内容请购买。

基于TSP规划模型的碎纸片拼接复原问题研究_李蕾

｝，， …，ｘ０，１ｉ２，ｎｊ＝１，ｉｊ ∈ ｛，，（）其中ｒｉｉ完成Ｂｉｉｎ称为效率矩阵。 × ｊ表示Ａｊ工作的效率由ｒｊ组成的方阵Ｒ＝ｒｊｎ由于Ｔ求解存在很大的难度。注意到第３个约束条件是保证最优解ＳＰ问题是一个典型的ＮＰ完全问题，只有一个环。如果不考虑该约束条件，当指派模型求出的最优解恰ＴＳＰ问题的规划模型就化为了指派模型。好只有１个环时，则其解即为Ｔ根据碎纸片拼接复原问题的特点，可以按照指派ＳＰ问题规划模型的最优解。模型求解ＴＳＰ问题。
２纵切碎纸片的拼接
针对２规定最左边一片为第０片，最０１３年全国大学生数学建模竞赛Ｂ题的纵切碎纸片的拼接复原问题，右边一片为第１每片碎纸片的像素是１建立Ｔ８片，９８０×７２，ＳＰ问题的规划模型：
１８１８
ｍｉｎδ ＝
１８
∑ ∑ｒｘ
＝０ｊ＝０ｉ
］１２－、。题（并运用贪心算法进行求解［ｒｏｂｌｅｍ，ｔｒａｖｅｌｉｎｓａｌｅｓｍａｎＴＳＰ）０１规划模型等，－ｐｇ
本文对２纵切、纵横切和双面碎纸片）提出复原方０１３年全国大学生数学建模竞赛Ｂ题的３种碎纸片（法，以差异度最小为目标建立Ｔ设计 “ 按行聚类－行内排序 ” 算法，并运用模式识别技术ＳＰ问题的数学模型，降低时间复杂度和拼接的错误率，从而减少人工干预。
第３卷第２期２０１４年６月檺檺殣檺檺檺檺檺檺檺殣

碎纸片的拼接复原

碎纸片的拼接复原摘要本文研究了碎纸片的复原问题。

对已有的碎纸片，我们利用Matlab求碎纸片边各侧边线的灰度值，通过最小偏差平方和法进行碎纸片间的相互匹配，中间加入人工干预进行筛选，将附件中的碎纸片全部还原。

之后，我们将该方法进行推广，可用以处理更复杂形状碎图片的的还原问题。

对问题一：首先假定附件一所给仅纵切的碎纸片的行文方向与各碎纸片两侧边线垂直，在此基础上先人工干预，根据碎纸片的剪切规范，甄选出原始图片的第一张和最后一张碎纸片，编号分别为008和006。

其次通过Matlab求出图片边线处各小网格点的灰度值，采用最小偏差平方和法，对编号008碎片右边线处的灰度值和其它碎纸片的左边线处的灰度值进行对应网格点的数值匹配，找到最匹配的碎纸片。

附件二碎片的处理进行了类似处理，给出的复原图片见附表4。

对问题二：附件三文本既纵切又横切，同样我们假设所给附件三中碎纸片的行文方向与碎纸片的上下左右边线分别平行或垂直。

在问题一的算法基础上，通过Matlab求出各碎纸片的4条边线的边界灰度值，然后利用最小偏差平方和法，对上下左右四边进行灰度值匹配，当结果多个时，我们进行了人工干预。

附件四依照附件三的方法类似处理，最终的复原见附表7和附表9。

对问题三：附件五中的图片既纵切又横切而且是正反面。

我们参照问题一、二的处理方法，加入反面的灰度值测算，随机选择一张碎纸片与其他碎纸片进行遍历匹配，得出4张匹配的碎纸片后，以这4张碎纸片为下一起点，扩张匹配，最终给出的复原图见附表12。

为适应更一般的情形，我们在模型改进部分，给出了当碎纸片的文字行文方向与碎纸片两侧边线不垂直时的处理方法（只处理了边线为直线的情形）。

首先是通过测算出的碎纸片灰度值确定出碎纸片的边缘线，其次定出碎纸片边缘线附近网格点的灰度值，最后完成边线的的匹配。

关键词：人工干预灰度矩阵灰度值最小偏差平方和法一问题重述1.1问题背景纸片文字是人们获取和交换信息的主要媒介，尤其是在计算机技术飞速发展、数码产品日益普及的今天。

碎纸片的拼接复原模型

碎纸片的拼接复原模型
邓方清;邓小安
【期刊名称】《数学学习与研究：教研版》
【年(卷),期】2016(000)022
【摘要】针对碎纸片的拼接复原问题,本文从边缘像素矩阵入手,通过对该矩阵数据的标准化处理、求取像素平均值、定义像素255的频率、矩阵分块等方法,运用相关的匹配度算法分析,建立了纵切又横切的碎片拼接复原模型.
【总页数】2页(P154-155)
【作者】邓方清;邓小安
【作者单位】[1]广东工业大学,广东广州510006;[2]广东石油化工学院,广东茂名525000
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题
2.碎纸片的拼接复原模型及其算法研究
3.基于线性规划的碎纸片拼接复原模型
4.TSP规划模型在文本碎纸片拼接复原问题中的应用
5.基于聚类分析与欧氏距离模型的碎纸片拼接复原
因版权原因，仅展示原文概要，查看原文内容请购买。

基于灰度矩阵的中文碎纸片的拼接复原算法

基于灰度矩阵的中文碎纸片的拼接复原算法作者：王欣洁来源：《智能计算机与应用》2013年第06期摘要：主要对碎纸片的拼接复原问题进行分析，分别对仅纵切和横纵切两种切割方式建立了模型进行求解，主要思想是对碎片的灰度值矩阵进行处理，利用文字所处的位置信息、空格的分布情况、碎片的边界信息（文字的链接情况）等信息，对所给的碎纸片进行拼接复原。

对2013年“高教社杯”大学生数学建模竞赛B题附件中的中文碎片进行拼接，拼接效率高，算法可行。

关键词：灰度值矩阵；差异度量；贪心算法；相容性；边界特征中图分类号：TP312 文献标识码：A文章编号：2095-2163（2013）06-0095-040问题提出破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

为了提高拼接复原效率，人们试图利用计算机，实现碎纸片的自动拼接。

本文对2013高教社杯全国大学生数学建模竞赛B题中提出的碎纸片拼接复原问题进行研究，主要研究其中中文碎片的拼接复原。

1模型假设和符号说明研究前，需要做出如下假设：假设所给碎片均无噪声污染；各碎片之间互有关联；并且只考虑打印稿，而不涉及手写稿；同时也要假设文件中的文字行间距确定；没有相同的两个碎片；以及附件所给碎片的原文件页边距不为零。

本文中用到的符号如下：Ai：第i个碎片图像的灰度值矩阵；aikm：第i个碎片图像的灰度值矩阵中第k行m列元素；d（Ai，Aj）：两矩阵的列差异度；N1：附件1、2碎片个数；N2 ：附件3、4碎片个数；F：复原序列；d（r）（Ai，Aj）：两矩阵的行差异度；S1R：排在左侧的第R张碎片；GR：第R个相容的碎片集合2问题分析2.1仅纵切问题的分析对于仅纵切的情形，各碎片的边界特征信息（文字的链接情况）较为丰富，故可以利用边界特征进行拼接复原。

首先根据左侧的第一张碎片通常存在着左边的页边距的特点，即其灰度值矩阵中左边几列的元素均为255，从而可以找出排在左边的第一张碎片。

数学建模中的碎纸片拼接复原要点研究

数学建模中的碎纸片拼接复原要点研究基于模拟退火算法与系统聚类法，文章首先依次介绍了仅纵切、既有横切又有纵切、双面打印三种情形下的碎纸片拼接复原要点，然后对全文进行了总结与展望。

标签：碎片；拼接；复原；模拟退火算法；系统聚类法碎纸片拼接复原工作在诸多领域中有着极其重要的应用，如历史文物的考证、司法鉴定以及情报获取等。

在计算机技术发展起来之后，传统的人工复原方式导致效率低下的弊端日益凸显，因此，通过数学建模的方法得到碎纸片自动拼接复原模型以提高拼接效率显得尤为重要，已有文献对此做了一些研究[1-3]。

文章以2013年全国大学生数学建模竞赛B题为例，基于模拟退火算法与系统聚类分析，依次介绍仅纵切、既有横切又有纵切、双面打印三种情形下的碎纸片拼接复原要点。

1 仅纵切的碎纸片拼接复原要点步骤6：降温。

选定降温系数θ（一般取为接近1的数）进行降温，即用θT 取代T，从而得到新的温度。

步骤7：算法终止条件。

用选定的终止温度Te，判断退火过程是否结束。

若T<Te，算法结束并输出当前的状态。

这样，由于碎纸片较大，图片信息较明显，因此不需要人工干预，复原率可达100%。

附件2中的英文图片可类似处理。

2 有横、纵切的碎纸片拼接复原要点对于既有横切又有纵切的碎纸片拼接复原，若利用上一问的方法直接对全部的209张图片进行拼接，一方面必然会导致算法运行效率大大降低；另一方面，由于区分各图片间边界差异的灰度值信息较少，易导致拼接时重码率高而复原率低。

因此，我们采用的方法是，首先提取出所有图片的行特征；然后对209张图片建立行聚类模型，对各行聚类依据上一问的方法将其中图片重排；最后对排好序的各行类似的作横向排序即可将碎片拼接复原。

具体的步骤如下：第一步，提取图片的行特征。

利用Matlab读入图片，将每张图片转化为一个180*72的灰度值矩阵；再用Matlab可计算出中文字符高为40像素点，行间距为31像素点。

第二步，建立行聚类模型。

碎纸片拼接问题(2013B)

方法2：聚类算法：主要方法，效果好。
• 计算 Ai 的行和，得到一个特征向量 ri 。定义适当的向量相似度指标，对 ri 进行相似度计算，然后对所有碎片进行聚类，得到分行结果。
几种相似度度量指标：
1 欧式距离倒数： d ij || ri r j ||
夹角余弦： cos ij || r || || r || i j 相关系数： ij
规划方法：将每一行的碎片依次编号为 1, 2, , N . 定义两碎片之间的有向距离为 cij 。
令 xi ,k 1, 第 i 块碎片在第 k 个位置上否则 0,
ห้องสมุดไป่ตู้
min z
N 1 N
c
k 1 i 1 j 1 , j i
N
ij
x i ,k x j ,k 1
c
MN
k ,l
x i , j , k x i , j 1 ,l

M 1 N MN
i 1 j 1 k 1 l 1 , l k
d
MN
k ,l
x i , j ,k x i 1 , j ,l
约束条件：（1）每个碎片只能放在一个位置上。
x
i 1 j 1
（1）整体的文字拼接正确度；
不易衡量。
（2）纸片两两之间的拼接正确度。
•如何计算纸片两两之间的拼接正确度？分析：假设纸片 i 和 j 拼接在一起，i 左 j 右，则应该可以计算出一个相关的正确度指标。怎么计算？
• 利用什么信息计算？利用Matlab 软件读取碎片，生成相对应的灰度值数字矩阵 Ai 。
如何确定碎纸片的位置？
方法一：一次性确定所有碎纸片的位置。方法二：分组确定碎纸片的位置。方法三：逐一确定碎纸片的位置。

碎纸片的拼接复原数学建模论文

碎纸片的拼接复原摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上，拼接复原工作由人工完成，虽准确率高，但效率很低。

特别是当碎片数量巨大，人工拼接难以完成任务。

因此随着计算机信息技术的发展，开发一个碎纸片的自动拼接技术，并建立简便的拼接复原模型，提高拼接复原效率，具有重要的实现意义。

文章通过对所给的附件图片数据进行分析研究，在综合考虑了碎片边缘的尖点特征、尖角特征、面积特征等几何特征下，我们将图片读入电脑，并进行二值化转换，考虑边界值的匹配，建立了图片边界匹配模型。

依据模型，只要边界能匹配上就可以拼接，并依次解决了如下问题。

对于问题一，由于给定图片来自同一页印刷文字文件仅纵切破碎纸片，针对附件1、附件2给出的碎片数据，建立了碎纸片拼接复原的边界匹配模型。

根据模型，我们首先对附件1、附件2中的图片用Matlab软件进行二值转化，得到一个储存图片的二值灰度矩阵，并利用边界相关性比较法判断矩阵中两边界变量是否能匹配得上，如果匹配得上就拼接在一起，按此算法，附件1、附件2中的碎纸片就能拼接成功，具体的算法结果见附录中的附件1、附件2。

对于问题二，由于碎纸机既有纵切又有横切的情形，算法的设计上要相对复杂一些，我们在前面模型的基础上进行了修改和补充，对图片的上下左右的边界都进行了边界提取。

首先，我们选将图片作二值转换，分别用矩阵进行保存，然后任迁一个，对其余的进行全程扫描，按照问题一中的边界匹配模型，逐一对其边界进行扫描匹配，其间，有些矩阵的边界数据可能一样（如空白时），我们便跳出模型，进行适当的人工干预，干预完成，再进入模型进行迭代，按此方法便可拼接成功，具体的算法结果见附录中的附件3。

对于问题三，根据现实问题中的双面打印文件的碎纸片拼接复原问题，由于多了双面的问题，在算法的设计上，我们考虑了正反两的边界匹配，在原有模型的基础上，将问题一和问题二的模型相结合，建立一个新的双面碎纸片拼接模型。

数学建模—碎纸片的拼接复原

碎纸片的拼接复原模型摘要本文针对破碎纸片形状规则和碎片间无有效重叠区域等特点，选取了信息熵、差方和、欧氏距离、相关系数、互信息和灰色斜率关联度作为碎纸片之间的相似性判别准则，给出了碎纸片拼接复原模型和算法，解决了破碎纸片的拼接复原问题．对于问题1，引入信息熵来衡量每个碎片含有的信息量，将熵值最小的碎片确定为印刷文字文件的第一列；利用差方和计算出第1列右端与其余碎片左端的相似程度，求得碎纸片之间的最佳匹配组合，借助Matlab软件成功实现了附件1和附件2的碎片拼接复原．对于问题2,通过计算每个碎片的信息熵，找到印刷文字文件第一列的11个碎片；再利用互信息和相关系数评价碎纸片之间的相似性程度，确定出碎片间的上下位置关系，得到了印刷文字文件的第一列；然后利用欧氏距离作为相似性测度，进一步进行碎片间的粗拼接．若某个碎纸片与多个碎片的欧氏距离相等，则利用灰色斜率关联度进行碎纸片间的细拼接，借助Matlab软件完成了对附件3和附件4给出的碎片拼接复原．对于问题3，基于模糊聚类方法，粗略地确定出每个碎片的正面和反面；然后利用问题2的算法对已分类的正面碎纸片进行拼接复原；针对无法复原的碎纸片，借助Matlab 软件和最优搜索算法进行人工干预，确定出附件5文件正面的拼接复原；根据碎片数据编号的命名规则，在正面碎片数据的拼接复原结果中填充对应编号的反面碎片数据，实现了附件5文件反面的拼接复原．最后，对碎纸片的拼接复原模型和算法进行了分析和展望．关键词：破碎纸片的拼接复原；信息熵；差方和；互信息；欧氏距离；灰色斜率关联度；模糊聚类1. 问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用．传统上，拼接复原工作需由人工完成，准确率较高，但效率很低．特别是当碎片数量巨大，人工拼接很难在短时间内完成任务．随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率，需解决以下几个问题：问题1，考虑对于给定的来自同一页印刷文字文件仅纵切的破碎纸片的拼接复原模型和算法，并针对B 题附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原．如果复原过程需要人工干预，还需要写出干预方式及干预的时间节点．并就附件1和附件2的碎片数据给出拼接复原结果．问题2，考虑对于碎纸机既纵切又横切的情形，设计出碎纸片拼接复原模型和算法，并针对B 题附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原．如果复原过程需要人工干预，请写出干预方式及干预的时间节点．并就附件3和附件4的碎片数据给出拼接复原结果．问题3，则需要考虑更一般的情形，即考虑有双面打印文件的碎纸片拼接复原问题．对B 题附件5给出的是一页英文印刷文字双面打印文件的碎片，设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果．2. 模型假设(1) 碎纸片的切割是等间距的，忽略切割碎纸片时由机器工作所产生的摩擦误差； (2) 碎片切缝处的图像灰度平滑；(3) 碎片在缩放的情况下，像素点保持稳定； (4) 碎片上的文字只显示黑白两种颜色．3. 符号说明N ：每张碎片像素点的数目；ij a 、ij b ：图像A 、B 在()j i ,的像素值；),(B A SSD ：A 与B 的差方和；)(a h A ：图像A 中第a 个灰度级的像素个数与总的像素个数之比；)(ab h AB ：图像A 中第a 个灰度级和图像B 中第b 个灰度级的像素对数与两幅图像总的像素对数之比；)(A H 、)(B H ：图像A 和B 各自含有的信息量；)(AB H ：两幅图像A 和B 的联合信息熵；ij d ：两幅图像A 和B 的欧式距离；ij a 、ij b ：图像A 和B 在 ()j i ,位置的像素值； a ：图像A 像素值的平均值；),(B A C :两幅图像A 和B 的相关系数；)(a P A 、)(b P B ：碎片边缘概率密度； )(ab P AB ：两碎片A 和B 的联合概率密度；);(B A I :两碎片A 和B 的互信息；)(t X :系统特征函数；)(t Y i :相关因素函数；tt x ∆∆)(:系统特征函数)(t X 在t 到t t ∆+的斜率； tt y i ∆∆)(:相关因素函数)(t Y i 在t 到t t ∆+的斜率； )(t x ∆：系统特征函数在t 到t t ∆+的增量；)(t y i ∆：相关因素函数在t 到t t ∆+的增量； x ：系统特征函数的均值；i y ：相关因素函数的均值；)(t i ξ：)(t X 与)(t Y i 在t 时刻的灰色斜率关联系数；D ：对称距离矩阵；i ε：)(t X 与)(t Y i 在t 时刻的灰色斜率关联度．4. 问题分析由于文章以行书写，只有段首段尾有空白，切缝处恰好以列之间的空白或笔画出断开的概率较小，在拼接碎纸片前需要对B 题附件1—5的碎片内图像进行二值化处理，进而获取由0和1组成的矩阵．扫描后的图像有亮的图像和暗的背景组成，由于光照、拍摄角度等因素，一幅图像往往包括文字、背景还有噪声等．如果从多值的数字图像中直接提取目标，最常用的方法就是设定阈值T ，用T 将图像的数据分为两部分：大于T 的像素群和小于T 的像素群．由于5个附件中的文字显示都是黑白颜色，因此先调用Matlab 软件中的im2bw()对每个碎纸片进行二值化图像预处理，然后综合利用图像的相似性测度寻找高精度的匹配碎片，从而实现整个印刷文字文件的复原．5. 模型的建立与求解5.1 问题1的求解5.1.1 模型的建立差方和利用两幅图像对应位置的差方和均值表示图像之间的相似程度，定义为[1]，∑-=ij21),(）（ij ij NB A SSD b a (1) 式中，N 为每幅图像像素点的数目，ij a 和ij b 分别是图像A 和B 在()j i ,位置的像素值．当两幅图像正好可拼接时，),(B A SSD 值最小．差方和计算的时间复杂度为()2N O ．信息熵反映了图像含有的信息量大小．信息熵越小，图像包含的信息量越小，往往空白区域越多，其定义为[2-4]：∑=aA A a h a h A H )(log )()( (2)其中，)(a h A 表示图像A 中第a 个灰度级的像素个数与总的像素个数之比． 5.1.2 拼接复原算法附件1和附件2中碎纸片的切割方式只有纵切一种，假设碎片的总数为n 个．考虑到纵切的特殊性，给出如下的拼接复原算法：步骤1 计算每一个碎纸片)1(n i A i ≤≤的信息熵)(i A H ，并确定出熵值最小的一个碎片n i i A H 1)}(min{=为印刷文字文件的第1列；步骤2 计算第1列图像A 的右边与其余1-n 个碎片)1,1(≠≤≤j n j A j 的左边的差方和),(1j A A SSD ，确定出与第1列图像差方和最小的碎片为印刷文字文件的第2列；步骤3 重复步骤2，依次继续，直到找到印刷文字文件的n 列为止． 5.1.3 问题1的求解借助Matlab 软件对以上拼接复原算法进行仿真，得到如下结果： (1) 附件1中的中文文件复原结果表1 附件1中19个碎片的信息熵从表1可以看出，19个碎片所包含的信息量中，第008碎片的信息熵最小，因此第008碎片是附件1中的中文文件的第1列．表2 附件1中19个碎片之间差方和最小的配对碎片表从表2可以得到附件1中的中文文件复原结果，如下表所示：表3 附件1中文件的拼接复原结果表附件1中的中文文件复原图结果见附录1．(2)附件2中的英文文件复原结果表4 附件2中19个碎片的信息墒从表4可以看出，所有19个碎片所包含的信息量中，第003碎片的信息墒最小，因此第003碎片是附件2文件的第1列．表5 附件2中19个碎片之间差方和最小的配对碎片表从表5可以得到附件2的英文文件复原结果，如下表所示表6 附件2英文件的拼接复原结果表附件2中英文文件的复原结果图见附录2．5.2 问题2的求解5.2.1 模型的建立由于互信息测度是从图像的统计信息出发，既不需要两幅图像的灰度关系，也不需要图像进行预处理，因此成为目前广泛使用的图像配准相似性测．在图像配准过程中，如果两幅图像精确匹配，互信息达到最大．联合熵定义如下[5]：)(log )()(,ab h ab h AB H AB ba AB ∑= （3）其中)(ab h AB 表示图像A 中第a 个灰度级和图像B 中第b 个灰度级的像素对数与两幅图像总的像素对数之比．互信息定义为)()()();(AB H B H A H B A I -+= (4)欧氏距离被视为两个图像的相似程度，距离越近就越相似，其定义为∑-=2)(ij ijij b ad (5)相关系数是标准化的协方差函数，当两幅图像的灰度之间存在线性畸变时，仍能较好的评价两幅图像之间的匹配性程度．图像的相关系数1),(≤B A C ,它是两幅图像A 和B 特征点之间近似程度的一种线性描述．如果),(B AC 越接近于1，两幅图像的相似程度越大，越近似于线性关系．选择相关系数中最大的相关系数所对应的特征点为这个点的匹配特征点．当两幅图像可匹配时，相关系数达到最大值．相关系数定义如下[7-9]：2/122))(*)(()(*)(),(∑∑∑----=b b a a b b a bB AC ij ij ijij ij(6)两幅图像相关系数计算的时间复杂度为)(2N O ,其中N 为每幅图像像素点的数目．灰色斜率关联度的基本思想是根据待拼碎片的特征曲线（称系统特征函数）与参照碎片的特征曲线（称相关因素函数）的相似程度来判断其联系是否紧密，曲线越接近，关联度就越大，反之就越小．灰色斜率关联度的定义为[10]：∑-=-=11)(11n t i i t n ξε (7) 其中，t t y yt t x x t t x x tt x x t i i ∆∆-∆∆+∆∆+∆∆+=)(*1)(*1)(*11)(*11)(ξ (8)为灰色斜率关联系数．(7)、(8)式中)(t X 为系统特征函数，)(t Y i ()m i ,,2,1 =为相关因素函数（对应于参照碎片的特征曲线），∑==nt t x n x 1)(1，)()()(t x t t x t x -∆+=∆,t t x ∆∆)(为系统特征函数)(t X 在t 到t t ∆+的斜率, ∑==nt i i t y n y 1)(1，)()()(t y t t y t y i i i -∆+=∆, t t y i ∆∆)(为相关因素函数)(t Y i 在t 到t t ∆+的斜率．对于灰色斜率关联系数)(t i ξ公式(8)有如下性质[11-13]：(1) 任意的系统特征函数)(t X 与相关因素函数)(t Y i 的灰色斜率关联系数满足：1)(0≤<t i ξ，m i ,,2,1 =；(2) 灰色斜率关联系数)(t i ξ满足对称性；(3) 灰色斜率关联系数)(t i ξ只与)(t X 与)(t Y i 的几何形状有关，与相对位置无关； (4) )(t X 与)(t Y i 的斜率越接近，灰色斜率关联系数)(t i ξ就越大；(5) )(t X 与)(t Y i 在t 到t t ∆+的变化速度相同时，它们的斜率相等，这时1)(=t i ξ；由上述公式及性质可知，灰色斜率关联系数反映了两曲线在某一点的变化率的一致程度，而灰色斜率关联度则是整个区间上灰色斜率关联系数的平均值．灰色斜率关联度i ε具有下列性质： (1) 10≤<i ε；(2) i ε只与)(t X 与)(t Y i 的变化率有关，而与它们的空间相对位置无关； (3) 当)(t X 与)(t Y i 变化率相同时， 1=i ε； (4) )(t X 与)(t Y i 的变化率越接近， i ε就越大；5.2.2 拼接复原算法附件3和附件4中碎纸片的切割方式有纵切和横切两种，假设碎片的总数为n 个（m ⨯k 个碎片组成整个原图），具体的拼接复原算法如下：步骤1 计算每一个碎纸片)1(n i A i ≤≤的信息熵)(i A H ，并确定出熵值最小的m 个碎片n i i A H 1)}(min{=为印刷文字文件的第1列的m 个碎片；步骤2 计算步骤1找到的m 个碎片的上半部图像和下部分图像之间互信息和相关系数，确定出m 个碎片的上下位置关系，得到印刷文字文件的第1列；步骤3 计算第1列中m 个碎片右边与其它碎片左边的欧氏距离，得到碎片之间关于欧氏距离的矩阵n m M ⨯；在矩阵n m M ⨯中，第i 行的值ij d 表示第i 个碎片与第j 个碎片之间的欧氏距离．步骤4 在n m M ⨯中，计算第)1(m i i ≤≤行的最小值i min ；若n m M ⨯中i min 在第i 行出现的次数为1且对应的列标为j ，则第i 个碎片和第j 个碎片是最佳匹配组合；若i min 在第i 行出现的次数为大于1，则进行步骤5.步骤5 i m i n 在i 行中出现的次数为大于1，则计算第i 个碎片的右边图像与其余碎片左边图像的灰色斜率关联度)1(n f if ≤≤ε，记灰色斜率关联度最大的值ih ε对应的列为k ；若第k 个碎片在步骤4的最佳匹配组合中没有出现，那么第i 个碎片和第k 个碎片是最佳匹配组合；若第k 个碎片已在步骤4的最佳匹配组合中出现过，选择灰色斜率关联度仅次于ih ε)(ih iy εε<的值对应的列y ；若第y 个碎片在步骤4的最佳匹配组合中没有出现，则第i 个碎片和第y 个碎片是最佳匹配组合，否则继续寻找第i 个碎片的最佳匹配碎片，直止找到满足斜率关联度最大且在以前的最佳匹配组合中没出现条件的碎片．步骤6 重复以上步骤，直到所有的碎片找到最佳的匹配组合为止．按照最佳匹配组合的关系将所有碎片链接起来，并在第1列中出现的碎片位置出换行，便可对文件的所有碎片数据进行拼接复原． 5.2.3 问题2的求解运行matlab 软件对以上算法进行仿真，得到如下的结果．(1) 附件3中的中文文件复原结果表7 附件3中碎片的排列序号附件3中文件的最终复原图见附录4．(2) 附件4中的英文文件复原结果附件4的复原结果表格形式如下表所示：表8 附件4中碎片的排列序号附件4中文件的最终复原图见附录6．5.3 问题3的求解5.3.1 模型的建立模糊聚类分析是一种将样本或者变量分类的统计方法，基于物以类聚的思想，它根据样本数量计算样本之间的距离（相似程度），按距离的大小，将样本或变量逐一归类，关系密切的类聚到一个小的分类单位，使同一类的对象之间具有较高的相似度，然后逐步扩大，使得关系疏远的类聚合到一个大的分类单位，知道所有的样本或变量都累计完毕．模糊聚类分析法常用的距离为绝对值距离和欧式距离，其中，欧氏距离在聚类分析中用的最广．计算流程如下[14-15]：(1) 将n 张碎纸片分为n 类，取其中一个碎纸片右侧一列和另外任意碎纸片左侧一列作为样本，两个样本之间的距离构成一个对称距离矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=00021221112 n n n n d d d d d d D (2) 选择)0(D 中的非对角线上的最小元素，设这个最小元素是pq D ，此时{}p P x G =与{}q q x G =的距离最近，将q P G G 和合并成一个新类{}q P r G G G ,=．在)0(D 中消去q P G G 和所对应的行与列，并加入由新类r G 与剩下的其他未聚合的类间的距离所组成的新的距离矩阵)1(D ，它是n-1阶方阵；(3) 从)1(D 出发重复(2)的做法得)2(D ，再由)2(D 出发重复上述步骤，直到碎纸片聚成一个整体，聚类完成． 5.3.2 拼接复原算法附件5的碎片均为双面，假设碎片的总数为n 个（m ⨯k 个碎片组成整个原图的正面），具体的拼接复原算法如下：步骤1 基于模糊聚类分析法的思想，借助Matlab 软件编程将所有碎片区分粗分为正面和反面两大类；步骤2任选某一大类的碎片，利用问题2的拼接复原算法对该类的碎片进行拼接复原；步骤3 对无法拼接的碎片进行人工干预，直至所有的最碎片找到最佳的匹配组合为止．将所有的碎片进行链接，可复原文件的原图．根据碎片编号的命名规则，如果一面的原图复原成功，选择原图每个碎片对应序号的反面，可直接拼接复原出反面的原图．5.3.3 问题3的求解运行matlab软件对以上算法进行仿真，得到如下的结果．(1)附件5中的文件正面复原结果附件5中的文件正面复原结果见表9.附件5中文件正面的复原结果中间图见附录7．附件5中文件正面的复原结果中间图见附录8．对附录8中的碎片49a、161b、108b、045b、021a、042a、048b、180b、041b、202b和175b进行人工干预，得到附录9。

基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题

基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题
刘铁
【期刊名称】《重庆理工大学学报（自然科学版）》
【年(卷),期】2015(000)003
【摘要】传统的拼接复原工作需由人工完成，准确率较高，但效率很低。

针对该问题，借助数字图像处理技术，建立了关于图片匹配度函数的优化模型，依据穷举思想设计了求解算法，可大幅提高复原效率，但在处理复杂问题时，准确性有所下降，需要一定的人工介入。

通过对复原后图片的验证结果可知，碎纸片复原拼接模型具有可行性。

【总页数】6页(P83-88)
【作者】刘铁
【作者单位】安康学院数学与统计系数学与应用数学研究所，陕西安康 725000【正文语种】中文
【中图分类】TP393;O221
【相关文献】
1.基于数学模型的碎纸片拼接复原问题研究 [J], 周千;李文胜;朱熙
2.基于数字图像的碎纸复原模型与算法——2013年全国大学生数学建模B题碎纸片的拼接复原问题 [J], 刘铁;
3.基于SACO算法的碎纸片拼接复原模型 [J], 杨凌;王琳琳;刘冲冲;苏思美
4.基于数学模型的碎纸片拼接复原问题研究 [J], 周千;李文胜;朱熙;
5.基于量子算法的碎纸片拼接复原问题 [J], 王彦超;刘鑫磊;武良隆;刘晓东;范兴奎因版权原因，仅展示原文概要，查看原文内容请购买。

碎纸片拼接复原的算法设计

碎纸片拼接复原的算法设计于静;朱家明;吴朝阳;赵天梅【摘要】文章针对碎纸机切割的碎纸片拼接复原问题,首先将碎纸片的图片批量导入Matlab7.0中,并对其进行矩阵数值化处理,根据纸张边缘留白的特点找出最左边的图片,再根据汉字和英文字母的笔画的连续性构建碎纸片边缘矩阵的像素差值最小化模型,依次向右匹配相邻的碎纸片,最终得到完整的复原图.【期刊名称】《成都师范学院学报》【年(卷),期】2015(031)005【总页数】4页(P102-105)【关键词】拼接复原;差值最小化模型;Matlab7.0【作者】于静;朱家明;吴朝阳;赵天梅【作者单位】安徽财经大学统计与应用数学学院,安徽蚌埠233030;安徽财经大学统计与应用数学学院,安徽蚌埠233030;安徽财经大学统计与应用数学学院,安徽蚌埠233030;安徽财经大学统计与应用数学学院,安徽蚌埠233030【正文语种】中文【中图分类】TP391破碎纸片的拼接在文物碎片自动复原、虚拟考古、故障分析以及计算机辅助设计、医学分析、司法物证恢复等领域有着重要的应用。

[1]当要拼接的碎纸片数量巨大时可以想象完全凭借人工的方法对碎纸片进行拼接复原是一件十分费时费力的事情，由于科技的发展，借助软件和算法就可以大大地减少工作量，比如利用特征区域块分割技术来实现图像的拼接。

用灰阶Sobel算子通过引入衰减因子对图像进行边缘检测得到不失真的灰阶边缘图,然后将灰阶边缘图进行三次样条插值处理,使特征区域块边缘的定位达到亚像素级,提高了图像边缘检测的精度,对碎纸片进行准确的定位从而完成拼接。

[2]诸如此类，很多方法都是针对不规则的碎纸片，对其轮廓特征进行分析[3]，然后完成拼接复原的过程。

对于碎纸机规则切割的碎纸片来说根据上述两种方法显然是行不通的，因为碎纸片的形状基本完全相同，那么只能根据碎纸片上的文字特征进行拼接[4]，而由于计算机不具有人的思维，不可以对文字或者字母是否可以衔接为完整的字或字母进行判别，那么考虑必须通过对碎纸片边缘文字特征的转化来完成对碎纸片的拼接复原过程[5]。

碎纸片拼接复原

我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）：我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：参赛队员(打印并签名) ：1.2.3.指导教师或指导教师组负责人(打印并签名)：（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。

以上内容请仔细核对，提交后将不再允许做任何修改。

如填写错误，论文可能被取消评奖资格。

）日期：年月日赛区评阅编号（由赛区组委会评阅前进行编号）：编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：赛区评阅记录（可供赛区评阅时使用）：评阅人评分备注全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（全国组委会评阅前进行编号）：碎纸片拼接复原摘要本文主要是研究关于分割图片处理——汉字碎片拼接问题。

针对问题一，首先将附件1图片用像素表示并进行二值化量化处理，用迭代法求出最佳阈值，将抽象的图片用具体的0-1矩阵表达；其次根据像素值分布用MATALAB筛选出最左列碎纸片的编号为008；最后用欧氏距离法建立像素匹配模型，通过MATALAB直接得到中文的拼接图片（见附录一）及序列（见文中表一），不需要进行人工干预。

2013年高教社杯全国一等奖论文碎纸片的拼接复原

其中矩阵 B _ left 的每一列向量对应着每一碎纸片的左边界特征向量。
右边界矩阵
B _ right = [b _ right1,b _ right2,...,b _ right19 ];
b _ righti = (bi1, bi2 ,..., bi1920 )'
其中矩阵 B _ right 的每一列向量对应着每一碎纸片的左边界特征向量。
我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。
我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B
我们的参赛报名号为（如果赛区设置报名号的话）：
20007002
所属学校（请填写完整的全名）：长沙理工大学
5
注：英文的主体字符表示如下红色阴影部分的行高：
5.2 问题一针对问题一，对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），一共产生了 19 条破碎纸片，每条碎纸片的像素尺寸为 1920× 72。通常对于切点两端的像素点通常具有一定的相关性（见图 3）。
图3
如图一所示，假设位于图像中央的的黑色竖线为图片切线，可以发现对于非文字或字母边界处的水平、竖直、空白或者斜线中心附近切点的左右两边图片的像素灰度相同，只有在文字或字母笔画的边缘（灰度渐变处）或者呈一定角度的笔画切点左右像素的灰度会有一定的差别，因此建立相关匹配拼接模型，对于问题一是一种行之有效的解决策略。具体步骤如下（见图 4）：
根据排版规则，每一张图片上的同种字符点阵都具有固定的行高和字符高度，且每一行字符点阵的高度和行高均相等，且平行。因此首先确定纸张的行高和字符高度对后文的字符识别及碎纸片分类具有重要意义。

2013数学建模基于灰度像素理论的碎纸片拼接方法

基于灰度像素理论的碎纸片拼接方法摘要常规的二维碎片拼接技术一直受到科研领域重视，它在司法鉴定、文物修复、图像处理等领域有着广泛的应用。

本文研究的是二维碎片拼接技术中最典型的文档类碎纸片拼接问题。

基于文档纸片色彩明确、方向一致、无重叠等特点，利用灰度理论对问题作出解决。

通过图形扫描得到图像,然后通过二值化，Sobel[]3梯度算进行预处理,并运用皮尔逊相关性度量及方差分析算法进行匹配，以实现对纸片进行还原。

本文通过MATLAB程序模型，以及图片像素灰度理论实现文档碎片的重新拼接.对于问题1，应用图像处理技术中的灰度理论建立了灰度模型I.在对得到灰度模型进行Sobel梯度边缘化预处理的方法进行模型改进,建立了边缘灰度模型II。

然后借助于皮尔逊相关系数算法和MATLAB软件,对附件中所提供的碎片进行排列拼接.对于问题2，采用化归思想，将二维问题渐变为一维问题。

首先归纳碎片特征运用MATLAB软件对碎片进行同行分类，得到11行19列的元素;采用方差分析算法和人工干预对各行中元素进行排列,得到11条横切的图形；采用方差分析算法和人工干预对其进行排列，得以还原。

本文的亮点在于对各行中元素采用方差分析算法进行左侧到右侧匹配后，同时增加了右侧到左侧的匹配检验，大大减少了人工干预的工作.关键字:灰度理论；皮尔逊相关系数算法；Sobel梯度边缘化；方差分析算法；人工干预一、问题的重述问题一、对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切）,建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原.如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达。

问题二、对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

碎纸片的拼接复原

碎纸片的拼接复原作者：薛瑶瑶来源：《科技信息·中旬刊》2017年第03期摘要：图像碎片自动拼接技术是借助计算机把大量的图像碎片重新拼接成初始图像的完整模型.本文在综合分析的基础上，建立了阈值分割、动态规划等数学模型，通过利用边缘特征近似相等的原理将不同程度切割所得的碎纸片进行还原修复.关键词：阈值分割；碎纸片复原；动态规划；软件1 绪论1.1 研究背景破碎文件的拼接在司法物证复原以及军事情报获取等领域都有着重要的应用.传统上，拼接复原工作需由人工完成，准确率较高，但是效率很低.特别是当碎片数量巨大，因此人工拼接很难在短时间内完成任务.随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高图片拼接复原效率.要从成千上万的图像碎片中找到相互邻接的图像碎片，并最终拼出完整的图型，没有计算机的辅助是很难实现的.因此，一种能够快速且高效的恢复碎纸机数据文档技术的研究有巨大的现实意义.2 模型假设1.碎纸机横纵切割平滑，切割面完整.2.切割图片时无数据量丢失.3.两幅图像之间没有重叠部分.4.碎纸片图像四周无全白.5.碎纸机切割的图片全为大小规格相同的矩形.3 符号说明4 模型建立与求解4.1 纵切碎纸片的模型建立和求解为了得到碎纸片左右边缘的特征信息，首先将碎纸片进行图像碎片的预处理，对于碎纸片来说，就是将其数字化，获得可处理的图像碎片.本文首先应用软件设计程序将碎图片一次性导入到程序中，然后通过建立图像阈值分割模型对每张碎纸片进行二值化处理.为了便于计算，本文将所有黑色像素点用灰度值0表示；白色像素点灰度值为1，表示背景. 本文将值定义为254，对所给图片进行二值化处理，得到所有图像二值化数据. 图像阈值化处理的变换函数形式如下：将图像左右边缘二值化后的像素点所得灰度值看作单个向量，应用程序对两图片向量进行余弦值求解，通过图像右边缘向量与相邻图片像左边缘向量夹角余弦值近似等于1的原理复原图像.在确立图像左边缘破碎图片的右边缘向量，用建立余弦求解模型时，需要对剩余所有图像的左边缘进行模型求解，筛选出其中最大值所对应的图片标号，继而用此标号所对应图片进行下一步余弦求解.在求解剩余图片对应余弦值时，已确定图片的数据需要人工删除.动态规划模型也是求解这类问题的一种方法.其中，解决本问题所用到的方法是算法.本文首先定义一初始全一列向量且与同维，，为了确定第一张碎片使得与的夹角余弦值最大或两向量与之差的模最小，令其所对应碎片的右向量为（即左起第一张碎片），将赋值给，确定第二张碎片，以此类推，直到找到第十九张碎片.因此，本文建立动态规划模型：通过运用程序求解已确定左端图片位置的右边缘向量和剩余所有图片的左向量，并求出相应图片所对应编号.经最短路问题，筛选所得最大余弦值结果并排序所得的碎纸片编码将所得碎纸片的图片编号依次整合，施以人工筛选，排序，通过依次导入程序中，便可得到碎纸片的复原图.4.2 横纵切的模型建立和求解本问题基于纵切图型增设了碎纸片的横向切割，在解决此问题时首先通过纵切建立的阈值切割模型将碎纸片二值处理，获得碎纸片左右及上下边缘的特征数据.根据模型一求解方法确定图象左右边缘的碎纸片，通过动态规划模型先确定左上第一张碎片位置，利用向量夹角余弦值或向量间模长最小值应用动态规划模型建立方程，确定其右端碎片和下端碎片位置，以此类推最终拼接复原出原图.因此本文建立以下动态规划模型：4.3 双面碎纸片的模型建立和求解本问题基于上述两大模型，在问题二基础上增加了纸张的正反面问题.首先对图像边缘数据进行二值化处理，根据图像正面左边缘就是图像反面右边缘继而确定原图片左右边缘碎纸片，图像的左右边缘数据一定满足其左边缘数据和相应反面的右边缘数据全为白色，即：其中，为图像反面对应的右边缘向量.对已确定图像左右边缘的碎纸片图像进行相邻碎纸片图像的左右拼接，应用程序对两图片向量进行余弦值求解，通过求得图像右边缘向量与相邻图片像左边缘的所有向量夹角余弦值，应用最短路问题人工筛选干预，先确定每一小行图像片段.继而通过已拼接完成的碎纸片行图像片段进行上下边缘的夹角余弦值求解，重复应用问题二的求解方法解决上下行之间的排序问题.由于图像正反面成对称性，所以只要确定纸张的一面，另外一面通过逆序排列即可得到原图.5 模型评价5.1 阈值分割模型阈值分割法因其实现简单，计算量小以用于很多领域.可以极大的压缩数据量而且也大大简化了分析和处理步骤.在阈值分割模型中，阈值的选取是图像阈值分割方法中的关键技术.若阈值的选择不恰当，最终结果会因为误差的增大导致差异.5.2 动态规划模型：建立的动态规划模型具有一般性，而且简单易懂可操作性强，同时还可以推广到其他的动态规划问题上.当出现两向量夹角余弦值相等时在选择的时候容易出现误差.且筛选数据时人工干预的次数太多，容易出现误差而导致结果的差异.参考文献：[1] 张强，王正林.精通MATLAB图像处理第二版[M].北京：电子工业出版社，2012.[2] 吴炯圻，林培荣.数学思想方法[M]. 北京：高等教育出版社，2005.[6][3]张雄，李得虎等. 数学方法论与解题研究[M].北京：高等教育出版社，2005.[4]徐树道. 数学方法论[M].桂林：广西师范大学出版社，2001.[5]王子兴.数学方法论-问题解决的理论[M].长沙：中南大学出版社，2002.[6]高秀莲，董立华.数学建模与数学实验[M].天津：天津教育出版社，2010.。

基于人机交互界面的碎纸片拼接复原

基于人机交互界面的碎纸片拼接复原
郦烜杰
【期刊名称】《无线互联科技》
【年(卷),期】2013(000)012
【摘要】2013年的全国大学生数学建模竞赛提出了碎纸片的拼接复原的问题，然而绝大多数论文都先设置了不同筛选条件对碎片进行筛选得到最有可能处于同一行的碎片，然后再逐行对得到的碎片进行手工调整得到完整的还原图，笔者认为这种方法效率不是很高并且存在一些难以克服的精度问题，从而在本文中给出了一种通过人机交互界面的优化模型来实现碎片复原的思路和算法，其复原效率可达到90%或95%以上。

【总页数】3页(P87-89)
【作者】郦烜杰
【作者单位】南京邮电大学通信与信息工程学院，江苏南京 210046
【正文语种】中文
【相关文献】
1.基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题 [J], 刘铁
2.基于数字图像的碎纸复原模型与算法——2013年全国大学生数学建模B题碎纸片的拼接复原问题 [J], 刘铁;
3.基于MATLAB的碎纸片拼接复原技术研究 [J], 唐巧玲;陈佳
4.基于MATLAB的碎纸片拼接复原技术研究 [J], 唐巧玲;陈佳
5.基于量子算法的碎纸片拼接复原问题 [J], 王彦超;刘鑫磊;武良隆;刘晓东;范兴奎因版权原因，仅展示原文概要，查看原文内容请购买。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

二.模型假设
1.假设所有附件中给出的碎纸片图像不存在重叠部分；
2
2.假设文件中的碎纸片没有缺失； 3.假设全部碎纸片形状相同且规整。
三.符号说明及有 i 个像素点每张碎片横向有 j 个像素点
i
j
lij
d ij
Xk
i , j 处图象的灰度值
两碎纸片边缘灰度的偏差距离任意纸片的右特征向量任意纸片的左特征向量中文碎片中心位置的高度
4.3 基于模式相似性测度的偏差距离模型模式识别中最基本的研究问题是样品与样品之间或类与类之间相似性测度 3 的问题，我们采用近邻准则判断两张碎纸片图像边缘灰度信息的相似性，将任意纸片 k k n 的右特征向量 X k 作为模板，用其他每一张纸片的左特征向量 Yt 模板做比较，观察与哪个与模板最相似，就是模板的近邻，即 t 纸片排在 k 纸片的右边。计算模式相似性测度的距离算法有欧式距离、马氏距离、夹角余弦距离等，针对中英文文本，我们分别测试了不同的距离算法：
次优解次优解
最优解
最优解
绝对距离在中文识别中的效果评价图
欧式距离在中文识别中的效果评价图
图 1 纸片特征匹配中最优解区分度对比（横坐标为进行匹配的纸片序号，纵坐标为匹配距离）
当我们对中文碎纸片进行匹配时，采用绝对距离及欧氏距离作为距离函数都具有较好的区分度。从图像上可以看出，采用欧式距离，使得每张纸片的期望拼接对象，与潜在会引起匹配错误的次优匹配对象具有更大的区分度，所以，一般情况下，采用欧式距离作为距离函数会使得匹配效果更好，有趣的是，在作英文内容的纸片匹配时，情况相反。因此，在之后的算法中，我们将更灵活的使用这两种距离函数，而不会固定为一种。最终得到的附录一及附录二的图片排序表格如下所示：
3
且，任意像素点的灰度值 l 的范围在 0,255 ，白色为 255 ，黑色为 0 。同时，我们定义：
X k l11 l21 li1 为第 k 张碎纸片图像的右特征向量，
T
Yk l1 j
l2 j lij 为第 k 张碎纸片图像的左特征向量。
T
考虑到实际情况，一页纸左右两端通常会有留白，所以在 Lk 中取一个 i m 阶子矩阵，得到：
6
008
014
012
015
003
010
002
016
001
004
005
009
013
018
011
007
017
000
006
表 1 附录一复原结果表
003 006 002 007 015 018 011 000 005 001 009 013 010 008 012 014 017 016 004
表 2 附录二复原结果表
w 1
1 i S ( X k X )( X k X )T N 1 k 1
1 X N
i
X
k 1
k
夹角余弦距离： S ( X k , Yt ) cos
X k Yt X k Yt
T
距离函数的选择并非一成不变，可根据不同的情况选择合适的距离函数。
5
五.模型的求解
碎纸片的拼接复原
张旭萌(数学与应用数学)、崔宇 (数学与应用数学)、顾尔健（计算机科学与技术）（全国一等奖）
摘要
本文针对碎纸片拼接问题不同的规模和难度，制定了贪心策略，模拟退火，合成启发式等多样的算法策略，并利用分类思想，化繁为简，大大增加了算法效率；同时本文兼顾到问题求解的时间、人工干预时机和“距离”函数的选择，并人性化的开发了具有实用功能的计算机软件，并以此对问题进行拓展。首先，我们类比经典的 TSP 问题的数学模型建立过程，删除“返回起始点”的限制条件，并利用 0-1 规划思想建立了简洁的模型。在距离函数的选择上，本文以“实用性” 为原则，舍弃了贝叶斯分类器等复杂的函数，而选择了实验效果较好的绝对值距离和欧氏距离，同时利用统计最优解和次优解的区分度对这两种距离函数做出了评价。对于问题一，在该模型的基础之上，利用贪心策略即可直接搜索出最基本问题的排列顺序。对于问题二这样规模更大，更复杂的情况，本文采用了分类思想，利用碎片的行特征，如行高，文字相对坐标等，将其划分到各个行，形成若干个子问题分别求解，最后再将解得的行进行合并。对于中文碎片，本文巧妙的提取碎片文字中心，从而确定出一个中心位置，以此为标准进行划分，无需人工干预就将所有碎片划分到了 11 个行。之后，利用模拟退火算法对每一个行的排列进行求解优化，最后人为进行结果的调整。而英文碎片的特征信息相对更少，考虑到英文字母的特点，本文利用灰度值密度确定碎片特征位置坐标，并以此作为划分的依据；由于英文碎片在行相对坐标上有重叠，并没有像中文纸片那样被直接划分成 11 个行，我们放弃了模拟退火算法，以局部优化的方式，代替了全局优化，采用更灵活的合成启发式算法，对每一次成功的拼接的碎片进行保留，同时记录失败的拼接，防止重复搜索，并设置函数判别阀值，在合适的时机由人去判别是否拼接，拼接效率较好。对于问题三中双面有字的碎片，求解问题二的方法也同样适用。本文额外设计了一种关联算法，在碎片一面拼接时同时将背面拼接好，减少了拼接次数。在此之外，我们额外对纸片的识别，如中英文纸片的区分，两张混杂在一起的纸片拼接，模式匹配等方面进行了拓展研究，并制作了简单易用的软件，使得人工干预更为方便，模型的实用性更强。本文的特色在于人性化的考虑，在成功解决问题的基础之上，利用合理的分类，高效的优化算法，大大降低了人为干预的次数，而在不得不介入人为干预的情况下，又设计出友好的程序软件，方便了人们的使用。关键词：灰度矩阵 TSP 问题相似性测度模拟退火算法合成启发式算法
l11 l12 l1m l l22 l2 m 21 ， k 1,2, , n Pk li1 li 2 lim
其中， m 根据实际情况人为定义，且 1 m n 。我们对全部子矩阵内的灰度值进行比较，白色 l 255 出现次数最多的子矩阵所对应的碎纸片即为最左端的纸片。同理，可以确定最右端的纸片。
5.2 问题二的求解 5.2.1 通过提取文字行特征对图片进行分类相比较问题一的碎片，问题二中碎片存在的问题有： 1.图片太小使得图片边缘信息缺失过多，无法只通过提取边缘灰度信息的方法进行比较拼接。 2.图片数量过多，使用全局优化耗时过大，因此，我们在求解问题二的过程中，首先根据文字的行特征对碎纸片进行分类，将原本位于同一行的碎纸片分为一类。这样，就将问题二转化成了问题一。
5.2.1.1 对中文文本的分类按照汉字的书写（打印）习惯，每一个字都是居中的，即同行文字的中心是处于同一水平线上的。所以，我们提取出每一张碎纸片上第一行完整文字的中心位置的信息，相同的即为一类。例如：
h1
h2
图 2 附件三 000
如图 2 所示，图像顶端到第一行完整文字顶端的距离为 h1 ，图像顶端到第一行完整文字底端的距离为 h2 。则文字的高度为 h h2 h1 ，h 完整文字的中心的距离，我们把它称为中心位置高度。
1
一.问题重述与分析
破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。 1.1 问题一的重述与分析问题一中所给出的文字图片文件仅是通过对原文件纵切形成的，要求通过建立碎纸片拼接复原模型和算法对所有图片进行排序恢复原文件。碎纸片的边缘信息可以反映该图片的特征，因此我们首先可以提取出图片的边缘信息，由于文件仅纵切，边缘处所保留的信息较多，可以不考虑中英文字的区别，取边缘信息相似的图片进行拼接可对原文件进行复原。 1.2 问题二的重述与分析问题二中所给出的文字图片相比较问题一来说又对图片进行了横切，我们考虑解决本题的方法依然是通过对两两图片边缘的信息进行比较，但是在加入了横切之后使得图片过小，边缘信息缺失过多可能导致拼接的结果并不是很理想，因此，我们在问题二中需要考虑对图片提取文字特征，通过文字特征按行进行分类，再对各行中的图片进行比较拼接。 1.3 问题三的重述与分析问题三中所给出的碎片为双面英文文字的横纵切碎片，所以可以设计一种关联算法，将同一碎片的 a 面与 b 面联系起来，只要一面拼接好，另一面就自动拼接好。
n
绝对值距离： d ij X k Yt xkw ytw
w 1
欧式距离： d ij ( X k Yt )T ( X k Yt ) X k Yt 马氏距离： d ij Dij X k Yt S 1 ( X k Yt )
2 T
2
n
( xkw ytw ) 2
4.2 类比 TSP 问题的 0-1 规划模型 TSP 问题 2 （旅行商问题），是最基本的路线问题，该问题是在寻求单一旅行者由起点出发，通过所有给定的需求点之后，最后再回到原点的最小路径成本。类比 TSP 问题，我们将每一张图片当作旅行中需经过的一点，以两图片边缘灰度信息的偏差距离作为路径成本，与原问题不同的是碎纸片拼接不需要返回原点。对于 n 张碎纸片，定义 0-1 整数型变量 xij 1 表示，第 i 张纸片拼接在第 j 张纸片的左边，否则 xij 0 。特别的，根据 4.1 中碎纸片的预处理，很容易可以找到端点处的纸片，我们将最左端纸片的序号定为 1，最右端纸片的序号定为 n 。
Yt
h
四.模型的建立
4.1 碎纸片的预处理首先用 MATLAB 软件读取附件中每张碎纸片图像的灰度信息 1 ，利用 MATLAB 自带的 imread 函数可将其自动转化为灰度矩阵： l11 l12 l1 j l l22 l2 j 21 ， k 1,2, , n Lk li1 li 2 lij 其中， j 表示每张图像横向有 j 个像素点， i 表示每张图像纵向有 i 个像素点。

CUMCM2013-碎纸片的拼接复原(全国一等奖)

合集下载

碎纸片的拼接复原

基于TSP规划模型的碎纸片拼接复原问题研究_李蕾

碎纸片的拼接复原

碎纸片的拼接复原模型

基于灰度矩阵的中文碎纸片的拼接复原算法

数学建模中的碎纸片拼接复原要点研究

碎纸片拼接问题(2013B)

最新-碎纸片的拼接大学生数学建模竞赛二等奖论文精品

碎纸片的拼接复原数学建模论文

数学建模—碎纸片的拼接复原

基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题

碎纸片拼接复原的算法设计

碎纸片拼接复原

2013年高教社杯全国一等奖论文碎纸片的拼接复原

2013数学建模基于灰度像素理论的碎纸片拼接方法

碎纸片的拼接复原

基于人机交互界面的碎纸片拼接复原

文档推荐

最新文档

CUMCM2013-碎纸片的拼接复原(全国一等奖)

合集下载

碎纸片的拼接复原

基于TSP规划模型的碎纸片拼接复原问题研究_李蕾

碎纸片的拼接复原

碎纸片的拼接复原模型

基于灰度矩阵的中文碎纸片的拼接复原算法

数学建模中的碎纸片拼接复原要点研究

碎纸片拼接问题(2013B)

最新-碎纸片的拼接大学生数学建模竞赛二等奖论文 精品

碎纸片的拼接复原数学建模论文

数学建模—碎纸片的拼接复原

基于数字图像的碎纸复原模型与算法--2013年全国大学生数学建模B题碎纸片的拼接复原问题

碎纸片拼接复原的算法设计

碎纸片拼接复原

2013年高教社杯全国一等奖论文碎纸片的拼接复原

2013数学建模基于灰度像素理论的碎纸片拼接方法

碎纸片的拼接复原

基于人机交互界面的碎纸片拼接复原

文档推荐

最新文档

最新-碎纸片的拼接大学生数学建模竞赛二等奖论文精品