碎纸片拼接复原数模论文b
- 格式:docx
- 大小:271.66 KB
- 文档页数:17
基于图像处理的碎纸片拼接数学模型分析【摘要】本文基于图像处理技术,通过建立数学模型分析碎纸片拼接的过程。
首先介绍研究背景和研究意义,接着详细阐述数学模型的建立和图像处理方法的应用。
通过实验结果分析和误差分析,发现现有模型存在一定的问题,并提出模型优化方法。
总结研究成果,展望未来可能的研究方向。
通过本文的研究,可以更加深入地理解碎纸片拼接的数学模型,为相关领域的研究提供参考和帮助。
【关键词】碎纸片、图像处理、数学模型、拼接、实验结果、误差分析、模型优化、研究背景、研究意义、研究成果、未来展望。
1. 引言1.1 研究背景碎纸片拼接是一种常见的问题,它在实际生活和工程应用中具有重要意义。
碎纸片拼接可以用于恢复损坏的文件或图像,也可以用于数字化文物等领域。
在实际操作中,由于碎片形状、大小、颜色等的多样性,导致碎纸片拼接过程复杂且耗时。
基于图像处理的碎纸片拼接方法能够有效地解决这一问题,通过利用计算机视觉技术对碎纸片进行识别、匹配和拼接,实现自动化碎纸片拼接的目的。
目前,针对碎纸片拼接问题的研究已经取得了一定的进展,但仍然存在一些挑战和问题。
碎纸片的形状复杂多样,容易出现匹配错误或漏配现象;碎纸片之间可能存在重叠或遮挡情况,导致图像处理的难度增加。
有必要建立一个有效的数学模型,结合图像处理方法来对碎纸片拼接进行深入研究和分析。
本研究旨在探讨基于图像处理的碎纸片拼接数学模型,提出相应的算法和优化方法,为解决碎纸片拼接问题提供新的思路和方法。
1.2 研究意义碎纸片拼接是一个常见的问题,它涉及到图像处理、数学建模等多个领域。
通过对碎纸片进行拼接,可以恢复原始图像,这在很多场景下都具有重要的应用意义。
对于破损的文件进行修复、对于涂抹的照片进行修复等。
碎纸片拼接数学模型的建立和图像处理方法的应用,可以帮助我们更好地理解碎纸片拼接问题的本质,并且为实际问题的解决提供重要的理论支持。
通过对实验结果进行分析和误差分析,可以不断优化模型,并且为碎纸片拼接问题的应用提供更加精确和稳定的解决方案。
基于最小二乘法的碎纸片拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。
针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。
经计算,得到附件1的拼接结果为:08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。
附件2的拼接结果为:03,06,02,07,15,18,11,00,05,01 ,09,13, 10,08,12,14,17,16,04。
针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。
我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。
针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。
经计算,附件5的拼接结果见表14和表15该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。
关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。
近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1. 卢丽丹2. 王雪梅3. 国占飞指导教师或指导教师组负责人(打印并签名):指导教师组(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文主要研究碎纸片拼接复原的问题,它实质上是建立特征数组并利用C语言进行比较。
在问题1中,建立了以每个边缘像素到原点距离的特征数组;通过比较边缘像素,以距离比较的方法得到各个图象的特征数组相似度的大小并以此建立模型1。
具有最大相似度的图片认为其匹配。
对于问题2,由于出现精度太低的情况,所以我们对问题1进行了改进,由于问题2图片横纵切。
关于碎纸片自动拼接的数学模型摘要本文针对生活中破碎文件的拼接难度大,效率低等现象,从题目所给的情形出发,利用计算机软件把碎纸片图像转化为数字图像,综合运用matlab 软件中的数字图像处理方法,建立了以图与图之间的相似程度为基准的数学模型。
这个模型的评价标准很简单,就是相似度函数的值。
通过比较图像与图像之间的相似度函数的值的大小,就可以得出碎纸片的具体拼接序列。
对于问题(1),首先,用matlab 软件的imread 函数对图像的进行读取,得到数据矩阵为),(y x F i 。
其次,根据模型的假设(1),找到最右端的碎纸片,并记为),(1y x F 。
然后,以数据矩阵),(y x F i 为基础,引入相似度函数)(b sim ,并求 出相似度函数值。
最后,用matlab 工具箱中的sort 函数把所得到的相似度函数值进行排序,所得到的相似度函数值最小的图像即为与最右端的碎纸片匹配的图像。
如此重复18次,即可得附件1的中文图像的排列序号,结果如表1所示。
同理可得附件2的英文图像排列序号,结果如表2所示。
复原结果图片见论文附件的图1和图2。
对于问题(2),同样先找到最右端的11张图像和最上方的19张图像,根据图像的页边距特性确定原图像右上角的第1张图像。
利用问题(1)的算法可得最右端的11张图像和最上方的19张图像的排列序号。
然后,在问题(1)的算法的基础上,利用图像中的文字的固定间距去改进算法,缩小搜索范围,并在拼接完一行后显示一次结果,由于近似距离计算公式与人主观视觉差异,所以需要人机交互调整结果。
如此重复18次,即可得附件3的中文图像的排列序号,结果如表3所示。
同理可得附件4的英文图像排列序号,结果如表3所示。
对于问题(3),与问题(2)相似,只是碎纸片由单面变为双面。
因此在匹配图像时,引入两重相似度函数)(Q sim ,以确保正反两面能同时匹配。
同时每匹配5张图像显示一次结果,以增加人工干预次数。
2013高教社杯全国大学生数学建模竞赛B题碎纸片的拼接复原首先分析问题:对于第一问分析如下对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
求matlab图像拼接程序clear;I=imread('xingshi32.bmp');if(isgray(I)==0)disp('请输入灰度图像,本程序用来处理128 *128的灰度图像!');elseif (size(I)~=[128,128])disp('图像的大小不合程序要求!');elseH.color=[1 1 1]; %设置白的画布figure(H);imshow(I);title('原图像');zeroImage=repmat(uint8(0),[128 128]);figure(H); %为分裂合并后显示的图设置画布meansImageHandle=imshow(zeroImage);title('块均值图像');%%%%%设置分裂后图像的大小由于本图采用了128像素的图blockSize=[128 64 32 16 8 4 2];%%设置一个S稀疏矩阵用于四叉树分解后存诸数据S=uint8(128);S(128,128)=0;threshold=input('请输入分裂的阈值(0--1):');%阈值threshold=round(255*threshold);M=128;dim=128;%%%%%%%%%%%%%%%%% 分裂主程序%%%%%%%%%%%while (dim>1)[M,N] = size(I);Sind = find(S == dim);numBlocks = length(Sind);if (numBlocks == 0)%已完成break;endrows = (0:dim-1)';cols = 0:M:(dim-1)*M;rows = rows(:,ones(1,dim));cols = cols(ones(dim,1),:);ind = rows + cols;ind = ind(:);tmp = repmat(Sind', length(ind), 1);ind = ind(:, ones(1,numBlocks));ind = ind + tmp;blockValues= I(ind);blockValues = reshape(blockValues, [dim dim numBlocks]);if(isempty(Sind))%已完成break;end[i,j]=find(S);set(meansImageHandle,'CData',ComputeMeans(I,S));maxValues=max(max(blockValues,[],1),[],2);minValues=min(min(blockValues,[],1),[],2);doSplit=(double(maxValues)-double(minValues))>threshold;dim=dim/2;Sind=Sind(doSplit);Sind=[Sind;Sind+dim;(Sind+M*dim);(Sind+(M+1)*dim)];S(Sind)=dim;end对于第二问于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。
承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆XX大学参赛队员(打印并签名) :1. 祝XX2. 冯XX3. 周XX指导教师或指导教师组负责人(打印并签名):张XX(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期: 20XX 年 X 月 XX 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要图像碎片自动拼接复原是需要借助计算机把大量碎片重新拼接复原成初始图像的完整模型,这一研究在考古、刑侦犯罪、古生物学、医学图像分析、遥感图像处理以及壁画保存复原等方面具有广泛、实际的应用[1].本文主要解决碎纸机破碎文档的自动拼接复原问题.我们利用图像数字化技术,借助Matlab软件将图像转化为矩阵.通过建立数学模型,运用矩阵论、聚类分析方法、自定义相似度方法、遗传算法、字符分割和字符识别等方法,对数据进行处理,实现对图像碎片自动拼接,从而将所给碎片拼接复原为完整图像.问题一,我们首先把碎片图形进行二值化处理,根据所给纵切黑白碎片边缘的像素关系(相邻两张碎片,一张碎片矩阵右边的像素与另一张碎片左边的像素相同 ),我们采和自定义相似度算法,利用附件一和附件二求出碎片间的相似度,然后根据所需要满足的条件即相似度最大原则,建立了纵切碎片拼接模型一及其算法,运用Matlab编程实现该模型,并得到碎片复原结果(见表一表二).问题二,要实现快速准确的拼接复原纵横切碎片,在问题一的思路基础上,我们采用了模糊C的均值聚类方法,先对附件三所有碎片进行初步的分类,然后在自定义相似度算法上增加了约束条件,以此来排除有若干碎片在匹配时相似度相同的情形,建立了改进的中文纵横切碎片拼接模型二,同样利用Matlab软件求得碎片的复原结果(见表三).对于英文纵横切碎片的拼接问题,我们采用了字符切割和字符识别思想,即在碎片的二值化矩阵中选取适当大小的行与列,对碎片边缘的英文字母进行切割,与其他图片匹配合并,提取切割字母的特征(统计特征或结构特征),再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符,将两张碎片拼接在一起,先一行一行地进行拼接,再利用模型二横切碎片方法,利用Matlab软件求得碎片的复原结果(见表四).问题三,在处理双面打印纵横切碎片时,经分析发现两面图片最大的区别在于光滑度的不同,纸张的正面比反面要光滑,因此在模型二的基础上还需增加一步筛选工作,就是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”,再根据不同页面的频率范围,设定一段频率值,借助计算机将双面打印的碎片进行分类,分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可,通过这种方法求得碎片的复原结果.关键词:碎片拼接均值聚类方法相似度模型傅里叶变换一、问题重述背景:破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础,而且图像配准算法的计算量一般非常大,因此图像拼接复原技术的发展很大程度上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.重述:该题研究的是如何对碎纸片进行拼接复原.传统上,拼接复原工作需由人工完成,准确率较高,但是效率低.随着计算机技术的发展,当碎纸片数量巨大的时候,人们试图开发碎纸片的自动拼接技术,以提高拼接复原的效率.问题1 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。
碎纸片的拼接复原分析(最终).(优选)基于多耦合规则的人机交互拼接模型摘要随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
本题就是求解破碎文件自动拼接问题,实际上就是通过数字处理技术将碎纸信息转化成计算机可以识别的数字图像信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的全自动或半自动拼接还原。
题目共分为三个问题,第一个问题是对同一页单面印刷文字文件仅纵切的碎纸片进行拼接复原。
第二个问题是对同一页单面印刷文字文件既纵切又横切的碎纸片进行拼接复原。
第三个问题是对同一页双面打印文件既纵切又横切的碎纸片拼接复原问题。
前两个问题的文件又分为中英文两种情况。
三个问题由简到难,层层深入。
在求解问题过程中,首先利用图论概念与定义描述了图片的拼接问题,将问题转化为最优树寻找问题。
根据对中、英字符的分析,总结出中、英字符在书写上的异同,分别建立基线耦合、字宽耦合、边缘耦合、字符耦合、双边耦合、三边耦合等六种耦合拼接准则,尽量使得每一块碎片都有多种可用的耦合拼接方式。
将耦合准则根据关联程度进行优先级排序,每一块碎片的信息依次按照耦合准则优先级进行量化,从而多方式量化每一块碎片之间拼接的耦合程度,进而实现了碎片的自动最优拼接。
本题所建立的耦合准则拼接算法只需要随机选取一块碎片作为种子,经过不同耦合方式的筛选,可找到与之某一边具有较高耦合度的另一块碎片,拼接成为一块具有较大可信度的图像,再通过人工识别,判断所得的图片是否正确,并建立确定拼接集和排除拼接集,实现拼接图像的进化,再与用户交互。
对于碎片拼接过程的提出了交互审查式、人机交互式和混合式三种模式,并建立了包括拼接模式、拼接识别、拼接控制、信息显示等多种用户指令在内的指令库,即可通过简单的人工指令对程序进行控制,进而利用计算机对碎片进行正确的复原。
利用耦合准则拼接算法及人机交互过程实现了碎片复原过程的简化。
且本题所建立的模型可广泛应用与解决一维、二维、双面等问题。
数学论文基于图像处理的碎纸片拼接数学模型分析1.问题背景目前碎纸的拼接工作大部分是靠人工的方式完成,但是当碎纸片的数量巨大的时候,要人工拼接完成就很困难了。
国内对此技术的研究主要是集中于文物碎片的自动修复、虚拟考古、故障分析以及计算机辅助设计、医学分析等领域,除此之外,破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域也有只重要的应用。
常规的碎纸片拼接方法一般是基于碎纸片的边缘的形状特征比如尖点、尖角、面积等几何特征,再进行搜索与之相匹配的纸片从而完成拼接。
但是这种基于纸片边缘几何特征的拼接方法,当存在许多边缘几何特征相似的纸片的情况下,这种拼接方法就不适用了,因此,本文重在建立一种基于纸片中文字特征的模型来完成碎纸片的拼接。
2.问题分析碎纸片自动拼接技术是图象处理与模式识别领域中的一个较新但是很典型的应用,它是通过计算机扫描和图像提取技术获取一组碎纸片的形状、颜色、文字特征等信息,然后利用计算机进行相应的处理从而实现对这些纸片自动和半自动的拼接还原。
碎纸片自动拼接技术的关键包括图像的预处理和匹配,其中预处理的目的是把碎纸片表示为适合于利用计算机处理的形式。
预处理包括图像的获取和处理,对于边界特征明显的纸片可以进行边界检测,轮廓提取和表示。
而纸片的匹配技术是碎纸自动拼接中关键之关键,即利用建立好的模型并设计出算法对纸片进行特征识别和自动拼接。
问题中的碎纸片由于具有同样的边缘几何特征,因此不能采用常规的靠提取碎片边缘尖点、尖角以及面积的方式来对不同的碎片进行区分。
对于这类边缘相似的碎纸片拼接,理想的计算机拼接过程应与人工拼接过程类似,及拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎片内的字迹断线或碎片内的文字内容是否匹配,然而由于理论和技术的限制,让计算机具备类似人那种识别碎片边缘的字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。
但是,利用现有的技术,完全可以获取碎纸片内部及边缘的文字几何特征以及纸片不同部分的颜色等信息,在自动拼接时,只要寻找到具有相同边缘特征的纸片即可。
碎纸片的拼接复原数学模型的构建摘要院本文讨论在碎纸机以不同方式破碎纸片的情况下建立碎纸片的拼接复原模型,以解决碎片数量巨大时人工拼接的难题,本文建立了三个具有针对性的模型。
模型一:方差分析法下的碎纸片拼接模型。
在以纵切方式破碎纸片的情况下,提取碎纸片左右边缘的灰度列向量,利用碎纸片边缘处为单边同宽空白区域的特殊性对碎纸片进行定位,再利用方差分析法和欧式距离解决了纵切碎纸片的拼接复原问题。
模型二:文字行间距一致性的碎纸片拼接模型。
以纵横方式破碎纸片,利用同行文字行间距一致性的主要特性可解决横向碎纸片的拼接复原问题,简化了模型,将离散的像素灰度矩阵平均化处理,进而利用欧氏距离对碎纸片进行匹配,得到了碎纸片复原后的完整图片。
模型三:二值化Otsu 算法的碎纸片拼接复原模型。
本文从双面纵横破碎纸片的问题出发,建立了纸片二值化Otsu 法拼接模型,先对碎纸片分组预处理,为将复杂模型简单化,再利用全局阈值方法中典型的Otsu 法求取碎纸片的最佳阈值,以该阈值对碎纸片中所含灰度值信息进行划分实现二值化处理,将边缘区域明显化,利用统计学方法求取拼接后的纸片间成功匹配的像素点占纸片边缘的概率,最终双面纵横破碎纸片的拼接复原问题得以解决。
Abstract: This paper discusses the construction of splicing scrap recovery model under the condition of shredder breaking paper intopieces in different ways, so as to solve the problem of artificial splicing when there is a great amount of pieces. This paper establishes threecorresponding model.Model One: Paper Scrap Splicing Model under Analysis of Variance.Shredding paper through longitudinal mode, the paper selects the gray scraps of paper around the edge extraction column vector,locates the paper scrap by using edge of paper scraps as blank area with same width, then solves the problem of reconstruction of thelongitudinal cutting paper splicing through analysis of variance method and Euclid Distance.Model Two: Paper Scrap Splicing Model with Consistency of Text Line Spacing.Shredding paper through vertical and horizontal mode, its main characteristics of peer text line spacing consistency can solve theproblem of reconstruction of splicing transverse paper scraps, simplifies the model, processes the pixel matrix of discrete in average andmatches the paper scraps through Euclid Distance and then gets the complete picture of paper scrap afterrecovery.Model Three: Paper Scrap Splicing Model Based on Binaryzation Otsu Algorithm.This paper firstly expounds the double side's vertical and horizontal mode, establishes the paper scrap splicing model based onbinaryzation Otsu algorithm. The paper firstly does preconditioning for paper scraps into groups, simplifies the complex model, and then getsthe optimal threshold of the paper scraps by using typical Otsu algorithm of global threshold method. The paper classifies the gray valueinformationof paper scraps through this threshold to realize binaryzation processing, specifies the edge area, evaluates the probability ofsuccessful matching pixels on edge of splicing paper, and finally solves the mosaic and restoration problems of double side's vertical andhorizontal mode.关键词院离散;方差分析;置信区间;阈值;Otsu 算法Key words: discrete;analysis of variance;confidence interval;threshold;Otsu algorithm中图分类号院TQ018 文献标识码院A 文章编号院1006-4311(2014)25-0238-031模型一考虑以为空间拼接情况,为了获取拼接图像所必须的数据,文章以像素为单位离散所得碎片:利用VC++使用了Windows.H 头文件并调用RGB 等结构定义获得不同像素点的g 值[1],生成了多个灰度矩阵。
数学建模中的碎纸片拼接复原要点研究嘿,你是不是也碰到过这样的一种场景?某天,不小心把文件弄坏了,纸张四分五裂,散落一地。
可能是你不小心掉了咖啡,可能是好奇心作祟,忍不住撕了某个文件,结果纸片就像乱七八糟的拼图一样,飞到天上,摔在地上,结果呢?你站在碎片堆里一脸懵逼,心里想着,“这怎么办?”你可以想象那种绝望的感觉,不是么?碎纸片拼接复原这事儿,虽然听起来有点疯狂,但它不仅仅是纸张的恢复,更是一种深层次的“重生”之道,充满了无限可能,简直就像是面对一堆零散的拼图,我们总能找到适合的解决方案。
看着那些纸片,你可能会想:“这就算了吧,反正都是碎片,哪里能拼得起来?”可是,事实是,解决这些碎片的方法其实有很多,数学建模的意义不就是什么?找到正确的方法和思路,让这些破碎的片段重新组合成一个完整的整体。
是不是有点像拼乐高?看似没有头绪,但只要找对了顺序,最后一切都能完美呈现。
你看,数学建模就有点这个意思。
对,那些碎片,它们可能是无序的,是乱糟糟的,可是只要你有了对的思路、方法,一切都能恢复如初,甚至超乎你想象的完美。
要说碎纸片的拼接复原,首先就得搞清楚什么是数学建模。
你得想象它不是一个万能的机器,它是一个思维工具,它能帮你捋清楚思路,找到其中的规律。
就像拼图游戏,你眼前散落的纸片就像是一个个信息块,散得毫无规律,似乎你根本无法看到整个画面。
但如果你能从碎片中抓住一些关键的联系,就能一步步找出这些碎片的拼接顺序。
所以,复原碎纸片的过程其实是一个“解谜”过程。
这其中不仅仅是纸张本身的重组,更是一个对空间、时间甚至是规则的深刻理解。
说白了,数学建模就像是给了我们一套“万能钥匙”,用它打开看似混乱的局面,找到通往完整答案的道路。
像拼图一样,首先得弄清楚每块拼图的形状,哪个角落是直的,哪个边缘是圆的,哪些部分应该放在一起。
这里面有很多学问,一旦你把规律摸清了,整个过程就像开挂一样,轻松自如。
可能会有人觉得:“哎呀,这个太复杂了吧,怎么能从一堆碎片中找到规律呢?”其实啊,碎纸片复原的关键就在于“分析”和“推理”。
碎纸片的拼接复原摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
传统上,拼接复原工作由人工完成,虽准确率高,但效率很低。
特别是当碎片数量巨大,人工拼接难以完成任务。
因此随着计算机信息技术的发展,开发一个碎纸片的自动拼接技术,并建立简便的拼接复原模型,提高拼接复原效率,具有重要的实现意义。
文章通过对所给的附件图片数据进行分析研究,在综合考虑了碎片边缘的尖点特征、尖角特征、面积特征等几何特征下,我们将图片读入电脑,并进行二值化转换,考虑边界值的匹配,建立了图片边界匹配模型。
依据模型,只要边界能匹配上就可以拼接,并依次解决了如下问题。
对于问题一,由于给定图片来自同一页印刷文字文件仅纵切破碎纸片,针对附件1、附件2给出的碎片数据,建立了碎纸片拼接复原的边界匹配模型。
根据模型,我们首先对附件1、附件2中的图片用Matlab软件进行二值转化,得到一个储存图片的二值灰度矩阵,并利用边界相关性比较法判断矩阵中两边界变量是否能匹配得上,如果匹配得上就拼接在一起,按此算法,附件1、附件2中的碎纸片就能拼接成功,具体的算法结果见附录中的附件1、附件2。
对于问题二,由于碎纸机既有纵切又有横切的情形,算法的设计上要相对复杂一些,我们在前面模型的基础上进行了修改和补充,对图片的上下左右的边界都进行了边界提取。
首先,我们选将图片作二值转换,分别用矩阵进行保存,然后任迁一个,对其余的进行全程扫描,按照问题一中的边界匹配模型,逐一对其边界进行扫描匹配,其间,有些矩阵的边界数据可能一样(如空白时),我们便跳出模型,进行适当的人工干预,干预完成,再进入模型进行迭代,按此方法便可拼接成功,具体的算法结果见附录中的附件3。
对于问题三,根据现实问题中的双面打印文件的碎纸片拼接复原问题,由于多了双面的问题,在算法的设计上,我们考虑了正反两的边界匹配,在原有模型的基础上,将问题一和问题二的模型相结合,建立一个新的双面碎纸片拼接模型。
摘要:本文以2013年全国数学建模竞赛B题为背景,主要研究双面打印碎纸片的拼接复原问题。
利用特征点匹配的图像拼接算法,绘出了基于特征点的图像拼接流程图;根据图像拼接流程图建立了特征点检测算法Moravec角点检测算法模型,通过计算各像素的兴趣值、选择恰当的特征点、候选点,分析运算得到了附件5的碎纸片拼接复原结果。
关键词:拼接复原特征点匹配Moravec角点检测1研究背景破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
本文利用数学建模,借助MATLAB、SPSS软件研究试图双面打印文件碎纸片的自动拼接复原,以提高拼接复原效率。
2数据提取利用题目给的为碎纸片的图片,先使用MATLAB软件读入图片,把图片特征位置信息转换为数字矩阵。
MATLAB函数为:imread(‘file name’)。
3问题求解3.1Moravec角点检测模型的建立由于双面打印文件中碎片数量众多,利用图片边缘灰度矩阵进行匹配时会产生庞大的数据,实际操作过程中进行人工干预会产生很大误差。
本文采用基于特征点的图片拼接模型,并取各矩阵的角点为特征点。
图像拼接的质量主要依赖于图像配准的程度,因此图像的配准是拼接算法的核心和关键。
算法的总体思想是既要保证配准的精度,又要保证计算量不要过大。
基于特征点匹配的图像拼接算法包括:特征点检测、特征点匹配、空间变换、图像融合。
下图1是基于特征点的图像拼接流程图。
输入原始图像a输入原始图像b提取a图像特征点提取b图像特征点对图像a、b进行特征匹配计算图像变换关系对图像b进行几何变换图像融合a、b图1用特征来建立两幅图像之间的匹配对应关系,所以提取好的特征是特征匹配的关键,那么选择高精度的提取方法至关重要。
特征提取的难点在于自动、稳定、一致性的特征提取。
特征点中主要的一类是角点,本文采用的是Moravec角点检测算法。
2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文从开发碎纸片的自动拼接技术,以提高拼接复原效率的角度出发,研究了不同切割方式、不同语言文字和单双面打印下的破碎文件拼接还原方面的问题。
与同类研究相比,本文旨在突出研讨自动拼接技术在生活中应用问题的重要性。
针对问题一,附件1和附件2中的碎纸片都只是纵向切割的情况,运用切割边缘灰度检测模型和图论模型,对附件1和附件2中的碎纸片进行了拼接还原,得到了附件1和附件2中破碎文件复原后的排列顺序如下所示:附件1中碎纸片文件复原顺序表(表1)附件2中碎纸片文件复原顺序表(表2)针对问题二,附件3和附件4中的碎纸片是横向、纵向都切割,且附件3和附件4中碎纸片上的文字是不同语言文字的情况,运用层次聚类方法、灰度检测模型、图论模型和递归收缩算法,并且加入了人工干预的影响,对附件3和附件4中的破碎文件先进行局部还原,且进行人工干预,得到了附件3中破碎文件复原后的排列顺序表(表4)和附件4中破碎文件复原后的排列顺序表(表7)。
精心整理碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。
本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。
针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。
对于仅纵切的碎纸片,根据矩阵的行提取理论,将每个灰度矩阵的第一列提取,作为新矩阵,提取每个灰度矩阵的最后一列,生成新矩阵。
建立碎纸片匹配模型:将矩阵中的任一列与矩阵中的每一列带入模型,所得p值对应的值,即为所拼接的碎片序列号。
将程序进行循环操作,得到最终的碎片自动拼接结果。
针对问题2,首先将图像信息进行灰度分析,提取灰度矩阵。
基于既纵切又横切的碎纸片,根据矩阵的行列提取理论,分别提取每个灰度矩阵的第一列和最后一列,分别生成新矩阵、;提取所有灰度矩阵的第一行和最后一行,分别作为新生成的矩阵、。
由于纸质文件边缘空白处的灰度值为常量,通过对灰度矩阵的检验提取,确定最左列的碎纸片排序。
在此基础上,采用从局部到整体,从左到右的方法,建立匹配筛选模型:,将矩阵中的任一列分别与矩阵中每一列代入模型,所得p值对应的值即为横排序;将矩阵中的任一行分别于矩阵中的任一行代入模型,所得q值对应的值即为列排序。
循环进行此程序,得计算机的最终运行结果。
所得结果有少许误差,需人工调制,更正排列顺序,得最终拼接结果。
针对问题3,基于碎纸片的文字行列特征,采用遗传算法,将所有的可能性拼接进行比较,进行择优性选择。
反面的排序结果用于对正面排序的检验,发现结果有误差,此时,进行人工干预,调换碎纸片的排序。
【关键词】:灰度矩阵欧式距离图像匹配自动拼接人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
全国大学生数学建模竞赛B题全国一等奖论文IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】碎纸片的拼接复原【摘要】破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
本文主要解决碎纸机切割后的碎纸片拼接复原问题。
针对第一问,附件1、2分别为沿纵向切割后的19张中英文碎纸片,本文在考虑破碎纸片携带信息量较大的基础上,利用MATLAB对附件1、2的碎纸片图像分别读入,以数字矩阵的方式进行存储。
利用数字矩阵中包含图像边缘灰度这一特征,本文采用贪心算法的思想,在首先确定原文件左右边界的基础上,以Manhattan 距离来度量两两碎纸片边界差异度,利用计算机搜索依次从左往右搜寻最匹配的碎纸片进行横向配对并达成排序目的。
最终,本文在没有进行人工干预,成功地将附件1、2碎纸片分别拼接复原,得到复原图片见附录、,纵切中文及英文结果表分别如下:心思想仍为贪心算法,整体思路为先对209张碎纸片进行聚类还原成11行,再对分好的每行进行横向排序,最后对排序好的各行进行纵向排序。
本文在充分考虑汉字与拉丁字母结构特征差异以及每块碎纸片携带信息减少的基础上,创新地提出一种特征线模型来分别描述汉字及拉丁文字母的特征用于行聚类。
对于行聚类后碎片的横向排序,本文综合了广义Jaccard系数、一阶差分法、二阶差分法、Spearman系数等来构建扩展的边界差异度模型,刻画碎片间的差异度。
对于计算机横向排序存在些许错误的情况,本文给出了人工干预的位置节点和方式。
对于横向排序后的各行,由于在一页纸上,文字的各行是均匀分布的,本文基于各行文字的特征线,在确定首行的位置后,估计出其他行的基准线位置,得到一页的基准线网格,并通过各行基准线在基准线网格上的适配实现纵向的排序。
最终,本文成功的将附件3、4碎纸片分别拼接复原得到复原图片及结果表见附录、、、,同时本文给出了横向排序中人工干预的位置节点和方式。
碎纸片拼接复原数模论文bRevised as of 23 November 20202013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆XX大学参赛队员 (打印并签名) :1. 祝XX2. 冯XX3. 周XX指导教师或指导教师组负责人 (打印并签名):张XX (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期: 20XX 年 X 月 XX 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要图像碎片自动拼接复原是需要借助计算机把大量碎片重新拼接复原成初始图像的完整模型,这一研究在考古、刑侦犯罪、古生物学、医学图像分析、遥感图像处理以及壁画保存复原等方面具有广泛、实际的应用[1].本文主要解决碎纸机破碎文档的自动拼接复原问题.我们利用图像数字化技术,借助Matlab软件将图像转化为矩阵.通过建立数学模型,运用矩阵论、聚类分析方法、自定义相似度方法、遗传算法、字符分割和字符识别等方法,对数据进行处理,实现对图像碎片自动拼接,从而将所给碎片拼接复原为完整图像.问题一,我们首先把碎片图形进行二值化处理,根据所给纵切黑白碎片边缘的像素关系(相邻两张碎片,一张碎片矩阵右边的像素与另一张碎片左边的像素相同 ),我们采和自定义相似度算法,利用附件一和附件二求出碎片间的相似度,然后根据所需要满足的条件即相似度最大原则,建立了纵切碎片拼接模型一及其算法,运用Matlab 编程实现该模型,并得到碎片复原结果(见表一表二).问题二,要实现快速准确的拼接复原纵横切碎片,在问题一的思路基础上,我们采用了模糊C的均值聚类方法,先对附件三所有碎片进行初步的分类,然后在自定义相似度算法上增加了约束条件,以此来排除有若干碎片在匹配时相似度相同的情形,建立了改进的中文纵横切碎片拼接模型二,同样利用Matlab软件求得碎片的复原结果(见表三).对于英文纵横切碎片的拼接问题,我们采用了字符切割和字符识别思想,即在碎片的二值化矩阵中选取适当大小的行与列,对碎片边缘的英文字母进行切割,与其他图片匹配合并,提取切割字母的特征(统计特征或结构特征),再利用字符识别的方法从得到的特征库中找到与待识别字符相似度高的字符,将两张碎片拼接在一起,先一行一行地进行拼接,再利用模型二横切碎片方法,利用Matlab软件求得碎片的复原结果(见表四).问题三,在处理双面打印纵横切碎片时,经分析发现两面图片最大的区别在于光滑度的不同,纸张的正面比反面要光滑,因此在模型二的基础上还需增加一步筛选工作,就是采用傅里叶变换将图像的二值矩阵从“空域”变为“频域”,再根据不同页面的频率范围,设定一段频率值,借助计算机将双面打印的碎片进行分类,分离出在同一页面的碎片.分离成功后再采用模型二对于英文碎片的拼接方法将碎片进行复原即可,通过这种方法求得碎片的复原结果.关键词:碎片拼接均值聚类方法相似度模型傅里叶变换一、问题重述背景:破碎文件的拼接和复原对于司法物证复原、历史文献再现和军事情报获取等方面都有极其重要的作用.于是碎纸片的拼接复原技术便成为图像处理与模式识别领域中的一个崭新典型的应用.图像配准是图像拼接复原的基础,而且图像配准算法的计算量一般非常大,因此图像拼接复原技术的发展很大程度上取决于图像配准技术的创新.本文将通过图像提取技术获取一组碎纸片的形状、颜色、文字等信息,然后利用计算机进行相应的处理从而实现对这些碎纸片的自动拼接复原.重述:该题研究的是如何对碎纸片进行拼接复原.传统上,拼接复原工作需由人工完成,准确率较高,但是效率低.随着计算机技术的发展,当碎纸片数量巨大的时候,人们试图开发碎纸片的自动拼接技术,以提高拼接复原的效率.问题1 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、2给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,写出干预方式及干预的时间节点.问题2 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、4给出的中、英文各一页文件的碎片数据进行拼接复原.如果复原过程需要人工干预,写出干预方式及干预的时间节点.问题3 对于双面打印文件的碎纸片拼接复原问题设计碎纸片拼接复原模型和算法,并针对附件5给出的一页英文印刷文字双面打印文件的碎片数据进行拼接复原,结果表达同上.二、问题分析碎纸机破碎纸片的拼接复原,都需要经过获取图像,导入图像,图像预处理,图像配准,和图像的拼接复原步骤.其中图像配准是碎纸片拼接复原技术中最重要的环节之一.针对本题中给出的三种不同的情况,需采用不同的模型和算法来提高拼接复原的效率和准确度[2]:对于问题1 所需要拼接复原的碎纸片为纵向切割的小纸条,通过Matlab软件将所给图片转换成为198072⨯的二值矩阵,先随机选择一个碎片的矩阵作为基本矩阵,将剩余矩阵与基本矩阵作比较,通过matlab软件计算出相比较矩阵的相似度,再根据模型一的匹配方法将碎纸片进行拼接复原,此拼接模型不需要人工干预.对于问题2 对于碎纸机既横切又纵切的情形,所得碎片的像素较低,采用模型一的算法无法完全拼接复原1911⨯个碎片,需要先对碎片进行聚类分析,筛选出特征相同的碎片,再根据二重判别标准的相似度刻画原则,将碎片进行横向和纵向的拼接复原.对中文碎片进行拼接时,先通过二值矩阵找出字间距和一个字的间距,通过聚类分析法先将所有碎片分行找出,把横纵切拼接问题转化为横切碎片拼接,再利用行间距和字的行高约束条件,运用遗传算法拼接复原整个图片.英文碎片拼接与中文碎片拼接不同,在拼接碎片时,需要采用字符切割的方法,提取英文字母的特征,根据碎片边缘字母的特征,再利用字符识别的方法,寻找相匹配的碎片,根据这一原则运用遗传算法的匹配方法拼接复原英文碎片.对于问题3 要想拼接复原双面打印碎片,必须先将所有碎片进行分类.把同一页的碎片分离出来.经过分析可得,两面打印的纸张的粗糙度不同,正面比反面光滑,根据这一特征,需要采用傅里叶变换处理图像,从而得到碎纸片的“频率”图.高频代表图像的细节、纹理信息,低频代表图像的轮廓信息.对所有碎纸片进行高频滤波.滤波后可得图像的纹理信息.运用Matlab软件计算若干碎纸片的频率信息,设定频率范围,将所有碎纸片分为正反页面图片两类.再采用模型二的算法拼接复原整个图片.三、基本假设1、碎纸机破碎的每个纸片的长、宽和厚度均相同;2、所有碎片是黑白图片,图片清晰;3、碎片完整没有缺损缺失,可以完全拼接复原;4、碎纸片的正反两方面的印刷效果都一样,互不影响;5、扫描图片没有变异,文字与图片上边界平行;6、文件页边距和行距固定;7、碎片中的文字方向相同,不需要考虑碎片拼接时需要旋转拼接复原. 表示两个碎纸片像素边界矩阵元素相同的数目 通过我们建立的自动拼接模型,在图片拼凑过程中,我们可以预测图片的拼接大致需进行图片处理、边界比较、图片输出等步骤.通过我们所得的模型预测,可以得出预测方程.具体流程图如图5-1所示:图5-1 模型方法预测(一)问题一模型的建立与求解5.1.1 图像的导入 运用Matlab 软件采用二值法原理将碎片的图像转换成为198072⨯的(0,1)矩阵,记为i A )19,,2,1( =.5.1.2图像的去噪边缘处理 采用中值滤波的原理对图像边缘进行去噪.中值滤波就是用相邻像素的中值来替代该像素的值,利用Matlab 对图像所成二值矩阵进行光滑处理,以此提高碎片匹配时的相似度.中值滤波法是一种非线性平滑技术,它将每一象素点的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值.中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个拎域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。
方法是去某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。
二维中值滤波输出为)},(),,({),(w l k l y k x f med y x g ∈--=,其中,),(y x f ,),(y x g 分别为原始图像和处理后图像。
W 为二维模板,通常为33,22⨯⨯区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等中值滤波的函数为:5.1.3图像的配准1)遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种有效的解最优化问题的方法.借助计算机选取第一张碎片作为第一张图,采用遗传算法,将该图片的右边缘矩阵与剩下的18张图的相对应的左边缘矩阵随机的根据相似度进行比较,然后把相似度最高的图片作为第二张图并与第一张图片拼接起来.将第一张图作为基准图,向右匹配,若右方向的匹配完成,再朝左方向匹配,以此类推,直到将所有图片拼接复原完成.问题一不需要进行人工干预.图5-2 遗传算法流程图2)相似度的计算方法:计算机自动选择一张碎片为第一张碎片(此处就以为第一张),具体实现算法为用嵌套循环,第一重循环取出每张图片最右边(第72列)的像素矩阵,第二重循环取出每张图片最左边(第1列)的像素矩阵,然后作这两个矩阵的比较,结果相同为1不同为0,对其结果矩阵求和作为刻画相似度的标准,如果是自身比较则置为0,当结果中出现1980(说明两张图片是100%匹配,可以判断出第一张和最后一张),用这种方法就可以得到完整的拼接图像,剩余图片的矩阵随机编号为i A ,利用Matlab 软件选取矩阵中的n 行运用同或运算法则进行相似度的计算.假设 100010100A ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦ 01101101i A ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦. 让1A 的最右列与i A 的最左列的元素一一对应作比较,同行的两元素相同则为,1,不同记为0,从第一行开始累加,累加的结果记为i m . 相似度记为:100%ib nm =⨯ (n=1980). 5.1.4图像的导出1)根据配准结果进行矩阵的拼接.2)运用Matlab 软件编程实现图像的导出.问题二为纵横切有1119⨯个碎片,每个碎纸片的边缘像素相对于问题一来说要少很多,无法直接利用模型一求解问题二.在模型一的基础上,我们首先对中文碎片进行拼接复原,根据图片的特征对图片进行分类,然后再采用双重标准定义相似度的算法来进行图片的拼接.拼接英文碎片时,采用字符切割和字符识别的方法,问题二需要人工介入.5.2.1 图像导入同样采用二值法,运用Matlab 软件将碎纸片的图像转换为18072⨯的(0,1)矩阵.5.2.2图像边缘处理采用模型一的中值滤波的方法对209张图片的边缘进行光滑处理,以提高图片在匹配时的相似度,排除噪声对图片的影响.5.2.3图像配准(拼接中文碎片)1)采用模糊C 均值聚类方法根据同行图片的特征,同一行图片的同列字间的间距相同,缺损字的上边缘或下边缘与碎片的边缘之间的距离相同.还可以根据字的最左端到图片边缘之间的距离相等筛选出文章最左列碎片,运用Matlab 软件编程将209张碎片进行初步分类,再利用Matlab 软件建立元胞数组,将碎片分行导入元胞数组,同行碎片不分顺序[3].模糊C 均值聚类:设R X X X P N X ⊂=},,,{21 ,R P表示P 维实数向量空间.令u ik 表示第k 个样本属于第i 类的隶属度,10≤≤u ik ,∑=c i ik u 1=1,N Nk ik u <<∑=10,c i N k ≤≤≤≤1,1。