当前位置：文档之家› 基于低秩稀疏分解的字符矫正方法研究

基于低秩稀疏分解的字符矫正方法研究

第一章绪论 (1)

1.1研究背景和意义 (1)

1.2研究现状 (1)

1.2.1OCR的研究现状 (1)

1.2.2文本字符矫正的研究现状 (4)

1.2.3低秩矩阵恢复的研究现状 (5)

1.3本文的具体安排 (8)

第二章解决低秩矩阵恢复的现有方法 (11)

2.1迭代阈值（IT）方法 (11)

2.2加速近端梯度（APG）算法 (12)

2.3增广拉格朗日乘子算法 (14)

2.4算法性能的比较 (17)

2.5低秩矩阵恢复的应用 (18)

2.6本章小结 (20)

第三章改进的ADM算法 (21)

3.1字符矫正模型的建立 (21)

3.1.1把字符图像的变形看成是域变换 (21)

3.1.2把小的不规则的笔画看成是稀疏矩阵 (21)

3.1.3凸松弛 (22)

3.1.4迭代线性化 (22)

3.2传统的增广拉格朗日乘子法求解字符矫正问题 (23)

3.3改进的ALM算法 (25)

3.3.1改进ALM算法的提出 (25)

3.3.2新方法收敛性的说明 (27)

3.4本章小结 (32)

第四章并行分离的增广拉格朗日乘子法 (33)

4.1并行分离的增广拉格朗日乘子法的提出 (33)

4.2新算法收敛性的具体证明过程 (34)

4.2.1相关知识的介绍 (34)

4.2.2新方法收敛性的证明 (38)

4.3本章小结 (44)

第五章字符矫正的实验结果 (47)

5.1算法性能的比较 (47)

5.2字符矫正实例 (48)

5.3本章小结 (53)

第六章结论 (55)

6.1总结 (55)

6.2展望 (55)

参考文献 (57)

攻读学位期间所取得的相关科研成果 (61)

致谢 (63)

河北工业大学硕士学位论文

第一章绪论

1.1研究背景和意义

伴随着计算机多媒体输出设备的日新月异，纯键盘、鼠标输入技术已经不能满足人们的需求。传统的汉字输入方式劳动强度大，速度慢，所以这种方法对文档管理、图书情报管理、办公室自动化等需要处理大量文字资料的场合并不适用。非键盘汉字输入技术正异军突起，其中发展较快的有基于汉字识别技术的识别技术和基于语音识别技术的听写机。特别是发展迅速的OCR技术，已变成电脑不可或缺的汉字输入方式，为计算机应用推广和中文信息处理提供了一个更为广泛的空间。

OCR技术从最初提出相应的概念至今，已经经历了近一个世纪的发展。传统的OCR技术只对扫描得到的背景简单、分辨率和对比度高的图像有比较理想的识别率。在输入扫描的过程中，扫描后的文本图像会出现一定程度的倾斜，这不仅会对下一步的字符切割造成困难，也会影响最终的识别精度。现存的文本图像倾斜校正技术已经能够很好地解决这一问题，从而确保OCR系统的识别率。

但是，现实生活中的很多场景都带有文字，比如车站牌、路牌、商品简介和店名等等，想要获取这些自然场景的文字，就必须依靠数码照相机、数码摄像机、拍照手机等数字图像拍摄设备。一般地，图像拍摄设备可以获取纯文字图像和带自然场景的文字图像。但自然场景的复杂性，使得文字背景处理起来相当困难，拍摄角度和拍摄地点等许多原因会造成文字大小、字体、亮度以及对比度的不均匀，这些都给自然拍摄的文本图像识别带来了巨大的挑战和困难，而OCR结构框架所存在的较大局限性就是其对输入文本图像在文本结构和规范上的限制有要求。因而，通过预处理步骤——文本字符图像矫正技术，可以为OCR提供规范性和结构性更好的输入进而提升其识别率，有着非常重要的理论研究意义和现实应用价值。

1.2研究现状

1.2.1OCR的研究现状

很早之前，国内外研究人员就已经开始对图像中提取和识别文字部分进行了大量研究，并且已经取得了巨大的成功。

（1）20世纪20年代

1929年，德国科学家Tausheck第一个提出了OCR（Optical Character Recognize，光字符识别）的概念，同时申请专利。几年以后，美国的科学家Handel也提出了通

-1-