数字识别论文
- 格式:doc
- 大小:730.00 KB
- 文档页数:28
基于特征提取的数字识别算法研究
赵丽
【期刊名称】《信息记录材料》
【年(卷),期】2024(25)3
【摘要】基于模板匹配的数字识别算法需要保证训练样本和模板样本一致,基于深度学习的数字识别算法需要保证有大量的训练样本。
然而户外环境复杂,很难找到所有与训练样本相匹配的模板样本,搜集到的图像也比较有限,很难建立一个大的数据集,因此识别准确率欠佳。
基于这种情况,本文提出了一种采用方向梯度直方图(histogram of oriented gradients,HOG)特征提取和支持向量机(support vector machine,SVM)分类器训练的方法对数字进行识别。
为了增强复杂样本识别的鲁棒性,本文还对获取的图像进行了一系列的投影分割操作。
实验后发现,本文所提算法可以有效避免模板匹配和深度学习方法的缺点,具有较高的识别准确率,且运行速度较快。
【总页数】3页(P243-245)
【作者】赵丽
【作者单位】河南工业贸易职业学院信息工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于自编码特征提取及弹性学习的手写数字识别
2.基于Zernike矩特征提取的改进FCM手写体数字识别
3.基于多尺度卷积核特征提取算法的手写数字识别研究
4.基于分块LBP特征提取和改进KNN的手写数字识别
5.基于新特征提取法和量子神经网络的手写数字识别
因版权原因,仅展示原文概要,查看原文内容请购买。
基于深度学习的手写数字识别与文字识别技术研究I. 选题背景及意义随着深度学习技术的逐渐成熟,手写数字识别和文字识别技术已经被广泛应用于各种领域。
手写数字识别技术可以用于快速识别银行卡号、车牌号等数字,而文字识别技术则可以用于扫描文档、翻译等任务。
这些技术的应用使得人们的工作和生活变得更加便利和高效。
因此,本文旨在研究基于深度学习的手写数字识别和文字识别技术,探讨其实现方法和优化手段。
II. 深度学习手写数字识别技术1. 数据集的选择为了构建数字识别模型,需要准备足够的训练数据集。
在数字识别领域,MNIST数据集是最常用的数据集之一。
MNIST数据集包含6万张28x28像素的手写数字图像,其中50,000张是用于训练的,10,000张用于测试。
MNIST数据集是一个具有挑战性的任务,因为有些数字的区分度比较小,例如1和7。
2. 模型的构建深度学习模型一般采用卷积神经网络,常用的包括LeNet-5和AlexNet等。
这里以LeNet-5为例,简要介绍其结构。
(1)卷积层:包括6个卷积核,每个大小为5x5,步长为1,输出6张14x14的特征图。
(2)池化层:采用2x2的最大池化,步长为2,输出6张7x7的特征图。
(3)卷积层:包括16个卷积核,每个大小为5x5,步长为1,输出16张5x5的特征图。
(4)池化层:采用2x2的最大池化,步长为2,输出16张3x3的特征图。
(5)全连接层:包括120个神经元,用于将卷积层输出的特征图进行分类。
(6)全连接层:包括84个神经元,用于进一步处理分类结果。
(7)输出层:包括10个神经元,用于输出最终的分类结果。
3. 模型的训练和优化为了训练模型,需要选择一个适合的损失函数和优化算法。
针对手写数字识别任务,最常用的损失函数是交叉熵损失函数,同时可以采用动量梯度下降、Adam等优化算法来加速模型的训练。
此外,模型的性能还可以通过改变网络结构、增加数据量、数据增强等手段来进一步提升。
手写体数字识别方法的研究与实现摘要1引言手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也是模式识别领域中最成功的应用之一。
由于识别类型较少,在实际生活中有深远的应用需求,一直得到广泛的重视。
近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用。
尽管人们对手写数字的研究己从事了很长时间的研究,并己取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,所以对手写数字识别的进一步研究,寻求如何更高效更准确更节能地实现手写数字的自动录入和识别的解决方案对提高经济效益、推动社会发展都有深远的意义。
近年来, 人工神经网技术发展十分迅速, 它具有模拟人类部分形象思维的能力, 为模式识别开辟了新的途径, 成了模拟人工智能的一种重要方法,特别是它的信息并行分布式处理能力和自学习效用等显著优点, 更是激起了人们对它的极大的兴趣。
BP(Back Propagation)网络是神经网络中一种,是1986年由Rumelhart和McCelland 为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,可以很好地解决非线性问题,在函数逼近、模式识别和数据压缩等方面都有很广泛的应用。
我们在认真地研究了神经网络的基本原理和机制的基础上, 结合手写体数字识别这一具体课题, 提出了用BP神经网络方法来实现手写体数字识别的方案。
2手写体数字识别概述2.1手写数字识别简述模式识别是六十年代初迅速发展起来的一门学科。
由于它研究的是如何用机器来实现人及某些动物对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。
字符识别是模式识别的一个传统研究领域。
从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。
手写体数字识别是多年来的研究热点也是字符识别中的一个特别问题。
基于人工智能的手写数字识别技术研究随着人工智能技术的发展,越来越多的应用场景开始采用AI技术来解决实际问题。
其中,手写数字识别技术是一个非常典型的例子。
手写数字识别技术指的是通过计算机程序,将手写数字转换成数字字符的过程。
这种技术在实际应用中有着广泛的应用,比如字符识别、自动填表、手写邮箱等。
手写数字识别技术的研究历程可以追溯到上个世纪。
最初的手写数字识别系统采用的是模板匹配的方法,即将数字转化为模板后再与输入的数字进行比较,但是这种方法对于写法稍有不同的数字无法进行准确匹配,难以应对实际应用中的多变的手写数字。
随着计算机性能的提升和深度学习技术的出现,手写数字识别技术得到极大的提升。
目前,基于深度学习的手写数字识别技术已经达到了非常高的准确率,甚至能够超过人类的识别水平。
基于深度学习的手写数字识别技术主要采用卷积神经网络(CNN)和循环神经网络(RNN)等模型来进行学习和识别。
其中,CNN被广泛应用于图像分类领域,可以提取图像中的局部特征并进行高效的特征提取和分类。
而RNN则主要用于序列数据的处理,具有较好的时序特征提取能力。
在进行深度学习模型训练时,需要大量的数据集来进行训练和验证。
手写数字识别技术的数据集有很多,比如著名的MNIST数据集、EMNIST数据集、NIST数据集等。
这些数据集包含了大量的手写数字图片和对应的数字标签,可以用于模型的训练和测试。
除了基于深度学习的手写数字识别技术,还有一些其他的方法也被应用到手写数字识别中。
比如基于传统机器学习算法的手写数字识别方法,比如支持向量机、随机森林、K近邻等,这些方法在一些特定的数据集上也能取得不错的效果。
总之,基于人工智能的手写数字识别技术是一个非常有前途的方向。
通过不断地研究和探索,我们相信将会有更多的优秀方法应用到手写数字识别领域,让这个领域能够更好地服务于人们的生活和工作。
手写体数字识别第一章绪论 (3)1.1课题研究的意义 (3)1.2国内外究动态目前水平 (4)1.3手写体数字识别简介 (4)1.4识别的技术难点 (5)1.5主要研究工作 (5)第二章手写体数字识别基本过程: (6)2.1手写体数字识别系统结构 (6)2.2分类器设计 (7)2.2.1 特征空间优化设计问题 (7)2.2.2分类器设计准则 (7)2.2.3分类器设计基本方法 (8)3.4 判别函数 (9)3.5训练与学习 (10)第三章贝叶斯方法应用于手写体数字识别 (10)3.1贝叶斯由来 (10)3.2贝叶斯公式 (11)3.3贝叶斯公式Bayes决策理论: (12)3.4贝叶斯应用于的手写体数字理论部分: (15)3.4.1.特征描述: (15)3.4.2最小错误分类器进行判别分类 (17)第四章手写体数字识别的设计流程及功能的具体实现 (18)4.1 手写体数字识别的流程图 (18)4.2具体功能实现方法如下: (19)结束语 (25)致谢词 (25)参考文献 (26)附录 (27)摘要数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。
随着计算机技术的发展,人类对模式识别技术提出了更高的要求。
特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。
对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。
识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。
本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。
第一章介绍了数字识别学科的发展状况。
第二章手写体数字识别基本过程。
第三章贝叶斯方法应用于手写体数字识别。
第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。
手写数字识别的研究与应用一、概述手写数字识别是计算机视觉和模式识别领域的重要研究内容,具有广泛的应用前景。
随着信息化和数字化的发展,手写数字识别技术在银行票据处理、邮政编码识别、税务表单处理、移动支付以及智能设备交互等方面发挥着越来越重要的作用。
手写数字识别的主要任务是将手写输入的数字转化为计算机可理解的数字信息。
由于手写数字存在书写风格多样、笔迹变化大、书写不规范等问题,使得手写数字识别成为一项具有挑战性的任务。
研究手写数字识别的算法和技术,提高识别的准确性和鲁棒性,具有重要的理论价值和实际应用意义。
近年来,随着深度学习技术的发展,基于神经网络的手写数字识别方法取得了显著的进步。
这些方法通过构建复杂的网络结构,自动学习手写数字的特征表示和分类器,从而实现了较高的识别性能。
同时,随着大数据和计算资源的不断丰富,基于深度学习的手写数字识别方法在实际应用中也越来越广泛。
本文旨在探讨手写数字识别的研究与应用,首先介绍手写数字识别的基本原理和常用方法,然后分析深度学习在手写数字识别中的应用及最新进展,最后讨论手写数字识别在实际场景中的应用案例和未来发展趋势。
通过本文的研究,期望能够为手写数字识别领域的研究者和应用开发者提供一定的参考和借鉴。
1. 手写数字识别的背景与意义随着信息技术的飞速发展,数字化、自动化和智能化已经成为现代社会的重要特征。
在这一背景下,手写数字识别技术应运而生,成为人工智能和计算机视觉领域的重要研究方向。
手写数字识别技术的主要目标是将手写输入的数字信息自动转换为计算机可识别的数字编码,从而实现信息的快速、准确录入和处理。
手写数字识别的研究具有重要意义。
它在实际应用中具有广泛的需求。
例如,在金融、邮政、税务、交通等领域,大量手写数字信息需要被快速、准确地录入和处理。
手写数字识别技术能够大大提高这些工作的效率和准确性,减少人为错误和劳动强度。
手写数字识别技术的研究有助于推动人工智能和计算机视觉领域的发展。
浅谈人工智能与模式识别的应用一、引言随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造.但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。
虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。
这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。
这时,能够提高计算机外部感知能力的学科—-模式识别应运而生,并得到了快速的发展,同时也成为了未来电子信息产业发展的必然趋势。
人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。
近年来电子产品中也加入了诸多此类的功能:如手机中的指纹识别解锁功能;眼球识别解锁技术;手势拍照功能亦或是机场先进的人耳识别技术等等.这些功能看起来纷繁复杂,但如果需要一个概括的话,可以说这都是模式识别技术给现代生活带来的福分.它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知,从而将非电信号转化为计算机可以识别的电信号.二、人工智能和模式识别(一)人工智能。
人工智能(Artificial Intelligence),是相对与人的自然智能而言的,它是指采用人工的方法及技术,对人工智能进行模仿、延伸及扩展,进而实现“机器思维"式的人工智能.简而言之,人工智能是一门研究具有智能行为的计算模型,其最终的目的在于建立一个具有感知、推理、学习和联想,甚至是决策能力的计算机系统,快速的解决一些需要专业人才能解决的问题。
从本质上来讲,人工智能是一种对人类思维及信息处理过程的模拟和仿真。
(二)模式识别。
基于模式识别的手写体数字识别技术研究手写体数字识别技术是一项关键的人工智能技术,它在日常生活中得到了广泛应用。
本文将研究基于模式识别的手写体数字识别技术,通过深入分析现有的研究成果,总结这一技术的原理、方法和应用,并探讨其存在的挑战和未来发展方向。
一、手写体数字识别技术的原理手写体数字识别技术的原理是模式识别。
它通过分析手写数字的笔画特征和形状,提取出数字的特征向量,并将其与已有的数字模板进行比对和匹配,最终确定数字的类别。
手写体数字识别技术的关键是构建有效的特征提取和匹配算法。
二、手写体数字识别技术的方法手写体数字识别技术的方法可以分为两个主要步骤:预处理和特征提取。
预处理阶段主要包括图像二值化、降噪和分割等操作,旨在提高图像质量和准确性。
特征提取阶段则是提取图像的特征向量,常用的方法包括经典的统计学特征提取法、基于神经网络的方法以及基于深度学习的方法等。
三、手写体数字识别技术的应用手写体数字识别技术具有广泛的应用前景。
首先,它可以应用于邮政和快递行业,自动识别信件和包裹上的手写数字,提高处理效率和准确性。
其次,手写体数字识别技术还可以用于银行和金融机构,实现自动化的支票和票据处理。
此外,它还可以应用于教育领域,用于批改学生的试卷和作业。
四、手写体数字识别技术存在的挑战尽管手写体数字识别技术已取得了一些进展,但仍然存在一些挑战。
首先,手写体数字的多样性和变异性导致了识别的复杂性。
不同人的手写风格差异较大,需要建立较大规模的数字模板库以适应各种手写样式。
其次,噪声和干扰也会对手写体数字的识别造成干扰,需要提出更加鲁棒和稳健的算法。
此外,手写体数字的识别速度也需要进一步提高,以满足实时识别的需求。
五、手写体数字识别技术的未来发展方向随着人工智能技术的不断发展,手写体数字识别技术也将得到进一步的改进和推广。
未来,手写体数字识别技术有望结合高级机器学习算法,如卷积神经网络和循环神经网络,实现更高的准确性和鲁棒性。
论基于机器学习的手写数字识别技术一.引言手写数字识别(Handwritten Digit Recognition)是指利用计算机程序识别手写数字的过程。
这项技术已广泛应用于大多数生活领域,如数字签名、邮政编码、搜索引擎、语音识别和智能手机键盘等。
基于机器学习的手写数字识别技术在准确性和速度方面较传统的方法更具优势,广受欢迎。
本文将讨论基于机器学习的手写数字识别技术,包括什么是机器学习,如何使用机器学习实现手写数字识别,机器学习算法以及其在手写数字识别方面的应用等问题。
二.什么是机器学习?机器学习是人工智能的分支之一,是指计算机通过学习来改进性能的过程。
这种学习通常是基于数据和统计算法运算的方式进行的。
机器学习可以分为监督学习、无监督学习和强化学习三种类型。
监督学习是指通过标记数据进行训练,使计算机在新数据上能够更好地预测。
无监督学习是指无需标记数据进行训练的学习方法。
强化学习是指通过奖励和惩罚来训练计算机,使其学习更好的行为。
机器学习技术可以在许多领域中有良好的应用,如语音识别、图像识别、自然语言处理等。
三.如何使用机器学习实现手写数字识别?机器学习可以用于手写数字识别的实现,其过程包括以下几个步骤:1.数据预处理数据预处理是指将原始数据进行转换和归一化,以便计算机进行分析和使用。
在手写数字识别任务中,原始数据是一张包含手写数字的图像。
将图像转换为我们可以计算的数字矩阵是第一步。
我们可以通过将图像分为像素网格来实现这一点,并将黑色像素和白色像素分别转换为1和0来表示。
接下来,数字矩阵可以被归一化为统一的大小。
数据预处理的最终目的是将图像转换为数学形式,从而容易处理。
2.特征选择在机器学习模型中,特征是指代表数据某方面的相关信息。
在handwritten digit recognition中,特征通常是指图像的像素值。
然而,在所有像素值中选择哪些特征是至关重要的。
因为我们只需要选择有用的特征,以避免模型出现过拟合,而不选择所有的特征。
基于MATLAB的手写体数字识别算法的实现与分析摘要手写体数字识别是利用计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。
手写体数字识别在邮政编码、财务报表、银行票据、各种凭证以及调查表格的识别等等方面有着重要应用,由于数字识别经常涉及财会、金融领域,其严格性更是不言而喻的。
所以,对识别系统的可靠性和识别率要求很高,构成了手写体数字识别面临的主要困难,大批量数据处理对系统速度又有相当高的要求。
本文基于MNIST数据集,通过Matlab平台,对决策树算法、SVM算法和人工神经网络(ANN)算法进行实现,并对分类算法的准确率进行评估。
实验结果表明,人工神经网络(ANN)的准确率最高,为99.69%,SVM算法次之,准确率为94.53%,决策树算法的准确率为83.53%。
三种分类算法中,决策树算法的速度最快,SVM算法的速度最慢。
另外,针对每一种分类算法在MNIST数据集上的实验结果,本文还得出以下结论:第一,MNIST数据集的归一化与否对决策树的分类效果几乎没有影响;对SVM的分类效果影响较大,未归一化时的准确率为11.35%,归一化之后的准确率为94.53%;对人工神经网络的分类效果影响较小,未归一化时的准确率为82.11%,归一化之后的准确率为99.69%。
这说明三种分类算法对数据的不平衡分布的敏感程度各不相同。
第二,对于SVM分类算法,当训练数据集的样本容量小于60000(MNIST训练数据集的最大样本容量)时,该算法对测试数据集分类预测的准确率随样本容量的增大而增大。
第三,针对人工神经网络,数据类标签的表示形式对分类预测的准确率的影响较大。
使用10位数据表示类标签是的准确率为99.69%,远远高于使用1位数据表示类标签时的准确率60.24%。
关键词:手写体数字识别;决策树算法;SVM算法;人工神经网络算法ABSTRACTHandwritten numeral recognition is a technique that uses computer to recognize handwritten Arabic numerals automatically and is a branch of optical character recognition technology. Handwritten numeral recognition has important applications in postal codes, financial statements, bank notes, various kinds of vouchers and the identification of survey forms. Since digital identification often involves accounting and finance, its strictness is self-evident. The demand for identification system of the reliability and recognition rate is very high, constituting a handwritten digital identification facing major difficulties, high-volume data processing on the system speed and a very high demand.In this paper, we use Matlab to implement decision tree algorithm, SVM algorithm and artificial neural network (ANN) algorithm based on MNIST dataset, and the accuracy of classification algorithms is calculated by using the real data tag. Experimental results show that the artificial neural network (ANN) the highest accuracy rate for 99.69%, SVM algorithm, followed by 94.53 percent accuracy rate, decision tree algorithm accuracy is 83.53%. In terms of speed, decision tree algorithm is the fastest, SVM algorithm is the slowest. In addition, for each classification algorithm we also concluded that:Firstly, whether or not the MNIST dataset is normalized has no effect in the classification tree; While it has a great impact on SVM classification. When it is not normalized the accuracy is 11.35%, and after normalized the accuracy is 94.53% ; The artificial neural network classification is less affected, and when it is not normalized the accuracy is 82.11% while after normalized the accuracy is 99.69%. This shows the sensitivity of the three classification algorithms to unbalanced distribution of data.Secondly, for the SVM classification algorithm, when the sample size is less than 60,000(maximum size of MNIST test data set), the accuracy increases with the increasing of sample size.Thirdly, for the artificial neural network, the impact of class label representation is large on the classification accuracy. When using 10 bits to represent class labels, the accuracy is 99.69%, far higher than the accuracy of 60.24% when using 1 bit to represent data labels.KEY WORDS: Handwritten numeral recognition; Decision tree algorithm; SVM algorithm; Artificial neural network algorithm目录ABSTRACT (II)1. 引言 (1)1.1 手写数字识别 (1)2. 分类算法 (1)2.1 决策树算法 (2)2.1.1 ID3算法 (2)2.1.2 C4.5算法 (3)2.1.3 CART算法 (3)2.1.4 SLIQ算法 (3)2.1.5 SPRINT算法 (3)2.1.6 经典决策树算法的比较 (4)2.2 支持向量机 (4)2.3 人工神经网络 (6)2.3.1人工神经网络的原理 (6)2.3.2反向传播网络(BP) (6)2.3.3 Hopfield网络 (8)3 实验过程与结果分析 (10)3.1 实验环境 (10)3.2实验数据集 (10)3.3数据预处理 (10)3.4决策树分类实验 (11)3.4.1实验过程 (11)3.4.2实验结果 (12)3.5 SVM分类实验 (13)3.5.1实验过程 (13)3.5.2实验结果 (14)3.6人工神经网络分类实验 (14)3.6.1实验过程 (14)3.6.2实验结果 (15)4 结论 (19)4.1 三种分类算法的比较 (19)4.2 决策树算法的分析 (19)4.3 SVM算法分析 (19)4.4 神经网络算法分析 (20)参考文献 (21)1.引言1.1手写数字识别手写数字识别是模式识别领域的一个重要分支,它研究的核心问题是:如何利用计算机自动识别人手写在纸张上的阿拉伯数字。
中南大学本科生毕业论文(设计)题目基于神经网络的手写数字识别系统的设计与实现目录摘要 (Ⅰ)ABSTRACT (Ⅱ)第一章绪论 (1)1.1手写体数字识别研究的发展及研究现状 (1)1.2神经网络在手写体数字识别中的应用 (3)1.3 论文结构简介 (4)第二章手写体数字识别 (5)2.1手写体数字识别的一般方法及难点 (5)2.2 图像预处理概述 (6)2.3 图像预处理的处理步骤 (6)2.3.1 图像的平滑去噪 (6)2.3.2 二值话处理 (7)2.3.3 归一化 (8)2.3.4 细化 (10)2.4 小结 (11)第三章特征提取 (12)3.1 特征提取的概述 (12)3.2 统计特征 (12)3.3 结构特征 (13)3.3.1 结构特征提取 (14)3.3.2 笔划特征的提取 (14)3.3.3 数字的特征向量说明 (15)3.3 知识库的建立 (15)第四章神经网络在数字识别中的应用 (17)4.1 神经网络简介及其工作原理 (17)4.1.1神经网络概述[14] (17)4.1.2神经网络的工作原理 (17)4.2神经网络的学习与训练[15] (18)4.3 BP神经网络 (20)4.3.1 BP算法 (20)4.3.2 BP网络的一般学习算法 (21)4.3.3 BP网络的设计 (22)4.4 BP学习算法的局限性与对策 (26)4.5 对BP算法的改进 (27)第五章系统的实现与结果分析 (29)5.1 软件开发平台 (29)5.1.1 MATLAB简介 (29)5.1.2 MATLAB的特点 (29)5.1.3 使用MATLAB的优势 (30)5.2 系统设计思路 (30)5.3 系统流程图 (31)5.4 MATLAB程序设计 (31)5.5 实验数据及结果分析 (32)结论 (27)参考文献 (28)致谢 (30)附录 (31)摘要手写体数字识别是模式识别中一个非常重要和活跃的研究领域,数字识别也不是一项孤立的技术,它所涉及的问题是模式识别的其他领域都无法回避的;应用上,作为一种信息处理手段,字符识别有广阔的应用背景和巨大的市场需求。
---文档均为word文档,下载后可直接编辑使用亦可打印---摘要]数字验证码在安全方面起着十分大的用处,因此在很多网站都可以看到数字验证码的使用。
如今互联网的发展相当快速,紧随着我们也就需要思考安全问题,隐私的泄露会或重或轻的影响用户,而数字验证码作为互联网安全的常用的屏障,可以让互联网生态环境更加健康便利且很好的保护用户隐私。
目前,在网站上中相对常用的是由数字、字母组成的数字验证码。
本文针对粘连且存在干扰噪声的数字验证码图像识别性能欠佳的情况,通过比较各种识别数字验证码的方法,最终选择使用KNN算法作为数字验证码字符识别方法,本课题对有粘连扭曲情况的数字验证码的识别进行设计和分析,过程主要是以下三步:预处理、匹配识别、分析识别率。
图片预处理过程采用了灰度化、二值化、降噪和分割,在分割图片阶段,可能出现检测出四、三、二和一个字符的情况,分别采用不同的方法进行处理,再采用Python工具进行单字符匹配,最后通过KNN算法来识别匹配数字验证码,得到了高达94.4%的识别率,这说明采用该算法能很好的识别粘连扭曲的数字验证码图片。
[关键词]验证码识别;KNN算法;验证码匹配;PythonDesign and Implementation of Digital AuthenticationCode RecognitionStudent: Li Xinyu,College of Electronic InformationInstructor: Wang Yuanmei,College of Electronic Information [Abstract]Digital Authentication Code (DAC) plays a very important role in security, so it can be used in many websites.With the rapid development of the Internet, we also need to think about security issues. The leak of privacy will affect users more or less. Digital Authentication Code, as a common barrier to Internet security, can make the Internet ecological environment healthier, more convenient and better protect user privacy.At present, the relatively common digital verification code on websites is composed of numbers and letters.In view of the poor performance of image recognition of digital verification codes with glue and interference noise, this paper chooses KNN algorithm as the character recognition method of digital verification codes by comparing various methods of identifying digital verification codes. This topic designs and analyzes the recognition of digital verification codes with glue distortion. The process mainly consists of three steps:preprocessing,Match recognition, analyze recognition rate.Picture preprocessing process uses grayscale, binarization, noise reduction and segmentation. In the phase of image segmentation, four, three, two and one characters may be detected. Different methods are used to process them, then single character matching is performed with Python tools. Finally, matching number verification codes are recognized by KNN algorithm, and the recognition rate is up to 94.4%.This demonstrates that the algorithm can recognize the distorted digital authentication code picture very well.[Keywords]Verification code identification;KNN recognition;Verification Code Matching;Python第一章绪论1.1 研究目的及意义当前,随着互联网技术的不断创新研发,我国科技技术飞速发展,各类新兴产品应运而生,在不断丰富人们生活的同时,提高了人们生活质量与生活水平。
基于卷积神经网络的手写数字识别研究随着人工智能技术的发展,卷积神经网络(Convolutional Neural Network,CNN)成为了图像识别领域的一种重要算法。
卷积神经网络已经在各种领域得到了广泛的应用,包括图像分类、目标检测、行人识别等。
本文将介绍基于卷积神经网络的手写数字识别研究。
一、手写数字识别概述手写数字识别是数字图像处理的一种应用。
一些重要的应用,如邮政编码、银行支票识别、身份证号码识别、病历号码识别等,都需要对手写数字进行识别。
手写数字识别是一个二分类问题(数字或非数字),同时也是一个多分类问题(0-9数字识别)。
手写数字识别也是深度学习领域中的一个重要问题。
二、卷积神经网络卷积神经网络是一种生物灵感的人工神经网络,由卷积层和全连接层组成。
卷积层用于提取图像特征,全连接层用于分类。
卷积层将输入的图像通过卷积运算,生成对特征进行高维特征表示。
卷积层通常由多个卷积核组成,每个卷积核可以提取出图像的不同特征。
这些特征呈现出不同的形状,可以代表不同的物体,在全连接层中进行分类。
三、手写数字识别网络设计本文所提出的手写数字识别网络设计如下图所示:该手写数字识别网络由3个卷积层、3个池化层和2个全连接层组成。
输入特征为手写数字的图像,在卷积和池化层较深的部分,对图像进行更细粒度的分析和特征提取,在最后两个全连接层进行分类。
每个卷积层都使用了Rectified Linear Units(ReLU),这是一种常用的非线性激活函数。
ReLu函数具有线性、非阻塞的特点,在深层卷积神经网络中表现良好。
四、数据集我们使用MNIST数据集进行训练和测试。
MNIST数据集包含6万张训练图像和1万张测试图像,图像大小为28x28像素。
图像中的数字为0-9,是手写的数字。
这个数据集是学术界和工业界用于测试算法的常见基准数据集之一。
五、实验结果我们使用了NVIDIA Tesla V100 GPU进行训练和测试,训练集和验证集的划分比例为6:1。
手写数字识别中数字特征提取的研究与实现随着计算机技术的飞速发展,计算机视觉领域也迎来了新的技术发展机遇。
人工智能的发展使得计算机视觉技术被广泛应用。
其中,手写数字识别是计算机视觉领域的基础问题之一。
手写数字识别能够使得我们的日常生活更加方便快捷,如银行卡密码识别、邮政编码识别等。
为了实现手写数字识别,首先需要将数字的形态特征进行提取,再对数字进行分类。
在手写数字识别中,数字的特征提取是实现识别的关键。
相比于其他数字识别,手写数字的特征提取更加复杂,因为手写数字的形态各异,而且在不同的笔画和角度下都有不同的外观特征。
因此,手写数字的特征提取问题一直是手写数字识别中的难点之一。
数字特征提取是指从数字中提取出具有区分性的特征,使得这些特征能够准确地区分不同数字。
在手写数字识别中,特征提取的方法有很多种,比如基于统计的方法、基于拓扑的方法、基于神经网络的方法等。
其中,基于统计的方法是最常用的手写数字特征提取方法。
在手写数字识别的特征提取方法中,最常用的方法是提取数字的形态特征和拓扑特征。
提取形态特征的方法是基于数字的笔画进行提取,包括笔画的长度、弯曲度等。
而提取拓扑特征的方法是通过分析数字的拓扑结构和形态特征来提取数字的特征。
基于拓扑的方法包括数字的识别区域、数字的区域边界等。
为了更好地提取手写数字的特征,还需要对数字进行预处理。
数字的预处理包括对数字的灰度化、二值化、去噪等。
其中,最常用的数字预处理方法是二值化。
二值化就是将数字的灰度值转化成二值,使得数字的像素点转化成黑白矩阵,方便进行数字特征的提取。
数字特征提取的方法有很多种,但是不同的特征提取方法对于识别的准确率和鲁棒性有很大的影响。
因此,在手写数字识别中,选择合适的特征提取方法是非常重要的。
基于神经网络的手写数字识别是近年来比较常用的方法。
神经网络具有很强的模式识别能力,能够自动地提取数字的特征。
而在神经网络中,特征提取是隐含层的一个重要过程。
北京邮电大学硕士学位论文手写体数字识别中的特征提取和特征选择研究姓名:董慧中请学位级别:硕士专业:信号与信息处理指导教师:盛立东20070308手写体数字识别中的特征提取和特征选择研究手写数字识别是文字识别中的一个重要的研究课题,数字的类别只有十种,笔划又简单,其识别问题似乎不是很困难。
但事实上,一些测试结果表明,数字的正确识別率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。
手写数字识别的难度在于其变体极多,而且对数字识别单字识别正确率的要求要比文?要苛刻得多。
目前对各类字体的数字识别特别是脱机手写数字识别仍然处在发展阶段,识别效果仍然不够理想。
因此,研究简单高效的手写数字识别依然是一个重要的研究方向。
本文主要对手写体数字识别的关键问题——特征提取和特征选择进行了探讨和实验。
本文的工作主要有以下几个方面:1 •在研究了多种手写数字特征的基础上,本文提取了轮廓特征. 笔划密度特征、粗网格特征.重心及重心矩特征.首个黑点位置特征.投影特征及傅立叶变换特征等七种手写数字的结构和统计特征。
2•从多种特征选择方法中,采用了类内类间比、K・W检验及爛函数这三种特征选择方法对特征进行了选择。
3•通过大量实验,对手写体数字的特征降维问题进行了分析研究。
4 •建立了一个基于BP神经网络的手写体数字识别系统,将原始特征和选择后的特征经过该BP神经网络检验,取得了较好的系统性能, 从而证明上面提出的方法是可行的。
关键词手写数字识别BP算法神经网络特征提取特征选择ABSTRACTHandwriting digits recognition is an important res character recognition. The difficulties of handwriting digitsrecognition are due to its various anamorphosis. At present, the digits recognitions of different letterforms, especially the offline handwriting digits recognition,are still under development, and the recognition effect is not id Therefore, it is still a very important research direction to study simple and high-efficient handwriting digits recognition ・The thesis probes into the key issue of handwriting digits recognition 一feature extraction and feature selection. The main work of the thesis includes the following aspects:1. Based on the researches on the features of several handwriting digits, the thesis extracts the structures and statistic features of seven kinds of handwriting digits, i.e. outline feature, stroke density feature, wide grid feature, barycenter and barycenter distance feature, the first black point position feature, project feature, and Fourier switch feature ・2. From different feature selection methods, this thesis adopts three methods —inner and outer analogy, K-W checking and entropy function 一 to select the features.3・ This thesis analyzes the feature dimension decrease issue of the handwriting digits through a lot of experiments ・4. This thesis establishes a handwriting digit recognition system based on BP neural network ・ The original features and selected features both have good systematic performance after checked through BP neural network, which proves the above mentioned method feasible ・KEY WORDS: Handwriting Digits RecognitionBP Algorithms Neural Networktrch subject in 1.Feature Extraction Feature Selection.独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。
【关键字】论文基于MATLAB的手写体数字识别算法的实现与分析摘要手写体数字识别是利用计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。
手写体数字识别在邮政编码、财务报表、银行票据、各种凭证以及调查表格的识别等等方面有着重要应用,由于数字识别经常涉及财会、金融领域,其严格性更是不言而喻的。
所以,对识别系统的可靠性和识别率要求很高,构成了手写体数字识别面临的主要困难,大批量数据处理对系统速度又有相当高的要求。
本文基于MNIST数据集,通过Matlab平台,对决策树算法、SVM算法和人工神经网络(ANN)算法进行实现,并对分类算法的准确率进行评估。
实验结果表明,人工神经网络(ANN)的准确率最高,为99.69%,SVM算法次之,准确率为94.53%,决策树算法的准确率为83.53%。
三种分类算法中,决策树算法的速度最快,SVM算法的速度最慢。
另外,针对每一种分类算法在MNIST数据集上的实验结果,本文还得出以下结论:第一,MNIST数据集的归一化与否对决策树的分类效果几乎没有影响;对SVM的分类效果影响较大,未归一化时的准确率为11.35%,归一化之后的准确率为94.53%;对人工神经网络的分类效果影响较小,未归一化时的准确率为82.11%,归一化之后的准确率为99.69%。
这说明三种分类算法对数据的不平衡分布的敏感程度各不相同。
第二,对于SVM分类算法,当训练数据集的样本容量小于60000(MNIST训练数据集的最大样本容量)时,该算法对尝试数据集分类预测的准确率随样本容量的增大而增大。
第三,针对人工神经网络,数据类标签的表示形式对分类预测的准确率的影响较大。
使用10位数据表示类标签是的准确率为99.69%,远远高于使用1位数据表示类标签时的准确率60.24%。
关键词:手写体数字识别;决策树算法;SVM算法;人工神经网络算法ABSTRACTHandwritten numeral recognition is a technique that uses computer to recognize handwritten Arabic numerals automatically and is a branch of optical character recognition technology. Handwritten numeral recognition has important applications in postal codes, financial statements, bank notes, various kinds of vouchers and the identification of survey forms. Since digital identification often involves accounting and finance, its strictness is self-evident. The demand for identification system of the reliability and recognition rate is very high, constituting a handwrittendigital identification facing major difficulties, high-volume data processing on the system speed and a very high demand.In this paper, we use Matlab to implement decision tree algorithm, SVM algorithm and artificial neural network (ANN) algorithm based on MNIST dataset, and the accuracy of classification algorithms is calculated by using the real data tag. Experimental results show that the artificial neural network (ANN) the highest accuracy rate for 99.69%, SVM algorithm, followed by 94.53 percent accuracy rate, decision tree algorithm accuracy is 83.53%. In terms of speed, decision tree algorithm is the fastest, SVM algorithm is the slowest. In addition, for each classification algorithm we also concluded that:Firstly, whether or not the MNIST dataset is normalized has no effect in the classification tree; While it has a great impact on SVM classification. When it is not normalized the accuracy is 11.35%, and after normalized the accuracy is 94.53% ; The artificial neural network classification is less affected, and when it is not normalized the accuracy is 82.11% while after normalized the accuracy is 99.69%. This shows the sensitivity of the three classification algorithms to unbalanced distribution of data.Secondly, for the SVM classification algorithm, when the sample size is less than 60,000(maximum size of MNIST test data set), the accuracy increases with the increasing of sample size.Thirdly, for the artificial neural network, the impact of class label representation is large on the classification accuracy. When using 10 bits to represent class labels, the accuracy is 99.69%, far higher than the accuracy of 60.24% when using 1 bit to represent data labels.KEY WORDS: Handwritten numeral recognition; Decision tree algorithm; SVM algorithm; Artificial neural network algorithm目录1. 引言 (1)1.1 手写数字识别 (1)2. 分类算法 (1)2.1 决策树算法 (2)2.1.1 ID3算法 (2)2.1.2 C4.5算法 (3)2.1.3 CART算法 (3)2.1.4 SLIQ算法 (3)2.1.5 SPRINT算法 (3)2.1.6 经典决策树算法的比较 (4)2.2 支持向量机 (4)2.3 人工神经网络 (6) (6) (6)2.3.3 Hopfield网络 (8)3 实验过程与结果分析 (10)3.1 实验环境 (10)3.2实验数据集 (10)3.3数据预处理 (10)3.4决策树分类实验 (11) (11) (12)3.5 SVM分类实验 (13) (13) (14)3.6人工神经网络分类实验 (14) (14) (15)4 结论 (19)4.1 三种分类算法的比较 (19)4.2 决策树算法的分析 (19)4.3 SVM算法分析 (19)4.4 神经网络算法分析 (20)参考文献 (21)1.引言1.1手写数字识别手写数字识别是模式识别领域的一个重要分支,它研究的核心问题是:如何利用计算机自动识别人手写在纸张上的阿拉伯数字。
保密类别编号毕业论文数字识别实现学院计算机学院专业软件工程班级2班姓名王茜指导教师黄祥林中国传媒大学年月日数字识别实现王茜摘要在信息化飞速发展的时代,光学字符识别是一种重要的信息录入与信息转化的手段。
数字识别作为光学字符识别中的一个分支,在车牌识别、邮政编码识别、统计报中等领域有着非常广泛的应用,用数字识别系统代替手工录入,可节约大量的人力和财力。
因此,数字识别的研究有着重大的现实意义。
本文主要研究的即数字识别问题。
首先,对数字图像的预处理工作进行了详细的介绍,其中包括:二值化、字符切分、归一化等。
接着介绍了当前数字识别的几种常用方法。
然后重点描述了用于印刷体数字识别的模板匹配法和基于整体特征的快速手写体数字识别法的原理,并给出了算法实现的过程。
实验结果证明,上述算法能取得较好的识别效果。
关键词:数字识别,图像预处理,模板匹配,整体特征Xi. WangABSTRACTOCR (Optical Character Recognition) has become one of the important methods in gathering information and information transformation. Digit recognition has a promising business feature in many fields in society, for example the car license plate recognition、postcode recognition, the statistics of report forms, financial report forms. So the researching on the Digit recognition is one of the important things.The paper describes the basic process and methods of numeral recognition system. First,Keywords: Numeral recognition \一、绪论(一)问题的提出光学字符识别(Optical Character Recognition),是属于图型识别的范畴。
一个OCR识别系统,其目的是把图像中的内容转化为文本格式,便于计算机进行后续处理,使图像资料的储存量减少,同时也可节省因键盘输入的人力与时间。
数字识别技术作为光学字符识别中的一个分支,也是现在非常受人们关注的问题。
目前,数字识别技术主要分为印刷体数字识别技术和手写体数字识别技术。
印刷体数字识别在许多领域都有广泛的应用价值。
如印刷字体的邮政编码识别系统,通过印刷体识别技术识别邮件上的邮政编码,帮助邮局做快速区域分信的作业;另外,身份证号码的识别、汽车牌照的识别、电话号码识别等[1]也是印刷体数字识别技术的应用领域,通过此技术的应用,可以节约大量的人力录入时间和财力。
手写体数字识别,是使计算机能够识别手写的数字,包括联机手写体数字识别和脱机手写体数字识别。
联机手写数字的识别目前在实际生活中已经有了很多的应用,如在带有写字板的手机中,电话号码的写入,及各种商务伴侣中手写字符的录入等。
脱机手写体数字识别是整个数字识别领域中最为困难的部分,但经过多年的研究,研究者们已经开始把各种理论方法实用化,为手写数据的高速自动录入提供了一种解决方案。
近些年来,我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促使这一事业的进展。
因此,手写数字的识别研究有着重大的实现意义,一旦研究成功并投入使用,将产生巨大的社会和经济效益。
[2]在各种应用领域,由于相关软硬件技术性能的不断提升,新的方法理论不断涌现并应用,同时原有方法也不断被重新组合利用以达到更好的性能。
因此,该问题的提出有很大的现实意义。
(二)论文的内容本文主要研究的是数字识别技术。
数字识别技术通过提取代表数字的特征,再根据提取的特征设计相应的分类器进行分类识别,得到正确的识别结果。
根据印刷体和手写体的特点,本文分别提出了相应地特征提取技术和分类方法,主要内容包括一下几个方面:1、介绍了数字识别技术的主要流程,对流程中的各个功能模块进行了系统的阐述,并对目前常用的方法进行了概括。
2、详细介绍了基于模板匹配的印刷体数字识别方法,对原理和算法实现都进行了细致的描述。
3、分析了手写数字的特点,提出一种基于整体特征的手写体数字快速识别方法,并详细阐述了其算法思想和实现方法。
(三)论文结构根据论文的主要内容,安排论文的结构如下:第一章绪论,介绍了数字识别问题的研究意义,论文的主要内容与结构安排。
第二章数字识别技术的概述,对各个功能模块进行详细的介绍。
第三章介绍基于模板匹配的印刷体数字识别技术的实现过程及实验结果。
第四章介绍基于整体特征的快速手写识别的原理和算法实现过程及实验结果。
第五章对整个研究工作做出总结回顾,并做出一些后续工作的难点和展望,以作为论文的结束语。
二、数字识别概述数字识别,其目的是实现数字识别,首先要对数字图像进行预处理,然后提取数字的特征,最后进行分类识别,输出识别结果,基本流程图如图2.1所示:字符图像输入图像预处理特征提取分类识别字符输出2.1 计算机数字识别流程图下面对数字识别中的每个功能模块进行详细的阐述:(一)图像的输入图像的输入就是图像数字化的过程。
BMP文件格式是微软公司定义的一种广泛使用的图像文件格式,本文所讨论的数字识别的识别对象—字符点阵图像就是BMP文件格式。
(二)图像预处理预处理作为后续工作的基础,是一个相当重要的部分,图像预处理工作的好坏直接影响到识别的效率。
预处理一般包括二值化,行字切分、归一化和细化等。
不同的识别方法,对预处理的项目和要求有所差别。
1.二值化字符图像的二值化即把字符灰度图像处理成二值图像的过程。
二值化的关键是要找到合适的阈值来区分对象和背景。
灰度图像二值化能显著减小数据存储的容量,并能够降低后续处理的复杂度。
根据阈值选取方法的不同,二值化方法主要分为三类:全局阈值法、局部阈值法和动态阈值法。
(1)全局阈值二值化全局阈值二值化方法是根据图像的直方图或灰度空间分布确定一个阈值,并根据此阈值实现灰度图像到二值化图像的转化。
典型的全局阈值法包括Ostu[13]方法、最大熵方法[14]等。
全局阈值方法的优点在于算法简单,对目标和背景明显分离、直方图分布是双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗力差,应用受到限制。
(2)局部阈值二值化由像素()j i,的灰度值()j i f,和像素周围点的局部灰度特性确定阈值的方法称为局部阈值选择法。
非均匀光照条件等情况虽然影响整体图像的灰度分布却不影响局部的图像性质。
邻域的规定及邻域计算模板的选取都是决定算法效果的关键因素。
局部阈值法也存在缺点和问题,如实现速度慢,不能保证字符笔画连通性,以及容易出现伪影现象等。
(3)动态阈值二值化当阈值选择不仅取决于该像素阈值以及其周围像素的灰度值,而且还和该像素坐标位置有关时,称之为动态阈值选择法。
由于充分考虑了每个像素邻域的特征,能更好的突出背景和目标的边界,使相距很近的两条线不会产生粘连现象,可以处理低质量甚至单峰值直方图图像。
但是,这种方法的计算量很大,运算速度一般比较慢。
2.字符的切分灰度图像经过二值化处理后,文字图像就变成了一些二值数字信号,它是一个整体,要想识别单个文字,就需要把每个文字从文字图像中分离出来,这就是所谓的切分。
目前,已提出的字符切分方法有很多种,下面对几种比较常用的方法作简单的介绍:(1)垂直投影法垂直投影法是最常用的一种切分方法,利用字符间的空隙在直方图上呈现波谷状进行字符的切分,该方法速度快,实现简单。
但简单的投影图法存在很大的缺陷,由于字符中经常存在的空洞或者字符的粘连,导致字符的垂直投影有多处波谷,因此在进行分割时难以依据波谷来确定字符的分割点。
(2)基于多行的垂直投影法这种切分方法实际上是垂直投影法的变形形式。
它通过多行文字在垂直扫描中进行多行信息点个数的统计,然后根据统计特征进行字符切分。
这种方法可以有效的解决由于个别字符断裂产生的错误切分问题。
但是这种方法主要用于字符排列很规整的文本图像,因而该种方法的局限性也很大。
(3)连通域法连通域法是一种应用比较普遍的字符切分方法。
字符的根本特征在于其连通性,无论字符如何倾斜或变形,其连通特征不会改变。
如果把书写的笔画看成连通域,那么数字和英文字母都是由一个连通域构成。
依据字符的这一特点,连通域方法可以实现字符的分割。
总体来说,上述的切分方法各有利弊,但没有一种通用的切分方法能够实现字符的精确切分。
因此,我们可以考虑将几种方法结合起来,以提高切分的速度和准确度。
3.字符的归一化字符图像的归一化包括位置,大小,旋转和倾斜归一化。
下面主要介绍位置归一化和大小归一化。
(1)位置归一化位置归一化就是把数字图像都放到某一固定的位置,能够消除数字点阵位置上的偏差,并能方便数字特征描述、提取。
位置归一化后的数字图像图2.3所示(图中以数字图像外围框的左上角作为归一化基准位置):2.3 数字位置归一化前后图像(2)大小归一化[12]大小归一化是指对不同大小的数字图像作变换,使之成为同一尺寸大小的文字,图像大小归一化方法分为两大类:线性归一化和非线性归一化。
1)线性归一化线性归一化是将数字图像的笔画按比例线性放缩或缩小到规定尺寸的图像,仅与原始数字图像和归一化后图像的大小有关系。
设()y x ,为原图像像素点坐标,()n m ,为归一化后的像素点坐标,则其变换关系如式2-1所示: ⎪⎪⎭⎫ ⎝⎛n m =⎝⎛21a a ⎪⎪⎭⎫21b b ⎪⎪⎭⎫ ⎝⎛y x + ⎪⎪⎭⎫ ⎝⎛21c c (2-1) 其中系数矩阵 ⎝⎛21a a ⎪⎪⎭⎫21b b 决定了图像的比例和旋转变换尺度,⎪⎪⎭⎫ ⎝⎛21c c 体现了图像的平移变换。
如果数字图像已经经过位置归一化,且没有旋转,则上述公式可简化为式2-2: ⎪⎪⎭⎫ ⎝⎛n m = ⎝⎛0x f ⎪⎪⎭⎫y f 0⎪⎪⎭⎫⎝⎛y x (2-2) 其结果如图2.4:2.4 大小归一化前后图像2)非线性归一化。
线性归一化的变换函数为线性函数,不能解决图像的变形问题,故提出了非线性归一化方法。
非线性归一化是通过密度均衡的方法实现大小归一化,以消除输入模式的各种变形,这些方法大致分以下三种:点密度均衡法、线密度均衡法和笔画穿透数均衡法。
4.字符的细化细化是指在保持原图像拓扑结构的情况下,尽可能快地抽取出单像素宽的骨架的过程。