脱机手写体字符识别-精
- 格式:ppt
- 大小:3.88 MB
- 文档页数:17
基于多尺度的蒙古文脱机手写识别方法武慧娟;范道尔吉;白凤山;滕达;潘月彩【期刊名称】《中文信息学报》【年(卷),期】2022(36)10【摘要】蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。
根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。
该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。
多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。
用三个连接时序分类器损失函数的和作为模型的总损失函数。
实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。
【总页数】7页(P81-87)【作者】武慧娟;范道尔吉;白凤山;滕达;潘月彩【作者单位】内蒙古大学电子信息工程学院【正文语种】中文【中图分类】TP391【相关文献】1.基于双射变换的脱机手写数字识别方法2.基于GA-BP神经网络的脱机手写藏文识别方法3.一种基于复合特征的脱机手写体字符识别方法4.基于反馈知识迁移的脱机手写体汉字识别方法5.基于GA-BP神经网络的脱机手写藏文识别方法因版权原因,仅展示原文概要,查看原文内容请购买。
基于GABP神经网络的脱机手写藏文识别方法摘要:通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GABP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。
关键词:脱机手写藏文识别;GABP神经网络;特征提取0引言模式识别在各个领域中的应用非常多,从这些应用中可以看到它们的共性,即一个模式识别系统通常包括原始数据的获取和预处理、特征提取与选择、分类或聚类、后处理4个主要部分。
其中藏文识别需要解决的关键问题是模式分类,其理论基础是模式识别技术,其中最常用的方法是统计模式识别方法和结构模式识别方法。
近年来也有很多人将隐马尔科夫模型用于手写识别领域,取得了良好的效果。
本文主要介绍统计模式识别、结构模式识别以及使用较多的隐马尔科夫模型和人工神经网络模型。
1模式识别1.1统计模式识别统计模式识别是依据统计的原理来建立分类器,其分类器设计方法主要有贝叶斯决策理论和判别函数。
贝叶斯决策理论基本思想为:在类条件概率密度和先验概率已知或者可以估计的条件下,利用贝叶斯公式比较样本属于两类的后验概率,然后将类别决策为后验概率大的一类,从而使总体错误率最小。
常见的一种贝叶斯决策为最小错误率贝叶斯决策<sup>[1]</sup>,其决策规律如下:如果P(w\-1|x)>P(w\-2|x),则x∈w\-1;反之,则x∈w \-2。
通过贝叶斯公式,后验概率的比较可以转化为类条件概率密度的比较,离散情况下也是类条件概率的比较,而这种条件概率或条件密度则反映了在各类模型下观察到当前样本的可能性或似然度,因此可以定义两类之间的似然比或对数似然比进行决策。
该方法的主要优点是抗干扰能力强,且易于实现,但是应用中的主要缺点是细分能力较弱,区分相似字的能力较差。