模式识别-第9章 核方法概要
- 格式:ppt
- 大小:1.19 MB
- 文档页数:54
第9章光学字符识别技术(上)光学字符识别技术是计算机自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术。
它是新一代计算机智能接口的一个重要组成部分,也是模式识别领域的一个重要分支。
文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科,它是介于基础研究和应用研究之间的一门综合性学科。
随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依赖计算机获得各种信息,大量的信息处理工作也都转移到计算机上进行。
在日常生活和工作中,存在着大量的文字信息处理问题,因而将文字信息快速输入计算机的要求就变得非常迫切。
现代社会的信息量空前丰富,其中绝大部分信息又是以印刷体的形式进行保存和传播的,这使得以键盘输入为主要手段的计算机输入设备变得相形见绌,输入速度低已经成为信息进入计算机系统的主要瓶颈,影响着整个系统的效率。
因此,要求有一种能将文字信息高速、自动地输入计算机的方法。
目前,文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等。
人工键盘输入方法需要经过一定时间的学习训练才能掌握;手写识别和语音输入虽然简单便捷,但其输入速度不高,对于大量已有的文档资料,采用这些方法要花费大量的人力和时间。
因此,能够实现文字信息高速、自动输入的只能是计算机自动识别技术,即光学字符识别(OCR)技术。
目前文字识别技术已经广泛地应用到了各个领域中。
它作为计算机智能接口的重要组成部分,在信息处理领域中可以大大提高计算机的使用效率,是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式;将庞大的文本图像压缩成机器内码可以节省大量的存储空间。
本章和第 10 章主要介绍光学字符识别中的一些关键技术,包括预处理、字符分割、特征提取、分类器设计以及后处理等。
另外,会给出一些相关的算法代码。
当然给出的代码只是一个雏形,只要读者在这个框架的基础上作修改,就可以构建自己的应用系统。
模式识别第四版Pattern Recognition Fourth EditionSergios Teodoridis / Konstantinos Koutroumbas第1章导论1.1 模式识别重要性1.2 特征、特征向量和分类器1.3 有监督、无监督和半监督学习1.4 MATLAB程序1.5 本书内容安排第2至10章有监督模式识别第2章估计未知概率密度函数的贝叶斯分类技术——重点关注:贝叶斯分类、最小距离、最近邻分类器、朴素贝叶斯分类器、贝叶斯网络。
第3章线性分类器的设计——均方理论的概率、偏差-方差、支持向量机(SVM Support Vector Machines)、线性可分性感知器算法均方和最小二乘法理论第4章非线性分类器的设计——反射传播算法基本原理、Cover定理、径向基函数(RBF Radial Basis Function)网络、非线性支持向量机、决策树、联合分类器第5章特征选择(介绍现有的知名技术)——t检验、发散、Bhattacharrya距离、散布矩阵、(重点)两类的Fisher线性判别方法(Fisher’s linear discriminant method LDA)第6章如何利用正交变换进行特征提取——KL变换、奇异值分解、DFT\DCT\DST\Hadamard\Haar变换、离散小波变换、第7章图像和声音分类中的特征提取一阶和二阶统计特征以及行程长度方法第8章模板匹配动态规划和Viterbi算法(应用于语音识别),相关匹配和可变形模板匹配的基本原理第9章上下文相关分类隐马尔可夫模型,并应用于通信和语音识别第10章系统评估和半监督学习第11章至第16章无监督模式识别第2章基于贝叶斯决策理论的分类器2.1 引言模式识别系统中的分类器设计共三章,这是其中的第1章以特征值的统计概率为基础。
设计分类器是将未知类型的样本分类到最可能的类别中。
现在的任务是定义什么是“最可能”首先要完成的任务是条件概率的计算,而贝叶斯规则条件概率是非常有用的2.2 贝叶斯决策理论BAYES DECISION THEORY概率中的贝叶斯规则P(x)是x的概率密度函数贝叶斯分类规则bayes classification rule结论等价表示为:若先验概率相等,上式可表示为:错误率Pe的计算公式最小化分类错误率Minimizing the Classification Error Probability:要证明贝叶斯分类器在最小化分类错误率上是最优的the Bayesian classifier is optimal with respect to minimizing the classification error probability.最小平均风险Minimizing the Average Risk用惩罚Penalty来衡量每一个错误it is more appropriate to assign a penalty term to weigh each error2.3 判别函数和决策面下面的主要讨论在高斯密度函数的情况下,与贝叶斯分类决策面有关的情况。
模式识别方法概述范会敏,王浩(西安工业大学计算机科学与工程学院,陕西西安710032)摘要:模式识别技术在社会生活和科学研究的许多方面有着巨大的现实意义,己经在许多领域得到了广泛应用。
文中就其理论基础与主要方法作了详细的介绍与阐述。
分别介绍了统计模式识别、句法结构模式识别、模糊模式识别、人工神经网络模式识别、模板匹配模式识别、支持向量机的模式识别。
关键词:模式;模式识别;统计模式识别;神经网络模式识别;模板匹配中图分类号:TP391.4文献标识码:A文章编号:1674-6236(2012)19-0048-04An overview of the pattern recognition methodsFAN Hui -min ,WANG Hao(Department of Computer Science and Engineering ,Xi ’an Technological University ,Xi ’an 710032,China )Abstract:Pattern recognition technology has great practical significance in many sides of social life and scientific research ,and it has been widely applied in many fields.The theoretical basis and principal methods of it have been thoroughly introduced in this paper.Describes the statistical pattern recognition ,sentence structure pattern recognition ,fuzzy pattern recognition ,artificial neural network pattern recognition ,template matching pattern recognition ,Support Vector Machines pattern recognitionKey words:pattern ;pattern recognition ;statistical pattern recognition ;neural network pattern recognition ;templatematching收稿日期:2012-06-08稿件编号:201206065作者简介:范会敏(1960—),女,陕西富平人,教授。