清华大学 模式识别 第一章(引言)
- 格式:pdf
- 大小:3.76 MB
- 文档页数:25
模式识别※第一章绪论§课前索引§1.1 模式识别和模式的概念§1.2 模式的描述方法§1.3 模式识别系统§1.4 有关模式识别的若干问题§1.5 本书内容及宗旨§本章小节§本章习题※第二章贝叶斯决策理论与统计判别方法§课前索引§2.1 引言§2.2 几种常用的决策规则§2.3 正态分布时的统计决策§本章小节§本章习题※第三章非参数判别分类方法§课前索引§3.1引言§3.2线性分类器§3.3 非线性判别函数§3.4 近邻法§3.5 支持向量机§本章小结§本章习题※第四章描述量选择及特征的组合优化§课前索引§4.1 基本概念§4.2 类别可分离性判据§4.3 按距离度量的特征提取方法§4.4 按概率距离判据的特征提取方法§4.5 基于熵函数的可分性判据§4.6 基于Karhunen-Loeve变换的特征提取§4.7 特征提取方法小结§4.8 特征选择§本章小节§本章习题※第五章非监督学习法§课前索引§5.1 引言§5.2 单峰子类的分离方法§5.3 聚类方法§5.4 非监督学习方法中的一些问题§本章小节§本章习题※第六章人工神经元网络§课前索引§6.1 引言§6.2 Hopfield模型§6.3 Boltzmann机§6.4 前馈网络§6.5 人工神经网络中的非监督学习方法§6.6 小结§本章习题第一章绪论本章要点、难点本章是这门课的绪言,重点是要弄清“模式识别”的名词含义,从而弄清这门课能获得哪方面的知识,学了以后会解决哪些问题。
《模式识别》课程教学大纲课程编号:04226课程名称:模式识别英文名称:Pattern Recognition课程类型:专业课课程要求:选修学时/学分:32/2 (讲课学时:28 实验学时:4)适用专业:智能科学与技术一、课程性质与任务模式识别课程是智能科学与技术专业的•门选修课,是研究计算机模式识别的基本理论和方法、应用。
模式识别就是利用计算机对某些物理现象进行分类,在错误概率最小的条件下,使识别的结果尽量与事物相符。
这门课的教学目的是让学生掌握统计模式识别和结构模式识别基本原理和方法。
本课程的主要任务是通过对模式识别的基本理论和方法、运用实例的学习,使学生掌握模式识别的基本理论与方法,培养学生利用模式识别方法、运用技能解决本专业及相关领域实际问题的能力,为将来继续深入学习或进行科学研究打下坚实的基础。
本课程的教学目的是为了使学生能应用模式识别处理计算机自动识别事物,机器学习数据分析中有关的技术问题。
由于本课程的目标是侧重在应用模式识别技术,因此在学习内容上侧重基本概念的讲解,辅以必要的数学推导,使学生能掌握模式识别技术中最基本的概念,以及最基本的处理问题方法。
学生在学习过程中还会用到一些概率论的最基本知识,线性代数中的部分知识,对学生在数学课中学到知识的进一步理解与巩固起到温故而知新的作用。
(该门课程支撑毕业要求中1.1, 2.1, 3.1, 3.3, 4.1, 6.1, 10.1和12.1)二、课程与其他课程的联系先修课程:概率论与数理统计、线性代数、机器学习后续课程:智能感知综合实践先修课程概率论与数理统计和线性代数为学生学习模式识别技术中最基本的概念,必要的数学推导打下基础,机器学习可以使学生建立整体思考问题的方法,并具有系统性能优化的概念。
本课程为后续智能优化方法打下理论基础。
三、课程教学目标1. 学习模式识别基本理论知识,理解参数估计的基本思想,掌握最大似然和贝叶斯儿种典型算法,理解聚类分析的的基本思想,掌握聚类分析的几种典型算法:(支撑毕业要求1.1,2.1)2. 具有数学分析和识别的基本能力;(支撑毕业要求1.1)3. 掌握基本的识别优化创新方法,培养学生追求创新的态度和意识;(支撑毕业要求3.1)4. 培养学生树立正确的分析和识别思想,了解设计过程中国家有关的经济、环境、法律、安全、健康、伦理等政策和制约因素;(支撑毕业要求3.3)5. 培养学生的工程实践学习能力,使学生具有运用标准、规范、手册、图册和查阅有关技术资料的能力;(支撑毕业要求4.1, 6.1)6, 了解模式识别方法前沿和新发展动向;(支撑毕业要求10.1, 12.1)四、教学内容、基本要求与学时分配五、其他教学环节(课外教学环节、要求、目标)无六、教学方法本课程以课堂教学为主,结合作业、自学及洲验等教学手段和形式完成课程教学任务。
模式识别课程编码:课程英文译名:Pattern Recognition课程类别:学位课开课对象:模式识别与智能系统开课学期:第2学期学分: 3 学分;总学时: 48 学时;理论课学时:48 学时;实验学时:0 学时;上机学时:先修课程:学习本课程之前,应先学习《概率论》、《线性代数》课程。
教材:《模式识别》清华大学出版社,2000年1月,第二版参考书:【1】《数字图像处理》 Kenneth.R.Castleman著,朱志刚等译,电子工业出版社 1998年9月一、课程的性质、目的和任务《模式识别》是模式识别与智能系统硕士生一门学位课。
模式识别就是利用计算机对某些物理现象进行分类,在错误概率最小的条件下,使识别的结果尽量与事物相符。
本课程的任务是使学生掌握模式识别的基本原理和方法,了解模式识别在实际系统中的应用。
二、课程的基本要求通过本课程的学习,要求重点掌握统计模式识别的基本理论和应用。
掌握统计模式识别方法中的特征提取和分类决策。
掌握特征提取和选择的准则和算法,掌握监督学习的原理以及分类器的设计方法。
基本掌握非监督模式识别方法。
了解应用人工神经网络和模糊理论的模式识别方法。
掌握模式识别的应用和系统设计。
三、教学方式课程采用教师课堂讲授和学生课外自学相结合的教学方式。
教师课堂讲模式识别方面的核心内容,学生通过阅读参考书和文献资料,进一步深入了解课程的最新研究成果。
四、课程的主要教学内容和学时分配授课时数:48学时主要内容:第一章绪论1.1 模式和模式识别的概念1.2 模式识别系统1.3 关于模式识别的一些基本问题第二章贝叶斯决策理论2.1 几种常用的决策规则2.2 正态分布时的统计决策2.3 分类器的错误率分析第三章概率密度函数的估计3.1 参数估计的基本原理3.2 监督参数估计3.3非监督参数估计第四章线性判别函数4.1线性判别函数和线性分类器的基本概念4.2 常用准则函数的线性分类器设计4.3 多类问题第五章非线性判别函数5.1 分段线性判别函数的基本概念5.2 分段线性分类器设计5.3 二次判别函数5.4 近邻法第六章特征的选择与提取6.1 基本概念6.2 类别可分离性6.3 特征提取6.4 特征选择第七章非监督学习方法7.1 引言7.2 单峰子集(类)的分离方法7.3 类别分离的间接方法7.4 分级聚类方法第八章模式识别的发展与应用8.1 神经网络模式识别8.2 模糊模式识别方法8.3 识别方法在语音信号数字处理中的应用8.4 印刷体汉字识别中的特征提取五、习题及课外教学要求通过习题巩固和加深对所学知识的理解,培养分析能力计算能力,为此要布置适量的习题。
课程中文名称:模式识别原理与技术(课程代码:系统生成,不必填写)课程英文名称:The Principle and Technology of Pattern Recognition学分:2 总学时:32开课学院:信息科学与技术学院层次:学术硕士研究生主要面向学科(类别):控制科学与工程学科/领域(与培养方案保持一致)预备知识:概率论与数理统计,最优化理论,数据结构课程学习目的与要求:通过本课程的学习,使学生掌握模式识别的基本概念、基本原理、基本分析方法和算法,具有初步设计、实现模式识别中比较简单的分类器算法的能力,从而为学生进一步从事该方向的学习与研究工作打下基础。
要求重点掌握统计模式识别方法中的特征提取和分类决策。
掌握特征提取和选择的准则和算法,掌握监督学习的原理以及分类器的设计方法。
基本掌握非监督模式识别方法。
掌握模式识别的应用和系统设计。
课程主要内容:一、绪论(2学时)1 模式和模式识别的概念2 模式识别系统3 关于模式识别的一些基本问题二、贝叶斯决策理论(6学时)1 引言2几种常用的决策规则2.1 基于最小错误率的贝叶斯决策2.2基于最小风险的贝叶斯决策2.3在限定一类错误率条件下使另一类错误率为最小的两类别决策2.4判别函数、决策面与分类器设计3正态分布时的统计决策3.1正态分布概率密度函数的定义与性质3.2正态分布概率模型下的最小错误率贝叶斯决策3分类器的错误率分析4 小结三、概率密度函数的估计(4学时)1. 什么是概率总体的估计?2 正态分布的监督参数估计2.1 极大似然估计2.2 贝叶斯估计2.3 贝叶斯学习2.4 极大似然估计、Bayes估计和Bayes学习之间的关系*3 非参数估计3.1概率密度函数估计的基本方法3.2 密度函数估计的收敛性4 小结四、线性判别函数(6学时)1 引言2 线性分类器2.1 线性判别函数的基本概念2.2 广义线性判别函数2.3 线性分类器设计步骤2.4 Fisher线性判别函数2.5 感知准则函数2.6 多类问题3 非线性判别函数3.1 非线性判别函数与分段线性判别函数3.2 基于距离的分段线性判别函数3.3 错误修正算法3.4 局部训练法4 近邻法4.1 最近邻法决策规划4.2 近邻法错误率分析4.3 改进的近邻法5 支持向量机5.1 线性可分条件下的支持向量机最优分界面5.2 线性不可分条件下的广义最优线性分界面5.3 特征映射法、解决非线性判别分类问题5 小结五、描述量选择及特征的组合优化(8学时)1 基本概念2 类别可分离性判据3 按距离度量的特征提取方法3.1基于距离的可分性判据3.2 按欧氏距离度量的特征提取方法4 按概率距离判据的特征提取方法4.1 基于概率分布的可分性判据4.2 按概率距离判据提取特征5 基于熵函数的可分性判据5.1 基于熵函数的可分性判据5.2 相对熵的概念及应用举例6 基于KarhunenKarhunenLoeveLoeve变换的特征提取6.1 KarhunenKarhunen--LoeveLoeve变换6.2 KarhunenKarhunen--LoeveLoeve变换的性质6.3 使用KK--LL变换进行特征提取7 特征提取方法小结8 特征选择六、* 非监督学习法(4学时)1 引言2 单峰子类的分离方法2.1 投影法2.2 基于对称集性质的单峰子集分离法3 聚类方法3.1 动态聚类方法3.2 分级聚类方法4 非监督学习方法中的一些问题5小节课程考核要求:1.小论文+开卷考试2.成绩评定规则,如综合成绩=期末考试成绩*70%+小论文成绩*30%主要参考书:1.张学工,《模式识别(第三版)》,清华大学出版社,2010an Sonka 等著,Image Processing, Analysis and Machine Visio n 人民邮电出版社,20023.期刊:模式识别与人工智能、中国图象图形学报等撰写人:郝矿荣2014 年12月10 日学院盖章:教授委员会主任签字:年月日。
模式识别Pattern Recognition自我介绍李玉鑑联系电话:67392879-2514 E-mail: liyujian@ 办公地点:信息北楼309课程的基本情况中文名称:模式识别英文名称:Pattern Recognition 课程类型:专业选修课学时:32学分:2.0教材和参考书✷教材:✷Richard O.Duda,Peter E.Hart,David G. Stork著,《模式分类》,李宏东、姚天翔译,机械工业出版社,2007年6月✷参考书:✷边肇祺、张学工等编著,《模式识别》,清华大学出版社✷杨光正、无岷、张晓莉编著,《模式识别》,中国科学技术大学出版社考试方法 闭卷考试,100分制第1讲模式识别简介✷常见模式识别系统举例✷模式识别的基本概念✷模式识别的相关领域✷模式识别的应用✷模式识别系统的基本组成常见模式识别系统举例✷汉王OCR✷指纹识别✷虹膜识别✷人脸识别✷返回模式识别的基本概念✷模式识别的定义✷样本、模式和模式类的相对关系✷模式识别的复杂性✷两可图形:立方体,面孔与酒杯✷返回模式识别的定义✷计算机对人或动物的识别功能的模拟✷Pattern Recognition✷Pattern:相似、相近但又不同的样本✷Recognition:识别,辨认✷“Pattern”源于法文Patron,本来指可作为大家典范的理想的人,或用以模仿复制的完美的样品。
返回样本、模式与模式类✷模式识别系统:✷输入通常称为样本,有时也称为模式。
✷输出通常称为模式,有时也称为模式类。
✷返回模式识别的复杂性✷模式识别是一个非常复杂的问题✷鲸在生物学中属于哺乳类,应该和牛算作同一类;但是从产业的角度看,捕鲸属于水产业,鲸和鱼是一类,而牛属于畜牧业,与鲸不同类。
✷返回立方体返回面孔与酒杯返回模式识别的相关领域✷模式识别技术不同于经典的统计“假设检验”技术✷模式识别技术也不同于“图像处理”(image processing)✷其它3种密切相关的技术:回归分析,函数内插,和(概率)密度估计✷返回假设检验(hypothesis testing )✷根据输入数据,判断零假设(或原假设、空假设)H 0与备择假设H 1中哪一个成立。
第一章引言
§1.1 样本和模式
§1.2 模式识别(分类)
§1.3 机器模式识别基本方法
——有监督模式识别
——无监督模式识别
Guijin Wang, Tsinghua University, 第一章引言1
Guijin Wang, Tsinghua University, 第一章引言
2§1.1 样本和模式
清华大
学→方正舒体清华大
学→隶书清华大
学→幼圆体清华大
学→ 华文彩云体↓ ↓ ↓ ↓
清华大学→ 代码(符号、概念)
C7E5 BBAA B4F3 D1A7强弱分布(信号)个体之间:有差别又有共性
Guijin Wang, Tsinghua University, 第一章3
Guijin Wang, Tsinghua University, 第一章
4
弓形螺旋形
环形短纹-孤
立点
分叉点纹线端点
样本的定义(from wiki)
⏹In statistics and quantitative research methodology,a data
sample is a set of data collected and/or selected from a statistical population by a defined procedure.
⏹This process of collecting information from a sample is
referred to as sampling.
⏹In mathematical terms,given a random variable X with
distribution F,a random sample of length n(where n may be any of1,2,3,...)is a set of n independent,identically distributed(iid)random variables with distribution F.
⏹The concept of a sample thus includes the process of how
the data are obtained(that is,the random variables).
⏹正样本&负样本
Guijin Wang, Tsinghua University, 第一章引言5
Guijin Wang, Tsinghua University, 第一章引言6
模式的定义和性质
⏹
广义定义:一种独特的、用于区别于其他类型的形态、方式、规律等⏹边书定义(P1):时间和空间中可观察的事物、
可区别其是否相同或相似(表现为具有时间或空间分布的信息)
⏹工程定义:与概念(符号?)有关的某种数据
结构(向量、矩阵、符号串等)
⏹《说文解字》
◆“模”:法也;式:法也
⏹样本所属的类别,同一类样本的总体(母体)
⏹模式分类的主观(目的)依存性
◆数字“零”、字母“O
◆椅子(P6)
◆形状、颜色:方、圆、长、4腿、3腿、单腿、红、绿
◆功能:“坐人”
◆字符:“字符识别”、“字体识别”
◆语音:“语音内容识别”、“说话人识别”、“语言识
别”
Guijin Wang, Tsinghua University,
Guijin Wang, Tsinghua University, 第一章引言8
学习(训练)、样本、模式
→0
→1
→2
→3
→4
样本和模式
清华大学→方正舒体
清华大学→隶书
清华大学→幼圆体
清华大学→华文彩云体
↓↓↓↓
清华大学
C7E5 BBAA B4F3 D1A7
Guijin Wang, Tsinghua University, 第一章引言9
样本和模式
Guijin Wang, Tsinghua University, 第一章引言10
人脸检测与识别
正脸检测: 既快又好(Voila 2001)
Guijin Wang, Tsinghua University, 第一章引言
样本和模式
Guijin Wang, Tsinghua University, 第一章引言12
人脸检测与识别
⏹人脸检测解决的是一个类别(人脸)分类问题⏹表情识别:笑脸检测
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
⏹人脸检测解决的是一个类别(人脸)分类问题
⏹表情识别:笑脸检测
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
⏹人脸识别则考虑的是个体认知问题
⏹业界动态
⏹Google在9月4号获得了一项新专利——“人脸识别登录计算
机”。
/htm/wljs/2012/0907/194466.html
⏹据New Scientist杂志报道,FBI称将耗资十亿美元于面部识
别技术,来完成一个名为下一代身份识别(Next Generation Identification,简称NGI)的项目。
⏹在2010年的测试表明,最好的算法可以在160万嫌
疑犯照片中达到92%正确率。
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
人脸比对
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
人脸比对
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
人脸比对
Guijin Wang, Tsinghua University, 第一章引言
人脸检测与识别
人脸比对
Guijin Wang, Tsinghua University, 第一章引言
Guijin Wang, Tsinghua University, 第一章引言20
Dog face detection
53种类别的狗
狗脸检测
Guijin Wang, Tsinghua University, 第一章引言
23
姿势检测
姿势检测
24
Guijin Wang, Tsinghua University, 第一章引言
静态手势
☐>10种静态手势
☐支持自定义手势☐高精度肢端定位☐基于手掌模型的静态手势识别。