基于matlab的数字识别系统设计
- 格式:doc
- 大小:414.00 KB
- 文档页数:52
长沙民政职业技术学院毕业实践报告 题目:基于MATLAB 勺人脸识别系统的研扌旨导老师: ______ 谭刚林 ______________________ 系 另寸: 电子信息工程系 __________________ 班 级: ______________ 电子1133 ____________学号:1119013333 1119013334 1119013335 姓 名: 刘盼符思遥樊阳辉类型:2014年5月5日基于MATLAB勺人脸识别系统的研究符思遥、刘盼、樊阳辉指导老师:谭刚林苏宏艮马勇赞【摘要】人脸检测与识别技术是计算机视觉和模式识别等学科的研究热点之一,是进行身份认证最友好直接的手段,在出入境安全检查、内容检索、证件验证、门禁系统等领域都具有十分广泛的应用前景。
多年来,人脸识别技术中的很多问题都被深入地研究,而且大量的算法已经成功应用于人脸识别。
本文在研究了人脸检测和身份识别的关键技术和相关理论的基础上,重点讨论了在光照和背景不同的条件下,彩色静止图像的人脸检测和身份识别问题,它包括基于肤色分割的人脸粗检测、基于人眼检测的几何归一化和基于二维主成分分析法(2DPCA的身份识别。
本文主要工作如下:首先对彩色图像进行光照补偿,其次通过肤色检测获得可能的脸部区域并二值化,再用形态学开闭运算对图像进行滤波处理并通过一定规则确定人脸区域,然后运用水平垂直投影定位人眼坐标以此对人脸进行几何归一化,识别部分运用2DPCA勺图像映射方法对灰度图进行特征匹配,最后输出识别结果并进行语音播报。
实验结果表明,结合肤色和面部几何特征的算法能够对人脸进行较快速和准确的定位,同时2DPCAT法运用于身份识别也能达到较高的识别率。
本毕业设计对实际应用具有一定的参考价值,该系统的操作流程和输入输出方式是以实际应用为出发点,可应用于公安机关证件验证以及日常家庭的自动门禁系统等。
【关键词】人脸检测;肤色分割;人眼检测;2DPCA特征提取1绪论 (1)1.1选题的背景 (1)1.2人脸识别系统 (2)1.3人脸识别的典型方法 (2)2基于YCbCr颜色空间的肤色分割 (3)2.1三种色彩空间 (3)2.1.1 RGB色彩空间 (3)3基于2DPCA特征提取的身份识别 (4)3.1 2DPCA算法实验结果与分析 (5)3.1.1实验用数据库 (5)3.1.2实验结果与分析 (5)3.1.3 结论 (7)4人脸检测与识别系统设计与实现 (7)4.1系统环境 (7)4.2人脸检测与识别系统框图 (7)4.3系统功能模块 (8)4.4实验结果分析 (9)5总结与展望 (10)5.1总结 (10)5.2展望 (10)参考文献 (12)1绪论1.1选题的背景近年来随着计算机技术和互联网的发展,信息技术的安全变得越来越重要,生物特征识别技术得到广泛研究与开发,如人脸识别、指纹识别、掌形识别等。
基于MATLAB的数字图像课程设计-图像频域增强高通滤波器算法设计目录1 设计任务及目的 (2)1.1 设计任务 (2)1.2 设计目的 (2)2 课程设计相关知识 (3)2.1 数字图像处理简介 (3)2.1.1 数字图像发展概述 (3)2.1.2 数字图像处理内容 (3)2.1.3 数字图像处理技术 (4)2.2 MATLAB简介 (5)2.2.1 MATLAB基本功能 (5)2.2.2 MATLAB产品应用 (6)2.2.3 MATLAB特点 (6)2.2.4 MATLAB系列工具优势 (6)3 图像频域高通滤波原理 (7)3.1 频域滤波增强步骤及流程框图 (7)3.2 傅立叶变换原理 (8)3.3 高通滤波器原理 (9)3.3.1 理想高通滤波 (9)3.3.2 巴特沃斯高通滤波 (9)3.3.3 指数高通滤波 (10)3.3.4 梯形高通滤波 (10)3.3.5 高斯高通滤波 (10)4 MATLAB程序代码 (10)5 仿真结果与分析 (15)5.1 仿真结果 (15)5.2 结果分析 (19)结论 (20)参考文献 (21)图像频域增强算法设计——高通滤波1设计任务及目的1.1设计任务利用所学的数字图像处理技术,建立实现某一个主题处理的系统,利用MATLAB软件系统来实现图像的频域滤波技术,要求:(1)学习和熟悉MATLAB软件的使用方法;(2)熟悉和掌握MATLAB 程序设计过程;(3)利用所学数字图像处理技术知识和MATLAB软件对图像进行高通滤波处理;(4)能对图.jpg、.bmp、.png格式进行打开、保存、另存、退出等一系列功能操作;(5)在程序开发时,必须清楚主要实现函数目的和作用,需要在程序书写时做适当注释说明,理解每一句函数的具体意义和使用范围;(6)比较几种高通滤波器对图像数字化处理效果的异同。
1.2 设计目的本次课程设计的目的在于提高发现问题、分析问题、解决问题的能力,进一步巩固数字图像处理系统中的基本原理与方法。
目录1.引言 (2)2.设计概述 (3)2.1车牌识别技术 (3)2.2 车牌识别技术的发展 (3)2.3 车牌识别技术的国内外研究现状 (4)2.4 主要应用领域 (6)3.设计方案 (7)4.车牌识别系统的matlab实现 (8)4.1 图像的读取 (8)4.2 图像预处理 (9)4.2.1灰度变换 (9)4.2.2 图像校正 (10)4.3 牌照分割 (10)4.3.1 图像边缘提取及二值化 (11)4.3.2 BP神经网络 (14)4.4 车牌提取 (15)5.设计结果及分析 (16)5.1程序运行结果 (16)5.2程序结果分析 (17)总结体会 (18)参考文献 (19)附录1 (20)附录2 (28)1.引言伴随着世界各国车辆数量的增加,城市交通状况日益受到人们的重视。
如何有效地进行交通管理,越来越成为各国政府的相关部门所关注的焦点。
针对这一问题,人们运行先进的信息处理技术、导航定位技术、无线通信技术、自动控制技术、图像处理和识别技术及计算机网络技术等科学技术,相继研发了各种交通道路监视管理系统、车辆控制系统及公共交通系统。
这些系统将车辆和道路综合起来进行考虑,运行各种先进的技术解决道路交通的问题,统称为智能交通系统( Intelligent Transportation System,简称ITS)。
ITS 是20世纪90年代兴起的新一代交通运输系统。
它可以加强道路、车辆、驾驶员和管理人员的联系,实现道路交通管理自动化和车辆行驶的智能化,增强交通安全,减少交通堵塞,提高运输效率,减少环境污染,节约能源,提高经济活力。
智能交通系统以车辆的自动检测作为信息的来源,因而对车牌照等相关信息的自动采集和处理的一门新的交通信息获取技术——车牌识别(License Plate Recognition ,LPR) 技术逐渐发展起来,成为信息处理技术的一项重要研究课题。
车牌自动识别是智能交通管理系统中的关键技术之一。
基于MATLAB的信号与系统实验教程第一部分 MATLAB基础第1章 MATLAB环境1.1 MATLAB界面图1.1 MATLAB主界面图1.2 Workspace图1.3 MATLAB.m文件编辑窗口界面1.2 文件类型图1.4 设置路径图1.5 例1-1运行结果1.3 系统和程序控制指令1.4 练习第2章 数据类型与数学运算2.1 数值、变量和表达式2.1.1 数值的记述2.1.2 变量命名规则2.1.3 运算符和表达式2.2 数组、矩阵及其运算2.2.1 复数和复数矩阵2.2.2 数组和矩阵的运算2.2.3 特殊矩阵(Specialized matrices)2.3 关系和逻辑运算2.4 练习第3章 数值计算与符号计算3.1 线性代数与矩阵分析3.1.1 线性代数3.1.2 特征值分解3.1.3 奇异值分解3.1.4 矩阵函数3.2 线性方程组求解3.2.1 确定性线性方程组求解3.2.2 线性最小二乘问题的方程求解3.3 数据分析函数图3.1 例3-4运行结果3.4 符号计算图3.2 数值型与符号型数据转换关系3.5 练习第4章 绘图4.1 基本绘图指令4.1.1 plot的基本调用格式图4.1 例4-1运行结果4.1.2 stem: 离散数据绘制(火柴杆图)图4.2 例4-2运行结果4.1.3 polar: 极坐标图图4.3 例4-3运行结果4.2 各种图形标记、控制指令图4.4 例4-4运行结果4.2.1 图的创建与控制4.2.2 轴的产生与控制4.2.3 分格线(grid)、坐标框(box)、图保持(hold)4.2.4 图形标志4.3 其他常用绘图指令4.3.1 其他类型图的绘制图4.5 例4-5运行结果图4.6 例4-6运行结果简易绘图指令图4.7 例4-7运行结果4.4 练习第5章 SIMULINK5.1 SIMULINK的基本使用方法图5.1 Simulink Library Browser窗口图5.2 Pulse Generator模块的参数设置5.2 SIMULINK模型概念及基本模块介绍图5.4 SIMULINK模型的一般结构5.2.1 常用的sources——信号源模块5.2.2 常用的sinks——信号显示与输出模块图5.5 示波器纵坐标设置对话框图5.6 示波器属性对话框5.2.3 math operations——数学运算单元模块5.2.4 continuous——连续系统模块5.2.5 discrete——离散系统模块5.3 SIMULINK模型的仿真5.3.1 仿真参数设置图5.7 仿真设置对话框5.3.2 建立子系统图5.8 例5-2的SIMULINK模型图5.9 例5-2的子系统模型图5.10 例5-2仿真输出波形5.4 练习第6章 M函数和工具箱6.1 M函数6.2 工具箱图6.1 演示程序中的工具箱(Toolbox)使用帮助6.3 练习第7章 MATLAB实用技术遴选7.1 图形用户界面设计7.1.1 设计原则与设计步骤7.1.2 界面与控件介绍图7.1 标准菜单样式7.1.3 GUI实例分析。
基于matlab的听音识曲系统的设计与实现随着人工智能技术的发展,听音识曲技术成为了一个重要的研究课题,它是利用计算机识别歌曲,并自动辨别出歌曲的名字和作者的技术。
在这里,我们将介绍一种基于Matlab的听音识曲系统的设计与实现方法。
第一步是语音分析,也叫音频特征提取。
这一步需要我们对输入的音频进行语音信号分析,来提取出语音的频率特性和能量特性。
我们可以使用Matlab的一些函数来实现这一步,比如短时傅立叶变换、滑动均值滤波及基于频率特性的谱聚类函数等。
这些函数可以实现音频的带宽限定和变换,同时提取出音频的语音特征,如能量特性、基频、频率谱、音频频谱等特征。
第二步是特征比较,也叫特征识别。
这一步需要我们与设定的歌曲数据库中的特征进行比较,以确定输入音频的歌曲名称和识别分数。
为了提高识别率,我们可以采用Matlab的矩阵计算技术,来自动计算特征之间的差异度,从而实现准确的歌曲识别。
第三步是输出结果。
当特征比较完成后,就可以给出歌曲名称和识别出的表示。
为了更好的展示,我们可以利用Matlab中的数据可视化技术,来展示识别出来的歌曲及其相应的特征、识别分数等信息,以便更好的识别结果。
以上就是基于Matlab的听音识曲系统的设计方法和实现方法,该系统可以有效的实现歌曲的名称识别和准确的歌曲特征比较,具有较高的精度及可靠性。
此外,该设计还具有较好的实现维护性、可扩展性及可行性,可以有效改进歌曲识别效率,有利于实现数字音频的自动化处理。
总之,Matlab是一款强大的计算机软件工具,可以完美的支持基于Matlab的听音识曲系统的设计与实现,帮助用户在音频识曲任务中取得更多的成功。
指纹识别算法的matlab实现(毕业论文)指纹识别算法的matlab实现摘要由于指纹所具有的普遍性,唯一性和不变性,以及指纹识别技术具有很高的可行性和实用性,使之成为目前最流行、也最可靠的个人身份认证技术之一。
本文主要对指纹图像进行三方面处理:图像预处理、特征提取和特征匹配。
图像预处理包括四个步骤:图像分割、滤波增强、二值化、细化,对指纹图像进行预处理后,去除了原图像的冗余部分,方便后续的识别处理;特征提取主要是提取指纹图像细化后的端点和分叉点;特征匹配是利用两个指纹的图像进行特征点比较,来确定两幅图像是否来自于同一手指。
本文给出了指纹图像预处理、特征提取、特征匹配的matlab 程序及处理结果。
该结果证明,用matlab实现的这些算法的处理结果比较理想,满足识别的可行性和应用性。
关键词分割,二值化,细化,特征点提取,匹配,MatlabAbstractBecause of the universality, uniqueness andconstantness of a fingerprint, and fingerprint identification technology has very high feasibility and practical applicability, make it to be one of the most popular, and most reliable personal identity authentication technology.This paper focuses on three aspects of the fingerprint image processing:image preprocessing, feature extraction, feature matching. Image preprocessing including four steps: image segmentation, filtering, binary, Refining, after The fingerprint image preprocessing, in addition to the original image of redundancy part, convenient subsequent identification processing; The main feature extraction is extracted from the end of the fingerprint image after thinning and bifurcation point; Feature matching is use two fingerprint image feature point is to determine whether the two images from the same finger.This paper provides the fingerprint image preprocessing, feature extraction, feature matching use matlab and handling results, The results prove that these algorithms had ideal results be used by matlab,, Be satisfied with the recognition and feasibility of the application.Key Words: Segmentation, Binary, Refining, Feature point extracting, Matching, Matlab目录第1章绪论 41.1 指纹识别概述 41.1.1 研究背景及意义 41.1.2 国内外研究状况 51.2指纹识别的原理和方法 5 1.2.1 指纹的基本知识 51.2.2 指纹识别的原理及应用7 1.3 Matlab在指纹识别中的应用8 第2章指纹图像预处理92.1图像的分割92.1.1 图像归一化 102.1.2 图像分割的方向法 112.1.3 图像分割的方差法 122.2 图像的二值化 132.2.1 方向图132.2.2 指纹图像二值化142.2.3 静态阈值二值化152.2.4 基于方向场的二值化15 2.3 指纹图像的滤波172.4 图像细化202.4.1 快速细化算法212.4.2 改进的OPTA算法21第3章图像特征提取和特征匹配253.1 特征点提取253.2 找出特征点253.3 特征点匹配26总结与展望 30致谢 31参考文献32附录A 预处理代码33附录B 特征点提取代码37附录C 图像特征点代码39附录D 特征点匹配代码42第1章绪论1.1 指纹识别概述21世纪是信息化时代,在这个特殊的时代,我们的生活中电子设备越来越多,比如,笔记本电脑,ATM取款机,考勤系统,门禁系统和各种智能卡,网络中的网上银行,人人网账号等,都需要验证身份。
现代控制系统分析与设计——基于matlab的仿真与实现随着现代科技的不断发展,越来越多的技术应用到现代控制系统中,而控制系统的分析与设计更是一项复杂的技术。
为了更好地实现现代控制系统的分析与设计,计算机技术尤其是基于Matlab的计算机仿真技术在现代控制系统分析与设计中已发挥着越来越重要的作用。
本文旨在介绍基于Matlab的仿真技术,总结它在现代控制系统分析与设计中的应用,为研究者们提供一个思考Matlab技术在现代控制系统分析与设计中的可能性的契机。
Matlab是当今流行的科学计算软件,它的设计特别适合进行矩阵运算和信号处理等工作,可以有效地处理大量复杂的数字信息,因此成为现代计算机技术应用于控制系统分析和设计的重要工具。
基于Matlab的仿真技术主要用于建立控制系统的动态模型,分析系统的特性,评估系统的性能,模拟系统的行为,确定系统的参数,优化系统的性能。
基于Matlab的仿真技术已被广泛应用于现代控制系统的设计中。
首先,基于Matlab的仿真技术可以有效地提高系统设计的效率。
通过实现对控制系统的动态模型建模,可以快速搭建出真实系统的模拟系统,并可以使用计算机来模拟系统行为,可以有效地缩短控制系统设计的周期。
其次,基于Matlab的仿真技术可以有效地改善系统设计质量。
通过分析模拟系统的行为,可以寻找更合理的解决方案,从而改善系统设计的质量。
第三,基于Matlab的仿真技术可以有效地确定系统参数。
通过在模拟系统中添加不同参数,并通过对系统模拟行为的分析,可以确定使系统更加有效的参数组合。
最后,基于Matlab的仿真技术可以有效地优化系统性能。
通过对系统行为的分析,可以识别出系统存在的问题,并设计相应的优化策略,从而实现系统性能的最佳化。
综上所述,基于Matlab的仿真技术在现代控制系统分析与设计中发挥着重要的作用,不仅可以提高系统设计的效率,而且可以改善系统设计的质量,确定系统参数,优化系统性能。
基于MATLAB的DHMM、DTW和CHMM语音识别算法的对比研究作者:陈新锐黄理来源:《计算机光盘软件与应用》2013年第04期摘要:在对语音识别基本理论阐述的基础上,研究了DHMM、DTW和CHMM三种不同的语音识别算法,并通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,验证了识别理论的正确性,对比三种不同语音识别算法优缺点,为硬件实现语音识别系统提供了重要参考。
关键词:离散隐马尔可夫算法;动态时间规整算法;连续隐马尔可夫算法;MATLAB语音识别中图分类号:TN912.34 文献标识码:A 文章编号:1007-9599 (2013) 04-0000-021 引言离散隐马尔可夫、动态时间规整和连续隐马尔可夫是语音识别中三种常用算法。
前人在孤立词数字语音识别对该三种算法研究方面的局限是,大多只阐述理论分析结果,却未有具体完整的实验平台来实际验证该三种算法的优缺点。
因此本文通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,以实现论文研究的突破。
2 基于MATLAB的DHMM、DTW和CHMM三种不同的孤立词数字语音识别系统的实现我完成下列实验所使用的机器类型是:笔记本电脑,Intel奔腾双核CPUT2060,主频1.6GHz,2GDDR2内存;Matlab7.04平台。
所用的非特定人汉语数字一到十发音的语音数据均是在实验室环境下用系统自带的录音机软件录制。
2.1 离散HMM方法(DHMM)在此,我做的是基于矢量量化(VQ)与DHMM模型的数字语音识别。
对于已经给出的非特定人汉语1—10语音数据,每个数字5次发音(共50个样本)用作训练集,另外5次发音(共50个样本)用作测试集。
实现的主要步骤是:(1)对所有1-10语音训练数据训练得到矢量量化用的码书;(2)获取1-10每个数字识别用的hmm模型;(3)把训练或者测试的数据与已经训练好了的码书和hmm模型进行匹配,从而得到识别数据。
基于MATLAB的多功能计算器设计与实现摘要随看信息技术的发展,数据变得越来越重要,针对数据的处理也越来越复杂,计算器在我们日常生活学习中扮演越来越重要角色。
本文基于MATLAB设计的GUI 多功能计算器,包括三部分:简易计算器、科学计算器和程序员计算器。
其中,简易计算器包括了常用的加减乘除;科学计算器在加减乘除上,添加了正余弦、阶乘和对数等常用的数学计算;程序员计算器包括了二进制、八进制、十六进制的相互转换和二进制的与、或和异或等逻辑运算。
此多功能计算器改进了以前功能单一的计算器,具有较强的实用性。
关键字:MATLAB; GUI ;多功能计算器AbstractWith the development of information technology, the data become more andmore complicated, according to data operations have become increasingly frequent, thecalculator is playing a more and more important role in leamning in our daily life. In this paper,MATLAB design of GUI based multi functional calculator, consists of three parts: a simplecalculator, scientific calculator and programmers calculator. The simple calculator, includingcommon add, subtract, multiply and divide; scientific calculator in add, subtract, multiply anddivide, add the commonly used mathematical cosine, factorial and logarithm calculation;programmers calculator includes the conversion of binary, octal, hexadecimal and binarysixteen and, or and XOR logic operation. The multi-function calculator before improvedsingle function has a strong practical.Keyword: MATLAB; GUI; Multi Function Calculator目录第1章绪论 (1)1.1.基于MATLAB的多功能计算器设计的目的和意义 (1)1.2国内外现状分析 (1)1.2.1 国内外计算器的发展 (1)1.2.2计算器的类型 (2)第2章数字信号处理原理概念 (4)2.1数字信号处理 (4)2.2数字信号处理的概述 (4)2.3用MATLAB实现信号处理 (4)2.3.1信号的取样 (4)2.3.2信号的重构 (5)第3章计算器总体设计 (6)3.1计算器整体设计思路 (6)3.2计算器的功能实现 (7)3.2.1数字0-9设计与实现 (7)3.2.2四则运算设计 (7)3.2.3简单科学计算设计 (7)3.2.4功能按钮设计 (7)第4章 MATLAB GUI界面设计 (8)4.1MATLAB GUI介绍 (8)4.2GUI界面创建的基本知识 (8)4.3计算器界面设计 (9)第5章 MATLAB程序设计 (10)5.1 M文件 (10)5.1.1局部变量与全局变量 (10)5.1.2M文件的编辑与运行 (11)5.1.3脚本文件 (13)5.1.4函数文件 (13)5.1.5函数调用 (14)5.2MATLAB的程序控制结构 (16)5.3 数据的输入与输出 (17)5.3.1 键盘输入语句(input) (17)5.3.2屏幕输出语句(disp) (17)5.3.3 M数据文件的存储/加载(save/load) (17)5.3.4二进制数据文件的存储/读取 (18)5.4.面向对象程序设计的基本方法 (19)5.4.1.创建类目录 (19)5.4.2.建立类的数据结构 (19)5.4.3创建类的基本方法 (19)5.4.4重载运算 (19)5.4.5面向对象的函数 (19)5.5MATLAB程序优化 (19)结语 (20)附录 (21)参考文献 (28)致谢...............................................................................................................第1章绪论1.1.基于MATLAB的多功能计算器设计的目的和意义当今时代是一个信息化的时代,信息化的时代到处充满了数据,生活在这个信息化时代的人们,无论人们在做什么行业,都需要时时刻刻跟数据打交道。
基于Matlab的数字图像水印算法设计设计1、绪论本章主要介绍信息隐藏技术的背景和研究意义、国内外信息隐藏技术研究现状,并给出全文的结构安排。
1.1信息隐藏技术的背景和研究意义从二十世纪九十年代开始,网络信息技术在全世界范围内取得了迅猛发展,它极大方便了人们之间的通信和交流。
借助计算机网络所提供的强大的多媒体通信功能,人们可以方便、快速地将数字信息(数字音乐、图像、影视等方面作品)传到世界各地,一份电子邮件可以瞬息间传遍全球[1-7]。
但在同时计算机网络也成为犯罪集团、非法组织和有恶意的个人利用的工具。
从恶意传播计算机病毒,到非法入侵重要部门信息系统,窃取重要机密甚至可使系统瘫痪;从用计算机进行金融犯罪,到利用表面无害的多媒体资料传递隐蔽的有害信息,对计算机信息系统进行恶意攻击的手段可谓是层出不穷。
信息隐藏技术在保密通信、版权保护等领域中都具有相当广泛的应用价值,根据不同应用背景,信息隐藏技术可以分为两个重要分支隐写术(Stegano Graphy)和数字水印[8](Digital Watermarking)。
数字水印主要是为了保护知识产权的,通过在原始媒体数据中嵌入信息来证实该媒体的所有权归属问题。
数字水印的主要目的不是限制对媒体访问,而是确保媒体中水印不被篡改或消除。
因此稳健性是数字水印最基本要求之一。
数字水印中的稳健性是指水印图像经过一些常见改变后,水印仍具有较好可检测性。
这些改变包括常见的图像处理手段(如数据压缩、低通滤波、图像增强、一次抽样、二次量化、A/D和D/A转换等等)、几何变换和几何失真、噪声干扰、多重水印(Multiple Watermarking)的重叠等。
对不同应用场合,要求具有不同的稳健性。
但需要指出的是,存在另一种与稳健水印性质相反的水印,被称为易损水印(Fragile Watermarks),它们被用来证实原始媒体是否被改动过。
稳健性在整个水印系统设计中具有很重要的分量,这也是将隐写术和数字水印分别对待的原因之一。
基于MATLAB的简谱识别算法研究作者:束美其来源:《电脑知识与技术》2014年第36期摘要:该文介绍了运用MATLAB软件实现简谱识别的算法。
该算法主要实现图像的预处理、分割以及匹配识别等功能,关键是对音符进行准确的分割,因为这直接影响到识别效果的好坏。
关键词:简谱识别;算法;MATLAB;分割中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2014)36-8757-03随着数字化信息时代的到来,全球经济以前所未有的速度向前发展,同时,人们的生活水平和文化要求也越来越高,人们在各个领域的工作也更加的细化和深化,软件行业异军突起,各种应用软件不断的得以开发并应用于工业、农业、行政、文化娱乐等行业,不仅为信息时代的人类提供了更加简洁、方便的工作和生活方式,更加使我们的生活丰富多彩。
在音乐方面,各种乐谱编辑软件、音乐合成软件和音乐制作软件已经广泛地应用于音乐爱好者和专业人士的音乐工作中,在这些众多的软件中,绝大部分的音乐处理软件都是对唱谱的后期制作与处理软件,而对于乐谱的识别软件相关的却不多,乐谱识别,是相应于现代化人们对快节奏工作方式的要求而产生的,但现有的识别软件大多都存在种种的误差,实际应用性不高,能够较准确地识别出乐谱地软件更是少之又少,这就给乐谱识别的软件开发人员带来了动力与挑战,同时,乐谱识别软件的开发也具有较好的市场发展前景。
简谱,相对于五线谱而言,它书写较为简便,学习起来也比较容易,越来越多的人倾向于用简谱来创作音乐,演奏音乐,目前市场上的简谱识别软件非常少,这与简谱本身的特点有关,使得识别处理存在一些难点。
因此,该文主要研究和设计了简谱识别算法。
1 算法设计与实现1.1 设计思路对于一张扫描到电脑中的简谱,进行识别前需要首先进行预处理,使之能够转化为易于进行数字化处理的形式。
依次为中值滤波、二值化、细化处理,如前所述,中值滤波可以较好的去除图片中的椒盐噪声,二值化将待处理音符提取出来,细化处理很好的保留了音符的形状、边界特征,这对于后续的识别是大有好处的。
matlab的功能及应用Matlab是一种功能强大且广泛应用的数学软件,它具有众多功能和应用,可以满足科学计算、数据分析、图像处理、机器学习等领域的需求。
本文将介绍Matlab的一些主要功能及其应用。
一、数学计算功能Matlab具有强大的数学计算能力,可以进行各种数值计算、符号计算和矩阵运算。
例如,可以使用Matlab进行线性方程组的求解、数值积分、微分方程的数值解法等。
这些功能在科学研究、工程计算等领域应用广泛。
二、数据分析功能Matlab提供了丰富的数据分析工具,可以对各种数据进行统计分析、数据可视化和建模预测。
例如,可以使用Matlab进行数据的描述统计分析、假设检验、方差分析等。
此外,Matlab还支持数据可视化,可以绘制各种统计图表,如柱状图、折线图、散点图等,直观展示数据的分布和趋势。
这些功能在市场调研、金融分析、医学统计等领域有广泛应用。
三、图像处理功能Matlab拥有强大的图像处理功能,可以对图像进行各种操作和处理,如图像的读取、显示、滤波、增强、分割等。
例如,可以使用Matlab对医学图像进行肿瘤检测、对遥感图像进行地物提取、对数字图像进行特征提取等。
此外,Matlab还支持图像的压缩和编码,可以对图像进行压缩存储和传输。
这些功能在计算机视觉、图像识别、图像检索等领域有广泛应用。
四、机器学习功能Matlab提供了丰富的机器学习工具箱,可以进行各种机器学习算法的实现和应用。
例如,可以使用Matlab进行数据预处理、特征选择、模型训练和模型评估等。
Matlab支持各种常见的机器学习算法,如线性回归、逻辑回归、支持向量机、决策树、随机森林等。
这些功能在数据挖掘、模式识别、智能推荐等领域有广泛应用。
五、信号处理功能Matlab具有丰富的信号处理工具箱,可以进行各种信号的分析和处理。
例如,可以使用Matlab进行信号的滤波、频谱分析、时频分析、谱估计等。
这些功能在通信系统、音频处理、雷达信号处理等领域有广泛应用。
精品文档 随意编辑 数字识别系统
1.绪论 1.1研究背景 1.1.1索书号的简介 索书号是图书馆赋予每一种馆藏图书的号码,这种号码具有一定结构并带有特定的意义。在馆藏系中,每种书的索书号是唯一的,可准确地确定馆藏图书在书架上的排列位置,它是读者查找图书必要的代码信息。 索书号通常是根据中国图书资料分类法编排的【1】——简称《中图法》。《中图法》采拉丁字母 和阿拉伯数字相结合的混合标记符号。根据图书的学科主题,以拉丁字母标记并顺序展列出22个基本大类,其中没有L、M和Y开头的——参考附录1中图法简表。由于“T工业技术”的大类范围广泛、内容繁多,故又在该类基础上采用双位拉丁字母标记出16个二级类目,如TK、TL、TM和TN等。字母之后再用阿拉伯数字对大类进行细分。如B表示哲学、宗教一大类;B020则表示宗教理论。有的图书馆如清华大学还在图书分类号码后添加按照图书作者姓名所编排的著者号码,或者是按照图书进馆时间的先后所取用的顺序号码。 不同索书号确定排列先后顺序的步骤是,先比较分类号码:如分类号码相同再比较著者号码 或顺序号码。最后按照字母表和数字大小的顺序排列。 1.1.2书库中图书查找存在的问题 精品文档 随意编辑 随着电子计算机和网络技术的发展,现代图书馆都已经广泛建立电子数据库图书管理系统, 方便用户查找、阅览书籍。读者借图书的流程如图2所示,一般利用书目查询系统,根据图书的 书名,出版社,作者以及书的内容等在电子数据库中检索自己需要的图书,记录图书相关信息。 最后,根据图书的索书号,快速方便地在书库中找到相应的图书。但是,经常会遇到下列问题:电子数据库系统显示图书状态为“归还”,利用检索到号,却无法在书库找到此书。出现这种情况主要有两个原因:(1)图书错位放置,即图书在书库中摆放的位置与索书号不一致。(2)图书已经丢失,即虽然电子数据库中显示图书状态为“归还”,但实质图书已经丢失,并不在书库中。随着图书馆藏书数目的不断增加,每天借阅的人数增多,而且有的图书馆发展成拥有几个分馆,上述问题越来越严重。这一方面严重降低了图书馆的资源的利用率;另一方面,浪费了读者的时间,造成了很大麻烦。 目前,图书馆主要通过定期的人工检查发现书库中错位和丢失的图书。但是,由丁馆藏图书 多达上万,甚至几十万,而且每天又都有大量图书的借出和还入,人工检查工作量很大,单调、 重复的工作容易使工作员疲劳,检查速度比较慢,无法满足实际的需要。因此,迫切希望开发索书号自动识别系统,实现对书库中图书放置位置的自动检查,并通过索书号识别结果与电子数据库中图书信息的比较,找出已经丢失的图书。确保电子数据库中的图书状态与书库中的一致,以及书库中的图书准确排放,从而有效解决上述“用索书号找不到图书”的问题。
1.2.索书号自动识别系统 近年来,随着电子计算机技术、图像处理技术和摄像技术的迅速发展,图像中的文字信息提 取系统已经成功地应用于各个领域。因此,借助其经验,本文研究采用图像处理和识别技术 实现索书号的自动识别。 1.2.1索书号自动识别系统概述 系统的硬件由彩色CCD摄像头,8位图像采集卡和计算机组成,拍摄的图像为8位RGB彩色精品文档 随意编辑 数字图像。如图1-1所示
CCD摄像机拍摄排放在书架上的图书图像,图书的图像出索书号外还有其他内容,如出版社的标志,其他文字甚至大块的污渍等,必须从中分割出仅包含索书号的文字图像。灰度的文字图像难以直接用于识别,所以讲灰度的文字图像装换为二值图像。由于噪声和五点的干扰,以及光照不均匀的影响,二值化后的文字会发生粘连,严重改变文字的自营。字符切分成单个字符后才进行文字识别。按照上述流程,具体介绍索书号识别的整个过程。 1.2.2 索书号识别存在的问题及关键技术 索书号识别所涉及的摄像技术,无线通讯技术,电子数据库图书管理技术,AGV自动导引技术和图像处理技术都已经在其他领域有成功应用的实例。图像处理技术是索书号识别的核心技术,而与相类似的应用相比,索书号图像处理与识别又有其自身显著的特点和难点。 图书馆收集了近几十年的藏书,不同时代的索书号编写风格大不相同。本论文选取图书馆的 主要类别图书——印刷体索书号,从图书馆的书架上随即抽取样本进行研究。如图7所示,CCD 摄像头拍摄的索书号图像,由于光照不均匀、退色、污迹、噪声以及其他非索书号文字的存在,大大增加了索书号识别的困难。为了能够解决上述问题,索书号图像识别主要由以下4个模块组
CCD摄像 索书号文字图像分割 文字图像二值化 单个字符切分 索书号识别 图书排放位置判断 精品文档
随意编辑 成:索书号定位,索书号提取,索书号字符切分和索书号单字识别。 第一阶段:索书号定位是在图像中找到包含索书号的图像区域,要求该区域尽可能包含完整 的索书号,同时尽量排除非索书号的图像区域。由于该阶段是解决索书号的区域查找问题,而没 有涉及单字切分,因此图像区域的估计允许有一定误差。为了包含完整的索书号以及避免索书号 漏检,往往是定位得到的图像区域略大于索书号的真实区域。索书号定位主要存在两个问题:(1)受不均匀光照和褪色的影响,索书号的纹理特征、颜色特征以及形状特征等有较大的变化,可靠性相对较差;(2)有的索书号由1个字符串组成,有的索陆号由2个字符串组成,而在索书号的周围附近还会存在其他文字,如出版社名称和作者姓名。因此,将索书号与其他文字相区别比较困难。 第二阶段:索书号提取是在定位得到的索书号区域中,将索书号字符与周围目标和背景相 互分离。通过二值化处理,能将字符与背最相互分离。但由于定位得到的图像区域略大于真实索 书号区域,二值化后在索书号字符附近可能会存在一些非字符目标,影响后续的单字切分和识别。 所以,二值化后采用连通域滤波进一步消除索书号周围的非字符目标。索书号提取主要存在的问题:(1)不均匀光照增大了索书号图像的灰度值变化范围。(2)褪色程度的不同则降低了字符与背景的对比度。(3)污迹的影响。上述因素的存在不仅使得确定二值化过程中合理的阈值非常困难,而且会改变索书号字符的形状特征,最终影响连通域滤波的性能。 第三阶段:索书号字符切分是将索书号字符串切分成一个个字符,以提供给识别算法进行识 别。单字切分的结果如何将直接影响识别结果,而且切分好坏除字符能否正确识别之外,没有较 好的判别依据。因此,单字切分往往与字符识别紧密结合在一起。 索书号的单字切分可以分为两种情况:非粘连单字切分和粘连字符的单字切分。非粘连单字 切分比价容易解决。但质量较差索书号图像二值化处理后,相邻字符可能会发生粘连。而粘连索 书号切分存在的主要问题是(1)粘连字符的切分比较困难:(2)索书号字符发生粘连有一部分是字符 的笔画发生变形所致,如笔划宽度变粗等。即使正确的切分也不一定能够完全修正笔画的变形, 精品文档 随意编辑 即无法通过粘连切分恢复字符的原形。 第四阶段:索书号单字识别。印刷体单字识别的研究已经相当成熟,只是与其他应用领域的 文字识别相比,索书号文字的质量较差,存在字符不均匀褪色,笔划残缺以及大面积污迹等问题, 精品文档
随意编辑 2索书号文字图像分割 复杂背景图像中的文字定位和分割是从图像中获取文字信息的关键步骤,直接影响到后续文字识别的准确性,它在机器人视觉.汽车牌照自动识别,计算机文本自动输入,邮件地址自动识别,集装箱编号自动识别以及视频图像内容的检索等系统中都有广泛的应用。CCD拍摄的图书索书号图像如图2-1所示.图像中除了索书号还包含尤其他文字,红色条形框还包含有其他文字,红色条形框以及装饰景物等,为了能够正确识别该书的索书号,首先必须从图像中正确分割出索书号图像。
图2-1 图书索书号图像 但是,从图像尤其场景图像中自动定位和分割文字是比较困难的,其主要原因有以下几个方面:第一,文字嵌入在图像中,并与其它图形共存,如边框,商标,装饰物以及污点等;第二,由于文字颜色退化,文字颜色不均匀,热切背景颜色有食欲吻脖子颜色差异很小;第三,文字尺寸大小变化;第四,关照条件无法控制,广州不均匀;第五,索书号文字与其他文字。 本课题利用基于边缘点数量统计的文字图像分割方法。根据图书馆索书号的制定规则,索书号文字图像具有如下特征:第一,索书号文字采用黑色应刷;第二,索书号文字的数量至少为3个;精品文档 随意编辑 第三,索书号字符水平排列;第四,索书号贴在书脊的下半部分。它的算法流程如图2-2所示,实验结果证明,该方法具有定位精度高,准确率高,抗噪能力强,并在“索书号自动识别系统”中取得理想效果。
图2-2 索书号图像分割算法流程 2.1 HSI彩色空间转换 摄像头拍摄的彩色图片的像素点通常是采用24位RGB表示。但R,G和B3分量之间有很高
Canny算子检测 索书号边缘点彩色分割 文字图像行区域检测
HSI彩色空间转换
文字图像列区域检测 边界调整 精品文档
随意编辑 的相关性,直接利用这些分量常常不嫩得到所需的分割效果。比较接近人堆颜色视觉感知的是色度,饱和度和亮度空间。其中I表示颜色的敏感程度,H表示不同的颜色,S表示颜色的深浅,I分量与彩色信息无关,H和S与人感受彩色的方式紧密相连。 本算法中,只对边缘点进行财社分割,切自用S分量。英雌,问了减少算法的耗时,首先子转换I分量,如图2-3所示,待边缘检测出来后,再堆边缘点进行S分量计算。转换关系如下: I=(R+G+B)/3 (2-1) S=1-3/(R+G+B)*[min(R,G,B)] (2-2)
图2-2 HSI彩色空间的I分量图 2.2 Canny算子检测
Canny算子边缘检测先计算X和Y方向的梯度平方和,局部最大的梯度幅值局部变化最大的点的过程叫非极大值抑制。 Canny算子边缘检测有如下3个指标:第一,对每个边缘点有唯一的响应,得到的边缘为单像素狂;第二,错误率最低,即要少将真正的边缘点丢失也要少将非边缘点判为边缘点;第三,高位置精度,检测的边缘应在正真的边界上。为此,Canny像影帝定义了3给准函数衣表达上述指标的约束:a,信噪比函数准则;b,定位精度准这函数;c,单边缘响应准这函数。这三个准则相结合可以检测的最佳的边缘。 Canny算子中有3个参数,σ是高斯函数闻不得参数,他控制平滑程度:高阈值(TG)和低阈值(TL)。实验中σ设置为1,TL=0.4*TG。这样在Canny算子中只保留了一个参数高阈值(TG)。实际应用中,TG取值只需要满足两个条件:第一,确保尽可能地检测出索书号文字的边缘点,这粗限定了TG取值的最高上限;第二,确保加边缘尽可能少,这限定了TG取值的下限。由于文字和背