当前位置:文档之家› 一种嵌入式语音识别控制模块的设计与实现

一种嵌入式语音识别控制模块的设计与实现

一种嵌入式语音识别控制模块的设计与实现
一种嵌入式语音识别控制模块的设计与实现

第16卷 第4期厦门理工学院学报V o.l 16 N o .4

2008年12月Journa l of X ia m en U niversity of T echno logy D ec .2008

[收稿日期]2008-10-04 [修回日期]2008-11-19

[基金项目]福建省教育厅科技项目(J A 08219)[作者简介]徐敏(1963-),男,福建龙岩人,副教授,从事嵌入式技术与智能控制研究.

一种嵌入式语音识别控制模块的设计与实现

徐 敏1,邹 莹2,魏洪兴2

(1.厦门理工学院电子与电气工程系,福建厦门361024;2.北京航空航天大学机器人研究所,北京100191)

[摘 要]在分析语音识别原理的基础上,结合机器人系统人机交互需求,提出了一种基于L i nux 应用

平台、S3C2410X 为处理器的低功耗、高性能的嵌入式语音识别控制模块,并分别从模块的硬件结构、软件

流程进行分析和设计,通过硬件平台的搭建和软件程序的实现,达到了硬件设计简单、控制灵活、人机交

互便捷的目的.

[关键词]机器人;语音识别;嵌入式系统;隐式马尔可夫模式

[中图分类号]TP391 [文献标志码]A [文章编号]1008-3804(2008)04-0043-04

0 引言

随着计算机技术、模式识别等技术的发展,适应不同场合的语音识别系统相继被开发出来,语音识别及处理技术在计算机、信息处理、通信与电子系统、自动控制等领域的应用也越来越广泛.嵌入式语音识别技术已经发展到第二代,即以隐式马尔可夫模式识别方法为主要技术来实现对非特定语音的识别,这种技术的发展降低了识别计算复杂度,并提高了识别准确率

[1].同时在语音识别技术的革新中,也带来了语音识别在机器人交互技术下一代的应用革新.

在智能机器人功能中,语音识别是人机交互的重要组成部分之一,而在语音采样基础上的识别,是机器人传感器融合中的重要环节,它用以接收人声的控制命令和信息交互.在传统的语音识别应用中,多采用PC 或DSP 来实现,前者的目的是利用PC 较强的处理速度来实现模拟定点运算,后者则是直接利用DSP 的定点运算能力完成,但二者的功耗均较大,不适合应用于对功耗敏感的嵌入式计算场合.DSP 处理器发展多年到今天已经品种繁多,如TI 公司和ADI 公司等几大阵营有多款优秀的DSP 处理器芯片,但它们仍然没有能够有效降低功耗到消费电子的水平,使得使用高性能嵌入式处理器来模拟定点运算,成为了这类低功耗需求的主要实现策略.

语音识别除要求高识别率外,还应考虑软硬件设计简单、价格低廉、可移植性好、外围控制灵活、人机交互便捷等特点.为此,本文利用高性能ARM 处理器S3C2410X 来运行语音识别引擎,设计了一种低功耗的嵌入式语音识别控制模块,并已在娱乐机器人、教育机器人中得到成功应用.1 语音识别原理与功能分析

1 1 语音识别原理

语音识别根据实际需要和应用场合的不同,可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别.语音识别方法很多,如动态时间归整法(Dyna m ic T i m e W ar p i n g )、隐式马尔可夫法(H i d den M arkov M odels)、人工神经网络法(A rtific ialN er va lN et w ork)等,隐式马尔可夫法对非特定人连续语音有很高的识别率,目前一般都采用基于隐式马尔可夫法的识别方法作为基本算法,采用模

厦门理工学院学报2008年式匹配的原理来实现语音识别功能

.

语音识别原理如图1所示.预处理模块,对输入的原始语音信号进行处理,滤除掉其中不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理.特征提取模块,负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数,以降低维数并便于后续处理.在训练阶段,用户输入若干次训练语音,系统经预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模型库.在识别阶段,将输入的语音的特征矢量参数和参考模型库中的模型进行相似性度量比较,将相似度最高的模型所属的类别作为识别的中间候选结果输出.后处理模块,对候选识别结果继续处理,通过语言模型、词法、句法、和语义信息的约束,得到最终的识别结果

[2-3].1 2 功能分析

机器人的语音识别功能模块作为一个可替换的独立单元,其功能较为静态、单一,人机交互的约束和逻辑确定,主要完成人与机器人模块之间的音频输入处理,音频数据采样,音频PC M 数据处理,模式识别,进而推理出有限词条库中对应词条文本的过程.其中数据采样可以由专门的音频A /D 来实现,音频PC M 数据处理和模式识别及推理可以由高性能ARM 处理器实现.另外,音频的播放则也可以使用音频D /A 实现声音输出.

为了实现上述处理和运算,这里使用了AR M 处理器.S3C2410X 是Sa m sung 公司推出的一款低价位、低功耗、高性能的32位RISC 嵌入式处理器,外围接口丰富,易于系统平台构建,具有内置4K SRAM,内置Flash 控制器,LCD 控制器,SD 控制器,两个USB HOST,一个USB DE V I CE ,4个P WM 定时器和一个内部定时器,看门狗定时器,117个通用I/O ,56个中断源,24个外部中断,8通道10位ADC 和触摸屏接口,4个带外部请求线的DMA 等等,处理频率可以达到200MH z ,而功耗极低,不需要散热片,适合低功耗的嵌入式语音识别控制[4].

2 模块硬件结构设计

语音识别模块的硬件结构包括3个主要部分:核心系统部分,人机接口部分和调试接口部分如图2所示.

44

第4期徐敏,等:一种嵌入式语音识别控制模块的设计与实现2 1 核心系统部分

这部分主要是实现了基本的系统核心功能,即ARM 处理器所需要的最小系统.AR M 系统的最小系统包括电源部分、处理器部分、复位电路、存储器部分等.

由于S3C2410支持Nand Flash Boo,t 因此在核心系统设计中,模块采用了简洁的设计,使用32M SDRA M 和64M Nand Flash ,利用Nand Flash 既充当启动存储介质又充当系统存储介质,其中SDRAM 提供系统及应用程序运行的内存空间,Nand Flash 主要存放系统内核映像、系统库、文件系统和应用程序等.

核心系统部分除了包含最小系统之外,还包含了音频编解码和放大部分.这里使用了集成芯片WM 8731L 和音频运算放大LMV 358.其中WM 8731L 是W o lfson 半导体公司生产的一款极高性价比的音频DA 芯片,其音频接口使用标准IIS ,并使用标准TTL 的II C 接口进行采样控制,且带有AD 输入采样保持和增益开关等,与各种处理器的接口非常方便.在设计中使用S3C2410的II S 接口和II C 接口直接连接WM 8731L ,保持了整个设计的简洁.另外,还使用了稳压芯片进行外部电源转换,以提供整个模块3 3V 和1 8V 电源的需要.

2 2 人机接口部分

人机接口部分主要是与语音识别和基本交互密切相关的人机接口部分的电路和接插件等,如复位按钮,电源接口,电源开关等,是实现人机交互的必要部分.

2 3 调试接口部分

调试接口部分主要是实现对系统进行调试的基本接口,该接口主要是对ARM 系统的软件运行进行监视和交互,特别是在系统启动阶段,调试接口的使用较多.ARM 系统运行的调试接口主要包含两部分,一部分是下载接口,用来下载系统Bootloader 和内核映像,如J TAG 、网络接口等,另一部分是监控接口,用于系统或应用程序运行加载的观测.调试接口部分只提供调试使用,而不保留在最终模块上.

3 模块实现与软件设计

模块核心系统部分设计应用了Linux 系统.在上述硬件系统上运行Linux 2 6 13系统内核,Linux 2 6 13包含了A lsa (Advanced L i n ux Sound A rchitect u re)驱动工程,提供了音频AD /DA WM 8731L 的驱动程序.在音频数据输入输出采样的基础上编写应用程序,实现语音识别的实例:人与模块之间简单对话应答或命令操作.

实现应答首先需要指定可选的答复词条以提供模式识别.在此基础上,应用包括3个部分:声卡初始化,语音识别引擎操作和识别结果功能处理.如图3所示

.

3 1 声卡初始化

调用vo ice_init ()函数,初始化WM 8731L 并打开声音采集和增益,进行声卡初始化配置,之后打开声卡设备. 45

厦门理工学院学报2008年3 2 语音引擎操作

第二代语音识别技术可以实现非特定人无训练的识别,只需要提前预置要识别的词条,就可以得到模式识别匹配的结果,其识别准确率在90%以上.非特定人的连续语音识别引擎的工作流程如下:初始化引擎 设置词条 (开始识别 返回识别结果) 停止,其中括号中内容为循环执行部分.程序的状态转换图如图3(a)所示.

初始化引擎:调用M SR _I n it (vo id)对语音识别引擎进行基本的初始化工作.

设置词条:即向引擎状态机中加入词条组成的字符串,调用M SR _Add A ctive W ord (M SR _VO C AB ULARYHANDLE hVoc ,char *w or d_i n pu,t char *w or d_na m e);其中参数hVoc 为被识别词条对应的句柄,参数w ord_i n put 注入预先需要识别的词条,w ord_na m e 参数一般使用NULL .

识别:在配置好上述词条后可以调用函数M SR _Set V ocabulary To D ecoder (M SR _VOCAB ULARY HANDLE hVoc)使用该词条,运行M SR_Start(vo id)启动识别引擎,在1s 之内即可输出识别结果显示相应状态.

停止:如需要停止运行识别引擎,调用M SR _Stop(void)执行停止.

按照上述流程把相应步骤封装为函数,其函数接口如表1所示.应用程序与识别引擎之间交互如图3(b).

表1 语音识别函数接口

Tab 1 Function in t e rface o f the speech recogn ition

接 口

功 能通信模式i nt i nitialize ()

初始化引擎请求/应答模式i nt setIte m (i nt i d ,

Str i ng ite m )设置词条请求/应答模式vo i d start ()

启动识别命令模式vo i d stop ()

停止识别命令模式S R Event 返回识别结果i d

事件模式

3 3 识别结果功能处理

在得到识别结果id 后,执行相应的语音指

令.若语音指令的行为效果为语音应答,则调用

m player 播放预先存储的w av 文件,对应产生音频

输出,实现人机对话.若语音指令为操作行为,

则执行相应的控制命令.

4 结语

通过对一种基于ARM 处理器的高性能低功耗嵌入式语音识别控制模块的组成结构、硬件系统和软件流程进行分析和设计,达到了硬件设计简单、控制灵活、人机交互便捷的目的,而基于li n ux 系统嵌入式应用平台和隐式马尔可夫模式识别方法,识别率高、可移植性好、扩展性强.控制模块在智能玩具、智能机器人等多个系统中得到应用(如图4所示),既可以单独使用,亦可作为模块嵌入到其它语音识别系统中应用.

[参考文献]

[1]刘斌,杜利民.基于M PC5200的嵌入式非特定人连续语音识别系统[J].中国科学院研究生院学报,2006(3):174 177.

[2]邢东洋,杨明极.非特定人语音指令识别系统的研究与实现[J].哈尔滨理工大学学报,

2008(4):75 77.

[3]赵力.语音信号处理[M ].北京:机械工业出版社,2003.

[4]王田苗,魏洪兴.嵌入式系统设计与实例开发[M ].北京:清华大学出版社,2008.(下转第51页)

46

第4期

赵晶,等:基于DSP 的光伏并网系统的设计33(6):67 69.[7]华建军,沈艳霞,纪志成.基于PSI M 断续导通模式的DC-DC 变换器的建模和仿真研究[J].电机与控制学报,2007,11(5):522 528.

D esign of a G ri d connected PV Syste m Based on DSP

Z HAO Ji n g 1,LI N G Zh i qiang 2

(1.Depart m ent o f E l ec tron i c and E lectr i ca l Eng i neer i ng ,X i am en U n i v ers it y o f T echno logy ,X i am en 361024,Chi na ;

2.M yw ay L abs Co.L td .,Shangha i 201203,Ch i na)

Abst ract :A photovo ltaic syste m i n the p latfor m ofDSP is introduced i n th i s paper in w hich a ne w w ay is app li e d to trace the m ax i m um po w er po i n t based on the i m pr oved accelerati n g si m plex m ethod w ith a vo ltage contro lled f u ll bri d ge i n verter .The online variable step can also regulate the vo ltage convergence rate ,and the phase locked control c ircuit is desi g ned to synchronously trace frequency and phase o f pow er gri d auto m atical l y .Test data show that the var i a b le stepMPPT a l g orithm s co mb i n ed w it h the opti m izati o n techno logy can qu ick l y and accurate l y track the m ax i m um po w er po i n t and the s m aller fluctuations and the higher stab ility can thus be ach ieved .Further m o re ,the i n verter current and the po w er vo ltage feed back to the po w er g ri d w ith the sa m e frequency and the sa m e phase can effective l y i m prove the efficiency and reliability of inverter syste m.

K ey w ords :DSP ;gr i d connected PV syste m;m od ifi e d accelerati n g si m plex m ethod ;vari a ble step ;phase locked control

(上接第46页)

D esign and I mple m entati on of an Embedded

Speech R ecognition ControlM odule

XU M i n 1,Z OU Y i n g 2,W E IH ong x i n g 2

(1.Depart m ent o f E l ec tron i c and E lectr i ca l Eng i neer i ng ,X i am en U n i v ers it y o f T echno logy ,X i am en 361024,Chi na ;

2.R obotics Instit u te ,B ei hang U n i versity ,Be iji ng 100191,Ch i na)

Abst ract :A high perfor m ance e m bedded speech recognition contro lm odu le has been designed based on t h e L i n ux platfor m and S3C2410X processor ,w hich is on the basis of the princ i p le o f the speech recogn ition and co m bined w ith the de m and for HM I o f robot syste m.In t h is paper ,the str ucture o f the hardw are and soft w are about this m odu le are ana l y zed and devised respectively .The si m p le design of t h e hardw are and the flex i b le control are ach ieved t h ough t h e buildi n g of the hardw are and so ft w are platfor m ,and the convenient hu m an co m puter interaction is also ob tained .

K ey w ords :robo ;t speech recogn iti o n;e m bedded syste m;h i d den m ar kov m odel

51

一种嵌入式语音识别模块的设计与实现

嵌入式系统结业(论文) 基于STM32的嵌入式 语音识别模块设计 学生姓名: 所在学院:信息技术学院 班级:电气 学号: 中国·大庆 2013 年12 月

摘要:介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 关键词:ARM;语音识别;对话管理;LD3320;μC/OS-II 1 引言 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC机或笔记本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 2 模块整体方案及架构

现有的语音识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。 基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。 语音识别技术在国内外的发展十分迅速。目前国内在PC应用领域,具有代表性的有:科大讯飞的InterReco2.0、中科模式识别的Pattek ASR3.0、捷通华声的jASRv5.5;在嵌入式应用领域,具有代表性的有:凌阳的SPCE061A、ICRoute的LD332X、上海华镇电子的WS-117。 本文的语音识别方案是以嵌入式微处理器为核心,外围加非特定人语音识别芯片及相关电路构成。语音识别芯片选用ICRoute公司的LD33 20芯片。 3 硬件电路设计 3.1 语音识别电路 图3为语音识别部分原理图,参照了ICRoute发布的LD3320数据手册进行设计。LD3320的内部集成了快速稳定的优化算法,不需外接Fla-sh、RAM,不需要用户事先训练和录音而完成非特定人语音识别,识别准确率高。

语音识别输入系统

IBM语音识别输入系统(ViaVioce) V9.1 简体中文光盘版| 用嘴巴控制电脑... sjyhsyj 2009-8-28 12:13:271# 软件大小:276.08MB 软件语言:多国语言 软件类别:国外软件 / 汉字输入 运行环境:Win9x/NT/2000/XP/ 软件介绍: 该系统可用于声控打字和语音导航。只要对着微机讲话,不用敲键盘即可打汉字,每分钟可输入150个汉字,是键盘输入的两倍,是普通手写输入的六倍。该系统识别率可达95%以上。并配备了高性能的麦克风,使用便利,特别适合于起草文稿、撰写文章、和准备教案,是文职人员、作家和教育工作者的良好助手。 IBM潜心研究26年,他领导了世界的语音识别技术,其语音识别产品在全球销售已达一百万套以上。使用语音输入方式,您的工作空间更加自由舒畅: *即使您不会打字,也可迅速准备好文稿; *只要集中精力思考问题,无须琢磨怎样拼音,怎样拆字; *当您疲劳时,闭上眼、伸伸腰,双手方在脑后,然后轻松地说:开始听写吧... ... 注:价值超数千元的IBM的中文语音录入工具,有耳麦的朋友可以试一试,也可以当作学习普通话的工具,没有理由不下载使用它。 IBM ViaVoice语音输入系统详解 作者: 艾寒出处: 天极网 目前汉字输入的方式主要有四种:键盘输入,手写输入,扫描输入和我们现在要谈到的语音输入。让我们先来了解一下这四种输入方式。 键盘输入:键盘输入基本上是基于各种输入法,主要又分为字形输入法和拼音输入法。实际上字形输入法是不符合人的写作思维习惯,因为人们在措辞时,头脑中首先反映出的是即将这个词语的语音,所以字形输入法更适合专业录入人员使用。拼音输入法也分两种,一种以词语为输入单位,另一种以语句为输入单位,而后者不符合写作的思维习惯,因为人们在写作时是以词为思考单位。键盘输入法在输入速度有要求的情况下对于键盘操作、指法要求比较高; 手写输入:手写输入是最容易上手的输入方法,但是同样由于手写输入的先天不足,很难达到较高的输入速度; 扫描输入:扫描输入对于硬件要求比较高,主要是适用于资料的整理; 语音输入:语音输入对输入人员的键盘操作能力、指法要求很低,几乎可以说你只要会说汉语,就可以进行语音输入。 语音输入尤其是汉字语音输入经历了很长时间的研究和应用,到目前已经达到了一个相

嵌入式实时操作系统

嵌入式实时操作系统 嵌入式实时操作系统(Embedded Real-time Operation System,RTOS)。 1 嵌入式实时操作系统概念 当外界事件或数据产生时,能够接受并以足够快的速度予以处理,其处理的结果又能在规定的时间之内来控制生产过程或对处理系统作出快速响应,并控制所有实时任务协调一致运行的嵌入式操作系统。 2 嵌入式实时操作系统特点 1)多任务; 2)有线程优先级 3)多种中断级别 3 嵌入式实时操作系统应用 在工业控制、军事设备、航空航天等领域对系统的响应时间有苛刻的要求,这就需要使用实时系统。 采用嵌入式实时操作系统(简称RTOS)能够支持多任务,使得程序开发更加容易,便于维护,同时能够提高系统的稳定性和可靠性。

4 实时操作系统的必要性: 首先,嵌入式实时操作系统提高了系统的可靠性。 其次,提高了开发效率,缩短了开发周期。 实时操作系统的优缺点: 在嵌入式实时操作系统环境下开发实时应用程序使程序的设计和扩展变得容易,不需要大的改动就可以增加新的功能。通过将应用程序分割成若干独立的任务模块,使应用程序的设计过程大为简化;而且对实时性要求苛刻的事件都得到了快速、可靠的处理。通过有效的系统服务,嵌入式实时操作系统使得系统资源得到更好的利用。但是,使用嵌入式实时操作系统还需要额外的ROM/RAM 开销,2~5% 的CPU 额外负荷,以及内核的费用。 5 实时系统与非实时系统的根本区别 实时系统与非实时系统的根本区别在于:实时系统具有与外部环境及时交互作用的能力。也就是说实时系统从外部获取信息以及系统得出结论要在很短的限制时间内完成。 它具有嵌入式软件共有的可裁剪、低资源占用、低功耗等特点;实时任务之间可能还会有一些复杂的关联和同步关系,如执行顺序限制、共享资源的互斥访问要求等。 实时操作系统所遵循的最重要的设计原则是:采用各种算法和策略,始终保证系统行为的可预测性(predictability)。可预测性是指在系统运行的任何时刻,在任何情况下,实时操作系统的资源调配策略都能为争夺资源(包括CPU、内存、网络带宽等)的多个实时任务合理地分配资源,使每个实时任务的实时性要求都能得到满足。与通用操作系统不同,实时操作系统注重的不是系统的平均表现,而是要求每个实时任务在最坏情况下都要满足其实时性要求,也就是说,实时操作系统注重的是个体表现。

PCM嵌入式软件概要设计V1.0

分布式能源箱变测控装置规约转换模块项目软件(系统/概要)设计说明书 项目令号: 承担部门:微网所 编制:亮 E-mail/Tel: 审核: 会审: 批准:

国电自动化股份

软件系统/概要设计文档修改记录

摘要 本文对分布式能源箱变测控装置规约转换模块(简称规约转换模块,PCM)的嵌入式软件的总体架构设计进行描述。PCM配套的配置工具主要牵涉到数据库设计和界面设计,不包含在本文档的叙述围。 PCM以数据采集、转发为核心功能,嵌入式软件在架构设计上采用了数据中心模式。为保证数据转发效率,采用共享存方式的实时数据库设计。 为减小系统模块的耦合,给系统扩展留有足够空间,系统采用多进程方式独立实现各子功能。各子功能模块通过进程访问接口(PAI)进行通信,通信方式包括信号量和共享存两种。 为提高软件的兼容性,系统设计了硬件抽象层(HAL)模块和数据库访问接口(DAI)模块,将硬件平台和数据库的操作进行了统一封装。 为提高系统的稳定性,设计了守护进程模块。守护进程通过信号量握手来监控实时数据库进程、通信规约进程等其他进程的运行状况,可以在被监视的进程发生异常时对其及时修复。

目录 第1篇概述 (3) 1.1 围 (3) 1.2 设计依据 (3) 1.3 术语、定义和缩略语 (3) 1.3.1 术语、定义 (3) 1.3.2 缩略语 (4) 第2篇系统总体设计 (4) 2.1 体系结构概述 (4) 2.2 系统体系结构 (5) 2.3 标准化设计 (6) 2.3.1 模块标准化设计 (6) 2.3.2 接口标准化设计 (6) 2.3.3 界面格式 (6) 2.3.4 编码约定 (7) 2.3.5 注释约定 (7) 2.4 系统版本规划 (8) 2.5 系统处理流程 (9) 2.6 子系统说明 (10) 2.6.1 实时数据库RDB (10) 2.6.2 历史数据库HDB (10) 2.6.3 通信规约模块 (11) 2.6.4 辅助模块 (11) 2.6.5 守护进程模块 (11) 2.6.6 网关模块 (12) 2.7 系统数据结构设计 (12) 2.7.1 逻辑结构设计要点 (12) 2.7.2 物理结构设计要点 (12) 2.7.3 数据与子系统关系 (12) 2.8 开发和运行环境 (12) 2.8.1 硬件环境 (12) 2.8.2 软件环境 (13) 2.8.3 外购件分析 (13) 2.9 可靠性设计 (13) 2.10 可测试性设计 (13) 2.11 安全性设计 (14) 2.12 出错处理设计 (14) 2.13 设计依据与需求跟踪 (14) 第3篇系统运行说明 (15) 3.1 配置说明 (16) 3.2 系统应用方式 (16) 3.3 代码目录说明 (16)

基于STM32的嵌入式语音识别模块设计实现

基于STM32的嵌入式语音识别模块设计实现 介绍了一种以ARM 为核心的嵌入式语音识别模块的设计与实现。模块的 核心处理单元选用ST 公司的基于ARM Cortex-M3 内核的32 位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320 芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II 来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC 机或笔记 本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC 机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 模块整体方案及架构 语音识别的基本原理如图1 所示。语音识别包括两个阶段:训练和识别。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。这

基于单片机的语音识别系统 毕业设计

基于单片机的语音识别系统毕业设计 目录 摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

嵌入式软件开发流程图

嵌入式软件开发流程 一、嵌入式软件开发流程 1.1 嵌入式系统开发概述 由嵌入式系统本身的特性所影响,嵌入式系统开发与通用系统的开发有很大的区别。嵌入式系统的开发主要分为系统总体开发、嵌入式硬件开发和嵌入式软件开发3大部分,其总体流程图如图1.1所示。 图1.1 嵌入式系统开发流程图 在系统总体开发中,由于嵌入式系统与硬件依赖非常紧密,往往某些需求只能通过特定的硬件才能实现,因此需要进行处理器选型,以更好地满足产品的需求。另外,对于有些硬件和软件都可以实现的功能,就需要在成本和性能上做出抉择。往往通过硬件实现会增加产品的成本,但能大大提高产品的性能和可靠性。 再次,开发环境的选择对于嵌入式系统的开发也有很大的影响。这里的开发环境包括嵌入式操作系统的选择以及开发工具的选择等。比如,对开发成本和进度限制较大的产品可以选择嵌入式Linux,对实时性要求非常高的产品可以选择Vxworks等。

1.2 嵌入式软件开发概述 嵌入式软件开发总体流程为图4.15中“软件设计实现”部分所示,它同通用计算机软件开发一样,分为需求分析、软件概要设计、软件详细设计、软件实现和软件测试。其中嵌入式软件需求分析与硬件的需求分析合二为一,故没有分开画出。 由于在嵌入式软件开发的工具非常多,为了更好地帮助读者选择开发工具,下面首先对嵌入式软件开发过程中所使用的工具做一简单归纳。 嵌入式软件的开发工具根据不同的开发过程而划分,比如在需求分析阶段,可以选择IBM的Rational Rose等软件,而在程序开发阶段可以采用CodeWarrior(下面要介绍的ADS 的一个工具)等,在调试阶段所用的Multi-ICE等。同时,不同的嵌入式操作系统往往会有配套的开发工具,比如Vxworks有集成开发环境Tornado,WindowsCE的集成开发环境WindowsCE Platform等。此外,不同的处理器可能还有对应的开发工具,比如ARM的常用集成开发工具ADS、IAR和RealView等。在这里,大多数软件都有比较高的使用费用,但也可以大大加快产品的开发进度,用户可以根据需求自行选择。图4.16是嵌入式开发的不同阶段的常用软件。 图1.2 嵌入式开发不同阶段的常用软件 嵌入式系统的软件开发与通常软件开发的区别主要在于软件实现部分,其中又可以分为编译和调试两部分,下面分别对这两部分进行讲解。 1.交叉编译 嵌入式软件开发所采用的编译为交叉编译。所谓交叉编译就是在一个平台上生成可以在另一个平台上执行的代码。在第3章中已经提到,编译的最主要的工作就在将程序转化成运行该程序的CPU所能识别的机器代码,由于不同的体系结构有不同的指令系统。因此,不同的CPU需要有相应的编译器,而交叉编译就如同翻译一样,把相同的程序代码翻译成不同CPU的对应可执行二进制文件。要注意的是,编译器本身也是程序,也要在与之对应的某一个CPU平台上运行。嵌入式系统交叉编译环境如图4.17所示。

基于STM32单片机的嵌入式语音识别系统设计

基于STM32单片机的嵌入式语音识别系统设计 陈心灵1,钱宁博2,胡佳辉1,王战中1 (1.石家庄铁道大学机械工程学院,河北石家庄050043;2.石家庄铁道大学电气与电子工程学院,河北石家庄 050043) 摘要:设计了一款以STM32F103为核心的自然语言识别系统,为满足实时语音识别系统对内存资源和运算速度的要求,基于硬件资源合理 设计语音处理算法,在嵌入式平台上实现了对孤立词语的语音识别。首先根据背景噪声和语音信号的时域特征差异设定相应门限值,从而实现了对语音信号的端点检测。然后针对语音识别中传统梅尔倒谱系数对语音的高频信息敏感度较低,对语音信号分别提取梅尔倒谱系数(MFCC)与翻转梅尔倒谱系数(IMFCC),结合Fisher 准则构造混合特征参数。最后采用动态时间规整算法实现语音识别。因系统体积小、便携性好等特点,易于实现对不同设备的语音控制,有一定的市场前景。关键词:语音识别;梅尔倒谱系数;翻转梅尔倒谱系数;Fisher 准则;动态时间规整算法;STM32F103 中图分类号:TP391.4 文献标识码:A 文章编号:1009-9492(2019)06-0135-03 Embedded Speech Recognition System Design Based on STM32F103 CHEN Xin-ling 1,QIAN Ning-bo 2,HU Jia-hui 1,WANG Zhan-zhong 1 (1.College of Mechanical Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ; 2.College of Electrical and Electronic Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ) Abstract:A natural language recognition system is designed based on STM32F103.To meet the requirements of real-time speech recognition system for memory resources and computing speed ,the speech processing algorithm is designed based on hardware resources and speech recognition of isolated words is implemented on the embedded platform.Firstly ,the corresponding threshold is set according to the time domain characteristic difference of the speech signal and the background noise and thereby realizing the endpoint detection of the speech signal.Concerning the traditional Mel Frequency Cepstral Coefficient (MFCC)in speech recognition is less sensitive to high frequency signals of speech ,MFCC and IMFCC (Inverted MFCC)are extracted respectively for the speech signal and the Fisher criterion is used to construct the mixed feature parameters.Dynamic time warping algorithm is used in speech recognition process.Due to the small size of the system and good portability ,it is easy to implement voice control for different devices and has much marker potential. Key words:speech recognition ;MFCC ;IMFCC ;Fisher criterion ;DTW ;STM32F103 收稿日期:2018-12-22 DOI:10.3969/j.issn.1009-9492.2019.06.045 0引言 语音识别是人机交互很重要的模块,应用领域相当广阔。集成电路的快速发展使得将具有先进功能的语音识别系统固化到更加微小的芯片或模块上成为可能[1],更便于语音识别系统的推广与使用,嵌入式语音识别技术开发变得更加有价值。 本文设计一个基于STM32F103单片机的嵌入式语音识别系统,包括硬件设计和软件设计 [2-3] 。语音特征提取在传 统梅尔倒谱系数基础上,运用Fisher 比结合梅尔倒谱系数与翻转梅尔倒谱系数,构建了混合特征参数[4],识别算法采用动态时间规整算法。硬件设计上实现了语音信号采集、语音信号处理、语音信息存储、语音识别结果的显示等功能。 1系统硬件设计 本系统主要由电源部分(LDO )、主控(STM32F103)、语音采样电路、LCD 显示模块等组成,如图1所示。 1.1MCU 选择 STM32F103开发板基于Cortex-M3处理器,内置2个 12位模数转换器,2个DMA 控制器,共12个DMA 通道,其可以满足本系统中的语音处理需求。1.2采样电路 采样电路选用差分放大电路,抑制共模干扰,放大有用信号,有效地解决采样噪声硬件预处理的问题。其原理图如图2。 在设计过程中,其输出端(即Q1\Q2的C 极)静态工作点为1/2Vcc 最为适宜,能保障其最大动态输出范围。电路设计尽可能使Q1、Q2的静态工作参数一致,构成对 称电路。 图1系统硬件框图 Fig.1The system hardware block diagram · ·135

嵌入式控制系统平时作业

1、什么是嵌入式系统? 答:嵌入式系统(Embedded system),是一种“完全嵌入受控器件内部,为特定应用而设计的专用计算机系统”,根据英国电气工程师协会(U.K. Institution of Electrical Engineer)的定义,嵌入式系统为控制、监视或辅助设备、机器或用于工厂运作的设备。与个人计算机这样的通用计算机系统不同,嵌入式系统通常执行的是带有特定要求的预先定义的任务。由于嵌入式系统只针对一项特殊的任务,设计人员能够对它进行优化,减小尺寸降低成本。嵌入式系统通常进行大量生产,所以单个的成本节约,能够随着产量进行成百上千的放大。 2、举例说明嵌入式的应用。 答: 工业控制 基于嵌入式芯片的工业自动化设备将获得长足的发展,目前已经有大量的8、16、32 位嵌入式微控制器在应用中,网络化是提高生产效率和产品质量、减少人力资源主要途径,如工业过程控制、数字机床、电力系统、电网安全、电网设备监测、石油化工系统。就传统的工业控制产品而言,低端型采用的往往是8位单片机。但是随着技术的发展,32位、64位的处理器逐渐成为工业控制设备的核心,在未来几年内必将获得长足的发展。 交通管理 在车辆导航、流量控制、信息监测与汽车服务方面,嵌入式系统技术已经获得了广泛的应用,内嵌GPS模块,GSM模块的移动定位终端已经在各种运输行业获得了成功的使用。目前GPS设备已经从尖端产品进入了普通百姓的家庭,只需要几千元,就可以随时随地找到你的位置。

信息家电 这将称为嵌入式系统最大的应用领域,冰箱、空调等的网络化、智能化将引领人们的生活步入一个崭新的空间。即使你不在家里,也可以通过电话线、网络进行远程控制。在这些设备中,嵌入式系统将大有用武之地。 家庭智能管理 水、电、煤气表的远程自动抄表,安全防火、防盗系统,其中嵌有的专用控制芯片将代替传统的人工检查,并实现更高,更准确和更安全的性能。目前在服务领域,如远程点菜器等已经体现了嵌入式系统的优势。 POS网络 公共交通无接触智能卡(Contactless Smartcard, CSC)发行系统,公共电话卡发行系统,自动售货机,各种智能ATM终端将全面走入人们的生活,到时手持一卡就可以行遍天下。 环境工程 水文资料实时监测,防洪体系及水土质量监测、堤坝安全,地震监测网,实时气象信息网,水源和空气污染监测。在很多环境恶劣,地况复杂的地区,嵌入式系统将实现无人监测。 3、嵌入式操作系统的作用是什么? 答:嵌入式操作系统的主要好处就是屏蔽了底层硬件的差别,给上层应用提供统一的接口,并管理进程调度和资源(如CPU时间、内存)分配等。就跟windows操作系统一样,不管你是用华硕的电脑还是戴尔的电脑,只要装了windows操作系统,你都可以用office、词霸之类的软件。人机界面(MMI)是上层应用show出来的。 简单的嵌入式应用不需要嵌入式操作系统的支持,如单片机,直接用汇编程序就能实现特定的功能。要跑的应用多了,就需要操作系统来进行管理。

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示: 未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法 目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。 动态时间规整算法(Dynamic Time Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。 隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。 矢量量化(Vector Quantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。 人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

用于智能家居语音识别系统设计

仪器科学与电气工程学院 本科毕业论文(设计)开题报告题目:用于智能家居的语音识别系统设计 学生姓名:学号: 专业:电气工程及其自动化 指导教师:讲师 2015年1月3日

1. 选题依据 1.1选题背景 语言作为人类信息交流中最重要的和最方便的方式,人与机器的交流能否像人与人一样自如,是人们研究的问题。控制论创始人维纳在1950年就曾指出:“通常,我们把语言仅仅看作人与人之间的通信手段,但是,要使人向机器,机器向人以及机器向机器讲话,那也是完全办得到的”。 随着现代科学技术的进一步发展和人民生活水平不断的提高,人们对家庭住宅需求的概念也发生了彻底的改变。人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华,向着追求品味、安全、舒适、便捷和智能方向发展。现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要,同时还可以提供充分的安全防护、物业管理等手段。智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物,它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来,IT产业的发展和人们生活水平的提高,“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动,智能家居的生活已经近在咫尺。 在智能家居中传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控越来越多,使用极不方便。这时,我们可以釆用语音识别的方式控制,例如,在观看电视频道时,我们可以很方便地直接说出“中央一套”来,所以语音识别及控制在智能家居中尤其重要。 1.2国内外研究现况 1、语音识别技术的发展 就技术而言,目前国内外对语音识别理论及各种实用算法的研究是一热点。人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究。语音识别技术发展到今天,PC 机的语音识别系统己经趋于成熟,而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片。近几年来,个人消费类电子产品的广泛使用,使大量的识别系统从实验室 PC 平台转移到嵌入式平台设备中,现在嵌入式对特定人语音识别系统的识别精度己经达到 98%以上。嵌入式语音识别系统和 PC 机的语音识别系统相比,虽然其运算速度和内存容量有一些限制,但是它也有各自的特点。嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点,是嵌入式语音识别系统和 PC 机的语音识别系统相比的最大优势。而且嵌入式语音识别系统多为实时系统,当用户讲话后,系统能够立即完成词条识别并作出反应。这些特点决定了嵌入式语音识别系统的应用十分广泛。可以预测在近几年内,嵌入式语音识别系统的应用将更加广泛。各种语音识别系统将出现在市场上。根据美国专家预测,具有语音识别功能的产品可达 50 亿美元。在短期内还不可能具

嵌入式Linux应用软件开发流程

从软件工程的角度来说,嵌入式应用软件也有一定的生命周期,如要进行需求分析、系统设计、代码编写、调试和维护等工作,软件工程的许多理论对它也是适用的。 但和其他通用软件相比,它的开发有许多独特之处: ·在需求分析时,必须考虑硬件性能的影响,具体功能必须考虑由何种硬件实现。 ·在系统设计阶段,重点考虑的是任务的划分及其接口,而不是模块的划分。模块划分则放在了任务的设计阶段。 ·在调试时采用交叉调试方式。 ·软件调试完毕固化到嵌入式系统中后,它的后期维护工作较少。 下面主要介绍分析和设计阶段的步骤与原则: 1、需求分析 对需求加以分析产生需求说明,需求说明过程给出系统功能需求,它包括:·系统所有实现的功能 ·系统的输入、输出 ·系统的外部接口需求(如用户界面) ·它的性能以及诸如文件/数据库安全等其他要求 在实时系统中,常用状态变迁图来描述系统。在设计状态图时,应对系统运行过程进行详细考虑,尽量在状态图中列出所有系统状态,包括许多用户无需知道的内部状态,对许多异常也应有相应处理。 此外,应清楚地说明人机接口,即操作员与系统间地相互作用。对于比较复杂地系统,形成一本操作手册是必要的,为用户提供使用该系统的操作步骤。为使系统说明更清楚,可以将状态变迁图与操作手册脚本结合起来。

在对需求进行分析,了解系统所要实现的功能的基础上,系统开发选用何种硬件、软件平台就可以确定了。 对于硬件平台,要考虑的是微处理器的处理速度、内存空间的大小、外部扩展设备是否满足功能要求等。如微处理器对外部事件的响应速度是否满足系统的实时性要求,它的稳定性如何,内存空间是否满足操作系统及应用软件的运行要求,对于要求网络功能的系统,是否扩展有以太网接口等。 对于软件平台而言,操作系统是否支持实时性及支持的程度、对多任务的管理能力是否支持前面选中的微处理器、网络功能是否满足系统要求以及开发环境是否完善等都是必须考虑的。 当然,不管选用何种软硬件平台,成本因素都是要考虑的,嵌入式Linux 正是在这方面具有突出的优势。 2、任务和模块划分 在进行需求分析和明确系统功能后,就可以对系统进行任务划分。任务是代码运行的一个映象,是无限循环的一段代码。从系统的角度来看,任务是嵌入式系统中竞争系统资源的最小运行单元,任务可以使用或等待CPU、I/O设备和内存空间等系统资源。 在设计一个较为复杂的多任务应用系统时,进行合理的任务划分对系统的运行效率、实时性和吞吐量影响都极大。任务分解过细会不断地在各任务之间切换,而任务之间的通信量也会很大,这样将会大大地增加系统的开销,影响系统的效率。而任务分解过粗、不够彻底又会造成原本可以并行的操作只能按顺序串行执行,从而影响系统的吞吐量。为了达到系统效率和吞吐量之间的平衡折中,在划分任务时应在数据流图的基础上,遵循下列步骤和原则:

常见的四种嵌入式操作系统

(一)VxWorks VxWorks操作系统是美国WindRiver公司于1983年设计开发的一种嵌入式实时操作系统(RTOS),是Tornado嵌入式开发环境的关键组成部分。良好的持续发展能力、高性能的内核以及友好的用户开发环境,在嵌人式实时操作系统领域逐渐占据一席之地。 VxWorks具有可裁剪微内核结构;高效的任务管理;灵活的任务间通讯;微秒级的中断处理;支持POSIX 1003.1b实时扩展标准;支持多种物理介质及标准的、完整的TCP/IP网络协议等。 然而其价格昂贵。由于操作系统本身以及开发环境都是专有的,价格一般都比较高,通常需花费10万元人民币以上才能建起一个可用的开发环境,对每一个应用一般还要另外收取版税。一般不通供源代码,只提供二进制代码。由于它们都是专用操作系统,需要专门的技术人员掌握开发技术和维护,所以软件的开发和维护成本都非常高。支持的硬件数量有限。 (二)Windows CE Windows CE与Windows系列有较好的兼容性,无疑是Windows CE推广的一大优势。其中WinCE3.0是一种针对小容量、移动式、智能化、32位、了解设备的模块化实时嵌人式操作系统。为建立针对掌上设备、无线设备的动态应用程序和服务提供了一种功能丰富的操作系统平台,它能在多种处理器体系结构上运行,并且通常适用于那些对内存占用空间具有一定限制的设备。它是从整体上为有限资源的平台设计的多线程、完整优先权、多任务的操作系统。它的模块化设计允许它对从掌上电脑到专用的工业控制器的用户电子设备进行定制。操作系统的基本内核需要至少200KB的ROM。由于嵌入式产品的体积、成本等方面有较严格的要求,所以处理器部分占用空间应尽可能的小。系统的可用内存和外存数量也要受限制,而嵌入式操作系统就运行在有限的内存(一般在ROM或快闪存储器)中,因此就对操作系统的规模、效率等提出了较高的要求。从技术角度上讲,Windows CE作为嵌入式操作系统有很多的缺陷:没有开放源代码,使应用开发人员很难实现产品的定制;在效率、功耗方面的表现并不出色,而且和Windows一样占用过的系统内存,运用程序庞大;版权许可费也是厂商不得不考虑的因素。 (三)嵌入式Linux 这是嵌入式操作系统的一个新成员,其最大的特点是源代码公开并且遵循GPL协议,在近一年多以来成为研究热点,据IDG预测嵌入式Linux将占未来两年的嵌入式操作系统份额的50%。 由于其源代码公开,人们可以任意修改,以满足自己的应用,并且查错也很容易。遵从GPL,无须为每例应用交纳许可证费。有大量的应用软件可用。其中大部分都遵从GPL,是开放源代

【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

摘要 语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。 语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。经过统计,识别效果明显达到了预期目标。 关键词:语音识别算法;HMM模型;Matlab;GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time

设计和实现一个嵌入式自动语音识别

设计和实现一个嵌入式自动语音识别 系统 sujay Phadke Rhishikesh Limaye亚洲时报Siddharth维尔马 Kavitha Subramanian 孟买印度技术研究所 电机工程学系 个人所得税孟买Powai,孟买,400076,印度。 {sujay,rhishi,亚洲时报Siddharth kavitha}@ ee.iitb.ac.in 摘要 我们提出了一个新的嵌入式语音识别系统的设计。它结合了硬件和软件设计等方面实现依赖扬声器,孤立词,小词汇量语音识别系统。是基于规模的修正Mel频率倒谱系数(MFCC)特征提取和模板匹配采用动态时间规整(DTW)的。一种新的算法已经被用来改善一个字开始检测。围绕行业标准TMS320LF2407A的DSP硬件。作为一个通用的DSP24X系列的TI DSP 开发板电路板设计。据载,除了从DSP,外部SRAM,闪存,ADC接口的I / O接口模块和JTAG 接口。无论是硬件和软件已设计的同时,最小功率最大精度和便携式设备,以便实现高速识别。建议的解决方案是一个低成本,高性能,可伸缩的替代现有的其他产品。 1.介绍 语音识别一直是一个活跃的研究领域多年。随着超大规模集成电路技术,高性的 编译器的进步,它已成为可能纳入这些算法在硬件。在过去的几年中,各系统已开发,以满足各种应用。有许多的ASIC解决方案,提供小型,高性能系统。然而,这些患有低的灵活性和较长的设计周期。一个完整的基于软件的解决方案是为桌面应用程序的吸引力,但未能提供一个便携式,嵌入式解决方案。高端的公司如TI,ADI公司的数字信号处理器(DSP)的,提供一个理想的平台,在硬件的开发和测试算法。 C编译器,模拟器和调试器之类的先进的软件工具提供了一种简单的方法,优化算法和减少市场的时间。然而,为了获得最大的优势,硬件和软件都必须设计在手。语音识别是任何扬声器独立或依赖[1]。独立扬声器模式涉及提取讲话是在口语中所固有的那些特点。这一类的算法一般比较复杂,并利用统计模型和语言模型。另一方面,扬声器依赖模式涉及讲话中提取用户特定的功能。必须为每个用户创建一个词提取系数的模板进行匹配,以确定口语。此外,使用孤立的单词,而不是一个复杂连续的话,有助于提高准确性承认。我们的工作涉及扬声器依赖性,孤立词语音识别系统的发展。该系统是能够认识到口语词,从10-15字的模板。它具有较高的识别精度和适度抑制比。本文组织如下。第二节处理软件的一部分。它解释了背后的梅尔倒频谱系数提取和动态时间规整技术,应用的基础上形成的理论。第三节介绍了定制硬件开发此应用程序设计有关的各种问题。 C代码的DSP平台的软件优化和移植在第四节进行了讨论。结果和比较在部分解释五,最后,我们的结论第六节系统的应用潜力。 2。软件 本节介绍软件方面使用的语音识别引擎。 MFCC的理论是解释其实施。还提出了由作 者开发的一种新的开始检测和错一个字抑制算法。它的结论与动态规整(DTW),确认使用的模板匹配算法。 2.1。特征提取 - 梅尔规模的频率倒谱系数(MFCC)

相关主题
文本预览
相关文档 最新文档