• 工业控制及医疗领域 当操作人员的眼或手已经被占
用的情况下,在增加控制操作时,最好的办法就是增 加人与机器的语音交互界面。由语音对机器发出命令 ,机器用语音做出应答。
语音识别系统应用领域
• 个人数字助理的语音交互界面 PDA的体积很小
,人机界面一直是其应用和技术的瓶颈之一。由于在 PDA上使用键盘非常不便,因此,现多采用手写体识 别的方法输入和查询信息。随着语音识别技术的提高 ,语音将成为PDA主要的人机交互界面。
目录
• 语音识别的定义 • 语音识别涉及领域 • 语音识别的类型 • 语音识别原理框图 • DTW算法 • 语音识别系统应用领域 • 语音识别技术的应用发展方向
语音识别的定义
语音识别技术就是让机器通过识别和理解过程把 人类的语音信号转变为相应的文本或命令的技术 ,属于多维模式识别和智能计算机接口的范畴。 它是语音信号处理学科的一个分支。语音识别系 统的本质就是一种模式识别系统。 常见的语音识别方法有动态时间归整技术(DTW) 、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、 基于段长分布的非齐次隐马尔可夫模型 (DDBHMM)和人工神经元网络(ANN)
DTW算法
DTW算法
搜索从(1,1)点出发,对于局部路径约束如 图5-3,点(in,im)可达到的前一个格点只可能 是(in-1,im)、(in-1,im-l)和(in-1,im-2)。那么 (in,im)一定选择这三个距离中的最小者所对 应的点作为其前续格点,这时此路径的累 积距离为:
D(in,im)=d(T(in),R(im))+min{D(in-1,im),D(in1,im-1),D(in-1,im-2)}
三种匹配模式的对比
DTW算法
DTW是把时间规整和距离测度计算结合起 来的一种非线性规整技术,它寻找一个规 整函数im=Ф(in),将测试矢量的时间轴n非线 性地映射到参考模板的时间轴m上,并使该 函数满足: