当前位置:文档之家› 近二十年来四川方言语音研究综述

近二十年来四川方言语音研究综述

近二十年来四川方言语音研究综述
近二十年来四川方言语音研究综述

近二十年来四川方言语音研究综述

广安地处四川的东部,呈扇形分布于川中丘陵与平行岭谷两大地形区之间,是三峡库区发展的接力带,有“川东门户”之谓。东、南两部分与重庆市垫江县、长寿县、渝北区、合川市接壤,西部与遂宁市蓬溪县和南充市嘉陵区、高坪区相邻,北部与南充市蓬安县和达州市渠县毗连。地理座标为北纬30°01′-30°52′,东经105°56′-107°19′,东西宽134.5公里,南北长93.6公里,幅员面积6344平方公里,辖广安区、岳池县、武胜县、邻水县,代管华蓥市,共86个乡,87个镇,2886个村,2002年总人口444.3万。它虽然以前只是属于南充市管辖的一个县级城市,但1998年11月广安地区改广安市,广安县改县设区。

前人对于广安地区方言的研究成果甚少,因此只能着眼于大方面搜集资料。根据黄雪贞先生的《西南官话的分区(稿)》(《方言》1986年04期)将广安市列入四川方言的成渝片区,即它属于典型的四川境内西南官话,因此本文所列举的都是西南官话或是与广安临近区的方言研究成果。

一、宏观方面

1、崔荣昌《四川方言研究述评》(《中国语文》1994年06期)3、李蓝《六十年来西南官话的调查与研究》(《方言》1997年04期)

4、4、詹伯慧《<方言>二十年述评》(《方言》1998年03期)

5、崔荣昌《九十年代出版的四川方言论著》(《成都大学学报(社会科学版)》2000年04期)

6、李霞《西南官话语音研究》上海师范大学2004

7、彭金详《略论近代四川方言的语音系统》(《四川文理学院学报》2008年06期)

8、陈荣泽、高永鑫《巴蜀方言语音研究综述》(《四川理工学院学报(社会科学版)》2008年01期)

9、汪启明、程曾《近十年(1997-2007)四川方言市县话研究综述》(《乐山师范学院学报》2008年07期)

10、李蓝《西南官话的分区(稿)》(《方言》2009年01期)

11、武小军、王庆、樊洁《人口跨域流动与地域方言变化——四川方言入声字口音调查》(《语言文字应用》2011年04期)

12、孙越川《四川西南官话语音研究》浙江大学2011

13、陈荣泽《西南官话的两字组连读变调与轻声》(《西藏民族学院学报((哲学社会科学版)》2011年02期)

14、周及徐《南路话和湖广话的语音特点——兼论四川两大方言的历史关系》(《语言研究》2012年03期)

15、汪启明、程曾《近十年(1997—2007)四川方言研究综述》(《楚雄师范学院学报》2008年08期)

14、牟成刚《中古精知庄章组声母在西南官话中的演变》(《文山

学院学报》2013第01期)

二、微观方面

1、汪坤玉《从南充方言语音看古今音变的规律性》(《四川师范学院学报(哲学社会科学版)》1993年01期)

2、王文虎《四川口音普通话的语音特征》(《四川大学学报(哲学社会科学版)》1994年03期)

2、侬斐、周雳《论四川武胜方言中的“年”类零声母》(《语文学刊》2010年08期)

3、汤娟《岳池方言的语音系统》(《青年文学家》2012年13期)

4、周巧媛《成都方言语音问题研究》天津师范大学2012

5、曾晓舸《四川岳池顾县话的音系》(《四川师范学院学报(哲学社会科学版)》2000年02期)

6、黄尚军《成都话音系》(《西华大学学报(哲学社会科学版)》2006年01期)

7、何婉《四川成都话音系调查研究》四川师范大学2008

8、柯蔚《四川遂宁方言语音与中古音对比》(《四川民族学院报》2012年04期)

9、韩子京《四川营山县“安化腔”与其祖籍方言音系的对比研究》(《重庆广播电视大学学报》1999年04期)

四川方言

从“雄起雄起”再到李伯清(微博)的“背你妈的时”,四川方言一度出现在各个论坛、微博的热门榜上,加之最近的一本叫《四川方言词典》的书让四川方言彻底火了,文字解释一本正经,配上的例句“简单粗暴”,引得网友纷纷点赞。 最近几年,成都诗人小安的《我们这儿是精神病院》,80后作家颜歌的《我们家》两本书,都使用到四川方言写作,四川话里的幽默、夸张,看得读者咯咯直笑。川话版《猫和老鼠》、《蜡笔小新》、更有神人女屌丝四川方言唱《火》再把四川方言推上网络。 四川方言为什么就火了? 首先方言既是一个地区感情的纽带,当你在远离家乡的地方,一句熟悉的方言从身后传来,必然能让人心头一暖。再者,方言的简单粗暴,深入民间,实用度极高也深受当地人的喜爱。 四川人就一定能听懂四川方言?NO!语言学家认为,四川话并不等同于“四川方言”因为除四川话外,四川省境内较为常见的汉语言还有土广东话(属客家话)和老湖广话(属湘语)等,其都以方言岛的形式分布于四川各地。同时,四川省境内还拥有大量藏语、彝语、羌语的使用者。但由于四川话在四川具有强势地位,是事实上的通用语,一般而言,土广东话与老湖广话的使用者同时也是四川话的使用者,小编整理了四川几个乡音比较特别的四川各市州方言,看看你能懂几个。 乐山(微博) 乐山(微博)方言是四川中极具代表性的一种分支语言,在声调、因素还是词汇上都与邻近的成都方言、重庆方言有巨大差异。乐山(微博)方言是四川方言里面比较难听懂的,很多四川人听乐山(微博)方言都很吃力。 在四川方言中乐山(微博)方言和泸洲方言比较接近,也和崇州(微博)方言,成都西南郊县的方言都非常像,都同属一片区的方言。它是四川中极具代表性的一种分支语言,无论在声调、因素还是词汇上都与邻近的成都方言、重庆方言有巨大差异,里面的很多词语字面上和本身相差十万八千里。 赞花儿——形容某人表现欲特强,爱出风头。 掺汉德是——形容自以为是。 呀尖色怪——搬弄是非,说话刻薄的意思。也指人卑鄙。 赞翎子——形容好出风头的人。 和尚头儿——膝盖。(注——膝盖不就像和尚的头吗?很形象哦!) 卧丁包——隆起的大包。(注——在乐山(微博)话中卧、鹅同音,应为“鹅丁包,形容包大得像鹅头。) 门各老——门后的角落(注——应为“门旮旯”)。 红鸡公——乡下对摩托车的俗称。 麦到(mādào)——认为,以为。 麻郎儿——蜻蜓。

语音识别技术综述

语音识别技术综述

语音识别技术综述 电子信息工程2010级1班郭珊珊 【摘要】随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展,该技术的发展和应用改变了人们的生产和生活方式,正逐步成为计算机处理技术中的关键技术。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 【关键词】语音识别;语音识别原理;语音识别发展;产品 语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器人自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的命令或文本的高新技术。 1 语音识别的原理 语音识别系统本质是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单位元。未知语音经过话筒变换成电信号后加载识

别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需特征,在此基础上建立语音识别所需的模板。 计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表可给出计算机的识别结果。这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。 2 语音识别系统的分类 语音识别系统可以根据对输入语音的限制加以分类。 2.1从说话者与识别系统的相关性考虑 可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识

别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。 2.2从说话的方式考虑 也可以将识别系统分为3类:(1)孤立词语音识别系统:孤立词识别系统要求输入每个词后要停顿;(2)连接词语音识别系统:连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现;(3)连续语音识别系统:连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。 2.3从识别系统的词汇量大小考虑 也可以将识别系统分为3类:(1)小词汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系统。通常包括几千到几万个词的语音识别系统。随着计算机与数字信号处理器运算能力以及识别系统精度的提高,识别

语音信号识别及处理中英文翻译文献综述

语音识别 在计算机技术中,语音识别是指为了达到说话者发音而由计算机生成的功能,利用计算机识别人类语音的技术。(例如,抄录讲话的文本,数据项;经营电子和机械设备;电话的自动化处理),是通过所谓的自然语言处理的计算机语音技术的一个重要元素。通过计算机语音处理技术,来自语音发音系统的由人类创造的声音,包括肺,声带和舌头,通过接触,语音模式的变化在婴儿期、儿童学习认识有不同的模式,尽管由不同人的发音,例如,在音调,语气,强调,语调模式不同的发音相同的词或短语,大脑的认知能力,可以使人类实现这一非凡的能力。在撰写本文时(2008年),我们可以重现,语音识别技术不只表现在有限程度的电脑能力上,在其他许多方面也是有用的。 语音识别技术的挑战 古老的书写系统,要回溯到苏美尔人的六千年前。他们可以将模拟录音通过留声机进行语音播放,直到1877年。然而,由于与语音识别各种各样的问题,语音识别不得不等待着计算机的发展。 首先,演讲不是简单的口语文本——同样的道理,戴维斯很难捕捉到一个note-for-note曲作为乐谱。人类所理解的词、短语或句子离散与清晰的边界实际上是将信号连续的流,而不是听起来: I went to the store yesterday昨天我去商店。单词也可以混合,用Whadd ayawa吗?这代表着你想要做什么。第二,没有一对一的声音和字母之间的相关性。在英语,有略多于5个元音字母——a,e,i,o,u,有时y和w。有超过二十多个不同的元音, 虽然,精确统计可以取决于演讲者的口音而定。但相反的问题也会发生,在那里一个以上的信号能再现某一特定的声音。字母C可以有相同的字母K的声音,如蛋糕,或作为字母S,如柑橘。 此外,说同一语言的人使用不相同的声音,即语言不同,他们的声音语音或模式的组织,有不同的口音。例如“水”这个词,wadder可以显著watter,woader wattah等等。每个人都有独特的音量——男人说话的时候,一般开的最低音,妇女和儿童具有更高的音高(虽然每个人都有广泛的变异和重叠)。发音可以被邻近的声音、说话者的速度和说话者的健康状况所影响,当一个人感冒的时候,就要考虑发音的变化。

猫和老鼠四川方言版完全版

片名:猫和老鼠四川方言版 主要演员:特克斯·艾弗里约瑟夫·巴伯拉 上映日期:0 对白语言:英语 影片地区:欧美 影片类型:动画片 剧情介绍:第1集、第1辑.1.艳遇br 第2集、第1辑.2指挥家br 第3集、第1辑.3.火炮节br 第4集、第1辑.4.风车车与表哥br 第5集、第1辑.5.西部牛仔br 第6集、第1辑.6.狮子脱险记br 第7集、第2辑.1.长翅膀的猫br 第8集、第2辑.2.假老练求爱记br 第9集、第2辑.3.大力鼠br 第10集、第2辑.4.小鸭子br 第11集、第2辑.5.台球室里的故事br 第12集、第2辑.6.灭鼠公司br 第13集、第3辑.1.麻将害猫br 第14集、第3辑.2.假老练征婚记br 第15集、第3辑.3.荒岛奇遇br 第16集、第3辑.4.风车车的寂寞夜br 第17集、第3辑.5.周末猫之夜br 第18集、第3辑.6.终级保镖br 第19集、第4辑.1.第82次战争br 第20集、第4辑.2.宝贝猫br 第21集、第4辑.3.钓鱼记br 第22集、第4辑.4.假老练勇闯狗场br 第23集、第4辑.5.科学捕鼠br 第24集、第4辑.6.可爱的鸡朋友br 第25集、第5辑.1.新桃园三结义br 第26集、第5辑.2.男子汉的责任br 第27集、第5辑.3.老员工的遭遇br 第28集、第5辑.4.两猫抢食br 第29集、第5辑.5.镜子妹妹br 第30集、第5辑.6.球场赖皮br 第31集、第6辑.1.男子汉的标准br 第32集、第6辑.2.圣诞夜br 第33集、第6辑.3.宠物的战争br 第34集、第6辑.4.替罪鼠br 第35集、第6辑.5.一物降一物br 第36集、第6辑.6.新三剑客br 第37集、第7辑.1.水中历险br 第38集、第7辑.2.麻烦的诞生br 第39集、第7辑.3.小孤儿br 第40集、第7辑.4.凶灵再现br 第41集、第7辑.5.竞争上岗br 第42集、第8辑.1.人造冰场br 第43集、第8辑.2.多嘴鸭br 第44集、第8辑.3.大假到海南br 第45集、第8辑.4.猫咪法拉德br 第46集、第8辑.5.午睡纠纷br 第47集、第8辑.6.隐身术br 第48集、第9辑.1.水痘折磨猫br 第49集、第9辑.2.猫鼠争窝br 第50集、第9辑.3.风车车进城br 第51集、第9辑.4.高雅艺术br 第52集、第9辑.5.钟点工假哥br 第53集、第10辑.1.闷墩的乖乖br 第54集、第10辑.2.三个小捣蛋br 第55集、第10辑.3.泡妞回忆录br 第56集、第10辑.4.假老练升天记br 第57集、第10辑.5.网球二百五br 第58集、第11辑.1.水手假老练br 第59集、第11辑.2.两个艺术家br 第60集、第

语音识别发展现状与展望

中国中文信息学会第七次全国会员代表大会 暨学会成立30周年学术会议 语音识别发展现状与展望中科院自动化研究所徐波 2011年12月4日

报告提纲 ?语音识别技术现状及态势?语音识别技术的行业应用?语音识别技术研究方向?结论与展望

2010年始语音识别重新成为产业热点?移动互联网的兴起成为ASR最重要的应用环境。在Google引领下,互联网、通信公司纷纷把语音识别作为重要研究方向 –Android系统内嵌语音识别技术,Google语音 翻译等; –iPhone4S 上的Siri软件; –百度、腾讯、盛大、华为等都进军语音识别领 域; –我国语音技术领军企业讯飞2010年推出语音云识别、讯飞口讯 –已有的QQ2011版语音输入等等

成熟度分析-技术成熟度曲线 ?美国市场调查咨询公司Gartner于2011年7月发布《2011新兴技术成熟度曲线》报告:

成熟度分析-新兴技术优先矩阵?Gartner评出了2011年具有变革作用的技术,包括语音识别、语音翻译、自然语言问答等。其中语音翻译和自然语言问答有望在5-10年内获得大幅利用,而语音识别有望在2-5年内获得大幅利用;

三十年语音识别技术发展 ---特征提取与知识方面?MFCC,PLP,CMS,RASTA,VTLN;?HLDA, fMPE,neural net-based features ?前端优化 –融入更多特征信息(MLP、TrapNN、Bottle Neck Features等) ?特征很大特点有些是跟模型的训练算法相匹配?大规模FSN图表示,把各种知识源集中在一起–bigram vs. 4-gram, within word dependencies vs. cross-word

指纹识别系统(文献综述)

指纹识别方法的综述 摘 要: 对在指纹的预处理和特征提取、指纹分类、指纹的匹配过程中的方向图、滤波器、神经网络等关 键性原理和技术做了详细的说明,并对在各个过程中用到的方法做了进一步的比较,讨论了各种方法的优越性。 0 引 言 自动指纹识别是上世纪六十年代兴起的,利用计算机取代人工来进行指纹识别的一种方法。近年 来,随着计算机技术的飞速发展,低价位指纹采集仪的出现以及高可靠算法的实现,更使得自动指纹识 别技术越来越多地进入到人们的生活和工作中,自动指纹识别系统的研究和开发正在成为国内外学术 界和商业界的热点。相对于其他生物特征鉴别技术例如语音识别及虹膜识别,指纹识别具有许多独到 的优点,更重要的是它具有很高的实用性和可行性,已经被认为是一种理想的身份认证技术,有着十分 广泛的应用前景,是将来生物特征识别技术的主流。 1 指纹取像 图 1 是一个自动指纹识别系统AFIS(Automated Fingerprint Identification System) 的简单流程。 → → → ↓ ↑ ———— 将一个人的指纹采集下来输入计算机进行处理是指纹自动识别的首要步骤。指纹图像的获取主要利用设备取像,方便实用,比较适合AFIS 。利用设备取像的主要方法又利用光学设备、晶体传感器和超声波来进行。光学取像设备是根据光的全反射原理来设计的。晶体传感器取像是根据谷线和脊线皮肤与传感器之间距离不同而产生的电容不同来设计的。超声波设备取像也是采用光波来取像,但由于超声波波长较短,抗干扰能力较强,所以成像的质量非常好。 2 图像的预处理与特征提取 无论采取哪种方法提取指纹,总会给指纹图像带来各种噪声。预处理的目的就是去除图像中的噪 音,把它变成一幅清晰的点线图,以便于提取正确的指纹特征。预处理是指纹自动识别过程的第一步, 它的好坏直接影响着指纹识别的效果。常用的预处理与特征提取( Image Preprocessing and Feature Ex 2 t raction) 方法的主要步骤包括方向图计算、图像滤波、二值化、细化、提取特征和后处理。当然这些步骤 可以根据系统和应用的具体情况再进行适当变化。文献[ 1 ]提出了基于脊线跟踪的方法能够指纹取像 图像预处理 特征提取 指纹识别 数据库管理

语音识别技术

目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分: (1)语音特征提取: (2)声学模型与模式匹配(识别算法) (3)语义理解:计算机对识别结果进行语法、语义分析。 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR), 语音识别的发展简史 1952年AT& T Bell实验室实现了一个单一发音人孤立发音的十个英文数字的语音识别系统,到现在的人机语音交互。语音识别研究从二十世纪50年代开始到现在历半个多世纪的蓬勃发展,在这期间获得了巨大的进展。 现代语音识别技术研究重点包括即兴口语的识别和理解,自然口语对话,以及多语种的语音同声翻译。 语音识别应用的特点 1.语音识别系统必须覆盖的功能包括: (1)语音识别系统要对用户有益(希望它是能检测到的)。例如提高生产率,容易使用,更好的人机界面,或更自然的信息交流模式。 (2)语音识别系统要对用户“友好”。这种“友好”的含义是:用户在和系统进行语音对话时感到舒适;系统的语音提示既有帮助,又很亲近。 (3)语音识别系统必须有足够的精度 (4)语音识别系统要有实时处理能力;例如系统对用户询问的响应时间要很短。 2. 语音识别错误的处理 有以下四种方式可以处理这个问题。 (1)错误弱化法。这种处理仅仅花费用户很少一点时间,对用户几乎没什么其它不利影响。 (2)错误自检纠正法 系统利用已知任务的限制自动地检测并纠正错误。 (3)确认或多层次判定

(4)拒绝/转向人工座席。系统对其中通常较易导致系统识别错误的极少部分语音指令拒绝做出识别决定,而是将其转给人工座席。 在很多情况下,语音识别技术可以充分发挥出RFID的潜能: 1.积压产品、脱销产品 2.被废弃、被召回或已过期产品 3.回收的商品 4.促销产品 RFID系统在利用原有语音导向投资的情况下可以大大增加收益 语音识别技术在邮件分拣中的应用 现代化分拣设备在邮政上的应用大大提高了邮件处理的效率。但是,并不是所有的邮件都能上分拣机处理,那些需要人工处理的邮件成了邮政企业实现自动化的瓶颈。邮政使用人工标码技术以及先进的计算机软件 系统来处理不能上机的邮件,仍需要大量的劳动力。 由MailCode公司开发并准备申请专利的Spell-ItTM软件技术通过提高系统数据库能力的方式对语音识别自动化设备进行了革命性的变革。这种技术提供了无限的数据库能力,并且保证分拣速度不会因数据库的增大而减小。由各大语音引擎公司开发的系统还支持世界上的各种主要语言,这样,语音技术就成为世界性的产品。 以英语语音识别系统为例,系统建立了36个可识别字符26个字母加上0~9的10个数字,同时还建立了一套关键词。Spell-It软件使用这些字符来识别成千上万的口语词汇和无数的词语组合。 对于大公司的邮件收发中心来说,使用MailCode公司的Spell-It软件技术,分拣员实际上只需发出几个字符的音来找到和数据库中相对应的词。例如:碰到了寄给Joseph Schneider的邮件,操作员只需发出“J”、“S”、“C”和“H”几个音就可以得到准确的分拣信息。 姓名和邮箱编码:Jennifer Schroeder, 软件工程部;Joseph Schneider, 技术操作部;Josh Schriver, 技术操作部,因为这三个姓名全都符合(J,S,C,H)的发音标准。邮件中心的操作员知道邮件实际上是寄给Joseph Schneider的,就可以把邮件投入Joseph Schneide的信箱了。 邮局要把邮件按投递路线分发,分拣员必须熟悉长长的投递段列表以及各种各样的国际邮件投递信息。Spell-It技术把地址、投递路线等信息都存入了系统,这样就大大方便了分拣工作。 例如,有一件寄往Stonehollow 路2036号的邮件。使用语音识别技术,分拣员仅仅需要发出“2”、“0”、“S”、“T”和“O”几个音,如表2所示,数据库就会给出所有可能和这几

语音识别技术文献综述

语音识别技术综述 The summarization of speech recognition 张永双 苏州大学 摘要 本文回顾了语音识别技术的发展历史,综述了语音识别系统的结构、分类及基本方法,分析了语音识别技术面临的问题及发展方向。 关键词:语音识别;特征;匹配 Abstact This article review the courses of speech recognition technology progress ,summarize the structure,classifications and basic methods of speech recognition system and analyze the direction and the issues which speech recognition technology development may confront with. Key words: speech recognition;character;matching 引言 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等,甚至还涉及到人的体态语言(如人民在说话时的表情手势等行为动作可帮助对方理解)。其应用领域也非常广,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统,在信息高度化的今天,语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。 1.语音识别技术的发展历史 语音识别技术的研究开始二十世纪50年代。1952年,AT&Tbell实验室的Davis等人成功研制出了世界上第一个能识别十个英文数字发音的实验系统:Audry系统。

语音识别技术概述

语音识别技术概述 摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的发展前景和应用。 关键词:语音识别;特征提取;模式匹配;模型训练 Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part. Keywords:Speech identification;Character Pick-up;Mode matching;Model training 一、语音识别技术的理论基础 语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。 不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式

语音识别文献综述

噪音环境下的语音识别 1.1引言 随着社会的不断进步和科技的飞速发展,计算机对人们的帮助越来越大,成为了人们不可缺少的好助手,但是一直以来人们都是通过键盘、鼠标等和它进行通信,这限制了人与计算机之间的交流,更限制了消费人群。为了能让多数人甚至是残疾人都能使用计算机,让计算机能听懂人的语言,理解人们的意图,人们开始了对语音识别的研究. 语音识别是语音学与数字信号处理技术相结合的一门交叉学科,它和认知学、心理学、语言学、计算机科学、模式识别和人工智能等学科都有密切关系。 1,2语音识别的发展历史和研究现状 1.2.1国外语音识别的发展状况 国外的语音识别是从1952年贝尔实验室的Davis等人研制的特定说话人孤立数字识别系统开始的。 20世纪60年代,日本的很多研究者开发了相关的特殊硬件来进行语音识别RCA实验室的Martin等人为解决语音信号时间尺度不统一的问题,开发了一系列的时问归正方法,明显地改善了识别性能。与此同时,苏联的Vmtsyuk提出了采用动态规划方法解决两个语音的时闻对准问题,这是动态时间弯折算法DTW(dymmic time warping)的基础,也是其连续词识别算法的初级版.20世纪70年代,人工智能技术走入语音识别的研究中来.人们对语音识别的研究也取得了突破性进展.线性预测编码技术也被扩展应用到语音识别中,DTw也基本成熟。 20世纪80年代,语音识别研究的一个重要进展,就是识别算法从模式匹配技术转向基于统计模型的技术,更多地追求从整体统计的角度来建立最佳的语音识别系统。隐马尔可夫模型(hidden Markov model,删)技术就是其中一个典型技术。删的研究使大词汇量连续语音识别系统的开发成为可能。 20世纪90年代,人工神经网络(artificial neural network,ANN)也被应用到语音识别的研究中,并使相应的研究工作在模型的细化、参数的提取和优化以及系统的自适应技术等方面取得了一些关键性的进展,此时,语音识别技术进一步成熟,并走向实用。许多发达国家,如美国、日本、韩国,已经IBM、Microsoft、Apple、AT&T、Nrr等著名公司都为语音识别系统的实用化开发研究投以巨资。 当今,基于HMM和ANN相结合的方法得到了广泛的重视。而一些模式识别、机器学习方面的新技术也被应用到语音识别过程中,如支持向量机(support vector machine,SVM)技术、进化算法(evolutionary computation)技术等。

四川方言词典(教你说一口地道的四川话)

四川方言词典(教你说一口地道的四川话) 四川方言 说明 一、以成都话、重庆话为主, 收录有代表性且具有较强地方色彩的方言词、方言熟语1400余条。 二、有音无字的条目, 用同音字表示, 并在该字右上角标以“*”号表示。 三、全部条目参照中国社会科学院语言文字应用研究所《北方话基本词汇调查表》按意义划分为32类, 另有熟语一类, 按类排列, 各类中的条目按音序排列。多义词意义跨类者, 只在一类中出现。 四、用汉语拼音字母注出条目的成都话读音, 成都话不说的方言词语, 按通行地的语音同成都音的对应关系折合为成都音。成都话声母[]用双字母gn表示, 声母[z] 用r表示; 声调用阿拉伯数字“1”、“2”、 “3”、“4”标在音节右上方表示调类的阴平、阳平、上声、去声。有规律的连读变调, 先注本调, 后注变调, 用A→B表示, 其中A表示本调, B表示变调, 如“坝坝ba4ba4→ba4ba1”。 五、释义用普通话解释方言词语的方言义项, 一般不考察词源或理据。 六、例句中出现本词条, 用符号“~”代替。 七、条目具体分类如下: 1.天文、气象 2.地理 3.时间、节令 4.人品 5.亲属称谓 6.婚育 7.丧葬8.人体9.人体动作 10.疾病、医药11.器具12.饮食 13.房舍14.服饰15.交通、邮电 16.农业17.植物18.动物 19.商业20.学校教育21.祭祀 22.文体娱乐23.交际24.一般动作 25.一般名物26.性质、感觉、状态、颜色27.方位 28.指代29.量词30.副词 31.介词32.连词、助词33.熟语 1. 天文、气象 扯霍闪ce3ho2san3打闪。 扯露水ce3nu4sui3 下露。 打白头霜da3be2tou2suang1 下很重的白色的霜。 打霜da3suang1 降霜。 发霞fa2xia2 出现霞光。 霍闪ho2san3 闪电。 回霜hui2suang1 降霜后晴天转阴天。

四川方言常用词大全

<四川方言翻译> 01: “鼓到”:意思是强迫、让别人做不愿意的事情。 例如:他鼓到要喊我去打牌。 02、“弯酸":指挑剔的意思! 比如:你这人怎么这么弯酸啊,我都给你弄了几道了,你还弯酸人! 03: “萨过":过去了,结束了的意思。 比如:“今天的会就萨过了,就到这里!” 04:“几哈些":是催促别人快点的意思! 比如:“快,几哈些吃完哈,人家等到起的” 05:“巴郎(喜)不得":就是别人想的和做的正好是自己想的! 比如:“他倒巴郎不得和你去去吃饭哦” 06:“掘货":没水准,很不入流。比如:“你个掘货!” 07:“斩劲”用劲,努力。 比如:“要斩劲抬哦,抬完了就吃饭了“ 08:“苟”吝啬的意思。 比如:“你不要看大哥那个样子,其实是个苟的很!” 09:“歪”:凶的意思! 比如:“你很歪哦!!知道我是干啥子的不哦?(其实自己啥子都不是!) 10:“狗儿麻糖":乱七八糟的意思! 比如:“今天老子去上网,啥子狗儿麻糖的人都有。“ 11:“绵”:拖拉! 比如:“你做事情不要那么绵嘛要的不哦?快点!” 12:“求”:取代“什么”的意思! 比如:"你求都不懂!” 13:“吃刹午”:吃中午饭的意思。一般出现在农村。 比如:二娃子,莫放牛啦。快回来吃刹午! 14:“一哈":就是一起的意思! 比如:“今天去吃饭,把他们一哈都喊上!” 15:“毛焦火辣”:烦躁,急躁的意思! 比如:“你的牌打得好差哦,输的我毛椒火辣的!” 16:“落教":懂事,听话。旺苍人常常来比喻孩子! 比如:“那娃儿还比较落较!说了他就不闹了” 17:“打捶”意思是打架的意思。比如:“你两个一天到黑都在打捶18:“背时":倒霉! 比如:“你该背时,哪个叫你不听老人言!” 19:“锤子":粗话,常用的旺苍哩语。 比如:锤子!鬼大哥信你的话。 20:“松活”:工作生活不忙不累比较轻松! 比如:“你干的这个活路好轻松哦!好久给我也介绍一下三!”21:“经事”:指一个事物比较耐用。

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示: 未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法 目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。 动态时间规整算法(Dynamic Time Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。 隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。 矢量量化(Vector Quantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。 人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

语音识别实验2

关于语音识别的研究 网络工程专业网络C071班贾鸿姗 076040 摘要:语音识别技术的广泛应用 1前言: 语音识别技术也被称为自动语音识别 (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T 贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。。到1950年代末,伦敦学院(Colledge of London)的Denes 已经将语法概率加入语音识别中。 1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC),及动态时间弯折Dynamic Time Warp技术。 语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。。此后严格来说语音识别技术并没有脱离HMM框架。 尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持无限领域,无限说话人的听写机应用。 2 正文 2.1应用领域 2.1.1.电话通信的语音拨号 特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。 2.1.2.汽车的语音控制 由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上,因此在汽车上拨打电话,需要使用具有语音拨号功能的免提电话通信方式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。 工业控制及医疗领域。当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。 2.1.3数字助理 个人数字助理(Personal Digital Assistant,PDA)的语音交互界面。PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识别的方法输入和查询信息。但是,这种方法仍然让用户感到很不方便。现在业界一致认为,PDA的最佳人机交互界面是以语音作为传输介质的交互方法,并且已有少量应用。随着语音识别技术的提高,可以预见,在不久的将来,语音将成为PDA主要的人机交互界面。 智能玩具 通过语音识别技术,我们可以与智能娃娃对话,可以用语音对玩具发出命令,让其完成一些简单的任务,甚至可以制造具有语音锁功能的电子看门狗。智能玩具有很大的市场潜力,而其关键在

语音识别开题报告

青岛大学 毕业论文(设计)开题报告 题目:孤立词语音识别的并行编程实现 学院:自动化工程学院电子工程系 专业:通信工程 姓名:李洪超 指导教师:庄晓东 2010年 3月22日

一、文献综述 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。 1.1 语音识别技术现状 1.1.1 语音识别获得应用 伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。 目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。 1.1.2 语音合成信息服务被用户接受 语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需

最新的四川方言顺口溜大全

最新的四川方言顺口溜大全 1、你们妈,母夜叉,拿起叉叉到处叉,你们爸,蝙蝠侠,天上飞来地上爬;你们婆,爆鸡婆拿起杆杆到处夺 2、XX你好,潲水洗澡,米汤游泳(念yun),粪涌前进。 3、屁屁屁是一种含酸气,在人们的肚子里钻来钻去,一不留意,钻了出去。恐龙放屁CUD,飘洋过海来到意大利,意大利的国王正在看戏,闻到这个屁,很不满意,专请科学家来研究这个屁,研究的结果是谁输了谁就是这个屁 4、一二三四五,上山打老虎,老虎要吃人,黑老要关门,门对门,虎对虎,刚刚对到中指拇。(儿歌都是很顺口的) 5、你好你好,你下河洗澡,你毛多肉少。(企业的愿景) 6、鲢邦郎,喝米汤,打烂碗,接婆娘,婆娘哭,回娘屋,娘屋远,买把伞,伞又高,买把刀,刀又快,好切菜,菜又咸,好放盐,盐又久,买根狗,狗又歪,咬你妈的猪奶奶。 7、太阳出来我爬电杆,爬上了电杆我耍电线,电线放出了高压电啊,把我送进了阎王殿,我给阎王上根烟,阎王把我送上天,过了一年又一年啊,我又回到了人世间。(《大花轿》的调子)(当时唱这个歌会被认为具有流氓气质) 8、说你瓜,你硬是瓜,半夜起来扫院坝,别个婆娘你喊?。 9、某某的头,像地球,有山有水有河流;某某的腰像菜刀,切肉切菜切辣椒;某某的屁股像面包,五分儿钱,随便挑——

10、幺儿乖乖,骑马立刻街街。幺儿乖乖,来契点奶奶……(忘了我小时候是否也可爱过) 11、告告告开大炮老爷吃酒你吃尿 12、鸡公叫,鸭公叫,各人捡到各人要。(嘿嘿,这句也是印象深刻) 13、我给小姐打扇,小姐说我能干,我给小姐搬家,搬到茅斯卡卡 14、狗撵摩托,不懂科学 15、告告告,开大炮,老爷吃酒你吃尿,老爷坐飞机,你坐烂撮箕。 16、星期天的早上雾茫茫,xxx的队伍排成行,端起机关枪,冲到女茅房,脱衣服脱裤儿耍流氓 17、你们婆,尖尖脚,汽车来了跑不脱 18、你们妈,母夜叉,拿起叉叉到处叉;你们爸,蝙蝠侠,天上飞来地上爬;你们婆,爆鸡婆拿起杆杆到处夺(你们婆魂斗罗,拿起机枪到处锣/你们婆,魂斗罗,几个跟斗翻过河);你们爷,苍蝇拍,打死苍蝇不流血;你们姐,有点野,狮子老虎拿来扯。 19、牙尖十八怪偷油又炒菜先炒X妖精后炒X妖怪(X是某人的姓) 20、大字不出头,两边挂灯笼,三天不吃饭,围倒锅圈儿转,买了三根葱,三角三,买了一个大冬瓜,六角六,买了两根油条,九角九。(画三毛的口诀)(嗯,此刻无聊时我也会默念这个口诀画娃娃耍) 21、瓜兮兮,开飞机,神搓搓,骑摩托(开奥拓)。 22、报告司令官,莫得裤儿穿,捡了一DA布,缝个叉叉裤(个性女生签名) 23、太阳当空照,花儿对我笑。小鸟说,早早早,你为什么背上炸药

四川方言

四川方言--你搞得撑展不? 在四川,有种饭叫稍午,有种掩饰叫不存在,有种工具叫戳机,有种失望叫哦活,有种倒霉叫翻船,有种厉害叫秒杀,有种批评叫洗刷,有种自信叫幺不倒台,有种结账叫数芊芊,有种加油叫扎起,有种停止叫你给劳资洼到... 在四川,有种幸灾乐祸叫该背时,有种舒服叫巴适,有种醉酒叫豁飘了,有种合适叫登对,有种行为叫妖沿儿,有种吃饭叫哦丽,有种客套话叫随便整,有种打算叫麦到起,有种鞋子叫孩子,有种裤子叫摇裤,有个北叫下江北... 在四川,有一种傻子叫憨包,有一种无能叫求不楞腾,有一种脏叫灰不拢耸,有一种白叫讯白,有一种黑叫雀幺儿达黑,有一种运气叫挫倒呢,有一种流氓叫二流子,有一种心急叫毛焦火辣,有一种不务正业叫冬儿档儿,有一种石头叫鹅贝儿... 在四川,有种仇恨叫接梁子,有种闪电叫扯活伞,有种拳叫乱婆娘拳,有种结束叫刹各,有种能力叫柯德平,有种人他豁得转,有个东西叫雀雀,有种诚信叫二骗,有种交通工具叫羚羊,有种欺骗叫豁伯伯,有种无知叫清不倒... 在四川,有种停顿叫刹一脚,有种不耐烦叫少批垮腩垮,有种昆虫叫丁丁猫,有种执着叫扭到将,有种性格叫弯酸,有个地方称为卡卡咯咯,有种动物叫黄鳝,有种母老虎她不咬人,只会让男人的耳朵趴... 在四川,有种龙叫宝批龙,有种鄙视叫踏蓄,有种留恋叫痴皮,有个部位叫瞎儿孔,有种便宜叫趴货,有种食物叫嘎嘎,有种承诺叫儿不,有种姿势叫孤到起,有种人叫卵人,有种状态叫扯拐儿... 在四川,有种耿直叫落较,有种刑法叫拔沙罐,有种结束叫搞归意,有种脚法叫挖到,有种可怜叫造孽,有种调皮叫千帆,有种便宜叫香音,有种潇洒叫打甩手,有座宜宾城:一个让人爱上了就无法自拔的城市。 在四川,有个部位叫罗兜,有种害怕叫打闪闪,有种游戏叫逮猫,有种动物叫偷油婆,有种发泄叫清叫唤,有种集合叫吹哨哨,有种吵架叫各孽,有种丑陋叫怪眉日眼... 在四川,有种说话叫开黄腔,有种义气叫说嘞些,有种方便叫撇托,有种游戏叫斗鸡,有种使劲叫黑实... 在四川,有种丢脸叫绍皮,有种状态叫出脱,有种能力叫航事,有种动词叫悄悄咪咪,小时候爷爷经常对我说:你个砍脑壳的,莫去耍赖克宝,小心脱不到爪爪哟...

语音识别综述

山西大学研究生学位课程论文(2014 ---- 2015 学年第 2 学期) 学院(中心、所):计算机与信息技术学院 专业名称:计算机应用技术 课程名称:自然语言处理技术 论文题目:语音识别综述 授课教师(职称): 研究生姓名: 年级: 学号: 成绩: 评阅日期: 山西大学研究生学院 2015年 6 月2日

语音识别综述 摘要随着大数据、云时代的到来,我们正朝着智能化和自动化的信息社会迈进,作为人机交互的关键技术,语音识别在五十多年来不仅在学术领域有了很大的发展,在实际生活中也得到了越来越多的应用。本文主要介绍了语音识别技术的发展历程,国内外研究现状,具体阐述语音识别的概念,基本原理、方法,以及目前使用的关键技术HMM、神经网络等,具体实际应用,以及当前面临的困境与未来的研究趋势。 关键词语音识别;隐马尔科夫模型;神经网络;中文信息处理 1.引言 语言是人类相互交流最常用、有效的和方便的通信方式,自从计算机诞生以来,让计算机能听懂人类的语言一直是我们的梦想,随着大数据、云时代的到来,信息社会正朝着智能化和自动化推进,我们越来越迫切希望能够摆脱键盘等硬件的束缚,取而代之的是更加易用的、自然的、人性化的语音输入。语音识别是以语音为研究对象,通过对语音信号处理和模式识别让机器自动识别和理解人类口述的语言。 2.语音识别技术的发展历史及现状 2.1语音识别发展历史 语音识别的研究工作起源与上世纪50年代,当时AT&T Bell实验室实现了第一个可识别十个英文数字的语音识别系统——Audry系统。1959年,J.W.Rorgie和C.D.Forgie采用数字计算机识别英文元音及孤立字,开始了计算机语音识别的研究工作。 60年代,计算机应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP),其中后者较好的解决了语音信号产生模型的问题,对后来语音识别的发展产生了深远的影响。 70年代,LP技术得到了进一步的发展,动态时间归正技术(DTW)基本成熟,特别是矢量量化(VQ)和隐马尔科夫(HMM)理论的提出,并且实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 80年代,实验室语音识别研究产生了巨大的突破,一方面各种连接词语音识别算法被开发,比如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。隐马尔科夫模型(HMM)就是其典型代表,能够很好的描述语音信号的时变性和平稳性,使大词汇量连

相关主题
文本预览
相关文档 最新文档