当前位置：文档之家› 科大讯飞ABNF文法规范

科大讯飞ABNF文法规范

人工智能与语言识别

人工智能与语言识别摘要：语言是人类之间交流信息的主要手段之一，自电脑发明以来，人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术，应用需求十分广阔，长期以来一直是人们研究的热点。神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学。本文针时语音识别的特点，对BP神经网络在语音识别技术中的应用进行了探索性研究，进而结合人工智能领域较为有效的方法——遗传(GA)算法。该算法有效地缩短了识别时问，提高了网络训练速度和语音的识别率。关键词：语言识别；神经网络；遗传算法；BP网络 Artificial Intelligence and Speech Recognition Abstract:Language is one of the most important means of exchanging information among the mankind.Since the computer was invented,many scientists have been devoted to enabling the computer to understand the natural language.Speech recognition is a comprehensive technology of such areas as acoustics,phonetics,linguistics,computer science,information processing and artificial intelligence,which can be used widely.The research of speech recognition technology has been focused by the world for a long time.The neural network is a new developing science,which simulates the mechanism of human brain and was putted forward by the developing of modern science. This paper mainly studies the application of the BP neural network in the research of speech recognition.The training speed can be accelerated by the method and the recognition performance is also promoted． Key words:speech recognition;neural network;genetic algorithm;BP network 正文一、语言识别的概述随着计算机技术的发展，人与机器之间的交流也越来越广泛和深入，计算机己经渗透到人们生活的各个方面。在现代社会中，人们逐渐习惯借助计算机来完成各项事务。在这种情况下，如何让计算机智能化地与人进行通信，使人机交互更加自然方便成为现代计算机科学的重要研究课题之一。二、语言识别的基本原理语音识别(Speech Recognition)主要是指让机器听懂人说的话，即在各种情况下，准确地识别出语音的内容，从而根据其信息，执行人的各种意图。现代语音识别技术以神经网络为主要发展趋势，进入20世纪90年代以来，神经网络已经成为语音识别的一条重要途径。人工神经网络(ANN)是采用大量的简单处理单元广泛连接起来构成的一种复杂信息处理网络。网络的训练学习是应用一系列输入矢量，通过已确定的算法逐步调整网络的权值，最终达到期望的目标。BP神经网络是神经网络中前向神经网络的核心部分，BP算法的学习过程由信号的正向传播和误差的反向传播组成。大部分基于神经网络的语音识别系统实现识别功能都要经过从特征参数提取到应用识别算法进行识别的过程。三、语音识别中的BP网络构造

2020年公需课程-人工智能技术与应用(一骨骼识别、二人脸识别、三步态识别、四虹膜识别、五语音识别)

人工智能技术与应用（练习一：骨骼识别） 1、（单选，10分）单人骨骼识别不需要包含如下处理过程（） A 、关键点区分 B 、关键点检测 C 、关键点串联 D 、结果输出答案：A 2、（单选，10分）以下哪项不属于目前常用的人体骨架关键点的定义方式（） A 、18 个关键点 B 、14 个关键点 C、25 个关键点 D、7 个关键点答案：D 3、（单选，10分）以下哪种环境/ 条件有助于提升人体骨骼识别的准确率（） A 、肢体遮挡 B 、光照良好 C 、观察视角变化 D 、衣服包裹严实答案：B 4、（单选，10分）人体骨骼识别与哪项技术的关联程度最低（） A 、区块链技术 B 、视频采集技术 C 、图像处理技术 D 、人工智能相关技术答案：A 5、（单选，10分）以下哪项不是骨骼识别系统包含的功能（） A 、图像采集 B 、图像预处理 C 、图像模糊化 D 、骨骼关键点识别答案：C 6、（单选，10分）以下哪项不属于造成多人骨骼识别较单人骨骼识别更具挑战的因素（） A 、关键点区分性弱 B 、背景中的局部区域容易混淆 C 、人与人的重叠 D 、需串联的关键点个数增多答案：D

7、（单选，10分）当前的骨骼识别技术不适用于以下哪个应用场景（） A 、身份认证 B 、视频监控 C 、体感游戏 D 、运动员辅助训练答案：A 8、（单选，10分） 8. 以下哪家公司不属于人体骨骼识别领域的代表企业（） A 、商汤科技 B 、旷视科技 C 、携程旅行网络科技 D 、凌感科技答案：C 9、（单选，10分）人的头颈、肩部、手肘关节、手腕关节、髋关节、膝关节等可作为人体骨骼关键点。 A 、正确 B 、错误答案：A 10、（单选，10 分）在自顶向下方法中，人体目标检测需要用方框标记出一块尽可能大的区域。 A 、正确 B 、错误答案：B 人工智能技术与应用（练习二：人脸识别） 1、（单选，10分）以下哪项不是人脸识别系统包含的功能（） A 、图像采集 B 、图像预处理 C 、图像模糊化 D 、匹配比对答案：C 2、（单选，10分）未来人脸识别的个人隐私防护不包含（） A 、随意授权自己的人脸信息 B 、立法保障“脸权” C 、规范化人脸数据的使用方法 D 、打击隐私泄露行为答案：A 3、（单选，10分）以下哪项不属于生物识别技术（） A 、人脸识别 B 、车牌识别 C 、掌纹识别 D 、语音识别答案：B

人工智能论文语音识别

信息学院《人工智能及其应用》课程论文题目：基于神经网络的语音信号识别作者黄超班级自动08-1BF班系别信息学院专业自动化完成时间 2011.6.12

人工智能语音识别发展报告

人工智能语音识别发展报告Report of Artificial I ntelligence Development

目录 1.语音识别 (3) 1.1.语音识别概念 (3) 1.2.语音识别发展历史 (4) 1.3.人才概况 (6) 1.4.论文解读 (8) 1.5.语音识别进展 (173)

语音识别 1.语音识别 1.1.语音识别概念语音识别是让机器识别和理解说话人语音信号内容的新兴学科，目的是将语音信号转变为文本字符或者命令的智能技术，利用计算机理解讲话人的语义内容，使其听懂人类的语音，从而判断说话人的意图，是一种非常自然和有效的人机交流方式。它是一门综合学科，与很多学科紧密相连，比如语言学、信号处理、计算机科学、心理和生理学等[8]。语音识别首先要对采集的语音信号进行预处理，然后利用相关的语音信号处理方法计算语音的声学参数，提取相应的特征参数，最后根据提取的特征参数进行语音识别。总体上，语音识别包含两个阶段：第一个阶段是学习和训练，即提取语音库中语音样本的特征参数作为训练数据，合理设置模型参数的初始值，对模型各个参数进行重估，使识别系统具有最佳的识别效果；第二个阶段就是识别，将待识别语音信号的特征根据一定的准则与训练好的模板库进行比较，最后通过一定的识别算法得出识别结果。显然识别结果的好坏与模板库是否准确、模型参数的好坏以及特征参数的选择都有直接的关系。实际上，语音识别也是一种模式识别，其基本结构如下图所示。和一般模式识别过程相同，语音识别包括如图所示3 个基本部分。实际上，由于语音信息的复杂性以及语音内容的丰富性，语音识别系统要比模式识别系统复杂的多。图 6-1 语音识别系统框架其中，预处理主要是对输入语音信号进行预加重和分段加窗等处理，并滤除其中的不重要信息及背景噪声等，然后进行端点检测，以确定有效的语音段。特征参数提取是将反映信号特征的关键信息提取出来，以此降低维数减小计算量，

语音识别技术文献综述

语音识别技术综述 The summarization of speech recognition 张永双苏州大学摘要本文回顾了语音识别技术的发展历史，综述了语音识别系统的结构、分类及基本方法，分析了语音识别技术面临的问题及发展方向。关键词：语音识别；特征；匹配 Abstact This article review the courses of speech recognition technology progress ,summarize the structure,classifications and basic methods of speech recognition system and analyze the direction and the issues which speech recognition technology development may confront with. Key words: speech recognition;character;matching 引言语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科，所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等，甚至还涉及到人的体态语言（如人民在说话时的表情手势等行为动作可帮助对方理解）。其应用领域也非常广，例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统，在信息高度化的今天，语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。 1.语音识别技术的发展历史语音识别技术的研究开始二十世纪50年代。1952年，AT&Tbell实验室的Davis等人成功研制出了世界上第一个能识别十个英文数字发音的实验系统：Audry系统。

语音识别方法及发展趋势分析

语音识别改进方法及难点分析 ——《模式识别》结课小论文学院：化工与环境学院学号：2120151177 姓名：杜妮

摘要：随着计算机技术的不断发展，人工智能程度也越来越高，作为人工智能的一部分——模式识别也在模型和算法上愈发成熟。本文根据近105年文献，分析最新声音识别的方法和应用。关键字：模式识别声音识别方法应用随着人工智能的迅速发展，语音识别的技术越来越成为国内外研究机构的焦点。人们致力于能使机器能够听懂人类的话语指令，并希望通过语音实现对机器的控制。语音识别的研究发展将在不远的将来极大地方便人们的生活。语音识别大致的流程包括：特征提取、声学模型训练、语音模型训练以及识别搜索算法。作为一项人机交互的关键技术，语音识别在过去的几十年里取得了飞速的发展，人们在研究和探索过程中针对语音识别的各部流程进行了各种各样的尝试和改造，以期发现更好的方法来完成语音识别流程中的各步骤，以此来促进在不同环境下语音识别的效率和准确率。本文通过查阅近10年国内外文献，分析目前语音识别流程中的技术进展和趋势，并在文章最后给出几项语音识别在日常生活中的应用案例，从而分析语音识别之后的市场走势和实际利用价值。一、语音识别的改进方法 (一)特征提取模块改进特征提取就是从语音信号中提取出语音的特征序列。提取的语音特征应该能完全、准确地表达语音信号，特征提取的目的是提取语音信号中能代表语音特征的信息，减少语音识别时所要处理的数据量。语音信号的特征分析是语音信号处理的前提和基础，只有分析出可以代表语音信号本质特征的参数，才能对这些参数进行高效的语音通信，语音合成，和语音识别等处理，并且语音合成的好坏，语音识别率的高低，也都取决于语音特征提取的准确性和鲁棒性。目前，针对特定应用的中小词汇量、特定人的语音识别技术发展已较为成熟，已经能够满足通常应用的要求，并逐步投入了实用。而非特定人、大词汇量、连续语音识别仍是

人工智能语音识别论文

基于神经网络的语音信号识别摘要语言是人类之间交流信息的主要手段之一，自电脑发明以来，人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术，应用需求十分广阔，长期以来一直是人们研究的热点。神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学，它模拟了人类神经元活动的原理，具有自学习、联想、对比、推理和概括能力，为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。本文针时语音识别的特点．BP 神经网络在语音识别技术中的应用进行了探索性研究，对进而结合人工智能领域较为有效的方法——遗传(GA)算法。针对传统BP 算法识别准确率高但训练速度慢的缺点，对BP 网络进行改进，构建了一种基于遗传神经网络的语音识别算法(GABP)，并建立相应的语音识别系统。仿真实验表明，该算法有效地缩短了识别时问，提高了网络训练速度和语音的识别率。关键词：语音识别，神经网络，遗传算法，遗传神经网络,BP 网络RECOGNITIO THE RSREARCH OF SPEECH RECOGNITION BASED ON THE NEURAL NETWORK ABSTRACT Language is one of the most important means of exchanging information among the mankind．Since the computer was invented，many scientists have been devoted to enabling the computer to understand the natural language．Speech recognition is a comprehensive technology of such areas as acoustics，phonetics，linguistics，computer science，information processing and artificial intelligence，which can be used widely．The research of speech recognition technology has been focused by the world for a long time．The neural network is a new developing science，which simulates the mechanism of human brain and was putted forward by the developing of modern science．is not the overall description of human brain，the abstract，It but simulation and simplifying of the physical neural networks of human beings. The purpose of the research in this area is exploring the human brain mechanisms in information processing，storing and searching．If people can understand these mechanisms，a new way for the research of artificial intelligence，information processing and etc. can be opened up. Artificial neural network is a system which using a physically feasible system to imitate the structure and function of nerve cells in human brain，which has the ability of self—learning，contrasting，reasoning and summarizing .It have offered a new way in solving such complicated pattern classification problems as speech recognition．This paper mainly studies the application of the BP neural network in the research of speech recognition. BP neural network can get higher identification precision, but its training speed is very low, a new recognizing algorithm based on BP algorithm by combining with good effect method in ANN which named genetic algorithm (GA) was proposed and used to improve the BP neural network. Experiments results show that the training speed can be accelerated by the method and the recognition performance is also promoted．words: Key words speech recognition, neural network, genetic algorithm, genetic neural network, BP network 1．绪论1.1 1.1 课题背景1．1．1 语音识别概述随着计算机技术的发展，人与机器之间的交流也越来越广泛和深入，计算机己经渗透到人们生活的各个方面。在现代社会中，人们逐渐习惯借助计算机来完成各项事务。在这种情况下，如何让计算机智能化地与人进行通信，使人机交互更加自然方便成为现代计算机科学的重要研究课题之一。语音识别(Speech Recognition)主要是指让机器听懂人说的话，即在各种情况下，准确地识别出语音的内容，从而根据其信息，执行人的各种意图。语音识别是一门涉及面很广的交叉学科，它是目前发展最为迅速的信息研究诸领域中的一个。语音识别的最大优势在于使得人机用户界面更加自然和容易使用。随着计算机技术、模式识别和信号处理技

基于人工智能深度学习的语音识别方法分析

血I「技术昌应用〕信息记录材料2019年9月第20卷第9期_______________________________________________基于人工智能深度学习的语音识别方法分析崔娟，吴磊 (潍坊职业学院山东潍坊262737) 【摘要】随着新一代信息技术的发展，语音识别在各个领域的应用越来越广泛，我们可以在日常生活中更加普遍地接触到各类语音识别产品，如手机中的智能语音助手、车栽语音导航、天猫精灵等.语音识别技术已经在很多应用领域取得重大进展，但是在语音特征提取准确性、识别稳定性、语言建模等方面仍需亟待改进，而深度学习技术的可以很好的解决这些问题。因此，本文针对人工智能深度学习在语音识别领域方面的应用进行分析，做出了简要的阐述。【关键词】人工智能；语音识别；方法分析【中图分类号】TP24【文献标识码】A【文章编号】1009-5624(2019)09-0168-02 1引言随着大数据、物联网、云计算等信息技术的发展，以深度学习为代表的人工智能技术的飞速发展，大幅度跨越了科学研究与实际应用之间的鸿沟，人工智能技术实现了语音识别系统从“不能用”到"可以用”的跨越式突破，迎来了迅猛发展的新高潮切。目前，在当前的市场上，虽然很多语音识别系统都初步实现了人与机器的沟通，但是仍有一些语音识别技术不是很完善。因此在针对语音识别技术改进方面，我们可以充分利用人工智能的深度学习，加强语音识别系统对语音、语义识别的准确性和实时性。而且在研究的过程中，研究人员也要深刻意识到研究结果和实际运用会出现的差异和问题，以及研究结果是否可以满足人们对人工系统的语音识别需求。深度学习的加入就是为了加强语音识别系统的运用，满足人们对语音识别系统提出的更高要求。 2语音识别技术的简介语言识别技术其实就是让机器通过识别人的发音或者是声线去进行理解，然后将语音信号转变为一种相应的文本，其过程可以简单总结为：语音信号预处理— —语音信号特征提取— —在语音模型库中找到相应的模式进行匹配— —在语言模型库中对语言进行处理— —完成识别。人们对语音识别准确性、实用型的需求促进了语音识别系统应用的快速发展，使得语音识别技术取得了一定的研究成果，语音识别系统也逐渐从实验室走向了人们的生活和市场。随着智能时代的到来，语音识别技术不仅在生活上对人们起到帮助，而且在工业发展、通信技术、甚至医疗区域都慢慢体现出了自己的价值⑵。尤其在2000年到2010年这一期间，是信息技术迅速发展的黄金时期，语音识别技术也是在这一时期得到更好的研究和探索，研究人员并将语音识别系统自身所能涉及的领域又进行了新的扩大。其中就包括对噪音信号的处理、信息的识别、以及对声线的识别和智能语音合成等等。总的来说，人类能够与机器进行畅通交流一直都是我们极力研究和期待的事情，语言识别技术很好的满足了人们这一想象和需求。 3目前传统语音识别系统存在的问题 3.1语音识别技术无法进行更好的提升虽然时代在慢慢进步，但是在研究语音识别系统方面，我们的研究者也遇到了研究事业的“瓶颈期”。虽然现在有很多的设备都安装了语音识别系统，也做到了人与机器之间进行沟通，但是机器始终是机器，就算能够识别语音但是也只能识别一些基础的简单语言回。相对于专业的术语还很难做到识别和理解。研究者在通过各个方面的改造和创新，最终使得语音识别系统在知识理解方面加强了一些对外语以及方言的理解。但是对于噪声处理、系统鲁棒性、语音复杂模型等方面仍然是需要克服的问题，有待进一步提升。 3.2语音识别系统无法进行准确的数据特征提取近年来互联网技术突飞猛进，很多设备也与互联网接轨，在当下信息技术发达的时代背景下，智能系统就成为了现在的社会主流。而语音识别就是这种主流中最重要的这些命令调整自身运行参数。 4结论 10kV以下配电网无功电压优化与智能控制设计的目的是降低系统无谓损耗，保证供电电压平稳，提升配电网运行的经济效益。随着我国1ORV以下配电网性能及运行压力的变化，其产生的无功电压也会随之改变。因此无功补偿应作为10kV以下配电网维护管理中的重点工作之一，结合行业发展对配电网运行效率的新要求，积极引进现代化技术，做好低压配电网无功补偿工作。【參考文献】［1］张世伟，连鸿波.配电网无功电压混成自动控制研究［J］.华东电力,2018(09). ［2］张文琼，戈狄，赵兴华.许昌地区无功电压合格率偏低的原因及对策［J］.农村电工，2018(06). ［3］陈章潮，林桂钱.地区电网的无功电压规划和运行的优化方法研究［J］.中国电力，2019(03). ⑷何志桥.略谈电网无功电压与几种调压措施［JL华东电力，2018(02). ［5］吴启富，王井钢，陈汝侧，林忠敏.川南电力系统电压无功综合分析［J］.四川电力技术，2018(06). 作者简介：范晓帅(1987-),男，山东省高密县人，开滦唐山矿业分公司机电科，工程师，从事矿井机电方向的研究. 168

语音识别及其关键技术

语音识别及其关键技术一、语音识别概述语音识别技术以语音信号处理为研究对象，涉及语言学、计算机科学、信号处理、生理学、心理学等诸多领域，是模式识别的重要分支。该技术有非常广阔的应用前景，从６０年代至今，世界许多著名公司不惜投入巨资进行开发研究。我国的北京大学和中科院声学研究所一直紧跟国际水平，进行汉语语音识别技术的研究工作。５０年代，是语音识别研究工作的开始时期，它以贝尔实验室研制成功可识别十个数字的犃狌犱狉狔系统为标志。６０年代，计算机广泛应用于语音识别的研究工作中，动态规划和线性预测分析技术是这一时期的重要成果。７０年代，语音识别的研究取得了突破性进展。基于线性预测倒谱和动态时间规整技术的特定人孤立语音识别系统被研制成功，提出了矢量量化和隐马尔可夫模型理论。８０年代，语音识别的研究工作进一步深入。其标志是人工神经元网络在语音识别中的成功应用。９０年代，随着计算机技术的飞速发展，语音识别正从研究走向实用，其研究成果已达到相当高的水平。２０００年，正象美国微软公司总裁所说的那样，语音识别技术将使计算机丢掉键盘和鼠标。这无疑将改变我们许多人的工作和生活方式。二、语音识别所面临的问题尽管语音识别的研究工作迄今已近５０年，但仍未有突破性进展，主要原因如下：１．语音识别系统的适应性差。全世界有近百种官方语言，每种语言有多达几

十种方言，同种语言的不同方言在语音上相差悬殊，这样，随着语言环境的改变，系统性能会变得很差。２．在强噪声干扰环境下语音识别困难。由于语音数据大部分都是在接近理想的条件下采集的，语音识别的编码方案在研制时都要在高保真设备上录制语音，尤其要在无噪环境下录音。然而，当语音处理由实验室走向实际应用时，环境噪声的存在所带来的问题就变得越来越重要。特别是线性预测作为语音处理技术中最有效的手段，恰恰是最容易受噪声影响的。３．体态语言难以识别。有人在讲话时习惯用眼神、手势、面部表情等动作协助表达自己的思想。由于这种体态语言的含义与个人习惯、文化背景、宗教信仰及生存地域等因素有关，其信息提取非常困难。４．对于?类由中枢神经控制的?忆机理、听觉理解机理、联想判断机理等人们目前仍知之甚少。三、语音识别系统语音识别系统的分类方式及依据如下：? 根据对说话人说话方式的要求，可分为孤立词语音识别系统，连接词语音识别系统和连续语音识别系统。? 根据对说话人的依赖程度，可分为特定人语音识别系统和非特定人语音识别系统。? 根据词汇量大小，可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别

语音识别技术人工智能论文_大学论文

一：前沿语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。它是一门交叉学科，正逐步成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。二：语音识别技术概述语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，例如语音到语音的翻译。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术，语音识别技术一直受到各国科学界的广泛关注。如今，随着语音识别技术研究的突破，其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术

开发出的产品应用领域非常广泛，如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等，几乎深入到社会的每个行业和每个方面。三．语音识别的研究历史语音识别的研究工作始于20世纪50年代，1952年Bell 实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959年，Rorgie和Forge采用数字计算机识别英文元音和孤立词，从此开始了计算机语音识别。60年代，苏联的Matin等提出了语音结束点的端点检测，使语音识别水平明显上升；Vintsyuk提出了动态编程，这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术，有效地解决了语音信号的特征提取和不等长语音匹配问题；同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。 80年代语音识别研究进一步走向深入：HMM模型和人工神经网络(ANN)在语音识别中成功应用。1988年，FULEE Kai等用VQ/I-IMM方法实现了997个词汇的非特定人连续语音识别系统SPHINX。这是世界上第1个高性能的非特定人、大词汇量、连续语音识别系统。进入90年代后，语音识别技术进一步成熟，并开始向市场提供产品。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、Microsoft等公司都为语音识别系统的实用化开发研究投以巨

人工智能与语音识别

语音识别及其发展本文简要介绍了语音识别技术的发展历史，所采用的关键技术以及所面临的困难与挑战，最后讨论了语音识别在通信等领域中的应用。 ——机器能听懂人类的语言吗？我们能扔掉键盘、鼠标用自然语言操纵计算机吗？随着语音识别技术的发展，梦想正在变为现实。 ——语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言（如人在说话时的表情、手势等行为动作可帮助对方理解），其最终目标是实现人与机器进行自然语言通信。 ——本文将简要介绍语音识别的发展历史，采用的关键技术，面临的困难与挑战以及广阔的应用前景。 1 语音识别的发展历史 ——语音识别的研究工作大约开始于50年代，当时A T& T Bell实验室实现了第一个可识别十个英文数字的语音识别系统——Audry系统。 ——60年代，计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划（DP）和线性预测分析技术（LP），其中后者较好地解决了语音信号产生模型的问题，对语音识别的发展产生了深远影响。 ——70年代，语音识别领域取得了突破。在理论上，LP技术得到进一步发展，动态时间归正技术（DTW）基本成熟，特别是提出了矢量量化（VQ）和隐马尔可夫模型（HMM）理论。在实践上，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 ——80年代，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络（ANN）在语音识别中的成功应用。HMM模型的广泛应用应归功于A T＆T Bell实验室Rabiner等科学家的努力，他们把原本艰涩的HMM纯数学模型工程化，从而为更多研究者了解和认识。ANN和HMM模型建立的语音识别系统，性能相当。 ——进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、A T＆T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。 ——我国语音识别研究工作一直紧跟国际水平，国家也很重视，并把大词汇量语音识别的研究列入“863”计划，由中科院声学所、自动化所及北京大学等单位研究开发。鉴于中国未来庞大的市场，国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者，研究成果已达到相当高水平。因此，国内除了要加强理论研究外，更要加快从实验室演示系统到商品的转化。

文档之家