智能语音报时系统研究_毕晓君(1)
- 格式:pdf
- 大小:105.82 KB
- 文档页数:2
智能语音助手的技术研究与应用随着人工智能技术的发展,智能语音助手越来越受到人们的关注和使用。
智能语音助手是一种基于语音识别、自然语言理解和语音合成等技术的人机交互系统,可以帮助人们解决生活中的各种问题,比如搜索信息、发送短信、听音乐、控制家电等。
本文将从技术研究和应用两个方面探讨智能语音助手的发展现状和未来趋势。
一、技术研究1.语音识别语音识别技术是智能语音助手的核心技术之一,它是将语音信号转换成可识别的数字信号进行处理。
目前,语音识别技术在语音识别率、效率和适应性等方面已经取得了显著的进展。
但是,在特定场景下,仍然存在语音干扰、口音差异、多种语言混合和口音变化等问题,这些问题是需要解决的。
2.自然语言理解自然语言理解是将语音信号进行语义理解的过程。
智能语音助手需要能够理解人们的语言表述,并能够将意图转化为可执行的任务,因此自然语言理解是智能语音助手的另一个重要技术。
目前,自然语言理解技术已经能够实现语义分析、情感分析和智能问答等功能,但是,在语言理解的深度、广度和精准度方面仍然存在诸多挑战。
3.语音合成语音合成是指将数字信号转化成人工声音信号的过程。
目前,语音合成技术已经能够实现自然的语音合成,并能够根据用户的需要进行个性化调整。
但是,在通过语音合成实现自然交流和语音融合的方面,仍然存在一些限制。
二、应用广泛的领域1.语音搜索语音搜索是智能语音助手最基本的应用之一。
通过语音搜索技术,人们可以通过语音命令进行信息的搜索和获取,从而省去了打字的繁琐过程。
目前,语音搜索技术已经应用于各种应用场景,如智能家居、智能办公等方面。
2.智能家居随着物联网技术的发展,智能家居已经成为了人们关注的焦点。
智能语音助手可以实现对家庭电器的语音控制,如打开灯光、调节温度、播放音乐等,从而增强了家庭的智能化程度。
3.智能客服智能语音助手还可以应用于智能客服领域,为人们提供更加方便和快速的服务。
通过智能语音助手,用户可以进行自然的语音交流,并可以得到相应的服务和支持。
基于人工智能的智能语音助手系统设计与实现智能语音助手系统设计与实现摘要:随着人工智能技术的快速发展,智能语音助手系统在各个领域得到了广泛的应用。
本论文主要介绍了基于人工智能的智能语音助手系统的设计与实现。
首先,论文介绍了智能语音助手系统的背景和意义,分析了其在生活、工作和学习中的应用。
然后,论文详细讨论了智能语音助手系统的架构设计和实现过程,包括语音识别、自然语言处理、对话管理和对话生成等关键技术。
最后,论文总结了智能语音助手系统的优势和不足,并对未来的发展趋势进行了展望。
关键词:智能语音助手系统,人工智能,语音识别,自然语言处理,对话管理,对话生成一、引言智能语音助手系统是一种基于人工智能技术的智能化系统,其目的是通过自然语言的交互方式,为用户提供各种服务和支持。
随着人工智能技术的快速发展,智能语音助手系统已经在各个领域得到了广泛的应用,包括语音识别、自然语言处理、对话管理和对话生成等关键技术,它们的集成为系统的高效运行提供了基础支持。
本论文主要介绍了基于人工智能的智能语音助手系统的设计和实现。
首先,我们将介绍智能语音助手系统的背景和意义,分析其在生活、工作和学习中的应用。
然后,我们将详细讨论智能语音助手系统的架构设计和实现过程,包括语音识别、自然语言处理、对话管理和对话生成等关键技术。
最后,我们将总结智能语音助手系统的优势和不足,并对未来的发展趋势进行展望。
二、智能语音助手系统的背景与意义智能语音助手系统是一种基于人工智能技术的智能化系统,它通过语音识别、自然语言处理和对话生成等关键技术,实现了与用户的自然语言交互。
智能语音助手系统在生活、工作和学习等方面具有很大的潜力和广泛的应用价值。
在生活方面,智能语音助手系统可以为用户提供生活娱乐信息的获取和管理。
用户可以通过语音命令快速查找新闻、天气、交通等信息,也可以通过语音交互完成购物、订票、预约等操作。
此外,智能语音助手系统还可以作为一个数字助手,帮助用户管理日程、提醒事项等。
DOI: 10.11991/yykj.202103025改进U-Net 网络的水下图像增强李微1,毕晓君21. 哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 1500012. 中央民族大学 信息工程学院,北京 100081摘 要:为解决现有水下图像增强方法对水下图像特征提取能力不足而导致的模型通用性不足的问题,本文提出一种改进U-Net 网络用于水下图像增强。
首先,提出用生成对抗网络拟合一个新的水下退化模型,再用无水深度图像经过生成对抗网络合成对应的水下图像,从而建立水下数据集。
然后,提出一种改进的U-Net 网络充分提取水下图像特征,自适应地学习水下图像到无水图像的映射关系。
在3种不同类型的数据集上对本文所提出的算法与其他具有代表性的增强方法进行对比验证,结果表明,本文提出的算法能够对不同场景下的水下图像进行颜色校正,提高了图像的清晰度和对比度。
关键词:水下图像增强;特征提取;深度学习;水下退化模型;生成对抗网络中图分类号:TP391.41 文献标志码:A 文章编号:1009−671X(2021)03−0034−07Underwater image enhancement based on improved U-Net modelLI Wei 1, BI Xiaojun 21. College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China2. School of Information Engineering, Minzu University of China, Beijing 100081, ChinaAbstract : In order to solve the problem of insufficient model versatility caused by insufficient feature extraction capabilities of existing underwater image enhancement methods, this paper proposes an improved U-Net model for underwater image enhancement. First, it is proposed to fit a new underwater degradation model with a generative adversarial network, and then use the water-free depth image to synthesize corresponding underwater image through the generative adversarial network to establish an underwater dataset. Then, an improved U-Net network is proposed to fully extract underwater image features and adaptively learn the mapping relationship between underwater images and water-free images. The proposed algorithm is compared with other representative enhancement methods on three different types of datasets. The results show that the proposed algorithm can correct the color of underwater images in different scenarios and improve the clarity and contrast of images.Keywords: underwater image enhancement; feature extraction; deep learning; underwater degradation model;generative adversarial network水下图像的质量对海洋军事、海洋资源开发等领域的研究具有至关重要的影响。
基于教与学算法的认知无线电频谱分配毕晓君;曲会晨【摘要】针对图着色理论模型下的认知无线电频谱分配问题,提出了基于改进教与学算法的认知无线电频谱分配算法。
利用改进教与学算法寻优精度高和收敛速度快等特点,实现了认知用户在平均系统效益最大化的准则下获得最优的频谱分配方案的目的。
仿真结果表明,提出的算法使用户能获得更高的系统效益,提高了频谱分配效率,扩大了教与学算法的应用范围。
【期刊名称】《黑龙江科技信息》【年(卷),期】2015(000)009【总页数】3页(P46-47,48)【关键词】认知无线电;频谱分配;系统效益;教与学算法【作者】毕晓君;曲会晨【作者单位】哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨 150001;哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨 150001【正文语种】中文在解决频谱资源越来越稀缺[1]问题过程中,频谱分配是认知无线电关键技术,它允许未授权的无线系统通过对周围无线通信环境的感知,来实现共享授权用户所使用的频段,从而达到提高频谱利用效率的目的。
因此,频谱分配方案的好坏将直接影响整个系统的资源利用率[1]。
其中目前效果最好的是基于离散人工蜂群算法的认知无线电频谱分配算法[2],但是人工蜂群算法本身还存在接近全局最优解时,搜索速度变慢,种群多样性减少,陷入局部最优等问题,因此,无法保证每次都能获得最佳的频谱分配方案。
教与学算法(Teaching-Learning-Based Optimization,TLBO)是Rao和V D Kalyankar等人于2011年提出的一种新型的群智能优化算法[3],2013年被引入国内,该算法具有参数少、算法易理解、精度高且具有极强的收敛能力等优点[4]。
但目前还没有把教与学算法应用到认知无线电频谱分配的研究成果。
为此本文进行了摸索和尝试,提出了一种改进的教与学算法 (Improve Teaching-Learning-Based Optimization,ITLBO),该算法在原始教与学算法中的学习阶段后增加了一个自主学习阶段,从而能使算法快速的减小最优解的搜索范围,提高了算法的局部搜索能力;并将该算法应用到认知无线电频谱分配中,仿真结果表明,该算法能够有效的使认知用户获得更高的系统效益,实现了有效优化频谱分配方案的目的。
智慧语音分析系统设计方案智慧语音分析系统是一种基于人工智能技术的系统,可以通过语音识别、自然语言理解和机器学习等技术,对用户的语音进行分析和处理,从而实现语音交互和语音控制。
下面是一个智慧语音分析系统设计方案:1. 系统架构设计:- 前端采用语音输入设备,如麦克风,用于接收用户的语音输入。
- 语音输入会经过语音识别模块,将语音信号转换为文本。
- 文本数据会经过自然语言理解模块,进行语义解析和意图识别。
- 通过对意图识别结果的处理,可以得到相应的系统动作和回答。
- 系统的动作和回答通过语音合成模块转化为语音信号,并通过声音输出设备,如扬声器,反馈给用户。
2. 语音识别模块设计:- 语音识别是系统中的核心技术,可以采用深度学习模型,如长短时记忆网络(LSTM)或卷积神经网络(CNN)。
- 训练语音识别模型需要大量带标签的语音数据集,可以利用现有语音数据集进行预训练,并通过迁移学习的方法进行微调。
- 语音识别模型需要进行实时推理,因此需要在设计时考虑模型的计算效率和内存占用。
3. 自然语言理解模块设计:- 自然语言理解是将用户的文本输入转化为机器可以理解的表示形式,通常包括语法分析、语义分析和意图识别等任务。
- 可以采用模板匹配、规则推理或机器学习方法来实现自然语言理解。
- 意图识别是自然语言理解的关键任务,可以采用基于统计的方法,如最大熵模型或隐马尔可夫模型,或者采用基于深度学习的方法,如循环神经网络(RNN)或卷积神经网络(CNN)。
4. 语音合成模块设计:- 语音合成是将系统的动作和回答转化为语音信号的过程。
- 可以采用基于规则的方法,如将文本分割为音素,并将音素转化为音频信号。
- 也可以采用基于深度学习的方法,如循环神经网络(RNN)或生成对抗网络(GAN),通过训练模型生成语音波形。
5. 数据处理和存储设计:- 系统需要处理大量的语音数据和文本数据,因此需要设计合适的数据处理和存储方案。
- 可以采用分布式数据存储和处理技术,如Hadoop 和Spark,来实现高性能和可扩展的数据处理。
基于机器学习技术的智能语音播报系统研究随着智能化时代的到来,越来越多的领域开始应用机器学习技术。
其中,语音技术成为了人们耳熟能详的应用之一。
现在,各种智能语音助手、智能音箱等产品已经成为人们生活的一部分。
在这些产品中,语音播报系统扮演着重要的角色,让人们更加智能化地获取信息。
一、智能语音播报系统的作用智能语音播报系统是一种利用计算机语音识别技术和语音合成技术,将文本信息转化为语音信息并播放出来的系统。
它可以广泛应用于电视广播、车载广播、机场、火车站等公共场所,也可以用于企业内部宣讲、学校广播等场景。
智能语音播报系统的主要作用就是让听者更加方便快捷地获取信息。
不论是在车站或是在商场,听到播报内容使我们能够及时了解到最新的变化。
如果我们将这种技术应用于企业内部,能够保证信息的传递及时、准确,大大提高工作效率。
二、智能语音播报系统的优势相比于传统的播音员,智能语音播报系统具有多重优势。
1. 智能语音播报系统的语音识别精度高。
机器学习技术的应用使得语音识别的准确率大大提高,文本信息转化为语音信息过程中发生的错误及不准确的情况显著减少。
2. 智能语音播报系统能够不间断地工作,而不会出现像人类播音员那样疲惫、出错的情况。
保证了其长时间稳定的播报能力。
3. 智能语音播报系统应用机器学习技术使得其具有了智能学习的能力。
随着系统使用时间的增加,其播报效果会越来越准确,以至于无需过多的人工干预。
三、机器学习技术在智能语音播报系统中的应用智能语音播报系统的核心在于语音合成和语音识别,而这些需要借助计算机的智能学习来实现。
下面简单介绍几个机器学习技术在智能语音播报系统中的应用。
1. 深度学习深度学习是一种机器学习的技术,最近几年在语音识别领域得到了广泛应用。
它通过建立多层次、多阶段的神经网络,从大规模数据中进行学习和构建模型,进而实现语音信号的识别。
2. 集成学习集成学习是一种结合多种分类器的机器学习技术,目的是提高整个系统的预测准确度。
智能语音报时系统研究
毕晓君;唐宏
【期刊名称】《自动化技术与应用》
【年(卷),期】2003(022)007
【摘要】基于语音识别技术和专用芯片,本文开发研制了一种智能语音报时系统,该系统能够自动识别人们发出的询问声音,并具有自动报出当前时间的功能,从而实现了语音报时的智能化.
【总页数】2页(P69-70)
【作者】毕晓君;唐宏
【作者单位】哈尔滨工程大学,哈尔滨,150001;哈尔滨工程大学,哈尔滨,150001【正文语种】中文
【中图分类】TP182
【相关文献】
1.输送机中间架智能语音交互设计型专家系统研究 [J], 宁志强;陶元芳
2.智能语音交互机械故障诊断专家系统研究 [J], 宁志强;陶元芳
3.基于智能语音的电扇控制系统研究 [J], 章周巍;楼承;吴博沿;郭歆怡;陈锡爱
4.基于深度学习的智能语音问答系统研究 [J], 董钰;郭军华
5.福建省广播电视节目智能语音分析系统研究与应用 [J], 郑晔;欧智坚;杨艇
因版权原因,仅展示原文概要,查看原文内容请购买。
一种语音播报系统的研究与设计随着科技的不断进步,语音播报系统越来越受到人们的关注和重视。
语音播报系统是利用先进的语音技术和计算机技术,将文字信息直接转换为语音,从而达到快速、便捷、准确的传递信息的效果。
本文将针对语音播报系统的研究与设计进行分析和探讨。
具体内容包括系统的原理、功能、应用场景、系统设计、系统实现和问题解决等方面。
一、语音播报系统的原理和功能语音播报系统的工作原理是通过识别电脑中的文字信息,将文字信息转换为语音信息并进行输出。
系统通过使用文本转语音(TTS)技术,将文字转换为语音信息。
TTS 技术包括文字分析和语音合成两个方面,采用自然语言处理技术解码分析文字,从而确定语音的声音、语调、音高和语速等要素。
语音播报系统具有多种功能,主要包括以下几点:1.支持多种语言:语音播报系统可以支持多种语言文字的转换,如中文、英文、法文、德文等。
2.支持多种声音:语音播报系统可以选择多种声音类型,包括不同性别、语音风格、语言口音等。
3.支持多种输出方式:语音播报系统可以输出至外部音箱、耳机、电脑扬声器及手机等,支持多种输出端口。
4.可自定义输出格式:语音播报系统可以根据用户需求自定义语音输出的格式,比如定义语速、音量、音调等。
二、语音播报系统的应用场景语音播报系统的应用场景非常广泛,可以在多个领域进行应用。
以下是一些常见的应用场景:1.智能家居:语音播报系统可以作为智能家居系统中的一部分,通过语音播报功能,为用户提供多种信息服务,如告知用户家庭保安情况、处理语音控制命令、通知用户家里的气温、湿度、等等。
2.物流行业:语音播报系统可以实时播报物流站点的货物情况,为运输人员、经理们提供即时的运输信息服务。
3.军事指挥:语音播报系统可以为军队指挥系统提供即时、准确的战略指挥,如战场情况、士兵需求等数据,帮助指挥官做出正确的决策。
4.无人驾驶:语音播报系统可以搭载在无人驾驶汽车上,进行实时播报路线、速度、目的地信息,为机器驾驶员提供帮助。
自动报时钟策划书3篇篇一《自动报时钟策划书》一、项目背景随着科技的不断发展,时钟已经成为我们生活中不可或缺的一部分。
然而,传统的时钟往往需要我们手动调整时间,对于一些忙碌的人来说,这可能会带来不便。
因此,我们设计了一款自动报时钟,旨在为用户提供更加便捷、准确的时间服务。
二、项目目标1. 设计一款自动报时钟,能够准确显示时间,并具有报时功能。
2. 采用智能化设计,用户可以通过手机 APP 等方式进行远程控制和设置。
3. 外观设计简洁大方,符合现代家居风格。
三、市场分析目前,市场上已经有一些自动报时钟产品,但大多数产品功能单一,价格昂贵。
我们的自动报时钟将具有更加智能化、个性化的功能,能够满足不同用户的需求。
同时,我们将采用低成本的生产方式,提高产品的性价比,具有较强的市场竞争力。
四、项目实施1. 硬件设计(1)采用高精度时钟芯片,确保时间显示准确无误。
(2)设计智能化控制系统,实现自动报时、远程控制等功能。
(3)外观设计采用简洁大方的风格,符合现代家居审美。
2. 软件设计(1)开发手机 APP,用户可以通过 APP 进行时钟设置、报时设置等操作。
3. 生产制造(1)寻找合适的生产厂家,进行批量生产。
(2)严格控制产品质量,确保产品性能稳定可靠。
五、项目推广1. 网络营销(1)建立官方网站,展示产品特点和优势。
(2)利用社交媒体平台进行宣传推广,吸引用户关注。
(3)开展促销活动,吸引用户购买。
2. 线下推广(1)参加各类电子产品展会,展示产品。
(2)与家居用品店、电子产品店等合作,进行产品推广。
六、项目预算1. 硬件成本:[X]元2. 软件成本:[X]元3. 生产制造费用:[X]元4. 营销费用:[X]元5. 其他费用:[X]元七、项目预期收益1. 销售收入:根据市场需求和销售价格,预计项目实施后第一年可实现销售收入[X]元。
2. 利润:预计项目实施后第一年可实现利润[X]元。
八、风险评估1. 技术风险(1)时钟芯片的稳定性和准确性可能会受到影响。
智能语音助手技术的研究与应用一、引言随着人工智能技术的不断进步和发展,语音助手技术也得到了强力发展,智能语音助手的广泛应用为用户带来了极大的便利和舒适,更增加了人工智能普及所带来的巨大方便及改变契机。
本文从技术的研究和应用两个方面,简单介绍智能语音助手的一些最新进展和实际情况。
二、智能语音助手的技术研究1.自然语言处理技术智能语音助手是一种基于自然语言处理技术的软件应用程序,主要涉及语音识别、语音合成、语音理解和语音应用等领域。
语音识别是智能语音助手的核心技术,是将人类语言转化为计算机可以理解的语言的过程。
目前,语音识别技术已经得到了相当程度的发展,特别是深度学习技术的不断发展,使得语音识别准确度更高,速度更快,相应的对用户的服务体验也更好了。
语音合成技术则是将计算机中输入的文字信息,转化为和人一样的声音输出,最终形成人类可以听懂的语音信号。
现阶段的语音合成技术已经相应的发展的很成熟,主要有三种方法:基于文本合成、基于拼接的合成和基于混合合成等。
语音理解技术是智能语音助手将用户的语音应答转化为软件执行命令或返回相关信息中最为核心的关键要素。
目前语音理解技术,在预处理、自然语言理解和匹配等方面,都在不断地更新和进步。
2.改进式学习和机器学习智能语音助手的技术能力和新的工作场景的增加,是确保智能语音助手能在实践场景中持续拓展的重要特征。
这就需要对改进式学习和机器学习等技术的高度关注和运用。
改进式学习是基于机器学习技术的一种深度学习算法,它的作用是可以快速将模型训练在有声音输入的场景中。
这也就在于通过人工智能技术对操作进行解耦,让模型可以适应个性化的数据,以进一步提升模型的学习性能。
机器学习是让智能语音助手能够通过训练自我提高性能的一种方法。
同时,不同的机器学习方法根据数据量、软件功能以及支持归纳与演绎等,都有不同的匹配适用区域。
熟练运用机器学习技术,可以进一步完善或扩大智能语音助手的应用场景,并更好地服务于用户。
轻松“听”时间,为本本巧设“语音报时员”1. 引言1.1 介绍问题随着现代社会生活节奏的加快,人们对时间的准确把握变得尤为重要。
随身携带手表或手机查看时间并不总是方便的,尤其是在一些特殊场合或需要注意安全的情况下。
如何更加便捷地获取准确的时间成为了一个备受关注的问题。
传统的时钟报时系统过于机械化,缺少人性化的交流方式,单调枯燥的报时声音往往让人感到厌烦。
而人工语音报时员常常需要长时间连续工作,容易出现口误或疲劳,无法保证报时的准确性和连续性。
在这样的背景下,如何设计一种轻松愉悦的方式来获取时间信息,让人们在忙碌中享受到一丝温暖呢?这就是我们亟需解决的问题。
接下来,我们将介绍一种新颖的解决方案,即为本本巧设“语音报时员”。
让时间不再冰冷机械,而是温暖亲切,成为我们生活中的好伙伴。
1.2 引出解决方案数字统计、段落格式等。
引出解决方案:本本巧设“语音报时员”旨在为用户提供一个方便轻松的时间查询方式,通过语音的方式将准确的时间信息传达给用户。
这项技术创新的解决方案,不仅能够方便用户随时了解当前时间,还可以帮助用户避免频繁查看手机或手表,提高工作和生活效率。
通过语音报时员的设置,用户可以更加放松地“听”时间,不再需要时刻关注时钟,而是可以在听到准确时间之后,根据需要来灵活安排自己的工作和生活。
这种解决方案让时间变得更加贴近用户,更加智能化、便捷化,为用户带来全新的时间体验。
2. 正文2.1 语音报时员的作用语音报时员的作用是为用户提供实时准确的时间信息,帮助他们及时掌握时间,合理安排生活和工作。
通过语音报时员,用户无需查看手表或手机,只需轻松“听”时间就能知道当前的时刻,方便快捷。
语音报时员的作用不仅在于帮助用户获取时间信息,更在于提供便利的时间管理服务,让用户可以更轻松地规划和控制自己的时间。
通过借助语音技术,语音报时员为用户带来了全新的时间体验,使时间管理变得更加智能化和便捷化。
2.2 设立语音报时员的好处1. 方便快捷:通过设立语音报时员,用户无需查看手机或手表,只需通过语音即可获得准确的时间信息。
专利名称:语音播报方法及装置、计算机装置和计算机可读存储介质
专利类型:发明专利
发明人:黎旭辉
申请号:CN201711150904.2
申请日:20171118
公开号:CN107888776A
公开日:
20180406
专利内容由知识产权出版社提供
摘要:本发明提供一种语音播报方法及装置、计算机装置和计算机可读存储介质。
所述语音播报方法包括:当接收到语音消息时,判断所述终端是否在预设时间内靠近人耳;若检测到所述终端在预设时间内靠近人耳,则对所述语音消息进行语音播报。
本发明能够通过简单的操作实现对语音消息的快速访问,既简化了繁琐的操作过程,又可以达到语音播报语音消息的目的,给用户带来更好的使用体验。
申请人:珠海市魅族科技有限公司
地址:519085 广东省珠海市科技创新海岸魅族科技楼
国籍:CN
代理机构:深圳市赛恩倍吉知识产权代理有限公司
更多信息请下载全文后查看。
一种智能电话语音报时系统
白燕;和康元
【期刊名称】《陕西天文台台刊》
【年(卷),期】1999(022)002
【摘要】介绍了电话语音报时系统的设计思路及原理,并阐述了硬件及通讯接口设计,该系统硬件结构简单,报时准确,可以满足一般用户的需求。
【总页数】4页(P110-113)
【作者】白燕;和康元
【作者单位】中国科学院陕西天文台,陕西省临潼;中国科学院陕西天文台,陕西省临潼
【正文语种】中文
【中图分类】TN916
【相关文献】
1.智能电话语音系统在农业信息服务中的应用 [J], 林初有;奚延勇
2.智能温度监测及电话语音报警系统 [J], 刘英华
3.智能电话语音招生系统的开发与应用 [J], 马美仙;王琴
4.电话语音智能自动报警系统 [J], 梁柏华;杜旭灿;杨琼涛;李炳生
5.秒级准确度的电话语音报时系统设计 [J], 蔡成林;窦忠;刘长虹
因版权原因,仅展示原文概要,查看原文内容请购买。
仪器仪表与检测技术
Instrumentation and Measu rement
5自动化技术与应用62003年第22卷第7期
智能语音报时系统研究
毕晓君,唐宏
(哈尔滨工程大学,哈尔滨150001)
摘要:基于语音识别技术和专用芯片,本文开发研制了一种智能语音报时系统,该系统能够自动识别人们发出的询问声音,并具有自动报出当前时间的功能,从而实现了语音报时的智能化。
关键词:语音识别;智能化;自动报时
中图分类号:TP182文献标识码:A文章编号:1003-7241(2003)07-00069-02
The Study of Intelligent Speech System For
Giving The Present Time
BI Xiao_jun,TANG Hong
(Harbin Engineering University,Harbin150001,China)
Abstract:Base d on speech recognition technology an d specia l speech chip,this pa p e r design a kind o f intelligent speech systemf or givin g the present time.
This system can recognize speech which is inquired by the people,and give the present time automatica lly.It rea lly realiz e the intellectualit y that gives the present time by speech chip.
Key words:Speech recognition;Intelligence;Gi ve the present time au toma tically
1引言
目前常见的语音报时系统是触发式语音报时系统,它通过人工触发相关按键,实现语音正确报时。
但是这种报时系统由于需要人为触发,其实并没有实现真正意义上的自动报时功能。
近年来,随着计算机和微电子技术的发展,语音识别技术得以实际应用[1],同时还出现了一些具有实用价值的语音专用芯片[2],这为智能语音报时系统的研制提供了技术条件。
本文开发的系统就是在现有触发式语音报时系统的基础上,增加语音识别电路,使得开发后的系统能够具有对话应答报时的功能,实现语音报时真正自动化、智能化。
2智能语音报时系统设计
本文所设计的智能语音报时系统,具有对话应答报时的功能。
在使用本系统之前,应该先对其进行/训练0,用户先通过系统麦克风录入一句话/现在几点了?0,使系统能够认知这句话,这里认知的这句话可以是特定的一句话。
训练完成后,当用户再次说出这句话时,系统就会自动应答出当前时间,通过扬声器准确报出当前时间。
本系统由三部分组成:语音识别电路部分、数字模拟开关部分和触发式语音报时部分,其中语音报时部分采用触发式语音报时器。
211语音识别电路的设计
该部分电路是整个系统的关键部分,本系统采用HL7003-2专用语音芯片[3],经过外围电路的设计,可以完成语音识别的
69
es of Aut oma tio n&Ap plicat io ns|
5自动化技术与应用62003年第22卷第7期
仪器仪表与检测技术
Instrumentation and Measu rement
功能[4],能够识别12个不同的字句,通过控制不同的输出开关,该芯片可以完成指定的功能。
在使用HL7003进行字识别之前,目标字必须预先记录在芯片中。
HL7003的存储器提供12块记忆空间,用于存储不同特征的目标字。
每个记忆块可以存储多达115秒长度的语句。
可以通过键区来选择记忆块,或者通过控制HL7003的内部程序去记录目标字。
被识别的关键字由外部麦克风或其他设备输入HL7003,然后通过内部麦克风前置放大器适当放大,语音信号被HL7003内的A P D 转换器数字化,HL7003处理器把数字语音信号接收,摘取关键字的特征。
当目标字被记录在HL7003后,即可进入HL7003的字识别模式。
存储在记忆块内的字与被摘取的字特征进行比较,最适合的匹配字将作为识别的目标字。
最后,识别结果将从输出端口A 或者其它输出端输出。
利用HL7003芯片设计的语音识别
电路图如图1
所示。
图1 语音识别电路
212 数字模拟开关设计
[5]
该部分是利用三极管的饱和和截止的特性设计而成的,其具体电路图如图2所示。
当高电平输入时三极管处于饱和状态,输出电压较小,三极管输出CE 两端近似导通;当输入低电平时,三极管处于截止状态,输出电压较大,CE 两端近似断开。
该开关的作用在于替代触发功能,当语音芯片识别正确时,该开关接通,系统正确报时;当语音芯片识别错误时,该开关断开,系
统不报时。
图2 数字模拟开关电路
3 系统整体连接设计
首先把语音识别电路的输出端POA1接到数字模拟开关的输入端,也就是三极管的B 极,把数字模拟开关的输出端接到报时按键两端,保证它们共用一个地,并在POA1和地之间接一个发光二极管作为测试之用,具体连接如图3
所示。
图3 系统整体连接框图
4 结束语
本文所开发的智能语音报时系统是在触发式语音报时器基础上,加入语音识别芯片,实现了时钟应答报时,使时钟具有智
能化。
本文设计的智能语音报时系统尚未见报道,同时在国内专利产品信息网中也未查出相关的专利电子产品。
因此,本文的研究是语音识别与合成技术在实际中应用的一次尝试,具有一定的创新性。
智能语音报时系统对于在夜间工作的人员、残疾人以及老人和儿童等是非常适用的,它具有一定的推广价值。
此外,还可以利用HL7003的其它输出端在此基础上向其它很多功能扩展,例如:可以进行语音校时,也可以加入语音求救的功能以及设计语音密码锁等。
5 参考文献:
[1] 朱民雄.计算机语音技术[M ].北京:北京航空航天大学出版社,2002年
[2] 任致程.语音录放和识别集成电路应用与制作实例[M].人民邮电出版社,1999年
[3] 何湘智.语音识别研究与发展[J].计算机与现代化,2002,(3):3-6
[4] 周季华,等.语音识别在家电遥控器中的应用[J].电子技术应用,2002,(4):23-25
[5] 阎石.数字电子技术基础[M ].北京:高等教育出版社,1998年
作者简介:毕晓君(1964-),女,硕士,副教授,主要研究方向:数字图象处理与
语音识别。
70
|Tech n iq ue s o f Au to mat io n。