当前位置:文档之家› 第二章 语音信号处理基础知识

第二章 语音信号处理基础知识

第二章 语音信号处理基础知识
第二章 语音信号处理基础知识

第二章语音信号处理基础知识

1、语音信号处理?

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。

2、语音信号处理的目的?

1)如何有效地,精确地表示、存储、传递语音信号及其特征信息;2)如何用机器来模仿人类,通过处理某种运算以达到某种用途的要求,例如人工合成出语音,辨识出说话人、识别出说话内容等。

因此,在研究各种语音信号处理技术之前,需要了解语音信号的基本特性,同时,要根据语音的产生过程建立实用及便于分析的语音信号模型。

本章主要包括三方面内容:语音的产生过程、语音信号的特性分析以及语音信号生成的数学模型。

第一部分内容语音的产生过程,我们要弄清两个问题:1)什么是语音?2)语音的产生过程?

3、什么是语音?

语音是带有语言的声音。人们讲话时发出的话语叫语音,它是一种声音,由人的发音器官发出且具有一定的语法和意义。语音是声音和语言的组合体,所以对于语音的研究包括:1)语音中各个音的排列由一些规则控制,对这些规则及其含义的研究成为语言学;2)对语音中各个音的物理特征和分类的研究称为语音学。

4、语音的产生

语音的产生依赖于人类的发声器官。人的发音器官包括:肺、气管、喉、咽、鼻、口等。

◆喉以上的部分称为声道,其形状随发出声音的不同而变化;

◆喉的部分称为声门。

◆喉部的声带是对发音影响很大的器官。声带振动产生声音。

◆声带开启和闭合使气流形成一系列脉冲。

每开启和闭合一次的时间即振动周期称为基音周期,其倒数为基音频率,简称基频。基频决定了声音频率的高低,频率快则音调高,频率慢则音调低。

基音的范围约为70 -- 350Hz,与说话人的性别、年龄等情况有关。

人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。

人的说话的过程:

1)想说阶段:人的说话首先是客观事实在大脑中的反映,经大脑的决策产生了说话的动机;

接着说话神经中枢选择适当的单词、短语以及按照语法规则的组合,以表达想说的内容和情感。

2)说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,使得舌、唇、鄂、声带、肺等部分的肌肉协调地动作,发出声音。与此同时,大脑也发出一些指令给其他有关器官,使之产生各种动作来配合言语的效果,如表情、手势、身体姿态等。经常有些人说话时会手舞足蹈。另外,还会开动“反馈”系统来帮助修正语音。

3)传送阶段:说出的话语是一连串声波,凭借空气为媒介传送到听者的耳朵。有时遇到某种阻碍或其他声响的干扰,使声音产生损耗或失真。

4)接收阶段:从外耳收集的声波信息,经过中耳的放大作用,达到内耳。经过内耳基底膜的振动,激发器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。

5)理解阶段:听觉神经中枢收到脉冲信息后,经过一种至今尚未完全了解的方式,辨认说话人及听到的信息,从而听懂说话人的话。

再开始介绍语音信号的特性之前,我们先了解一下语音和语言的定义。

5、语言

是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等不同层次的单位,以及词法、句法、文脉等语法和语义内容。语言学是语音信号处理的基础。例如,可以利用句法和语义信息减少语音识别中搜索匹配范围,提高正确识别率。

6、语音学

Phonetics是研究言语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类问题。现代语音学发展成为三个分支:发音语音学、声学语音学以

及听觉语音学。发音语音学研究语音产生机理,借助仪器观察发音器官,以确定发音部位和发音方法;声学语音学研究语音传递阶段的声学特性,与传统语音学和现代语音分析手段相结合,用声学和非平稳信号分析理论来解释各种语音现象;听觉语音学研究语音感知的生理和心理特性,即研究耳朵怎么听音的,大脑怎么理解语音的,语音信息在大脑中存储的部位和形式。

本章第二部分是语音信号的特性分析,包括语音的声学特性,时域波形,频谱特性和统计特性。首先来了解一下语音的声学特性。

7、语音信号的声学特性

语音是人的发声器官发出的一种声波,具有一定的音色、音调、音强和音长。音色也叫音质,是一种声音区别于另一种声音的基本特征;音调是指声音的高低,取决于声音的频率;音强是指声音的强弱,由声波的振幅决定;音长即声音的长短,取决于发音时间的长短。

说话时一次发出,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。

音素是语音发音的最小单位。任何语言都有语音的元音(V owel)和辅音(Consonant)两种音素。

元音:当声带振动发出的声音气流从喉腔、咽腔进入口腔,从唇腔出去时,这些声腔完全开放,气流顺利通过产生音素。-它构成一个音节的主干,长度和能量看,元音在音节中都占主要部分。

辅音:呼出的声流,由于通路的某一部分封闭起来或者受到阻碍,气流被阻不能畅通,而克服这些发音器官的这种阻碍产生的音素。-通常只出现在音节的前端、后端或前后两端。

发辅音时由声带是否振动引起浊音和清音的区别:-声带振动的是浊音;-声带不振动的是清音。

8、基音频率

发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期称为基音周期,其倒数为基音频率。

所以浊音声带振动的基本频率称为基音频率,一般用F

表示。无论一个音节或是一段连

都是随时间变化的,该变化产生了声调,其变化轨迹为声调续语音,各个音节的元音段的F

轨迹。

基音频率与个人声带的长短、厚薄、韧性和发音习惯等有关,在很大程度上反映了个人的特征。一般来说,男性说话者的基音频率大致分布在50-200Hz,女性和小孩的基音频率在200-450Hz之间。

9、共振峰

共振峰是一组谐振频率:声道可以看成一根具有非均匀截面的声管,在发音时起到共鸣器的作用,当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率(简称共振峰)。元音的一个重要的声学特性就是共振峰(Formant)。共振峰参数是区别不同元音的

重要参数,一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。

元音的共振峰与发音机制(舌位高低、前后,舌尖的状态等)有关。

不同元音对应于一组不同的共振峰参数,为精确描述语音,应尽可能使用多个共振峰,但实际应用时,只用前3个就够了,分别称为F1,F2,F3。

表给出了前3个共振峰成年男子和成年女子的分布范围。

所以虽然一般地说,虽然就语音的基音频率而言是女声和童声高于男声,但是实验表明:区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。

下面我们再看一下语音的时域波形和频谱特性:

10、语音信号的时域波形和频谱特性

时间域中,语音信号可以直接用时间波形表示出来,通过观察时间波形可以看出语音信号的一些重要特性。

观察语音信号时间波形的特性,可以通过对语音波形的振幅和周期性来观察不同性质的音素的差别。

下图为汉语拼音“sou ke”的时间波形。表示这段语音波形时采用的采样频率为8kHz,量化精度为16bit。图上标明了时间及各个音节的起始位置。由于在时域波形里各个单音节间不好明显地分界,因此,图上标出的某个音的起点只是粗略的。

从上图可以看出,清辅音[s][k]和元音[ou] [e]这两类音的时间波形有很大区别。例如,

从A点开始的音节[s],以及从C点开始的[k]都是清辅音,它们的波形类似于白噪声,振幅很小,没有明显的周期性;而从B点开始的元音[ou]以及从D点开始的[e]都具有明显的周期性,且振幅较大。它们的周期对应的就是声带振动的频率,即基音频率,它是声门脉冲的间隔。如果考察其中一小段元音语音波形,从它的频谱特性大致可以看出它们的共振峰特性。

语音信号具有很强的时变特性,有些波形具有很强的周期性,有些波形具有很强的噪声特性,且周期性和噪声性语音的特征也在不断变换中。但在较短的时间内,语音信号的特征可以认为基本不变,所以,语音信号属于短时平稳信号,一般认为在10~30ms内语音信号特性基本上是不变的,或者变化很缓慢。-因此可以截取一段进行傅里叶变换(具体的频谱分析方法将在第三章中介绍),求其短时谱。

于是,从中截取一小段进行频谱分析。下图给出“sou”中音素“ou”的傅里叶变换:时间大约为时间波形180ms处开始,取时间波形宽度为256个样本,因采样频率为8kHz,故语音段持续时间为32ms(256/8)。

从该频谱图上可以直接看出浊音的基音频率及谐波频率。在0~1.83kHz之间几乎有6个峰值,因此,基音频率为301Hz(1.83kHz/6)。观察时间波形“ou”波形周期之间的距离也可证明,其中在225~250ms之间大约有7.5个周期,因此可以估计周期为300Hz(7.5/25)。在频谱图中可以看出明显的具有几个凸起点,它们出现的频率就是共振峰频率,从而表明元音具有明显的共振峰特性。

清辅音“k”的傅里叶变换如下图所示:

可以看出,频谱峰点之间间隔是随机的,表明该清辅音没有周期分量。

11、语音信号的语谱图

语音的时域分析和频域分析是语音分析的两种重要方法。显然这两种单独分析的方法均有局限性:时域分析对语音信号的频率特性没有直观的了解;而频域分析出的特征中又没有语音信号随时间的变化关系。由于语音信号随时间变化是很缓慢的,因而在一段短时间内(如10ms~30ms之间,即所谓的一帧之内)可以认为其频谱是固定不变的,这种频谱又称为短时谱。短时谱只能反映语音信号的静态频率特性,不能反映语音信号的动态频率特性。因此,人们致力于研究语音的时频分析特性,把和时序相关的傅立叶分析的显示图形称为语谱图(Sonogram,或者Spectrogram)。

语谱图是一种三维频谱,它表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的特点,明显地显示出语音频谱随时间的变化情况,或者说是一种动态的频谱。记录这种谱图的仪器就是语谱仪。

语谱仪实际上是一个带通滤波器组的输出随时间连续变化,连续重复进行语音信号频率分析的仪器。带通滤波器有两种带宽选择:窄带为45Hz,宽带为300Hz。窄带语谱图具有较好的频率分辨率,有利于显示基音频率及其各次谐波,但时间分辨率较差,不利于观察共振峰的变化;宽带语谱图则具有良好的时间分辨率及较差的频率分辨率。它能给出语音的共振峰频率及清辅音的能量汇集区,在语谱图中共振峰呈现为黑色条纹。

语谱图上因其不同的黑白程度,形成不同的纹路,称为“声纹”,其因人而异,即不同说话人语谱图的声纹是不同的。因而可以利用声纹鉴别不同说话人。这与指纹可以区别不同人的道理相同。

下图给出了一个宽带语谱图,横坐标为时间,纵坐标为频率,语句内容为“nothing was really accomplished”。发音在图下方以音标表示。该图下方给出了时域波形。

语谱图中的花纹有横杠(Bar)、乱纹和竖直条等。横杠是与时间轴平行的几条深黑色带纹,它们相应于短时谱中的几个凸出点,也就是共振峰。从横杠对应的频率和宽度可以确定相应的共振峰频率和带宽。在一个语音段的语谱图中,有没有横杠出现是判断它是否是浊音的重要标志。竖直条(又叫冲直条)是语谱图中出现与时间轴垂直的一条窄黑条。每个竖直条相当于一个基音,条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音周期。条纹越密表示基音频率越高。元音一般对应横杠,如图中nothing的Λ,还有accomplished中的?。它指示了共振峰的存在。清擦音从语谱图上看,表现为乱纹,如语谱图中p以及?等音,乱纹的深浅和上下限反映了噪声能量在频域中的分布。

语音信号的第三个特性即统计特性。

12、语音信号的统计特性

语音信号的统计特性可以用它的波形振幅概率密度函数和一些统计量(如均值和自相关函数)来描述。表示语音信号的统计特性的概率密度的估算方法是根据长时间范围内一段语音信号的大量取样数据的幅度绝对值计算出其幅度直方图(统计某一幅度值出现的频度),然后,根据统计的振幅直方图,寻找近似的概率密度表达式。

通过对语音信号的统计特性的研究表明,语音信号振幅分布的概率密度有两种逼近方法: 一种是修正伽玛(Gamma)分布概率密度函数

? 另一种是拉普拉斯(Laplace )分布概率密度函数

对于长期统计来说,用拉普拉斯分布描述语音信号的统计特性不及伽码分布描述精确,但其函数式却简单一些。也可以用高斯分布(Gaussian)来近似。

如下图给出了修正伽马密度(实线)、拉普拉斯密度(虚线)和高斯密度(点线)以及天气预报语音的长期幅度分布(不规则的虚线)图形。可以看出,这三个分布函数中,伽码函数逼近效果最好,其次是拉普拉斯函数,而高斯分布逼近效果最差。

本章的第三个内容是语音信号的生成模型:

13、语音信号生成的数学模型

◆ 所谓建立数学模型就是要寻求一种可以表达一定物理状态下量与量之间关系的数学表

示。建立了语音信号的数学模型,才能够用计算机来定量地对语音信号进行模拟和处理。所以语音信号生成的数学模型是语音信号处理的基础。

◆ 建立数学模型的基本原则是这种数学关系不仅具有最大的精确性,还要最为简单。理想

的模型是线性的和时不变的。但从人的发声器官的机理看,发不同性质的语音,声道的情况是不同的。另外,声门和声道还会相互耦合,形成语音信号的非线性特性。因此,语音信号是非平稳随机过程,其特性是随着时间变化的,所以模型中的参数应该是随时

间而变化的。但语音信号特性随着时间变化是很缓慢的。所以可以作出一些合理的假设,

x e k x p x k G -=π2)(x L e

p αα-=5.0

将语音信号分为一些相继的短段进行处理,在这些短段中可以认为语音信号特性是不随着时间变化的平稳随机过程。这样在这些短段时间内表示语音信号时,可以采用线性时不变模型。

◆ 可以将语音生成系统分成三个部分,在声门(声带)以下,称为声门子系统,负责产生激励振动,是激励系统;从声门到嘴唇的呼气通道是声道

,是声道系统;语音从嘴唇辐射出去,嘴唇以外是辐射系统。

◆ 下面分别介绍激励模型、声道模型、辐射模型,再介绍语音信号产生的数学模型。

14、激励模型

激励模型一般分成浊音激励和清音激励来讨论。

浊音时,激励信号由一个周期脉冲发生器产生,产生的序列是一个频率等于基音频率的冲激序列。

清音时,激励信号是由一个随机噪声发生器产生。可设定其平均值为0,其自相关函数是一个单位冲激函数。

发浊音时,由于声带不断张开和关闭,将产生间歇的脉冲波。这个脉冲波的波形类似于斜三角形的脉冲,它的数学表达式如下: 式中,N 1为斜三角波上升部分的时间,N 2为其下降部分的时间。单个斜三角波波形脉冲如下图图左所示,频谱如下图右所示。

由图可见,它是一个低通滤波器。它的z 变换的全极模型的形式是:

这里,c 是一个常数。显然,上式表示的斜三角波形可描述为一个二极点的模型。周期性的斜三角脉冲串可看作加权的单位脉冲串激励上述单个斜三角脉冲的结果。而该单位脉冲串及幅值因子则可表示成下面的z 变换形式:

单位脉冲串及幅度因子可表示为:

?????+≤≤-≤≤-=其他,0],2/)(cos[0)],/cos(1)[2/1()(2112111N N n N N N n N n N n n g ππ21)1(1)(---=z e z G cT 1

1)(--=z A z E V

调节浊音信号的幅度

所以,整个浊音激励模型可表示为:

也就是说浊音激励波是一个以基音周期为周期的斜三角脉冲串。 发清音时,声道被阻碍形成湍流,可模拟为随机白噪声。实际中使用均值为0,方差为1,并在时间或幅度上为白色分布(在所考虑的频带内具有连续频谱和恒定的功率谱密度)的序列。

其实,简单的把激励分为浊音和清音两种情况是不全面的。对于某些音,把两种激励叠加起来也不严格,但是若将两种激励经过适当的网络之后,就可以得到良好的激励信号。为了更好地模拟激励信号,有人提出在一个音调周期内用多个斜三角波;还有人提出用多脉冲序列和随机噪声序列的自适应激励法。

15、声道模型

声道的数学模型有两种观点:

1)声管模型

将声道看为由多个不同截面积的管子串联而成的系统。在“短时”期间,声道可表示为形状稳定的管道。

另一种观点是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。

共振峰模型,把声道视为一个谐振腔。共振峰就是这个腔体的谐振频率。由于人耳听觉的柯替氏器官的纤毛细胞就是按频率感受而排列其位置的,所以这种共振峰的声道模型方法是非常有效的。一般来说,一个元音用前三个共振峰来表示就足够了;而对于较复杂的辅音或鼻音,大概要用到前五个以上的共振峰才行。基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、

并联型和混合型。

(1)级联型声道模型

2

11)1(11)()()(----?-==z e z A z E z G z U cT v

这时认为声道是一组串联的二阶谐振器。从共振峰理论来看,整个声道具有多个谐振频率和多个反谐振频率,所以它可被模拟为一个零极点的数学模型;但对于一般元音,则用全极点模型就可以了。它的传输函数可分解表示为多个二阶极点的网络的串联:

N=10,M=5时的声道模型如下图所示:

(2)并联型声道模型

对于非一般元音以及大部分辅音,必须考虑采用零极点模型。此时,模型的传输函数如下:

通常,N>R ,且设分子与分母无公因子及分母无重根,则上式可分解为如下部分分式之和的形式:

这就是并联型的共振峰模型。如图2-21所示(M=5)。

(3)混合型声道模型

上述两种模型中,级联型比较简单,可以用于描述一般元音。当鼻化元音或鼻腔参与共

振,以及阻塞音或摩擦音等情况时,级联模型就不能胜任了。这时腔体具有反谐振特性,必

2

212112cos(2)()12cos(2)k k k k B T B T

M

k B T B T k k e F T e V z e F T z e z ππ------=-+=-+∏∑∑=-=--=N k k k R r r r z a z b z V 101)(∑=----=M

i i i i z C z B A z V 1211)(

须考虑加入零点,使之成为零极点模型。采用并联结构的目的就在于此,它比级联型复杂些,每个谐振器的幅度都要独立地给以控制。但对于鼻音、塞音、擦音以及塞擦音等都可以适用。正因为如此,将级联模型和并联模型结合起来的混合模型也许是比较完备的一种共振峰模型。

16、辐射模型

从声道模型输出的是速度波)(n u L ,而语音信号是声压波)(n p L ,二者之倒比称为辐射阻抗L Z 。它表征口唇的辐射效应, 也包括圆形的头部的绕射效应等。当然,从理论上推导这个阻抗是有困难的。但是如果认为口唇张开的面积远小于头部的表面积,则可近似地看成平板开槽辐射的情况。此时,可推导出辐射阻抗的公式如下:

r

r r r L L j R R L j z Ω+Ω=Ω)( 式中,,91282

π=

r R c a L r π38= ,这里,a 是口唇张开时的开口半径,c 是声波传播速度。由辐射引起的能量损耗正比于辐射阻抗的实部,所以辐射模型是一阶类高通滤波器。 17、语音信号的数学模型

综上所述,完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。如图所示:

它的传输函数)(z H 可表示为:

)()()()(z R z V z U A z H ?=

这里,U(z)是激励信号,浊音时U(z)是声门脉冲即斜三角形脉冲序列的z 变换;在清音的情况下, U(z)是一个随机噪声的z 变换。V(z)是声道传输函数,既可用声管模型,也可以共振峰模型等来描述。实际上就是全极点模型: ∑=--=N k k

k z a z V 111

)(

应该指出,上式所示模型的内部结构并不和语音产生的物理过程相一致,但这种模型和真实模型在输出处是等效的。

另外,这种模型是“短时”模型,因为一些语音信号的变化是缓慢的,例如元音在10~20ms 内其参数可假定不变。

这里声道转移函数是一个参数随时间缓慢变化的模型。

另外,这一模型认为语音是声门激励源激励线性系统-声道所产生的。

而)(z R 则可由式(2-13)按如下方法来得到:先将该式改写为拉普拉斯变换形式: r r y

r L sL R L sR s z +=)(

然后使用数字滤波器设计的双线性变换方法将上式转换成z 变换的形式:

)

1()1()(1110----=z R z R z R 若略去上式的极点(1R 值很小),即得一阶高通的形式:

)1()(10--=z R z R

以上就是语音信号处理的基础知识。

基音频率F 0 振幅A V

振幅A U

习题:

1、什么叫语音?什么叫语言?人们说话过程包括哪5个阶段?各个阶段的主要内容是什么?

语音是由一连串的音组成语言的声音。

语言是是从人们的话语中概括总结出来的规律性的符号系统。

人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。

6)想说阶段:人的说话首先是客观事实在大脑中的反映,经大脑的决策产生了说话的动机;

接着说话神经中枢选择适当的单词、短语以及按照语法规则的组合,以表达想说的内容和情感。

7)说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,使得舌、唇、鄂、声带、肺等部分的肌肉协调地动作,发出声音。与此同时,大脑也发出一些指令给其他有关器官,使之产生各种动作来配合言语的效果,如表情、手势、身体姿态等。经常有些人说话时会手舞足蹈。另外,还会开动“反馈”系统来帮助修正语音。

8)传送阶段:说出的话语是一连串声波,凭借空气为媒介传送到听者的耳朵。有时遇到某种阻碍或其他声响的干扰,使声音产生损耗或失真。

9)接收阶段:从外耳收集的声波信息,经过中耳的放大作用,达到内耳。经过内耳基底膜的振动,激发器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。

10)理解阶段:听觉神经中枢收到脉冲信息后,经过一种至今尚未完全了解的方式,辨认说话人及听到的信息,从而听懂说话人的话。

2、语言学的主要研究有哪些内容?语音学又有哪些内容?

语言学包括构成语言的语素、词、短语和句子等不同层次的单位,以及词法、句法、文脉等语法和语义内容。语音学考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类问题。

3、人类的发音器官包括哪些部分?音调频率由什么因素决定?

发音器官包括肺、气管、喉(包括声带)、咽、鼻和口。音调频率由基音频率决定。

4、语音信号的数学模型包括哪些子模型?激励模型如何推导?辐射模型又是怎样推导?各属于什么性质滤波器?

包括激励模型,声道模型,辐射模型。推导略,激励模型类似低通滤波器;声道模型;辐射模型是一阶类高通滤波器。

P15

音色(tone-colour)是指乐器或嗓音的音质。

以人声来说,女高音嘹亮柔美,男高音挺拔高亢,女中音比较暗一些,浑厚而温暖,男中、男低音则是庄重厚实,给人一种坚定的感觉。乐器的音色种类就更丰富了,小提琴的纤

色的运用非常讲究,这些各种各样的声音特质对他们来说,就象是画家手中的色彩一样,会令他们的旋律、和声、节奏、力度产生鲜明的效果。

管理基础知识第二章决策笔记

第二章决策 一、决策的本质 决策定义:是决策者为达到某种预定目标,运用科学的理论、方法和手段,制定出若干行动方案,对此作出一种具有判断性的选择,予以实施,直到目标实现。 决策的简单定义就是从两个以上的备选方案中选择一个的过程。 决策的选择:a、为了达到一个预定目标b、寻求优化目标和达到目标的手段c、选择方案 从系统的观点看,管理决策是由决策主体、决策客体、决策理论与方法、决策信息和决策结果等六要素构成的一个有机整体。 决策主体是决策系统的灵魂和核心,决策能否成功,取决于主体的性质。 决策客体指决策对象和环境。其特点、性质决定决策活动的内容和复杂程度。 决策理论和方法在于提高决策的科学性,减少结果的误差和失误。 决策信息是决策的前提和基础,拥有大量丰富信息是保证决策正确性的条件。 决策结果是决策的构成要素 二、决策的分类与原则 (一)决策的分类: 1、按决策目标的影响程度不同,可分为战略性决策和战术性决策; 战略性决策关系发展方向和远景规划,包括组织目标、方针的确定,机构调整。 特点:宏观、全局、方向、原则性 战术性决策目标具体,问题单一,包括管理性决策和业务性决策。 特点:微观、局部、区域、阶段性 管理性决策是在组织内贯彻的,属于战略决策执行过程中的具体决策。业务性决策也称为作业决策,是日常工作中为提高生产工作效率而做出的决策,范围较窄。 2、按决策问题的重复程度不同,可分为程序化决策与非程序化决策; 组织中的两类问题:例行问题(常规、定型化、重复性出现的,日常管理问题)程序化决策的涉及,例外问题(偶然发生的、新颖的、性质不明的、重大影响的问题)非程序化决策涉及。 一般组织中80%的决策属于程序化决策。 3、按决策条件的可控程度划分,可分为确定型决策、风险型决策和不确定型决策; 确定性决策:指在稳定(可控)条件下进行的决策。确切知道自然状态的发生。每个方案只有一个确定的结果,方案的选择取决于各个方案结果的比较风险型决策(随机决策):自然状态不止一种,不知道那种自然状态会发生,但知道有多少种以及发生的概率 不确定型决策:不知道有多少种自然状态,就算知道,也不知晓发生的概率 风险型和不确定型决策的条件相似,不同的是不能确定概率。因为不确定因素更多,风险更大

重庆市事业单位管理基础知识(全)

第一章管理概述 第一节管理的概念和特点 一、管理概念:管理就是管理这在一定的环境下,为了实现特定组织的目标,动员和运用有效资源而进行的计划、组织、领导、控制等社会活动。 管理六点基本含义:1.管理是以管理者为主体进行的活动;2.在一定的环境下进行的;3.为了实现特定的目标;4.需要动员和配置有效资源;5.具有基本职能;6.是一种社会实践活动。 二、管理的特点 (一)管理具有两重性 1.管理的生产力属性和生产关系属性。 2.管理的科学性和艺术性。(艺术性即实践性,管理活动对于“度”的把握) (二)目标性 1.组织的共同目标;2.目标具有大小层次性;3.具有时间跨度;4.多元价值性(盈利、地位等) (三)组织性 (四)创新性 第二节管理职能与类型 一、管理职能(最早系统并明确分析管理职能的是法国管理学家亨利.法约尔。) (一)计划(做什么)活动条件研究;制定业务决策;编制行动计划。 (二)组织(怎么做)设计组织;人员配备;组织变革。 (三)领导(靠什么做) (四)控制(如何做得更好及做得如何) 二、管理职能发展:20世纪下半叶开始,决策、创新、协调职能受重视。 三、管理类型:按照公共领域和非公共领域及其主体组织形式,分为公共管理和企业管理。 (一)公共管理是以公共组织为依托,运用公共权力为实现公共利益而进行的管理活动。 特点:1.以公共利益为实现目标;2.以公共组织为依托;3.公共管理是公共权力运用过程; 4.独占性(一种公共服务、产品由一个部门承担); 5.接受公众监督。 在中国,把非政府组织分为事业单位和公共服务性中介组织。 (二)企业管理:企业是以盈利为目的而进行生产、服务的组织,以企业法人身份活动注重个体利益。 特点:1.目标单一即盈利;2.企业管理具有竞争性;3.典型的经济理性;4.权力来源于生产资料所有权及委托经营权。 第三节管理者职责与技能 一、角色类型:人际关系、信息传递、决策制定三方面角色。 层次:高层、中层、低层管理者。 领域分类:综合管理人员、专业管理人员(如人事、销售) 二、具备技能 (一)技术职能。使用某一专业领域有关工作程序、技术知识能力。 (二)人际技能。沟通协调能力。 (三)概念技能。概括洞察决策判断能力。 第四节管理环境 一、环境变化为组织生存发展提供想的机会;又对生存环境造成某种不利威胁。 环境三大类:(一)一般、宏观环境:政治、社会文化、经济、技术、自然环境五方面。 (二)具体微观环境:现有竞争对手研究、潜在竞争对手、替代品厂家、用户、供应商。 (三)组织内部环境 两种环境分析方法:1.识别环境不确定性程度的方法(美.邓肯),从两个方面确定组织环境因素:稳定(静态)---不稳定(动态);二是复杂程度:简单---复杂层面得出评价模型。 2.内外部环境综合分析:外部:机会(O)、威胁(T);内部:优势(S)、劣势(W)。 第二章决策

数字语音信号处理实验报告

语音信号处理实验报告 专业班级电子信息1203 学生姓名钟英爽 指导教师覃爱娜 完成日期2015年4月28日 电子信息工程系 信息科学与工程学院

实验一语音波形文件的分析和读取 一、实验学时:2 学时 二、实验的任务、性质与目的: 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验 (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 三、实验原理和步骤: WAV 文件格式简介 WAV 文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV 文件的头四个字节就是“RIFF”。WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16 位的整数(int),高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV 文件中,道0 代表左声道,声道1 代表右声道;在多声道WAV 文件中,样本是交替出现的。WAV 文件的格式 表1 wav文件格式说明表

人教版高中化学选修五第二章知识点

人教版化学选修五第二章知识点 1、烷烃、烯烃和炔烃 (1)代表物的结构特点 注意:碳碳双键不能旋转,由于碳碳双键不能旋转而导致分子中原子或原子团在空间的排列方式不同所产生的异构现象,成为烯烃的顺反异构。 顺反异构:两个相同的原子或原子团排列在双键的同一侧称为顺式异构,两个相同的原子或原 子团排列在双键的两侧称为反式异构,即“同顺异反”。如2-丁烯:顺反异构的化学性质基本相同,物理性质不同。 (2)物理性质烷烃、烯烃和炔烃的物理性质都是随着分子中碳原子数的递增,呈现规律性的变化,沸点逐渐升高,相对密度逐渐增大,常温下的存在状态,也由气态逐渐过渡到液态、固态。

注意: a) 烷烃、烯烃和炔烃都是分子晶体,随着相对分子质量的增大,熔沸点逐渐升高。同分异构体之间,支链 越多,沸点越低。 b) 碳原子数小于等于4 的烃在常温下通常为气态,但是由于新戊烷具有支链比较多,所以在常温下也是 气态。 c) 烷烃、烯烃和炔烃的相对密度都小于1,不溶于水。 3)烷烃的化学性质 烷烃的通式为C n H2n+2,其的化学性质类似于甲烷。 a) 化学性质相当稳定,跟强酸、强碱或强氧化剂(如KMnO 4)等一般不起反应。点燃 b) 氧化反应:烷烃能够燃烧,化学方程式为C n H2n+2+(3n+1)/2O2→ nCO2+(n+1)H2O c) 取代反应(烷烃的特征反应) :烷烃能够和卤素单质发生取代反应,一取代的化学方程光照 式为C n H 2n+2+Cl 2→ C n H2n+1Cl+HCl 高温 d) 分解反应:烷烃在高温下能够发生裂解。如C4H10→ CH2=CH2+CH3CH3,或者高温 C4H10→ CH2=CH-CH3+CH4 (4)烯烃的化学性质 烯烃的通式为C n H2n,n≥2(但C n H2n 不一定是烯烃,有可能是环烷烃)烯烃的化学性质类似于乙烯。由于烯烃具有碳碳双键官能团,所以化学性质比较活泼。 a) 氧化反应:烯烃的氧化反应包括被氧气氧化和被强氧化剂(酸性KMnO4 溶液)氧化 点燃 1) 被氧气氧化——燃烧反应:C n H2n+3n/2O2→ nCO2+nH2O,火焰明亮,伴有黑烟。 2) 被强氧化剂氧化——烯烃能够被酸性KMnO 4溶液氧化,使KMnO 4溶液褪色。(可 鉴别烯烃和烷烃) b) 加成反应——烯烃的特征反应:烯烃能够和卤素单质、卤化氢、水、氢气等物质加成,烯烃能使 溴水褪色。以乙烯为例,乙烯与卤素单质X2 加成的化学方程式为CH2=CH2

第二章财务管理的基础知识10页

第二章 财务管理的基础知识 教学目的:通过本章学习,掌握风险衡量的方法,掌握资金时间价值和本量利的计算;理解资金时间价值的含义;了解风险的种类、投资风险和投资报酬的关系,了解本量利的基本概念、基本关系式和前提条件。 教学难点:投资的风险和报酬;本量利分析 教学重点:资金时间价值的计算 教学课时:12 教学内容与过程: 导入图片和案例: 第一节 资金时间价值 一、资金时间价值的含义 (一)概念 (二)产生的条件 (三)表示方法 ()???一次性收付款项的终值、现值的计算 重点:资金时间价值的计算非一次性收付款项年金和混合现金流的终值、现值的计算 注:资金时间价值的计算,涉及两个基本概念,即现值和终值,P16 对于一个特定的时间段而言,该段时间的起点金额是现值; 该段时间的终点金额是终值。 二、一次性收付款项的终值和现值 (一)单利的终值和现值 (二)复利的终值和现值 1 .复利终值 例:若将1000元以7 %的利率存入银行,则2年后的本利和是多少? 注:i ↗, F ↗;n ↗, F ↗. 2.复利现值:即倒求本金 注:i ↗,P ↙; n ↗, P ↙. 注:复利现值系数与复利终值系数互为倒数 3.复利利息的计算:I =F-P 注:财务管理考试中,若不特指,均指复利。 企业再生产运动中,运用资金一次循环的利润,应投入下一次循环中,这一过

程与复利计算的原理一致。因此,按复利制计算和评价资金时间价值要比单利制更科学。所以,在长期投资决策计算相关指标时,通常采用复利计息。 课堂练习: 1.某人现在存入本金2000元,年利率为7%,5年后可得到多少? 2.某项投资4年后可得到40000元,按利率6%计算,现在应投资多少? F = 2000 × (F/P,7%,5)= 2000 × 1.4026 = 2805.2 (元) P = 40000 × (P/F,6%,4) = 40000 × 0.7921 = 31684 (元) 知识链接:有关复利的小故事 富兰克林的遗嘱 你知道本杰明·富兰克林是何许人吗?富兰克林利用放风筝而感受到电击,从而发明了避雷针。这位美国著名的科学家死后留下了一份有趣的遗嘱: 一千英磅赠给波士顿的居民,如果他们接受了这一千英磅,那么这笔钱应该托付给一些挑选出来的公民,他们得把这些钱按每年5%的利率借给一些年轻的手工业者去生息。这些款过了100年增加到131000英磅。我希望那时候用100000英磅来建立一所公共建筑物,剩下的31000英磅拿去继续生息100年。在第二个100年末了,这笔款增加到4061000英磅,其中1061000英磅还是由波士顿的居民来支配,而其余的3000000英磅让马萨诸塞州的公众来管理。过此之后,我可不敢多作主张了!” 同学们,你可曾想过:区区的1000英磅遗产,竟立下几百万英磅财产分配的遗嘱,是“信口开河”,还是“言而有据”呢?事实上,只要借助于复利公式,同学们完全可以通过计算而作出自己的判断。 德哈文的天文债权 十年前,美国人德哈文(J.Dehaven)的后代入禀美国法院,向联邦政府追讨国会欠他家族211年的债务,本利共1416亿美元。事情的经过是:1777年严冬,当时的美国联军统帅华盛顿将军所率领的革命军弹尽粮绝,华盛顿为此向所困之地的宾州人民紧急求援,大地主德哈文借出时值5万元的黄金及40万元的粮食物资,这笔共约45万美元的贷款,借方为大陆国会,年息为6厘(相当于6%)。211年后的1988年,45万美元连本带利已滚成1416亿美元,这笔天文数字的债务足以拖垮美国政府,政府当然要耍赖拒还了。 45万美元,变成1416亿美元,代价是211年6厘的复利,此故事足以说明复利增长的神奇力量。 朋友们可能会想,别说211年了,就算50年,我都老了,要钱干什么?是啊,我想反问一句又有几个人能做到几十年如一日的坚持呢!如果能坚持到最后,你一定会成功! 三、年金的终值和现值(非一次性收付款项的终值和现值)

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

(完整版)高中化学必修2第二章知识点归纳总结

必修2第二章化学反应与能量 第一节 化学能与热能 1、在任何的化学反应中总伴有能量的变化。 原因:当物质发生化学反应时,断开反应物中的化学键要吸收能量,而形成生成物中的化学键要放出能量。化学键的断裂和形成是化学反应中能量变化的主要原因。一个确定的化学反应在发生过程中是吸收能量还是放出能量,决定于反应物的总能量与生成物的总能量的相对大小。E 反应物总能量>E 生成物总能量,为放热反应。E 反应物总能量<E 生成物总能量,为吸热反应。 2、常见的放热反应和吸热反应 常见的放热反应:①所有的燃烧与缓慢氧化。②酸碱中和反应。③金属与酸反应制取氢气。 ④大多数化合反应(特殊:C +CO 22CO 是吸热反应)。 常见的吸热反应:①以C 、H 2、CO 为还原剂的氧化还原反应如:C(s)+H 2O(g) CO(g)+H 2(g)。 ②铵盐和碱的反应如Ba(OH)2·8H 2O +NH 4Cl =BaCl 2+2NH 3↑+10H 2O ③大多数分解反应如KClO 3、KMnO 4、CaCO 3的分解等。 需要加热,吸热反应都需要加热,这种说法对吗?试举例说明。 点拔:这种说法不对。如C +O 2=CO 2的反应是放热反应,但需要加热,只是反应开始后不再需要加热,反应放出的热量可以使反应继续下去。Ba(OH)2·8H 2O 与NH 4Cl 的反应是吸热反应,但反应并不需要加热。 第二节 化学能与电能 (1)概念:把化学能直接转化为电能的装置叫做原电池。 (2)原电池的工作原理:通过氧化还原反应(有电子的转移)把化学能转变为电能。 (3)构成原电池的条件:(1)电极为导体且活泼性不同;(2)两个电极接触(导线连接或直接接触);(3)两个相互连接的电极插入电解质溶液构成闭合回路。 △ △

管理学基础第二章课堂笔记

第二章管理思想的演变 第一章考核知识点与考核要求: 1、领会:中国古代、近代管理思想,西方早期管理思想,管理理论主要学派。 2、理解:X理论和Y理论、超Y理论、Z理论。 3、掌握:科学管理理论、组织管理理论、行政组织理论,人际关系学说,X理论和Y理论。 第一节中国管理思想的演变 一、中国古代的管理思想 1、儒家管理思想 儒家哲学的中心概念是“仁”(注意是仁义的意思)。 儒家管理手段和途径都强调“为政以德”(注重用道德感化臣民)。 注意:儒家虽然重道德,但是并不否认法治(碰到冥顽不灵者仍要用法制手段)。 2、道家管理思想 道家思想的基本精神是“道”,它强调“无为而治”(顺其自然) 真题链接:中国古代认为管理者要“处无为之事,行不言之教”来达到管理目的的是(B) A、儒家 B、道家 C、墨家 D、法家(2012.4/2014.4选择) 3、法家管理思想 法家哲学以“法”为中心,强调法律在管理中的重要性 韩非子提出了“上法而不上贤”的观点(往年多次考过的一个知识点) 4、兵家管理思想 兵家以“谋略”为中心,重视组织和编制的作用 厉以宁的观点→高层要道家,中层要儒家,基层要法家(2010.4选择) 二、中国近代管理思想 自1840年鸦片战争以后,近代中国的舞台上涌现出不同的阶层和代表人物。 1、地主阶级改良派的管理思想 林则徐最早意识到中国有不如西方之处,主张向西方学习 魏源提出了“师夷长技以制夷”的观点(学习洋人的技术来抵制洋人) 2、农民阶级的管理思想 以洪秀全为代表的太平天国运动虽然没有成功,但是却撼动了清朝的统治 《天朝田亩制度》虽然没有实现,但却体现了良好的愿望 3、无产阶级的管理思想 共产党人认为:要民主集中、要走群众路线、要集体领导 这些思想成为我党治军治国的重要原则 第二节西方传统管理思想 一、西方早期管理思想的产生 1、亚当斯密 背景介绍:亚当斯密是经济学的主要创立者,他生于1723年,逝于1790年,被世人称为“现代经济学之父”。他认为,劳动是国民财富的源泉。(2014.4填空)亚当斯密提出了劳动价值理论和劳动分工理论。 亚当斯密是如何论述劳动分工能提高劳动生产率的?(2011.4简答) ①劳动分工可以使工人重复完成单项操作,从而提高劳动熟练程度,提高劳动效率。 ②劳动分工节省了通常由一种工作转移到其他工作所损失的时间。 ③劳动分工使劳动简单化,使工具专门化,从而有利于创造新的工具和改进设备。

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论 (3) 1.1课题背景及意义 (3) 1.2国内外研究现状 (3) 1.3本课题的研究内容和方法 (4) 1.3.1 研究内容 (4) 1.3.2 开发环境 (4) 2 语音信号处理的总体方案 (4) 2.1 系统基本概述 (4) 2.2 系统基本要求与目的 (4) 2.3 系统框架及实现 (5) 2.3.1 语音信号的采样 (5) 2.3.2 语音信号的频谱分析 (5) 2.3.3 音乐信号的抽取 (5) 2.3.4 音乐信号的AM调制 (5) 2.3.5 AM调制音乐信号的同步解调 (5) 2.4系统设计流程图 (6) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6)

3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (7) 3.4切比雪夫滤波器 (7) 3.5数字滤波器设计原理 (8) 4 语音信号实例处理设计 (8) 4.1语音信号的采集 (8) 4.3.1高频调制与低频调制 (10) 4.3.2切比雪夫滤波 (11) 4.3.3 FIR滤波 (11) 5 总结 (12) 参考文献 (13) 语音信号的处理与分析 【摘要】语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 【关键词】Matlab 语音信号傅里叶变换低通滤波器

高中化学必修二第二章知识点及习题

一、化学键与化学反应中能量变化的关系 1、化学键的断裂和形成是化学反应中能量变化的主要原因; 2、能量是守恒的; 3、E(反应物的总能量)>E(生成物的总能量)化学反应放出热量 E(反应物的总能量)<E(生成物的总能量)化学反应吸收热量 二、化学能与热能的相互转化 放热反应:放出热量的化学反应 吸热反应:吸收热量的化学反应 三、中和热的测定 四、能量的分类 典例剖析 【例1】下列有关化学反应中能量变化的理解,正确的是( ) A.凡是伴有能量的变化都是化学反应 B.在化学反应过程中,总是伴随着能量的变化 C.在确定的化学反应中,反应物的总能量一定不等于生成物的总能量 D.在确定的化学反应中,反应物的总能量总是高于生成物的总能量 解析:在化学变化中,既有物质的变化,又有能量的变化;但有能量的变化不一定有化学变化,如NaOH固体溶于水中放出热量,NH4NO3晶体溶于水吸收热量,核反应的能量变化等。在确定的化学反应中,E (反应物总) ≠E (生成物总),当E (反应物总) >E (生成物总)时,反应放出热量;当E (反应物总) <E (生成物总)时,反应吸收热量。B、C正确,A、D错误。 【例2】在化学反应中,反应前与反应后相比较,肯定不变的是( ) ①元素的种类②原子的种类③分子数目④原子数目 ⑤反应前物质的质量总和与反应后物质的质量总和⑥如果在水溶液中反应,则反应前与反应后阳离子所带的正电荷总数⑦反应前反应物的总能量与反应后生成物的总能量 A. ①②③④ B. ①②⑤⑥ C. ①②④⑤ D. ②③⑤⑥ 答案: C 解析:依据能量守恒定律可知:①②④⑤正确,但化学变化中物质的分子数会变化,且一

工程造价管理基础知识精髓第二章

第二章 第一节 1.建设项目的竣工决算由( )负责编制。 A. 总承包单位 B. 分包单位 C. 建设单位 D. 设计单位 2.建设项目全部完成后,可以向负责验收的单位提出竣工验收申请报告。下列单位中,负责提出竣工验收申请报告的单位应该是( ) A. 建设单位 B. 总承包单位 C. 监理单位 D. 建设行政主管部门 3.具备独立施工条件,能形成独立使用功能但不能独立发挥生产能力或工程效益的工程项目被称为( )。 A. 分部工程 B. 分项工程 C. 单项工程 D. 单位工程 4.下列关于工程项目组成的说明,正确的是( )。 A. 具有独立的设计文件,并能形成独立使用功能的建筑物及构筑物称为单项工程 B. 具备独立的施工条件,竣工后可以独立发挥生产能力的工程项目称为单位工程 C. 电梯工程属于分部工程 D. 智能建筑工程属于分项工程 5.根据国家现行规定,下列关于建设项目竣工验收的表述正确的是( )。 A. 无论规模大小,建设项目完工后均应进行初验,然后进行竣工验收 B. 建设项目竣工图应由施工单位绘制并加盖“竣工图”标志 C. 具备竣工验收条件的工程,应在3个月内办理验收投产和移交固定资产手续;如3个月内办理竣工验收确有困难,经验收主管部门批准,可以适当推迟竣工验收时间 D. 施工单位必须及时编制竣工决算,分析投资计划执行情况 6.建设工程项目管理的核心任务是控制项目目标,最终实现项目的功能。其项目目标是指( )。 A. 造价、质量、进度 B. 造价、质量、安全 C. 决策、设计、施工 D. 决策、实施、运营 1. 政府投资项目按盈利性不同可以划分为( ) 。

A.竞争性投资项目 B.非经营性政府投资项目 C.基础性项目 D.公益性项目 E. 经营性政府投资项目 2. 建设工程项目按建设性质可以划分为( ) 。 A.新建项目 B.基础项目 C.改建项目 D.公益项目 E. 迁建项目 第二节 1.下列建设工程项目目标控制的方法中,可用来综合控制工程进度和工程造价的方法是( ) 。 A. 控制图法和因果分析图法 B. S曲线法和香蕉曲线法 C. S曲线法和直方图法 D. 网络计划法和排列图法 2.在项目实施中,激励、调动和发挥项目控制人员实现目标的积极性、创造性,这是建设工程项目目标控制的( )。 A. 组织措施 B. 技术措施 C. 经济措施 D. 合同措施 3.下列关于工程项目目标控制方法的表述中,正确的是( ) 。 A. 直方图是用来寻找某种质量问题产生原因的有效工具 B. 通过因果分析图,可以发现工程项目中的主要质量问题 C. S曲线法与香蕉曲线都可以用来控制工程造价和工程进度 D. 控制图和直方图法均属于质量控制的动态分析方法 第三节 1.风险事件发生概率很大且后果损失也很大的项目,应该采用的风险对策为( ) 。 A. 风险回避 B. 风险自留 C. 风险控制

数字信号处理教语音信号处理课程设计心得

这次课程设计虽然遇到了很多问题,很多困难,但是也学到了很多东西。不仅学到了书本上的东西,而且学到了很多课本上没有的东西,很多程序里的东西,特别是程序语法,总是有错误,但是总是不知道错在哪里,在细心的检查下,终于找出了错误和警告,排除困难后,程序编译就通过了,心里终于舒了一口气。还有各种各样问题,通过查网络和请教同学来弄明白,这个过程是痛苦的,有时候有些问题不能马上解决,感到很头痛,真想放弃这个问题,但是坚持下来,并且解决这些问题的时候,真的有种苦尽甘来的感觉。 应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个wav文件做语音信号处理,程序始终现实如下错误提示: ??? Error using ==> wavread Error using ==> wavread Data compression format (IMA ADPCM) is not supported. 我在查阅了很多资料,在网上也查阅相关信息,花费了大量时间也没找出结果,最后发现在WAV格式的语音文件有两种格式,即PCM格式和IMA ADPCM格式,而在MATLAB中用wavread函数进行语音处理时,并不能直接处理IMA ADPCM格式的语音信号,经

过格式转换之后(选择PCM格式),我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解,于是我又翻出学过的数字信号处理课本,认真研究起各种滤波器了,这才使我明白了大多数滤波器是如何工作地,不再单单只是懂理论,理论与实际相结合是很重要的,只有理论知识是远远不够的,只有把所学的理论知识与实践相结合起来,从理论中得出结论。实验过程中,我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别,这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题,其实也是有很多东西可以发掘的,这需要我们在平时多积累,多思考,只有这样,才能取得更大的进步,才能学有所用,学有所长。 通过这次设计,进一步加深了对数字信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时只通过课堂上听讲得到的知识更加生动立体,跟让人记忆深刻。在设计的过程中,我发现同学间的互帮互助真的很重要。当我们有问题的时候,大家一起讨论,将自己的观点表达出来,当发现别人的观点与自己的不同的时候,我们通过查阅资料找到最终正确的答案,这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神,对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处,对以前所学过的知识理

数字语音信号处理的应用价值及发展趋势

数字语音信号处理的应用价值及发展趋势 姓名:宁闯 学号: 201005107 众所周知, 语音在人类社会中起了非常重要的作用。 在现代信息社会中, 小至人们的日 常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、 移动电话和互联网已经普及到家庭。在这些先进的工具中, 语音信号处理中 的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机 ( 又称听写机, 它能把语音转换为文字 ) 、 语音翻译机 ( 例如输入为汉语,输出为英语, 或者相反 ) ,已经不是 梦想而是提到日程上的研究工作了。 20 世纪 60 年代中期形成的一系列数字信号处理方法和算法 , 如数字滤波器、快速傅 里叶变换 (FFT) 是语音数字信号处理的理论和技术基础。而 70

年代初期产生的线性预测编. 码 (LPC) 算法 , 为语音信号的数字处理提供了一个强有力的工具。语音信号的编码和压缩是语音信号处理的主要内容。语音信号处理在通信、 语音识别与合成、自然语言理解、多媒体 数据库以及互联网等多个领域有广泛的应用 , 同时它对于理解音频类等一般的声音媒体的 特点也有很大的帮助。对于移动通信来说 , 最多的信息是语音信号 , 语音编码的技术在数字 移动通信中具有相当关键的作用 , 高质量低速率的语音编码技术是数字移动网的永远的追 求。所谓语音编码是信源编码 , 它是将模拟语音信号变成数字信号以便在信道中传输。除了 通信带宽的要求外 , 计算机存储容量的限制也要求对语音信号进行压缩 , 以满足海量数据情 况下进行实时或准实时计算机处理的目的。 1 语音信号处理的关键技术 语音信号处理的理论基础就是一般的数字信号处理理论 , 它的主要研究内容是语音编 码和语音压缩技术。 考虑到人对听觉媒体的感应特点 , 研究语音信号处理必须与声音心理学 联系起来。因此这里我们把声音心理学也列为语音信号处理的关键技术之一。 (1) 声音心理学

人教版高中化学选修3知识点总结:第二章分子结构与性质

第二章分子结构与性质 课标要求 1.了解共价键的主要类型键和键,能用键长、键能和键角等说明简单分子的某些性质 2.了解杂化轨道理论及常见的杂化轨道类型(sp、sp2、sp3),能用价层电子对互斥理论或者杂化轨道理论推测常见的简单分子或离子的空间结构。 3.了解简单配合物的成键情况。 4.了解化学键合分子间作用力的区别。 5.了解氢键的存在对物质性质的影响,能列举含氢键的物质。 要点精讲 一.共价键 1.共价键的本质及特征 共价键的本质是在原子之间形成共用电子对,其特征是具有饱和性和方向性。 2.共价键的类型 ①按成键原子间共用电子对的数目分为单键、双键、三键。 ②按共用电子对是否偏移分为极性键、非极性键。 ③按原子轨道的重叠方式分为σ键和π键,前者的电子云具有轴对称性,后者的电子云具有镜像对称性。 3.键参数 ①键能:气态基态原子形成1 mol化学键释放的最低能量,键能越大,化学键越稳定。 ②键长:形成共价键的两个原子之间的核间距,键长越短,共价键越稳定。 ③键角:在原子数超过2的分子中,两个共价键之间的夹角。 ④键参数对分子性质的影响 键长越短,键能越大,分子越稳定. 4.等电子原理[来源:学§科§网] 原子总数相同、价电子总数相同的分子具有相似的化学键特征,它们的许多性质相近。 二.分子的立体构型 1.分子构型与杂化轨道理论 杂化轨道的要点 当原子成键时,原子的价电子轨道相互混杂,形成与原轨道数相等且能量相同的杂化轨道。杂化轨道数不同,轨道间的夹角不同,形成分子的空间形状不同。 2分子构型与价层电子对互斥模型 价层电子对互斥模型说明的是价层电子对的空间构型,而分子的空间构型指的是成键电子对空间构型,不包括孤对电子。 (1)当中心原子无孤对电子时,两者的构型一致; (2)当中心原子有孤对电子时,两者的构型不一致。 3.配位化合物 (1)配位键与极性键、非极性键的比较 (2)配位化合物 ①定义:金属离子(或原子)与某些分子或离子(称为配体)以配位键结合形成的化合物。 ②组成:如[Ag(NH3)2]OH,中心离子为Ag+,配体为NH3,配位数为2。 三.分子的性质 1.分子间作用力的比较

数字语音处理(精华版)

1·语音信号处理的三大分支:语音合成(说),语音编码(压缩),语音识别(听),语音增强。2·语音是怎样生成的:空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,这就形成了语音。 3·浊音:发音时声带振动的音称为浊音,它能量高,过零率低。 为周期性斜三角脉冲。清音:声带不振动,能量低过零率高非周期脉冲,可用随机白噪声激励。 4·掩蔽效应:一个声音的听感觉感受受同时存在的另一个声音的影响的现象。 掩蔽效应的应用:它指人耳只对最明显的声音反应敏感,对于不敏感的反应较不敏感,应用此原理人们发明了MP3等压缩的数字音乐格式,只突出记录人耳较为敏感的中频段声音,大大压缩了存储空间。 5·听觉机理:(1)外耳:机械振动,(2)中耳:限幅放大,(3)内耳:耳蜗。 6·语音信号数字模型:1)激励模型、2)声道模型、3)辐射模型。 7·语音生成系统的传递函数: ) ( )z( ) ( ) (z R V z G z H= 8·模型局限性及解决办法: 声道的传输函数具有全极点的性质,这对于元音和大多数辅音来说是比较符合实际的,但对于鼻音和阻塞音来说由于出现了零点,这种模型就不够准确了,一种解决办法是在V(z)中引入若干个零点但这样将使模型复杂化,另一种是适当提高阶数P,使得全极点模型能更好的逼近具有此种零点的传输函数。9·预加重含义:加入一阶高通滤波器。10·预加重处理目的:目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率11·预加重处理技术:一般通过传递函数为: z1 1 H(z)- - =α的一阶FIR高通数字滤波器来实现预加重。 12·短时平均能量主要用途: 1)可以作为区分浊音和清音的特征参 数2)在信噪比较高的情况下短时能量 还可以作为区分有声和无声的依据3) 可以作为辅助的特征参数用于语音识 别中。 13常用的窗有两种:一种是矩形窗, 窗函数如下: ? ? ?- ≤ ≤ = 其他 ,0 1 ,1 ) ( N n n ω 可简化为: ∑ - - = - - = n N n m n m x m x z )1 ( |)] 1 ( sgn[ )] ( sgn[ | 2 1 π 另一种是汉明窗,窗函数: ? ? ?≤ ≤ - - = 其他 ,0 )] 1 /( 2[ cos 46 .0 54 .0N n N nπ ω 14·过零率:单位时间内过零的次数。 浊音:过零率低能量高,清音:过零率 高能量高。 15·端点检测目的:从包含语音的一段 信号中确定出语音的起点及结束点。 16·自相关函数: 时域离散确定信号: ∑+∞ -∞ = + = m k m x M x) ( ) ( ) R(k 时域离散随机信号: ∑ - = + + = N N m k m x m x N ) ( ) ( 1 2 1 ) R(k 自相关函数性质:1)对称性: R(K)=R(-K)2)在K=0处为最大值, 即对于所有K来说 )0( |) ( |R K R≤3)对于确定信 号,R(0)对应于能量对于随机信号R (0)对应于平均功率。 17·浊音和清音的短时自相关函数有以 下特点:1)短时自相关函数可以很明显 的反映出浊音信号的周期性 2)清音的短时自相关函数没有周期性, 也不具有明显突出的峰值,其性质类似 于噪声。3)不同的窗对短时自相关函 数结果有一定影响。 18·短时自相关函数(求峰值)两个峰 值之间的距离为周期。短时平均幅度差 函数(求谷值)两个谷值之间的距离为 周期。 19·采用双限门比较的两极判决法:第 一级判决:1)先根据语音短时能量的轮 廓选取一个较高的门限T1进行一次粗 判:语音起止点位于该门限与短时能量 包络交点所对应的时间间隔之外。 2)根据背景噪声的平均能量确定一个 较低的门限T2,并从A点往左、从B 点往右搜索,分别找到短时能量包络与 门限T2相交的两个点C和D,于是CD 段就是双门限方法根据短时能量所判 定的语音段。第二级判决: 以短时平均过零率为标准,从C点往左 和D点往右搜索,找到短时平均过零 率低于某个门限T3的两点E和F,这 便是语音段的起止点。门限T3是由背 景噪声的平均过零率所确定的。 20·当n固定时,它们就是序列 ) ) (m x( m - n ω的傅里叶变 换或离散傅里叶变换。当ω或K固定 时,它们就是一个卷积,相当于滤波器 的运算。 21·基音周期估值的两种方法:第一种 方法:先对语音信号进行低通滤波,在 进行自相关计算。第二种方法,先对语 音信号进行中心削波处理,在进行自相 关计算。 判别基音周期的方法:1·短时自相关 函数法。2·短时平均幅度差函数。 22·线性预测编码就是利用过去的样值 对新样值进行预测,然后将样值的实际 值与预测值相减,得到一个误差信号, 显然误差信号的动态范围远小于原始 语音信号的动态范围,对误差信号的进 行量化编码,可大大减少量化所需的比 特数,使编码速率降低。

基于数字滤波器的语音信号处理系统的设计

基于数字滤波器的语音信号处理系统的设计 前言:语音信号的数字滤波就是利用快速傅里叶变换fft对语音信号进行频谱分析,利用分析得到的指标设计数字滤波器,将不需要的部分通过设计好的数字滤波器滤除掉,以达到优化语音的目的。数字滤波器是一种对数字信号进行处理的系统,数字滤波器完成数字信号滤波处理功能,其输入是一组数字量,其输出是经过变换的另一组数字量。它通过一定的运算关系或电路形式来改变输入信号所包含的频率成分的相对比例或滤出某些频率成分,数字滤波器具有稳定性高、精度高、灵活性大等优点。随着数字技术的发展,用数字技术实现滤波器的功能越来越受到人们的注意和广泛的应用。 摘要:本文介绍了两种数字滤波器的基本设计原理及步骤1、利用双线性变换法以及脉冲响应不变法设计IIR数字滤波器2、用窗函数法实现FIR数字滤波器的设计。并且把理论与实践结合,通过一段语音,利用MATLAB软件分析语音信号频谱,确定指标设计滤波器,编写程序设计滤波器,对语音信号进行滤波处理,分析滤波后的时域和频域特征,回放语音信号分析其经过信号处理后的效果。 正文 1、总体设计 1.1 总体设计内容 1)利用脉冲响应不变法和双线性变换法设计IIR数字滤波器,实现数字低通、数字高通、数字带通、数字带阻。 2)利用窗函数实现FIR数字滤波器的设计 3)设计完整的语音信号处理系统,可实现语音信号的读入、语音信号的频域分析、滤波器选择、语音信号的时/频域滤波操作、语音信号的短时频域分析等功能。 1.2 课设流程图设计

2、模块设计 2.1 语音信号的采集 用windows工具中的录音机录一段(语音信号),将语音信号的文件命名为test.wav. 将语音文件保存后,在MATLAB软件平台下,首先调用wavread函数可采集到录制的音乐信号,并得到其采样率fs和比特数bits。具体调用如下:>> [y,fs,bits]=wavread('d:\test.wav')%读取语音信号。 运行后得出fs,bit。其中参数y是每个样本的值,fs是生成该波形文件时的采样率,bits 是波形文件每样的编码位数。 sound(y); 用于对声音的回放。向量y则就代表了一个信号,也即一个复杂的“函数表达式”,也可以说像处理一个信号的表达式一样处理这个声音信号。 2.2 语音信号的时域及频域分析 语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分桥的准确性和精确性。因此语音信号分析在语音信号处理应用中具有举足轻重的地位。 2.2.1语音信号的时域分析 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。 运用matlab软件,调用plot函数,在读取语音信号的基础上画出语音信号的时域波形图。理想状态下,语音信号的时域波形应该是关于时间轴对称的,但是实际情况下,由于存在着一些噪音,使得波形看上去不是那么完美。 2.2.2语音信号的频域分析 对语音信号进行频谱分析。MATLAB提供了快速傅里叶变换算法FFT计算DFT的函数fft,调用格式如下: Xk=fft(xn,N) 参数xn为被变换的时域序列向量,N是DFT变换区间的长度,当N大于xn时,fft函数自动在xn后面补零,当N小于xn的长度时,fft函数计算xn的前N个元素,忽略其后面的元素。在本次设计中,调用fft函数得到语音信号的快速傅里叶变换序列,再用plot函数画出信号的频谱图。 2.3 IIR数字滤波器的设计 IIR滤波器系统函数的极点可以再单位圆内的任何位置,实现IIR滤波器的阶次较低,所用的存储单元较少,效率高,又由于IIR数字滤波器能够保留一些模拟滤波器的优良特性,因 此应用很广。设计IIR数字滤波器的方法主要有基于脉冲响应不变法和双线性Z变换法设计,

相关主题
文本预览
相关文档 最新文档