当前位置:文档之家› 基于matlab的语音信号的采集和处理

基于matlab的语音信号的采集和处理

基于matlab的语音信号的采集和处理
基于matlab的语音信号的采集和处理

电子科技大学

课程设计报告

课程名称:信号与系统

设计名称:语音信号的采集和处理

姓名:肖燕平

学号: 2011019090028

班级:通信九班

指导教师:何春

起止日期:2012.12.15-2012.12.20

基于MATLAB的语音信号的采集和

处理

摘要:本文介绍了一种基于matlab的语音信号的采集和处理设计实现方案。声音是由物体的振动产生,以声波的形式在介质中传播,介质主要可分为固体,液体以及气体。声波振动内耳的听小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音。内耳采用的原理与麦克风捕获声波或扬声器的发音一样,它是移动的机械部分与气压波之间的关系。在国际标准中,人声的频率范围是300Hz~3400Hz,不同的人或乐器产生的声音频率不一致,通过对声音信号的研究能够更好的处理声音信号的处理以及传输。Matlab 作为一款主要面对科学计算、可视化以及交互式程序设计的高科技计算软件,能够很好的完成对声音信号的分析和处理,快速的得出声音信号的时域图以及频域图。关键字:声音|、频率、时域图、频域图

1绪论

1.1课题研究目的及意义

掌握语音信号采集的方法

掌握一种语音信号基音周期提取方法

了解Matlab的编程方法

1.2本课题的设计要求及设计方案概述

一:使用wavrecord录入自己的语音信号,使用save函数进行保存后使用wavplay 函数进行播放。

二:使用plot再画出该语音信号的时域波形,对原始波形进行用fft函数傅里叶变换后,使用plot画出其频谱。

三:设计切比雪夫的低通,高通,带通滤波器对原始信号进行滤波。

四:画出滤波后的信号时域、频域图

五:考虑到国际标准人声的频率范围在300Hz~3400Hz,于是给原始语音信号加入3800hz的正弦高频噪声,再分析语音信号的特点。

六:设计低通计滤波器将高频噪声滤除。

2设计过程

2.1本课题的设计要求

1,使用wavrecord录入自己的语音信号,保存到一个数组后,再使用save函数进行保存文件,后使用wavplay函数进行播放。程序实现如下:

fs=8000; %采样频率为8000hz

y=wavrecord(3*fs,fs); %录入3s的声音

wavplay(y,fs); %播放已录入的声音信号

file='voice.mat'; %创建一个数据文件,且赋给变量file

save('voice.mat','y'); %将语音数据保存到数据文件voice.mat中

load voice.mat; %读出voicet.mat的语音数据

2,使用plot再画出该语音信号的时域波形

程序代码为:

subplot(211); %对图形窗口进行分割

plot(y);

xlabel('time n');

ylabel('amplitude');

title('原始语音信号'); %标出横纵坐标和图像名称

再对原始波形进行用fft函数傅里叶变换后得到向量,使用plot画出其频谱。因为直接用fft得出的数据与频率不是对应的,由于fftshift可以将fft的直流分量移到频谱中心,即让正半轴部分和负半轴部分的图像分别关于各自的中心对称。故再使用fftshift对fft进行变换。

程序代码为:

a=fftshift(fft(y,l)/l); %对语音信号进行离散时间傅里叶变换,且将fft的直流分量移

到频谱中心

fd=fs/l;

fx=fd*(-l/2:l/2-1); %将横轴变为频率轴

fy=abs(a); %将纵轴变为频率幅度轴

subplot(212);

plot(fx,fy);

xlabel('频率Hz');

ylabel('幅度');

title('原始信号频谱');

如图所示:

3,设计切比雪夫滤波器对原始信号进行滤波时,利用cheb1ord计算滤波器阶数:[N, Wn] =cheb1ord(Wp, Ws, Rp, Rs);利用cheby1计算滤波器系数:[b,a] = cheby1(N,Wn)。其中设计了通带截止频率为1000hz,阻带截止频率为1200hz 的低通滤波器,如图所示

程序为:

fph=1000;

fsh=1200;

rp=2;

rs=15;

omegaph=fph/(fs/2); %归一化

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'low');

yl=filter(BZ,AZ,y);

subplot(211);

plot(yl);

xlabel('time n');

ylabel('amplitude');

title('低通滤波后语音信号时域波形');

al=fftshift(fft(yl,l))/l; %对低通滤波后信号进行傅里叶变换

fdl=fs/l;

fxl=fdl*(-l/2:l/2-1);

fyl=abs(al);

subplot(212);

plot(fxl,fyl);

xlabel('频率Hz');

ylabel('幅度');

title('低通滤波后信号频谱');

设计了通带截止频率为2000hz,阻带截止频率为1600hz的高通滤波器,如图所示

fph=2000;

fsh=1600;

rp=2;

rs=15;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'high'); %计算切比雪夫高通滤波器系数

yh=filter(BZ,AZ,y);

subplot(211);

plot(yh);

xlabel('time n');

ylabel('amplitude');

title('高通滤波后语音信号时域波形');

ah=fftshift(fft(yh,l))/l;

fdh=fs/l;

fxh=fdh*(-l/2:l/2-1);

fyh=abs(ah); subplot(212);

plot(fxh,fyh);

xlabel('频率Hz');

ylabel('幅度');

title('高通滤波后信号频谱');

设计了截止频率Wp=[1000Hz 2000Hz];阻带截止频率Ws=[800Hz 2500Hz];的带通滤波器,如图所示

程序为:

fph=[1000,2000];

fsh=[800,2500];

rp=3;

rs=20;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'bandpass');

yb=filter(BZ,AZ,y);

subplot(211);plot(yb);

xlabel('time n');

ylabel('amplitude');

title('带通滤波后语音信号时域波形');

ab=fftshift(fft(yb,l))/l;

fdb=fs/l;

fxb=fdb*(-l/2:l/2-1);

fyb=abs(ab);

subplot(212);plot(fxb,fyb);

xlabel('频率Hz');

ylabel('幅度');

title('带通滤波后信号频谱');

4,使用wavplay函数播放滤波前后的语音信号

程序为:

wavplay(y,fs); %播放原始语音信号

wavplay(yl,fs); %播放低通滤波后语音信号

wavplay(yh,fs); %播放高通滤波后语音信号

wavplay(yb,fs); %播放带通滤波后语音信号

可以明显地听到经过低通后声音明显较先前低沉但音量减小,如下一、二图所示,低通滤波后信号高频部分明显大幅衰,即信号只剩余低音部分;经过高通滤波后声音较原始信号刺耳但音量减小,如下一、三图所示,高通滤波后信号低频部分明显大幅衰,剩下高频部分,即信号只剩余高音部分;经过带通滤波后声音较原始信号无明显区别但音量明显减小,如下一、四图所示,带通滤波后信号低频和高频部分明显大幅衰,剩下中频部分,即信号只剩余中音部分;

如图所示,分别为原始信号,低滤波后信号,高通滤波后信号,带通滤波后信号频谱

5,考虑到国际标准人声的频率范围在300Hz~3400Hz,于是给原始语音信号加入频率为3800hz的正弦高频噪声,如图所示,为加入高频噪声后的信号时域波形和频谱图,由图可以看出,加入信号后的时域波形明显幅度加大,使用wavplay函数播放也可明显听到明显‘滴’声,频谱图中也可看到较原信号而言,加噪声后频谱在3800hz和-3800hz处增加了一高峰。

程序为:

Au=1;

t=0:1/fs:(l-1)/fs;

d=Au*sin(2*pi*3800*t); %构造频率为3800hz的正弦信号,且取其一段

d=d';

yy=y+d; %将所得噪音信号加入原始信号中

subplot(211);

plot(yy); %绘制加入噪音后波形

xlabel('time n');

ylabel('amplitude');

title('加入噪音后语音信号时域波形');

ay=fftshift(fft(yy,l))/l;

fdy=fs/l;

fxy=fdy*(-l/2:l/2-1);

fyy=abs(ay);

subplot(211);

plot(yy); %绘制加入噪音后频谱

xlabel('time n');

ylabel('amplitude');

title('加入噪音后语音信号时域波形');

6,设计阻带截止频率为3600,通带截止频率为3400的切比雪夫低通计滤波器将高频噪声滤除。所得信号时域波形及频谱图如下:

程序为:

fph=3400;

fsh=3600;

rp=2;

rs=60;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'low');

yyy=filter(BZ,AZ,yy);

subplot(211);

plot(yyy);

xlabel('time n');

ylabel('amplitude');

title('对加噪信号滤波后语音信号时域波形');

ayy=fftshift(fft(yyy,l)/l);

fdyy=fs/l;

fxyy=fdyy*(-l/2:l/2-1);

fyyy=abs(ayy);

subplot(212);plot(fxyy,fyyy);

xlabel('频率Hz');

ylabel('幅度');

title('加入噪音滤波后信号频谱');

3本课题的设计原理

1、采样定理:在进行模拟与数字信号的转换过程中,当采样大于最高频率的2 倍时,则采样之后的数字信号完整的保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10 倍。

2、采样频率:采样频率是指计算机每秒钟采样多少个声音样本,是描述声音文件的音质、音频、衡量声卡、声音文件的质量标准。采样频率越高,即采样的时间间隔越短,则在单位时间内计算机得到的声音样本数据越多,

对声音波形的表示也越准确。

3、采样位数与采样频率:采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。采样位数和采样率对于音频接口来说是最为重要的两个指标。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。采样位数越多则捕捉到的信号越精确。

4、利用MATLAB对语音信号进行分析和处理:采集语音信号后,利用MATLAB 软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。

4 总结和心得体会

在为期一周的设计中我遇到不少的问题,主要有以下两点:

1,刚开始时对fft函数的本质不是很了解,导致画出的波形有一半是人声无法发

出的高频。后来经过复习信号与系统的课本,与同学讨论后才发现这部分看起来是高频的成分实际是-w,因为直接用fft得出的数据与频率不是对应的,由于fftshift可以将fft的直流分量移到频谱中心,即让正半轴部分和负半轴部分的图像分别关于各自的中心对称。故再使用fftshift对fft进行变换。

2,加入噪声时发现直接加入频率为5500hz的正弦信号后所得信号频率不再是实

际的5500hz,再次翻阅书本才回忆起采样的原则是Ws>2Wm,若采样频率为fs=8000,则5000hz频谱将会出现重叠现象,信号无法恢复,即所得噪音信号频率改变,考虑到国际标准人声的频率范围在300Hz~3400Hz,于是改为给原始语音信号加入频率为3800hz的正弦高频噪声。

通过这一个星期的课程设计,同时我学到了很多的东西,不仅巩固了我以前所学过的知识, 还让我学到很多在书本上所没有学到过的知识。同时进一步加深了对语音信号的了解和熟练了对Matlab 的使用。也深深地体会到作为工科女独有的骄傲,因为以前都是基于课本上所学的理论知识,很少将所学知识运用于实际,而通过这次课程设计之后更加感觉到只是会做题并不代表真正理解了课本的知识,必须要在实际中才能真正地理解。同时,这次设计也让我感受到了书本的知识也很重要,做任何一个工程,再小都需要足够的理论知识作为垫脚石。

5参考文献

【1】Alan.V.Oppenheim,Signal and System,电子工业出版社,2009.

【2】数学实验讲义,电子科技大学出版社,2010.

【3】刘树棠,《信号与系统》计算机练习——利用MATLAB,西安交通大学出版

社,2006

【4】谢云荪,数学实验,科学出版社,1999.

【5】苏金明,MATLAB 实用教程,电子工业出版社,2005.

【6】徐全智,概率论与数理统计,高等教育出版社,2004.

【7】杨克昌,计算机程序设计典型例题精解,国防科技大学出版社

程序清单

fs=8000; %采样频率为8000hz

y=wavrecord(3*fs,fs); %录入3s的声音

wavplay(y,fs); %播放已录入的声音信号

file='voice.mat'; %创建一个数据文件,且赋给变量file

save('voice.mat','y'); %将语音数据保存到数据文件voice.mat中

load voice.mat; %读出voicet.mat的语音数据

subplot(211); %对图形窗口进行分割

plot(y);

xlabel('time n');

ylabel('amplitude');

title('原始语音信号'); %标出横纵坐标和图像名称

a=fftshift(fft(y,l)/l); %对语音信号进行离散时间傅里叶变换,且将fft的直流分量移到频谱中fd=fs/l;

fx=fd*(-l/2:l/2-1); %将横轴变为频率轴

fy=abs(a); %将纵轴变为频率幅度轴

subplot(212);

plot(fx,fy); %画出原始信号频谱图

xlabel('频率Hz');

ylabel('幅度');

title('原始信号频谱');

fph=1000; %低通滤波程序开始

fsh=1200;

rp=2;

rs=15;

omegaph=fph/(fs/2); %归一化

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs); %计算滤波器阶数

[BZ,AZ]=cheby1(N,rp,wn,'low'); %计算滤波器系数

yl=filter(BZ,AZ,y); %对原始信号低通滤波

subplot(211);

plot(yl);

xlabel('time n');

ylabel('amplitude');

title('低通滤波后语音信号时域波形');

al=fftshift(fft(yl,l)/l); %对低通滤波后信号进行傅里叶变换

fdl=fs/l;

fxl=fdl*(-l/2:l/2-1);

fyl=abs(al);

subplot(212);

plot(fxl,fyl);

xlabel('频率Hz');

ylabel('幅度');

title('低通滤波后信号频谱');

fph=2000; %高通滤波程序开始

fsh=1600;

rp=2;

rs=15;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'high'); %计算切比雪夫高通滤波器系数yh=filter(BZ,AZ,y);

subplot(211);

plot(yh);

xlabel('time n');

ylabel('amplitude');

title('高通滤波后语音信号时域波形');

ah=fftshift(fft(yh,l)/l);

fdh=fs/l;

fxh=fdh*(-l/2:l/2-1);

fyh=abs(ah); subplot(212);

plot(fxh,fyh);

xlabel('频率Hz');

ylabel('幅度');

title('高通滤波后信号频谱');

fph=[1000,2000]; %带通滤波程序开始

fsh=[800,2500];

rp=3;

rs=20;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'bandpass');

yb=filter(BZ,AZ,y);

subplot(211);plot(yb);

xlabel('time n');

ylabel('amplitude');

title('带通滤波后语音信号时域波形');

ab=fftshift(fft(yb,l)/l);

fdb=fs/l;

fxb=fdb*(-l/2:l/2-1);

fyb=abs(ab);

subplot(212);plot(fxb,fyb);

xlabel('频率Hz');

ylabel('幅度');

title('带通滤波后信号频谱');

wavplay(y,fs); %播放原始语音信号

wavplay(yl,fs); %播放低通滤波后语音信号

wavplay(yh,fs); %播放高通滤波后语音信号

wavplay(yb,fs); %播放带通滤波后语音信号

Au=1;

t=0:1/fs:(l-1)/fs;

d=Au*sin(2*pi*3800*t); %构造频率为3800hz的正弦信号,且取其一段

d=d';

yy=y+d; %将所得噪音信号加入原始信号中

subplot(211);

plot(yy); %绘制加入噪音后波形

xlabel('time n');

ylabel('amplitude');

title('加入噪音后语音信号时域波形');

ay=fftshift(fft(yy,l)/l);

fdy=fs/l;

fxy=fdy*(-l/2:l/2-1);

fyy=abs(ay);

subplot(211);

plot(yy); %绘制加入噪音后频谱

xlabel('time n');

ylabel('amplitude');

title('加入噪音后语音信号时域波形');

fph=3400; %对加入噪音后信号进行低通滤波,滤除噪音fsh=3600;

rp=2;

rs=60;

omegaph=fph/(fs/2);

omegash=fsh/(fs/2);

[N,wn]=cheb1ord(omegaph,omegash,rp,rs);

[BZ,AZ]=cheby1(N,rp,wn,'low');

yyy=filter(BZ,AZ,yy);

subplot(211);

plot(yyy);

xlabel('time n');

ylabel('amplitude');

title('对加噪信号滤波后语音信号时域波形');

ayy=fftshift(fft(yyy,l)/l);

fdyy=fs/l;

fxyy=fdyy*(-l/2:l/2-1);

fyyy=abs(ayy);

subplot(212);plot(fxyy,fyyy);

xlabel('频率Hz');

ylabel('幅度');

title('加入噪音滤波后信号频谱');

基于MATLAB 的声音信号采集系统(论文)

基于MATLAB 的声音信号采集系统 野龙平 (陕西师范大学电子信息科学与技术,陕西) 摘要: 声音是各种信号传递与交流最直接的体现,因此对声音信号的研究有十分重要的意义。本文主要针对Matlab指令系统对声音信号的采集,作者利用Matlab 提供的数据采集工具箱, 介绍了倆种采集方法,简单分析并比较其优缺点。基于matlab的数据采集系统, 具有实现简单、性价比和灵活度高的优点。 关键词: Matlab; 数据采集 0 引言 随着科技的发展,对于语音信号的采集已经有很多种方法,如基于单片机技术、VC,C++等编程、纯硬件电路,本文介绍的方法主要通过一款软件MATLAB。它是MathWorks 公司推出的一种面向工程和科学运算的交互式计算软件, 其中包含了一套非常实用的工具-- 数据采集工具箱。使用此工具箱更容易将实验测量、数据分析和可视化的应用集合在一起。数据采集工具箱提供了一整套的命令和函数, 通过调用这些命令和函数, 可以直接控制数据采集设备的数据采集。 作者简单介绍了一种用声卡进行语音信号采集和MATLAB 的数据采集工具箱进行分析处理的语音信号采集系统。经实验证明, 该系统可实现在线连续采集语音信号并进行分析和处理, 具有实现简单、性价比和灵活度高的特点。 1 语音数据采集系统设计 MATLAB 中提供了强大的数据采集工具箱( DAQ- Data Acquisition Toolbox) , 可满足控制声卡进行数据采集的要求。用户通过调用MATLAB 命令, 可对采集的数据进行分析和处理, 为用户带来了极大的方便。 语音数据采集过程如图1 所示。

图1 声卡采集声音信号有两种方式: 传输线输入方式(LineIn) 和麦克风输入( MicIn) 方式。LineIn 方式是通过传输线把其他声音设备, 如录音机等设备的音频输出信号连接到声卡, 通过声卡记录数据存入计算机。 本系统采用MicIn 方式, 即用麦克风接收语音通过声卡将音频信号存入计算机。利用MicIn 方式通过声卡采集数据有两种方法: 方法一是采用对声卡产生一个模拟输入对象进行采集, 方法二是直接利用MATLAB 数据采集箱中提供的的函数命令进行采集。 1. 1 方法1 本系统是以声卡为对象利用MATLAB 数据采集工具箱提供的环境完成数据采集过程, 麦克风成为数据采集系统中的传感器。数据采集过程与其他硬件设备无关, 只与声卡有关, 因此应对声卡产生一个模拟输入对象(AI) 。 数据采集过程的具体实现: 1) 初始化: 创建设备对象。 ai= analoginput(‘ winsound ’ ) 2) 配置: 根据数据采集硬件设备的特性, 增加通道和控制数据采集的行为。为AI 添加1 个通道, 设置采样频率和采样时间。 addchannel( ai, 1) freq= 8000; % 采样频率fs8000Hz set( AI, sampleRate, freq) %为模拟输入设备设置采样频率 duration= 2; %采样时间为2 秒 set (AI, SamplesPerTriffer, duration* freq) ; % 为模拟输入设备设置触发时间 3) 执行: 启动设备对象, 采集数据。 start( ai) ; %启动设备对象 data= getdata( ai) ; % 获得采样数据 4) 终止: 删除设备对象。 stop( ai) ; % 停止设备对象 语音信号输入 声卡 Matlab 数据采集箱 计算机

语音信号处理与及其MATLAB实现分析

目录 摘要 (2) 第一章绪论 (3) 1.1 语音课设的意义 (3) 1.2 语音课设的目的与要求 (3) 1.3 语音课设的基本步骤 (3) 第二章设计方案论证 (5) 2.1 设计理论依据 (5) 2.1.1 采样定理 (5) 2.1.2 采样频率 (5) 2.1.3 采样位数与采样频率 (5) 2.2 语音信号的分析及处理方法 (6) 2.2.1 语音的录入与打开 (6) 2.2.2 时域信号的FFT分析 (6) 2.2.3 数字滤波器设计原理 (7) 2.2.4 数字滤波器的设计步骤 (7) 2.2.5 IIR滤波器与FIR滤波器的性能比较 (7) 第三章图形用户界面设计 (8) 3.1 图形用户界面概念 (8) 3.2 图形用户界面设计 (8) 3.3 图形用户界面模块调试 (9) 3.3.1 语音信号的读入与打开 (9) 3.3.2 语音信号的定点分析 (9) 3.3.3 N阶高通滤波器 (11) 3.3.4 N阶低通滤波器 (12) 3.3.5 2N阶带通滤波器 (13) 3.3.6 2N阶带阻滤波器 (14) 3.4 图形用户界面制作 (15) 第四章总结 (18) 附录 (19) 参考文献 (24)

摘要 数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域,这通常通过模数转换器实现。而数字信号处理的输出经常也要变换到模拟域,这是通过数模转换器实现的。 数字信号处理的算法需要利用计算机或专用处理设备如数字信号处理器(DSP)和专用集成电路(ASIC)等。数字信号处理技术及设备具有灵活、精确、抗干扰强、设备尺寸小、造价低、速度快等突出优点,这些都是模拟信号处理技术与设备所无法比拟的。 数字信号处理的核心算法是离散傅立叶变换(DFT),是DFT使信号在数字域和频域都实现了离散化,从而可以用通用计算机处理离散信号。而使数字信号处理从理论走向实用的是快速傅立叶变换(FFT),FFT的出现大大减少了DFT的运算量,使实时的数字信号处理成为可能、极大促进了该学科的发展。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

labview声音采集系统

虚拟仪器技术 姓名:史昌波 学号:2131391 指导教师:孙来军 院系(部所):电子工程学院专业:控制工程

目录 1、前言 (3) 2、声卡的硬件结构和特性 (3) 2.1声卡的作用和特点 (3) 2.2声卡的构造 (5) 3、LABVIEW中与声卡相关的函数节点 (5) 4、LABVIEW程序设计 (6) 4.1程序原理 (6) 4.2程序结构 (7) 4.3结果分析 (9) 5、结束语 (9) 6、参考文献 (10)

基于声卡的数据采集与分析 1、前言 虚拟仪器技术是利用高性能的模块化硬件,结合高效灵活的软件来完成各种测试、测量和自动化的应用。在虚拟仪器系统中,硬件解决信号的输入和输出,软件可以方便地修改仪器系统的功能,以适应不同使用者的需要。其中硬件的核心是数据采集卡。目前市售的数据采集卡价格与性能基本成正比,一般比较昂贵1。 随着DSP(数字信号处理)技术走向成熟,计算机声卡可以成为一个优秀的数据采集系统,它同时具有A/D和D/A转换功能,不仅价格低廉,而且兼容性好、性能稳定、灵活通用,驱动程序升级方便,在实验室中,如果测量对象的频率在音频范围,而且对指标没有太高的要求,就可以考虑使用声卡取代常规的DAQ设备。而且LABVIEW中提供了专门用于声卡操作的函数节点,所以用声卡搭建数据采集系统是非常方便的2。 2、声卡的硬件结构和特性 2.1声卡的作用和特点 声卡的主要功能就是经过DSP(数字信号处理)音效芯片的处理,进行模拟音频信号的与数字信号的转换,在实际中,除了音频信号以外,很多信号都在音频范围内,比如机械量信号,某些载波信号等,当我们对这些信号进行采集时,使用声卡作为采集卡是一种很好的解决方案。 声卡的功能主要是录制与播放,编辑与合成处理,MIDI接口三个部分3。 (1)录制与播放

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计 摘要:语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法,并在采集语音信号后,在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。利用MATLAB来读入(采集)语音信号,将它赋值给某一向量,再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波,然后我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 关键词:Matlab,语音信号,傅里叶变换,滤波器 1课程设计的目的和意义 本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计,拟主要达到以下几个目的: 1.1.了解Matlab软件的特点和使用方法。 1.2.掌握利用Matlab分析信号和系统的时域、频域特性的方法; 1.3.掌握数字滤波器的设计方法及应用。 1.4.了解语音信号的特性及分析方法。 1.5.通过本课题的设计,培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标 设计一个简单的语音信号分析系统,实现对语音信号时域波形显示、进行频谱分析,

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序,并且利用GUI设计图形用户界面。具体任务是: 2.1.采集语音信号。 2.2.对原始语音信号加入干扰噪声,对原始语音信号及带噪语音信号进行时频域分析。 2.3.针对语音信号频谱及噪声频率,设计合适的数字滤波器滤除噪声。 2.4.对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样,回放并与原始信号进行比较。 2.6.对语音信号部分时域参数进行提取。 2.7.设计图形用户界面(包含以上功能)。 3 设计方案论证 3.1语音信号的采集 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。 3.2语音信号的处理 语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等,以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更

语音信号处理 (第2版)赵力 编著 语音信号处理勾画要点

语音信号处理(第2版)赵力编著 重点考点 第2章语音信号处理的基础知识 1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。可以这样定义语音:语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。 4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。 5.元音的另一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。 6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。 8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型:一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。 13.语谱图:人们致力于研究语音的时频分析特性,把和时序相关的傅立叶分析的显示图形。 第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个:

光纤声音采集系统

摘要:科技的发展带来许多电磁干扰或射频干扰的恶劣环境,要想解决电磁干扰问题的,必须从本质上改变麦克风的工作模式。文章提出了利用激光的传输频带宽、通信容量大和抗电磁干扰能力强等优点,研制一种基于光相位干涉的高灵敏度声音采集系统。光纤声音采集能够传送非常高的声音质量,适用于多种恶劣环境下的声音采集。 关键词:光纤声音采集、干涉型光纤传感器 引言: 麦克风在声场和电场中起着重要的沟通界面,它可将声音信号传至任何地方或者记忆装置。传统型的使用电磁场或静电场来产生动作,外部的强电磁场影响会阻绝这些装置的功能。本项目研制的光纤声音采集系统是一种新颖的声音信号传感器,在反射式强度型光纤传感器的原理基础上,利用激光来采集声音信号,由于它与传统的麦克风有着本质的区别,所以在使用方面具有很大的优越性。系统由非导磁材料制成,其主要工作本体是光,即使在强电磁场或高射频环境中也能正常工作。把光纤应用于麦克风,充分利用了光纤传感器体积小、结构简单、灵敏度高、抗电磁干扰且光纤本身低损耗、耐腐蚀、安全可靠等优良特性。 1、系统结构 本系统利用干涉型光纤传感器的原理,开发基于光相位干涉的高灵敏度声音采集系统,由光纤传感探头、光路系统、光信号调制解调器等部分组成。 干涉型光纤传感器通常将被测量转化为光信号的相位,因此,相位测量是该类型传感器信号处理的基本要求。若直接对相位进行测量,那么有两个问题将限制系统的性能:一是系统受到环境的干扰时被测相位会产生随机漂移,从而引入测量误差,此外,相位漂移还会导致信号衰减;二是直接测相意味着直流检测,信号处理易受电路直流漂移的影响。针对这两个问题引出了相位生成载波技术。相位生成载波调制是在被测信号带宽以外的某一频带之外引入大幅度的相位调制,被测信号则位于调制信号的边带上,这样就把外界干扰的影响转化为对调制信号的影响,且把被测信号频带与低频干扰频带分开,以利于后续的噪声分离。 项目研制的光纤声音采集系统,在对传统michelson干涉仪加以改进的基础上,通过构造由光纤耦合器和振动膜组成的动态michelson干涉光路,能够将外界声压对振膜的作用转化为对光路相位的调制,得到的干涉光信号直接光电转换后即可解调还原声音信号。在多种干涉型光纤传感器的解调方法中,相位生成载波解调技术(pgc)由于是一种无源解调技术,并具有高灵敏度、大动态范围和好的线性度而得到广泛的应用。 2、系统原理 2.1光纤传感探头原理: 激光器发出的激光经耦合器到达传输光纤,由光纤出射的光束照射到振动膜上,传输光纤出射端面m1与振动膜构成一个干涉腔,从两表面反射回的光进行干涉,干涉光再经耦合器由光电探测器接收,外界声音信号通过改变干涉腔的光纤出射端面m1和振动膜之间的距离对光相位进行调制。系统中半导体激光器发出的光源光频随输入的调制电流线性变化,振动膜采用硅微技术进行研制。 2.2解调原理: 光纤声音采集系统中的调制解调器是由光源,光电转换器,高增益微弱信号放大电路,背景噪声消除器等组成。 光源向光纤传感头发射一稳定的激光,传感头内的振动薄膜被周围声音振动信号带动,从而对发射到振动薄膜上的激光进行相位调制后再反射回去,被调制的激光在光路系统里发生干涉,形成携带微弱声音强度的激光信号,光电转换系统的探测器将此激光信号转换成电信号,再经高增益微弱信号放大,pgc解调,噪声滤除,后将解调后的电信号还原成声音信号输出。

《语音信号处理》期末考试试题

2011-2012学年第一学期 《语音信号处理》期末考试试题(A) 适用班级:时量:120分钟闭卷记分: 考生班级:姓名:学号: 注:答案全部写在答题纸上,写在试卷上无效! 一、填空题:(共7小题,每空2分,共20分) 1、矢量量化系统主要由编码器和组成,其中编码器主要 是由搜索算法和构成。 2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰 模型:级联型、并联型和。 3、语音编码按传统的分类方法可以分为、和混合 编码。 4、对语音信号进行压缩编码的基本依据是语音信号的和人 的听觉感知机理。 5、汉语音节一般由声母、韵母和三部分组成。 6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时 频分析特性;另一个是人耳听觉的效应。 7、句法的最小单位是,词法的最小单位是音节,音节可 以由构成。 二、判断题:(共3小题,每小题2分,共6分)

1、预测编码就是利用对误差信号进行编码来降低量化所需的比 特数,从而使编码速率大幅降低。() 2、以线性预测分析-合成技术为基础的参数编码,一般都是根据 语音信号的基音周期和清/浊音标志信息来决定要采用的激 励信号源。() 3、自适应量化PCM就是一种量化器的特性,能自适应地随着输 入信号的短时能量的变化而调整的编码方法。() 三、单项选择题:(共3小题,每小题3分,共9分) 1、下列不属于衡量语音编码性能的主要指标是()。 (A)编码质量(B)矢量编码(C)编码速率(D)坚韧性 2、下列不属于编码器的质量评价的是() (A)MOS (B)DAM(C)DRT(D)ATC 3、限词汇的语音合成技术已经比较成熟了,一般我们是采用() 作为合成基元。 (A)词语(B)句子(C)音节(D)因素 四、简答题:(共2小题,每小题12分,共24分) 1、画出矢量量化器的基本结构,并说明其各部分的作用。 2、试画出语音信号产生的离散时域模型的原理框图,并说明各 部分的作用。 五、简答题:(共5小题,前三小题,每题5分,后两小题,每题10分,共35分) 1、线性预测分析的基本思想是什么?

通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲 北科大版 1、了解语音信号处理的目的、实质和发展历史; 实质:是研究用数字信号处理技术对语音信号进行处理的一门学科 目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。 通过对语音信号进行某种运算以达到某种要求。 发展历史:1876年电话的发明,贝尔(Bell); 1939年声码器的研制成功—声源+声道; 1947年贝尔实验室发明语谱图仪—语音识别研究的开始; 50年代第一台口授打字机和英语单词语音识别器; 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器; 70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别; 80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。 CMU语音组研制成功SPHINX系统(997,95.8%); 国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。 (除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。) 2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率; 1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容, 有用信息更易于被提取; 2. 语音信号数字表示的优点: 数字技术能完成许多很复杂的信号处理工作; 语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理; 数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务; 数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。 3. 语音信号的数字表示方法:波形表示—采样和量化,保持波形;参数表示—激励源和模型参数(第二章) 语音信号的特点—短时平稳性 4. 处理方法:短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算 短时频域分析—短时傅立叶分析 线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数 倒谱和同态分析、矢量量化和隐马尔可夫模型 5. PCM编码:采样率:8000次/second,均匀量化:采样率12bps信号速率96kbps,非均匀量化:采样率8bps信号速率64kbps ADPCM:采样率:8khz速率:32kbps 3、理解语音信号的产生过程、发生机理和语音信号的声学特性; 产生过程:语音是说话人和听者之间相互传递的信号,传递的媒介是声波,说话人的发音器官做出发声动作,接着空气振动形成声波,声波传到听者的耳朵里,立刻引起听者的听觉反应 发生机理: 声学特性:频率:与音高有关;振幅:与响度有关。 4、理解和掌握语音信号浊音的基音频率、共振峰,及共振峰的计算方法; 浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。 共振峰(formant):声道是一个谐振腔,当激励的频率达到至声道的固有频率,则声道会以最大的振幅振荡,此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要。

基于LabView的双声道声卡数据采集系统

基于LabView的双声道声卡数据采集系统班级:热动1007 姓名:刘堂俊学号:U201011568 在虚拟仪器系统中,信号的输入环节一般采用数据采集卡实现。商用的数据采集卡具有完整的数据采集电路和计算机借口电路,但一般比较昂贵,计算机自带声卡是一个优秀的数据采集系统,它具有A/D和D/A转换功能,不仅价格低廉,而且兼容性好、性能稳定、通用性强,软件特别是驱动程序升级方便。如被测对象的频率在音频范围内,同时对采样频率要求不是太高,则可考虑利用声卡构建一个数据采集系统。 1.从数据采集的角度看声卡 1.1声卡的作用 从数据采集的角度来看,声卡是一种音频范围内的数据采集卡,是计算机与外部的模拟量环境联系的重要途径。声卡的主要功能包括录制与播放、编辑和处理、MIDI接口三个部分。 1.2声卡的硬件结构 图1是一个声卡的硬件结构示意图。一般声卡有4~5个对外接口。 图1 声卡的硬件结构示意图 声卡一般有Line In 和Mic In 两个信号输入,其中Line In为双通道输入,Mic In仅作为单通道输入。后者可以接入较弱信号,幅值大约为0.02~0.2V。声音传感器(采用通用的麦克风)信号可通过这个插孔连接到声卡。若由Mic In 输入,由于有前置放大器,容易引入噪声且会导致信号过负荷,故推荐使用Line In ,其噪声干扰小且动态特性良好,可接入幅值约不超过1.5V的信号。另外,输出接口有2个,分别是Wave Out和SPK Out。Wave Out(或LineOut)给出的信号没有经过放大,需要外接功率放大器,例如可以接到有源音箱;SPK Out给出的信号是通过功率放大的信号,可以直接接到喇叭上。这些接口可以用来作为双通道信号发生器的输出。 1.3声卡的工作原理 声音的本质是一种波,表现为振幅、频率、相位等物理量的连续性变化。声卡作为语音信号与计算机的通用接口,其主要功能就是将所获取的模拟音频信号转换为数字信号,经过DSP音效芯片的处理,将该数字信号转换为模拟信号输出。输入时,麦克风或线路输入(Line In)获取的音频信号通过A/D转换器转换成数字信号,送到计算机进行播放、录音等各种处理;输出时,计算机通过总线将数字化的声音信号以PCM(脉冲编码调制)方式送到D/A转换器,变成模拟的音频信号,进而通过功率放大器或线路输出(Line Out)送到音箱等设备转换为声波。

语音信号处理matlab实现

短时能量分析matlab源程序: x=wavread('4.wav'); %计算N=50,帧移=50时的语音能量 s=fra(50,50,x);%对输入的语音信号进行分帧,其中帧长50,帧移50 s2=s.^2;%一帧内各种点的能量 energy=sum(s2,2);%求一帧能量 subplot(2,2,1); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=50'); axis([0,500,0,30]) %计算N=100,帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=100'); axis([0,300,0,30]) %计算N=400,帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=400'); axis([0,60,0,100]) %计算N=800,帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=800'); axis([0,30,0,200]) 分帧子函数: function f=fra(len,inc,x) %对读入语音分帧,len为帧长,inc为帧重叠样点数,x为输入语音数据 fh=fix(((size(x,1)-len)/inc)+1);%计算帧数 f=zeros(fh,len);%设一个零矩阵,行为帧数,列为帧长 i=1;n=1; while i<=fh %帧间循环 j=1; while j<=len %帧内循环 f(i,j)=x(n); j=j+1;n=n+1; end n=n-len+inc;%下一帧开始位置 i=i+1; end

(完整)《语音信号处理》期末试题总结,推荐文档

2011-2013学年 《语音信号处理》期末考试试题 适用班级:时量:120分钟闭卷记分: 考生班级:姓名:学号: 注:答案全部写在答题纸上,写在试卷上无效! 一、填空题:(每空2分) 1、矢量量化系统主要由编码器和译码器组成,其中编码器主要是由搜索算法和码书构成。P101 2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。P18 3、语音编码按传统的分类方法可以分为波形编码、参数编码和混合编码。P137 4、对语音信号进行压缩编码的基本依据是语音信号的冗余度和人的听觉感知机理。 P137-138 5、汉语音节一般由声母、韵母和声调三部分组成。P10 6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的掩蔽效应。P22 7、句法的最小单位是词,词法的最小单位是音节,音节可以由音素构成。P9 8、复倒谱分析中避免相位卷绕的算法,常用的有微分法和最小相位信号法。P62 9、语音信号处理也可以简称为语音处理,它是利用数字信号处理技术对语音信号进行处理的一门学科,包括语音编码、语音合成、语音识别、说话人识别和语音增强等五大分支。P3 10、语音信号处理也可以简称为语音处理,它是以数字信号处理和语音学为基础而形成的一个综合新的学科,包括发音语音学、声学语音学、听觉语音学和心理学等四大分支。P2,6 11、语音的四大要素:音质、音调、音强和音长。P9 12、人类发音过程有三类不同的激励方式,因而能产生三类不同的声音,即浊音、清音、和爆破音。P8 13、元音的一个重要声学特性是共振峰,它是区别不同元音的重要参数,它一般包括共振峰频率的位置和频带宽度。 14、语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态信号处理来实现。P56 二、判断题:(每小题2分)√× 1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。(×)P143 2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。(×)P181 3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。(×)P142 4、线性预测法正是基于全极点模型假定,采用时域均方误差最小准则来估计模型参数的。(×)P72 5、波形编码是依赖模型假定的语音编码方法。(×)P137 6、掩蔽效应是使一个声音A能感知的阀值因另一个声音B的出现而提高的现象,这时A叫

语音信号处理复习纲要

Ch1 绪论 §1.1 语音信号处理概述 一、语音、语音信号处理的名词解释 1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。 二、语音处理技术的应用领域 语音处理技术的应用领域包括:工业、军事、交通、医学、民用等。 三、语音信号采用数字处理的原因(数字语音的优点) 语音信号均采用数字处理,是因为数字处理与模拟处理相比具有许多优点: 1、数字技术能够完成许多很复杂的信号处理工作; 2、通过语音进行交换的信息本质上具有离散的性质,语音可以看做是音素的组合,适合数字处理; 3、数字系统具有高可靠性、廉价、快速等优点,容易完成实时处理任务; 4、数字语音适合在强干扰信道中传输,也易于加密传输。 四、语音学的名词解释 语音学:是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。 §1.2 语音信号处理的发展概况 一、语音信号处理的发展史 1、1874年:电话的发明时现代语音通信的开端; 2、1939年:通道声码器技术; 3、40年代后期:语谱仪; 4、50年代初:第一台口授打字机和英语单词语音识别器; 5、60年代:Fant发表《语音产生的声学理论》; 6、70年代初:Flanagan著作《语音分析、合成和感知》; 7、90年代以来:语音识别的研究由实验室走向实用化。 二、语音编码、语音合成、语音识别名词解释 1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。 2、语音合成:语音合成的目的是使计算机能像人一样说话,它是一种人机语音通信技术,应用领域广泛。 3、语音识别:语音识别是使计算机判断出所说的话得内容,和语音合成一样也是一种人机语音通信技术。 为了实现人机语音通信,必须具备语音识别和语音理解两种功能 Ch2 基础知识 §2.2 语音产生的过程 一、现代语音学发展的三个分支:发音语音学、声学语音学、听觉语音学。 二、语音、清音、浊音的名词解释及语音的产生过程(名词解释、简答,集中备课) 1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。语音室声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。 2、人类生成语音过程的第一阶段包括神经核肌肉的生理学阶段和产生语音波、传递语音波的物理阶段。 3、语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。

基于MATLAB的有噪声语音信号处理毕设

大学本科毕业设计论文 基于MATLAB的有噪声语音信号处理

摘要 滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR 滤波器是滤波器设计的重要组成部分。Matlab功能强大、简单易学、编程效率高,深受广大科技工作者的欢迎。特别是Matlab还具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB 有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。 关键词?数字滤波器;MATLAB;窗函数法;巴特沃斯; 切比雪夫; 双线性变换

Abstract ?Filterdesignin digital signal processingplaysan extre melyimportant role, FIR digital filters and IIR filter is an importan tpart of filter design.Matlab is powerful,easy to learn,programming efficiency,which was welcomed bythemajority ofsc ientists. Matlab alsohas a particular signalanalysis toolbox,it need nothave strongprogrammingskills can be easily signal analysis, processing and design. Using MATLAB Signal Processing Toolbox can quickly andefficiently design avarietyof digitalfilters. MATLAB basedon the noise issuespeech signal processing design and implementation of digital signalprocessing integrated use of the theoretical knowledge ofthe speechsignal plus noise, time domain, frequencydomainanalysis andfiltering. Thecorrespondingresults obtainedthroughtheoreticalderivation, and then use MATLAB as a programming toolfor computer implementation.Implemented inthe design process,usingthewindow function methodtodesign FIR digital filters with Butterworth, Chebyshev andbilinear Reform IIR digital filter design and use ofMATLAB as asupplementary tool to complete thecalculation and graphic design Drawing. Throughthesimulation of thedesigned filter and the frequency analysis shows thatusingMatlabSignal Processing Toolbox can quickly and easily design digital filters FIR andIIR,the processis simple and convenient, the results of the performance indicators to meetthe specifiedrequirements. ? Keywords: digital filter; MATLAB;Chebyshev;Butterworth;

相关主题
文本预览
相关文档 最新文档