语音信号处理与识别
- 格式:doc
- 大小:102.00 KB
- 文档页数:7
信号系统课程设计报告
欧阳光亮2012029020025
语音信号处理与识别
目的:理解时域和频域尺度变换基本概念,掌握信号时频域分析方法,正确理解采样定理,准确理解滤波器的概念。
内容:
(1)使用Matlab中wavrecord命令录制一段3秒的语音信号,使用wavplay命令播放,录制命令和播放命令中的采样频率设置成相同和不同两种情况,对观察到的现象进行分析并结合课本中的知识对该现象进行解释;
(2)使用不同的采样频率录制一段3秒的语音信号,画出信号的时域波形和频谱;找到语音信号的主要频谱成分所在的带宽;观察并分析不同采样频率对波形和频谱的影响;寻找声音信号不出现明显失真的最低采样频率;(3)录制一段男生的语音信号和一段女生的语音信号,对两段音频信号进行混合,设计滤波器将混合的语音信号分开成单独的男声和女声信号,如果分离效果不好,对原因进行解释。
Matlab命令:wavrecord, wavplay, wavwrite, wavread, save, load, fft, fftshift, filter, plot, subplot, figure.
过程:
(1)相同:
fs1=16000; %取样频率
fs2=16000; %播放频率
duration=5; %录音时间
fprintf('Press any key to start %g seconds of recording...\n',duration);
pause;
fprintf('Recording...\n');
y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数
fprintf('Finished recording.\n');
fprintf('Press any key to play the recording...\n');
pause;
wavplay(y,fs2);
wavwrite(y,fs1,'E:\matlab\record3.wav
不同:
fs1=16000; %取样频率
fs2=8000; %播放频率
duration=5; %录音时间
fprintf('Press any key to start %g seconds of recording...\n',duration); pause;
fprintf('Recording...\n');
y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数fprintf('Finished recording.\n');
fprintf('Press any key to play the recording...\n');
pause;
wavplay(y,fs2);
wavwrite(y,fs1,'E:\matlab\record3.wav');
现象:第二次播放时,声音明显失真。
理由:采样频率和播放频率不一样时声音信号会失真。
(2)
fs1=16000; %取样频率
fs2=16000; %播放频率
duration=5; %录音时间
fprintf('Press any key to start %g seconds of recording...\n',duration); pause;
fprintf('Recording...\n');
y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数fprintf('Finished recording.\n');
fprintf('Press any key to play the recording...\n');
pause;
wavplay(y,fs2);
wavwrite(y,fs1,'E:\matlab\record3.wav');
wav=wavread('E:\matlab\record3.wav'); Fs=16000; n=length(wav); f=(0:n-1)*16000/n; mag=abs(fft(wav)); subplot(2,1,1); plot(wav); subplot(2,1,2); plot(f,mag)
x 10
x/t
y /幅度
x/f
y /幅度
fs1=8000; %取样频率 fs2=8000; %播放频率 duration=5; %录音时间
fprintf('Press any key to start %g seconds of recording...\n',duration);
pause;
fprintf('Recording...\n');
y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数
fprintf('Finished recording.\n');
fprintf('Press any key to play the recording...\n');
pause;
wavplay(y,fs2);
wavwrite(y,fs1,'E:\matlab\record3.wav');
wav=wavread('E:\matlab\record3.wav'); Fs=8000;
n=length(wav); f=(0:n-1)*16000/n; mag=abs(fft(wav)); subplot(2,1,1); plot(wav); subplot(2,1,2); plot(f,mag)
wavplay(wav,8000)
x 10
x/s
y /幅度
y /幅度
x/hz
由图可知:语音信号的主要频谱成分所在的带宽为(0—1200hz ),带宽为1200hz 。
当采样频率较小时,频谱图上显示带宽较大,波形较稀松。
最低采样频率应为,声音信号的最高频率的两倍,由图可知为2400hz 。 (3)女声:
wav1=wavread('E:\matlab\record1.wav'); wav2=wavread('E:\matlab\record2.wav'); wav=wav1+wav2; fp1=800; fp2=1500; fp=[fp1,fp2];