当前位置:文档之家› MATLAB变声程序代码

MATLAB变声程序代码

MATLAB变声程序代码
MATLAB变声程序代码

% ct1 clear all,close all, clc;

% 定义常数

FL = 80; % 帧长

WL = 240; % 窗长

P = 10; % 预测系数个数

[s,fs] = wavread('sunday_2.wav'); % 载入语音 s

s = s/max(s); %归一化

L = length(s); % 读入语音长度

FN = floor(L/FL)-2; % 计算帧数

% 预测和重建滤波器

exc = zeros(L,1); % 激励信号(预测误差)

zi_pre = zeros(P,1); % 预测滤波器的状态

s_rec = zeros(L,1); % 重建语音

zi_rec = zeros(P,1);

% 合成滤波器

exc_syn = zeros(L,1); % 合成的激励信号(脉冲串)

s_syn = zeros(L,1); % 合成语音

last_syn = 0; %存储上一个(或多个)段的最后一个脉冲的下标

zi_syn = zeros(P,1); % 合成滤波器的状态

% 变调不变速滤波器

exc_syn_t = zeros(L,1); % 合成的激励信号(脉冲串) s_syn_t = zeros(L,1); % 合成语音

last_syn_t = 0; %存储上一个(或多个)段的最后一个脉冲的下标 zi_syn_t = zeros(P,1); % 合成滤波器的状态

% 变速不变调滤波器(假设速度减慢一倍)

v=.5;

exc_syn_v = zeros(v\L,1); % 合成的激励信号(脉冲串) s_syn_v = zeros(v\L,1); % 合成语音

last_syn_v = 0; %存储上一个(或多个)段的最后一个脉冲的下标 zi_syn_v = zeros(P,1); % 合成滤波器的状态

hw = hamming(WL); % 汉明窗

% 依次处理每帧语音

for n = 3:FN

% 计算预测系数(不需要掌握)

s_w = s(n*FL-WL+1:n*FL).*hw; % 汉明窗加权后的语音

[A E] = lpc(s_w, P); % 用线性预测法计算 P 个预测系数

% A 是预测系数, E 会被用来计算合成激励的能量

if n == 27

% (3) 观察预测系统的零极点图

zplane(1,A);

end

s_f = s((n-1)*FL+1:n*FL); % 本帧语音,下面就要对它做处理

% (4) 用 filter 函数 s_f 计算激励,注意保持滤波器状态 [exc1,zi_pre] =

filter(A,1,s_f,zi_pre);

exc((n-1)*FL+1:n*FL) = exc1; % 计算得到的激励

% (5) 用 filter 函数和 exc 重建语音,注意保持滤波器状态 [s_rec1,zi_rec] =

filter(1,A,exc1,zi_rec);

s_rec((n-1)*FL+1:n*FL) = s_rec1; % 计算得到的重建语音

%注意下面只有在得到exc后才会计算正确

s_Pitch = exc(n*FL-222:n*FL);

PT = findpitch(s_Pitch); % 计算基音周期 PT (不要求掌握)

G = sqrt(E*PT); %计算合成激励的能量 G (不要求掌握)

% 方法 3:本段激励只能修改本段长度

tempn_syn = [1:n*FL-last_syn]';

exc_syn1 = zeros(length(tempn_syn),1);

exc_syn1(mod(tempn_syn,PT)==0) = G; % 某一段算出的脉冲

exc_syn1 = exc_syn1((n-1)*FL-last_syn+1:n*FL-last_syn);

[s_syn1,zi_syn] = filter(1,A,exc_syn1,zi_syn);

exc_syn((n-1)*FL+1:n*FL) = exc_syn1; %计算得到的合成激励 s_syn((n-1)*FL+1:n*FL) = s_syn1; %计算得到的合成语音 last_syn = last_syn+PT*floor((n*FL-last_syn)/PT);

% (11) 不改变基音周期和预测系数,将合成激励的长度增加一倍,再作为

filt er

% 的输入得到新的合成语音,听一听是不是速度变慢了,但音调没有变。

FL_v = floor(FL/v);

tempn_syn_v = [1:n*FL_v-last_syn_v]';

exc_syn1_v = zeros(length(tempn_syn_v),1); exc_syn1_v(mod(tempn_syn_v,PT)==0) = G; % 某一段算出的脉冲

exc_syn1_v = exc_syn1_v((n-1)*FL_v-last_syn_v+1:n*FL_v-last_syn_v);

[s_syn1_v,zi_syn_v] = filter(1,A,exc_syn1_v,zi_syn_v);

last_syn_v = last_syn_v+PT*floor((n*FL_v-last_syn_v)/PT); exc_syn_v((n-

1)*FL_v+1:n*FL_v) =exc_syn1_v; % 计算得到的加长合成激励 s_syn_v((n-

1)*FL_v+1:n*FL_v) = s_syn1_v; %计算得到的加长合成语音

% (13)将基音周期减小一半,将共振峰频率增加150Hz,重新合成语音,听听是啥感受?

PT1 =floor(PT/2); %减小基音周期

poles = roots(A);

变声器的原理分类实现及应用

变声器的原理、分类、实现及应用 2009130309 徐佩 变声器的原理:变声器是通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变, 实现输出声音的改变的。通过自己发音,共振峰频率的改变是基本重采样实 现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和 共振频率变化的独立、互不相关,在基频移动是必须考虑抵消重采样带来的 偏移,理论上只要基频检测足够精确,确保可以保证基频改变和共振峰频率 改变间的互不相关,通过搬移和改变基频、语速,实现变声。 变声器的分类:根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具变声原理。无论是硬件变声器,还是软件变声 器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调, 使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们 的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的 不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同 乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调 的双重复合改变,实现输出声音的改变。其功能要点如下: 1.无限制式多格式录音:可以对来自麦克风、系统等众多设备的声音进 行实时的录制,支持多设备选择性录音,录音不需要临时文件,并可一 次性保存为WAV/WMA/MP3等众多流行格式。在录音过程中还允许对声音 进行男女变声处理! 2.音乐重混音录制功能:允许您选择一首歌曲(音频或视频),然后对 其进行各种特效处理,比如保持原唱的同时进行节奏快慢处理,或者进 行男女声变换处理。在混录过程中也允许您随时调节各特效参数,就像 一个专业混音师那样!通过这些混录功能,您可以制作出和原音乐风格 不同的轻快歌曲或类似迪斯科类型的快速歌曲,也可以是更轻柔的背景 歌曲!然后您新创作的歌曲将可以保存为新的音频文件。 3.文件混音功能:支持对一首歌曲(音频或视频)进行裁剪并对结尾部分施 加淡出效果,或增大原音乐音量,同时还允许将其和其他音乐进行混音处理, 并允许保存为WAV/WMA/MP3等众多流行格式。 变声器的实现:插值以后重新抽样。基本过程是这样的:已知当前帧帧长FL (采样)点,采样频率Fs ,目标变换帧频率Fs’ ,则目标变换帧帧长FL’=FL*Fs’/Fs 。 记R ate = Fs’/Fs ,那么FL’=FL * Rate ,其中Rate 为基频变化率。变换 开始时,先求得FL 和FL’ 的最小公倍数AL ,再将原音频帧插值为AL 点,最后将插值后的语音段重新抽样,得到长FL’ 点的变声后的数据。 专用变音集成电路 1、特点:宽电压范围3.0-5.0V*无需外部存储器*低功耗*使用可变电阻 或者开关来调整声音效果*可选择高音低音放大音机器人声音可以应用于玩 具变声,电话系统或其他声音领域*有静音功能 2、概述:RTS0072B是一种单片CMOS大规模集成电路设计的语音转换IC, 它可以将声音移调或转变成另外一个声音,通过将输入的正常速率的声音信

MATLAB变声器

MATLAB变声器 电子工程学院 摘要 语音信号处理中的变声处理已经有了比较成熟的算法,本文阐述了变声算法的基础原理,利用数字滤波器,自相关法,LPC,LPC系数求根法等方法在MATLAB上改变语音信号的基频和共振峰以实现变声,并总结了现有变声算法的缺陷,对用不同的变换域能否改进变声算法做了粗略分析。 关键词:变声算法,LPC,变换域

目录 研究背景 (3) 变声原理 (3) 语音基本概念 (3) 变声原理 (4) 变声过程 (5) 分帧处理 (5) 计算LPC系数 (5) 计算原始激励 (6) 计算基音周期 (6) 计算激励能量 (7) 合成脉冲序列 (7) 更改声道参数 (7) 合成变声语音 (8) 程序设计 (8) 传统变声算法缺陷 (9) 合成激励与原始激励差别较大 (9) 不能实现定向变声 (10) 实现定向变声的猜想 (11) 小波域是否存在恒定音色参数粗略分析 (12) 统计上的变换是否利于寻找恒定音色参数猜想 (12) 下一步研究计划 (12)

研究背景 语音信号是人们日常生活中十分常见的信号,语音也是人与人之间传递信息的一种十分重要的方式。随着智能终端以及互联网的普及,语音信号大量地以数字形式出现,语音信号处理变得越来越重要,变声处理是语音信号处理的基础之一,所以在这样的大背景下,研究变声算法并改进变声算法是很有意义而且有必要的。 另一方面,传统的变声算法是对发声过程的简单模拟进行语音合成,在模拟过程中改变参数以实现变声,而传统的变声算法存在一些缺陷,若要改进变声算法使其更灵活有效,那么细致的研究传统的变声算法是很有必要的。 变声原理 语音基本概念 1. 声道:声道是很多动物及人类都有的一个腔室,从声源产生的声音经由此处滤出。人的声道包括声道则包括喉腔、咽头、口腔和鼻腔。 2. 基音:一般的声音都是由发音体发出的一系列频率、振幅各不相同的振动复合而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为泛音。发音体整体振动产生的音,叫做基音,决定音高;发音体部分振动产生的音,叫做泛音,决定音色;基音和泛音结合一起而形成的音,叫做复合音,日常我们所听到的声音多为复合音。 3.共振峰:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰是语音音质的决定因素,反映了声道(共振腔)的物理特征。声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减,得到强化的那些频率在时频分析的语图上表现为浓重的黑色条纹。由于能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。在语音声学中,共振峰决定着元音的音质,在计算机音乐中,共振峰是决定音色和音质的重要参数。 4,短时平稳特性:语音信号是一种随时间而变化的信号,主要分为浊音和清音两大类。浊音的基音周期、清浊音信号幅度和声道参数等都随时间而缓缓变化。由于发生器官的惯性运动,可以认为在一小段时间里(一般为10~30ms)语音信号的频域特性近似不变,即语音信号具有短时平稳性。因而处理语音信号之前要把语

基于matlab变声器的设计

基于matlab变声器的设计 【摘要】为了实现由男声变换到女声,在语音信号参数分析过程采用短时自相关法提取语音信号的基音周期,同时用LPC倒谱分析法分析共振峰的范围,通过matlab编写程序修改语音参数并接近于女声的范围,构置GUI界面。在实验中,输入一段语音信号,输出时即实现了由男声到女声的变换效果。因此对于语音信号参数的修改能够实现男女声音之间的变换。 【关键词】短时自相关法;LPC倒谱;语音信号;matlab;GUI 随着生活水平的提高,科技的不断进步,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的访问节目为了保护被访问者,都对声音进行了相应的处理。本设计通过编写matlab程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。 1.变声原理 在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。 2.提取参数 2.1 基于短时自相关法的基音周期估值 进行自相关的计算可采用两种方法,一种是对语音信号进行低通滤波,另一种是对语音信号进行中心削波处理。本实验采用第一种方法,通过matlab③编程采用自相关算法可以实现基音周期的估值,即对语音信号进行低通滤波,然后进行自相关计算。在低通滤波时,采用巴特沃斯滤波器。 2.1.1 构建巴特沃斯低通滤波器 根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率,,算出为0.175,归一化低通原型系统函数为: 根据设定的滤波器编写matlab程序,当信号经过低通滤波器后,对原始信号滤波产生结果如图2所示,低通滤波后,保留基音频率,然后再用2kHz采样频率进行采样,采样序列为x(n),后进行下一步的自相关计算。 2.1.2 语音信号的短时自相关函数① 定义语音信号自相关函数如下:

数字变声器的设计

摘要 变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具本次课程设计是数字变声器的设计,整个程序使用MATLAB软件编写的。一个GUI界面实现录入一段10~15秒的语音,同时绘制出该语音的时域波形和频域波形,并实现了对该语音的保存和打开。 关键字:变声器;MATLAB软件;变声基本原理;语音;GUI;

目录 前言 (1) 第1章方案选择 (2) 1.1设计方案 (2) 1.2方案的选择 (2) 第2章变声的基本原理 (3) 2.1 基本概念 (3) 2.2 变声的原理 (4) 2.2.1 生成脉冲序列 (4) 2.2.2 计算预测系数 (5) 2.2.3 声道参数 (5) 第3章程序设计及仿真分析 (7) 3.1程序设计 (7) 3.1.1 分帧处理 (7) 3.1.2 计算预测系数 (7) 3.1.3 计算激励信号 (7) 3.1.4 重建语音 (8) 3.1.5 基音周期 (8) 3.1.6 合成激励的能量 (9) 3.1.7 变声处理 (10) 第4章GUI的设计 (11) 4.1 GUI简介 (11) 4.2 GUI界面设计 (11) 4.3 GUI界面运行流程图 (13) 4.4回调函数 (14) 4.4.1切换按钮 (14) 4.4.2 按钮 (15) 参考文献 (19) 设计总结 (20)

前言 我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。目前,语音伪装系统(变声器)被广泛应用于社会的各个领域。语音伪装设备经常出现在以下几个方面:为了防止打击报复,保护举报人的人身安全的匿名举报系统;记者采访时对采访对象声音的处理,保护被采访人的安全;应用于电台或电视台,可对热线电话进行声音的处理。独居女士和小孩;可用变声器应付骚扰电话和陌生人来访。另外,在智能手机或者平板电脑等便携式移动终端中利用变声器开发的小游戏等。因此,变声器的应用范围及其广泛。 我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。 本次课程设计就是运用我们所学到的理论知识,用MATLAB软件来实现对语音信号的变声处理,理论联系实际,从而更好地掌握以及运用所学习的知识。

变声器设计方案

MATLAB变声器的设计 前言 随着生活水平的提高,科技的不断进步,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的访问节目为了保护被访问者,都对声音进行了相应的处理。本设计通过编写MATLAB程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。 1 变声原理 在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。 人基频分布H共振峰频率分 男声180] [50 , 偏低380] [160 , 女声中 1000] [400 , 童声偏高 图1 2 提取参数 基于短时自相关法的基音周期估值进行自相关的计算,通过MATLAB编程采用自相关算法可以实现基音周期的估值,即对语音信号进行低通滤波,然后进行自相关计算。在低通滤波时,采用巴特沃斯滤波器。 2.1.1 构建巴特沃斯低通滤波器 根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N 为5,3dB截止频率,算出0.175,归一化低通原型系统函数为 .其中,,将带人中,得到低通滤波器,将 根据设定的滤波 器编写MATLAB程序,当信号经过低通滤波器后,对原始信号滤波产生结果如图2所示,低通滤波后,保留基音频率,然后再用2kHz采样频率,后进行下一步的自相关计算。x(n)进行采样,采样序列为

图2 2.1.2语音信号的短时自相关函数 定义语音信号的自相关函数如下: 其中k为信号延迟点数;为语音信号;N为语音帧长度。经过低通滤波之后, 取160个样点数,帧长取10ms,对每帧语音求短时自相关,取得自相关最大点数,自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,从而估计出基音周期,但是由于图中存在野点,编写MATLAB程序除去野点算出对应基音周期如图3所示,设基音周期值为PT,调动PT,接近女 声,设新的为PT1; 图3 2.2 LPC倒谱法提取共振峰 通过线性预测分析得到合成滤波器的系统函数为: H(z)= 为冲击响应,为预测系数。其中h(n)是最H(z)首先根据同态分析方法有下面求h(n)的倒谱(n),,因为可以展开成级数形式,即小相位的,即在单位圆内是解析的,所以说,将式两端同(0)=0是存在的,设(n)的逆变换,就是说.时对求导,得到:

数字变声器

数字变声器 摘要为了实现由男声变换到女声,在语音信号参数分析过程采用短时自相关法提取语音信号的基音周期,同时用LPC倒谱分析法分析共振峰的范围,通过matlab编写程序修改语音参数并接近于女声的范围,构置GUI界面。在实验中,输入一段语音信号,输出时即实现了由男声到女声的变换效果。因此对于语音信号参数的修改能够实现男女声音之间的变换。 关键词短时自相关法 LPC倒谱语音信号 matlab GUI 前言 为了锻炼自己数字信号处理的实践能力,也为了更好的完成老师布置的作业,本设计通过编写matlab程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。

目录 数字变声器 (1) 第1章采样 (4) 1 一些基本概念 (4) 1.1声道 (4) 1.2基音 (4) 1.3共振峰 (4) 1.4物理原理 (4) 第2章设计方案 (5) 2.1 设计原理 (5) 2.2 设计步骤 (5) 第3章建模 (5) 3.1 基于短时自相关法的基音周期估值 (5) 3.1.1构建巴特沃斯低通滤波器 (5) 3.1.2语音信号的短时自相关函数 (6) 3.2 LPC倒谱法提取共振峰 (6) 3.3 线性预测语音信号合成 (7) 第4章 GUI界面设计以及仿真图形和程序 (8) 4.1 界面设计 (8) 4.2 仿真图形 (9) 4.2.1 原声 (10) 4.2.2 女声 (10) 4.2.3 童声 (10) 4.2.4 老人声 (10) 4.2.5 音调变高 (11) 4.2.6 音调变低 (11) 4.2.7 语速变慢 (11) 4.2.8 语速变快 (12) 4.3 程序流程图如下 (12) 4.4每个控件的程序如下 (13) 4.4.1“录音”radiobutton(radiobutton1) (13) 4.4.2“打开”radiobutton(radiobutton2) (13) 4.4.3“开始”按钮(pushbutton1) (14) 4.4.4“保存”按钮(pushbutton2) (14) 4.4.5“打开音频文件按钮”(pushbutton3) (15) 4.4.6“原声”按钮(pushbutton5) (15) 4.4.7“女声”按钮(pushbutton7) (16) 4.4.8“童声”按钮(pushbutton6) (17) 4.4.9“老人”按钮(pushbutton12) (19) 4.4.10“音调变高”按钮(pushbutton11) (20) 4.4.11“音调变低”按钮(pushbutton9) (21) 4.4.12“语速变慢”按钮(pushbutton14) (21)

基于MATLAB算法的数字变声器

基于MATLAB算法的数字变声器【摘要】变声器的原理是通过改变输入声音频率,进行改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变,实现输出声音的改变。通过自己发声,共振峰频率的改变是基于重采样实现的。同时用LPC倒谱分析法分析共振峰的范围,通过MATLAB编写程序并构置GUI界面。实验中通过MATLAB软件对采集来的语言信号进行频谱分析,讨论不同人之间的噪音源参数和共振峰参数,通过对不同人语言信号频率和幅度的改变来实现不同人之间的语音转换。 【关键词】短时自相关法; LPC倒谱;语音信号; matlab GUI; 1引言 随着生活水平的提高,科技的不断进步,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的访问节目为了保护被访问者,都对声音进行了相应的处理。本设计通过编写matlab程序,借助对声音音色和音调的双重复合改变,实现输出声音的改变。共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时印发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。保证变声效果的自然度主要是没有采用基因检测将基因移动和共振峰变化彻底隔离的缘故。 本次课程设计就是运用我们所学到的理论知识,用MATLAB软件来实现对语音信号的变声处理,理论联系实际,从而更好地掌握以及运用所学习的知识。 2数字变声器的原理与算法 2.1基本原理 语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。 在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于打开一种声音进行相关参数提取,修改 接近于女声、男声或童声,实现声音的变换。 图1 人群基频与共振峰的关系 2.2实现过程及算法 采用线性预测参数合成法。线性预测参数合成法利用LPC语音分析方法,通过分析自然

数字信号处理--变声器报告

数字信号处理--变声器报告 1项目目标:把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。 2变声原理:语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语 音可分为有声语音和无声语音,前者是由声带振动激励的 脉冲信号经声腔调制变成不同的音,它是人类语言中元音 的基础,声带振动的频率称为基频。无声语音则是声带保 持开启状态,禁止振动引发的。一般来说,由声门振动决 定的基频跟说话人的性别特征有关,如下表,而无声语音 则没有体现这个特征。说话人的个性化音色和语音的另外 一个声学参数——共振峰频率的分布有关。儿童由于声道 短,其共振峰频率高于成年人,成年女性的声道一般短于 成年男性,所以女性的共振峰频率一般高于男性。 表男声、女声和童声基频、共振峰频率关系表 由上可知,在进行性别变声时,主要考虑基频和共振峰频率的变化。当基频伸展,共振峰频率也同时伸展时,可由男声变成女声,女声变成童声;反之,基频收缩,共振峰频率也同时收缩时,则由童声变女声,女声变男声。为了获得自然度、真实感较好的变声效果,基

频和共振峰频率通常必须各自独立地伸缩变化如图1。 V1 男声变童声 V2 男声变女声 图1 基频和共振峰频率分布的变化 共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。 3设计方案:1录入自己(小孩、女人、老人)的一段声音 2用MATLAB 做fft得到其频谱 3做fft频谱分析 4搬移和改变基 频、语速,实现变声 4程序流图

基于LabVIEW的变声器设计

基于LabVIEW的变声器设计 摘要:数字信号处理技术在语音信号的处理中具有十分重要的意义,是语音变换的处理方法之一。基于在语音变换时的技术要求,本文介绍了一种在基音同步叠加(PSOLA)算法的前提下,结合重采样技术实现语音变调不变速的方法,在分析变换理论及具体算法的基础上,利用LabVIEW编程实现语音的多种频率变换以及男∕女声变换。 关键词:基音同步叠加(PSOLA)算法; 重采样; 频谱搬移; 语音转换LabVIEW-based variable sound design Abstract: Digital signal processing technology is of great significance in speech signal processing, is one of the processing method of voice transformation. Based on the technical requirements in the voice change, this paper describes a synchronous overlap in pitch (PSOLA) algorithm premise resampling technique combining voice tone does not shift method, based on the analysis of specific algorithms transform theory and on the use of LabVIEW programming a variety of voice frequency conversion and male / female transformation. Keyword: PSOLA; resampling; spectrum shifting; V oice conversion 0 引言 在音频信号处理中,将源说话人语音中的个性特征转换成目标说话人语音的个性特征的语音信号处理技术,称为语音变换技术。人的语音说话特征分为音段特性与超音段特性以及语言特性,音段特征包括谱包络,谱激励;超音段特性包括基频,时长,幅度[1]。 近几年来,语音信号处理技术在实用化方面取得了很多突破性进展,例如,随着在对声学语音学统计模型的深入研究,像语音识别,基于语音段的建模方法等逐渐成为研究热点。在语音合成方面,基于基音同步叠加(PSOLA)算法的波形编辑和拼接技术得到广泛应用[2],PSOLA算法的优势在于能在不改变语音音段的音质的基础上,能改变体现语音自然度的韵律特征的变化,进而获得更高的清晰度。

数字变声器的设计-兰州理工大学

******************* 实践教学 ******************* 兰州理工大学 计算机与通信学院 2012年春季学期 计算机通信与网络课程设计 题目:数字变声器设计 专业班级:通信工程一班 姓名: 学号: 指导教师:蔺莹 成绩:

摘要 变声器的原理是通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变,实现输出声音的改变。通过自己发声,共振峰频率的改变是基于重采样实现的。 目前,语音伪装系统(变声器)被广泛应用于社会的各个领域。语音伪装设备经常出现在以下几个方面:为了防止打击报复,保护举报人的人身安全的匿名举报系统;记者采访时对采访对象声音的处理,保护被采访人的安全;应用于电台或电视台,可对热线电话进行声音的处理。独居女士和小孩;可用变声器应付骚扰电话和陌生人来访。另外,在智能手机或者平板电脑等便携式移动终端中利用变声器开发的小游戏等。因此,变声器的应用范围及其广泛。 关键字:变声器共振峰频率语音伪装

目录 摘要 (3) 目录 (4) 第一章数字变声器概述 (5) 1.1变声器定义 (5) 1.2变声器原理概述 (5) 第二章变声器原理及实现 (6) 2.1基本原理 (6) 2.2数字变声器的实现 (7) 2.3数字变声器的MATLAB实现 (8) 2.4仿真结果及分析 (11) 2.5结果分析 (13) 第三章课设总结 (15) 参考文献 (16) 致谢 (16)

第一章数字变声器概述 1.1变声器定义 变声器是通过改变输入音频的音色、音调,将变声后的音频输出的工具。根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具,譬如,知名动画名侦探柯南中,柯南侦破案件时扮演毛利小五郎时,使用的蝴蝶结,就是一种变声器,柯南正是通过这一蝴蝶结,模拟成毛利小五郎的声音,进行案件侦破的,这一变声器可称之为蝴蝶结变声器。变声器软件,即通过软件实现变声的工具,软件类变声器,运行平台皆为电脑系统。 1.2变声器原理概述 无论是硬件变声器,还是软件变声器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。保证变声效果的自然度主要是没有采用基音检 测将基音移动和共振峰变化彻底隔离的缘故。 重采样使得信号的样本数目增加或减少,若以不变的采样频率播放,速度会变慢或变快,因此需要进行保持声调不变的变速处理(变速不变调),恢复到原来的样本数目。同时为了改变信号的基频,还必须对信号进行变调处理即基频移动,在运用变调因子时,必须抵消重采样引起的基频变化。

变声器设计方案复习过程

变声器设计方案

MATLAB变声器的设计 前言 随着生活水平的提高,科技的不断进步,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的访问节目为了保护被访问者,都对声音进行了相应的处理。本设计通过编写MATLAB程序,修改相关声音参数,使其频率发生相应的变化,在输出时达到变声。 1 变声原理 在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。 图1 2 提取参数 基于短时自相关法的基音周期估值进行自相关的计算,通过MATLAB编程采用自相关算法可以实现基音周期的估值,即对语音信号进行低通滤波,然后进行自相关计算。在低通滤波时,采用巴特沃斯滤波器。 2.1.1 构建巴特沃斯低通滤波器

根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率,算出 0.175,归一化低通原型系统函数为 其中,, . 将将带人中,得到低通滤波器, 根据设定的滤波器编写MATLAB程序,当信号经过低通滤波器后,对原始信号滤波产生结果如图2所示,低通滤波后,保留基音频率,然后再用2kHz采样频率进行采样,采样序列为x(n),后进行下一步的自相关计算。 图2 2.1.2语音信号的短时自相关函数 定义语音信号的自相关函数如下:

其中k为信号延迟点数;为语音信号;N为语音帧长度。经过低通滤波之后,取160个样点数,帧长取10ms,对每帧语音求短时自相关,取得自相关最大点数,自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,从而估计出基音周期,但是由于图中存在野点,编写MATLAB 程序除去野点算出对应基音周期如图3所示,设基音周期值为PT,调动PT,接近女 声,设新的为PT1; 图3 2.2 LPC倒谱法提取共振峰 通过线性预测分析得到合成滤波器的系统函数为: H(z)= 其中h(n)为冲击响应,为预测系数。 下面求h(n)的倒谱(n),首先根据同态分析方法有,因为H(z)是最小相位的,即在单位圆内是解析的,所以说可以展开成级数形式,即 ,就是说的逆变换(n)是存在的,设(0)=0,将式两端同时对求导,得到:

MATLAB变声器

MATLAB变声器

MATLAB变声器 电子工程学院 摘要 语音信号处理中的变声处理已经有了比较成熟的算法,本文阐述了变声算法的基础原理,利用数字滤波器,自相关法,LPC,LPC系数求根法等方法在MATLAB上改变语音信号的基频和共振峰以实现变声,并总结了现有变声算法的缺陷,对用不同的变换域能否改进变声算法做了粗略分析。 关键词:变声算法,LPC,变换域

目录 研究背景 (5) 变声原理 (5) 语音基本概念 (5) 变声原理 (6) 变声过程 (7) 分帧处理 (7) 计算LPC系数 (8) 计算原始激励 (8) 计算基音周期 (8) 计算激励能量 (9) 合成脉冲序列 (9) 更改声道参数 (9) 合成变声语音 (10) 程序设计 (10) 传统变声算法缺陷 (12) 合成激励与原始激励差别较大 (12) 不能实现定向变声 (13) 实现定向变声的猜想 (14) 小波域是否存在恒定音色参数粗略分 析 (14)

统计上的变换是否利于寻找恒定音色 参数猜想 (14) 下一步研究计划 (15)

研究背景 语音信号是人们日常生活中十分常见的信号,语音也是人与人之间传递信息的一种十分重要的方式。随着智能终端以及互联网的普及,语音信号大量地以数字形式出现,语音信号处理变得越来越重要,变声处理是语音信号处理的基础之一,所以在这样的大背景下,研究变声算法并改进变声算法是很有意义而且有必要的。 另一方面,传统的变声算法是对发声过程的简单模拟进行语音合成,在模拟过程中改变参数以实现变声,而传统的变声算法存在一些缺陷,若要改进变声算法使其更灵活有效,那么细致的研究传统的变声算法是很有必要的。 变声原理 语音基本概念 1. 声道:声道是很多动物及人类都有的一个腔室,从声源产生的声音经由此处滤出。人的声道包括声道则包括喉腔、咽头、口腔和鼻腔。 2. 基音:一般的声音都是由发音体发出的一系列频率、振幅各不相同的振动复合而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为泛音。发音体整体振动产生的音,叫做基音,决定音高;发音体部分振动产生的音,叫做泛音,决定音色;基音和泛音结合一起而形成的音,叫做复合音,日常我们所听到的声音多为复合音。 3.共振峰:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰是语音音质的决定因素,反映了声道(共振腔)的物理特征。声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减,得到强化的那些频率在时频分析的语图上表现为浓重的黑色条纹。由于能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。在语音声学中,共振峰决定着元音的音质,在计算机音乐中,共振峰是决定音色和音质的重要参数。 4,短时平稳特性:语音信号是一种随时间而变化的信号,主要分为浊音和清音两大类。浊音的基音周期、清浊音信号幅度和声道参数等都随时间而缓缓变化。由于发生器官的惯性运动,可以认为在一小段时间里(一般为10~30ms)语音信号的

数字变声器设计方案

基于FFT算法的数字变声器 201242216 河北北方学院宣化教学部河北宣化 075100 【摘要】本数字变声器是实现男声变女声和女声变男声以及变成童声的系统。设计本数字变声器的目的是锻炼自己的学习实践能力。通过matlab编写程序修改语音参数来实现男声女声之间的变换。 【关键词】变音算法数字滤波器语音信号数字滤波器频谱分析 MATLAB 1 引言 变声器在现实生活中应用广泛,变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具;变声器软件,即通过软件实现变声的工具,软件类变声器,运行平台皆为电脑系统。无论是硬件变声器,还是软件变声器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。我们这里的变声器就是matlab来实现变声。 2 数字变声器的原理和算法 发音方法,发音时,喉头、口腔、鼻腔节制气流的方式和状态,包括发音时构成阻碍和克服阻碍的方式,气流强弱的情况及声带是否振动等几个方面。人类语音可分为有380声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声、童声、老人声,并实现了音调的高低与速度的快慢1.变声原理在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。基音周期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。 ●音段特征:描述的是语音的音色特征。特征参数主要包括基音频率、 共振峰位置、共振峰带宽、基音频率、能量等。 ●超音段特征:描述的是语音的韵律特征。特征参数主要包括因素的时 长、基音频率的变化(音调)、能量等 ●语言特征:包括习惯用语、方言、口音等。基音是指发浊音时声带振 动所引起的周期性,而基音周期是指声带振动频率的倒数。基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。不同的人以及同一个人在不同的年龄时期有不同的基音周期。人唱歌时,其基音频率范围大约是:童声高音频率范围为260-880Hz ,低音频率范围为 196-700Hz ,女声高音频率范围为 220-1.1KHz, 低音频率范围为 200-700Hz ,男声高音频率范围为 160-523Hz 低音频率范围为 80-358Hz 。此外,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息。先就如何实时地通过基音频率的变化来实现语声变声,进行讨论, Matlab实现算法。

变声器的原理分类实现及应用演示教学

变声器的原理分类实 现及应用

变声器的原理、分类、实现及应用 2009130309 徐佩 变声器的原理:变声器是通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变, 实现输出声音的改变的。通过自己发音,共振峰频率的改变是基本重采样实 现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和 共振频率变化的独立、互不相关,在基频移动是必须考虑抵消重采样带来的 偏移,理论上只要基频检测足够精确,确保可以保证基频改变和共振峰频率 改变间的互不相关,通过搬移和改变基频、语速,实现变声。 变声器的分类:根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具变声原理。无论是硬件 变声器,还是软件变声器,其原理都是,通过改变输入声音频 率,进而改变声音的音色、音调,使输出声音在感官上与原声 音不同。我们每个人的声音不同,源于我们的每个人的音色和 音调不同,我们所说的男中音、男高音,就是音调的不同,而 即便音调一致,我们依然能区分出两个不同人的声音,或不同 乐器的声音,这就是音色的不同。变声器,正是借助对声音音 色和音调的双重复合改变,实现输出声音的改变。其功能要点 如下: 1.无限制式多格式录音:可以对来自麦克风、系统等众多设备 的声音进行实时的录制,支持多设备选择性录音,录音不需要 临时文件,并可一次性保存为WAV/WMA/MP3等众多流行格式。 在录音过程中还允许对声音进行男女变声处理! 2.音乐重混音录制功能:允许您选择一首歌曲(音频或视 频),然后对其进行各种特效处理,比如保持原唱的同时进行 节奏快慢处理,或者进行男女声变换处理。在混录过程中也允

数字变声器

数字变声器设计方案

基于FFT算法的数字变声器 201242216 河北北方学院宣化教学部河北宣化 075100 【摘要】本数字变声器是实现男声变女声和女声变男声以及变成童声的系统。设计本数字变声器的目的是锻炼自己的学习实践能力。通过matlab编写程序修改语音参数来实现男声女声之间的变换。 【关键词】变音算法数字滤波器语音信号数字滤波器频谱分析 MATLAB 1 引言 变声器在现实生活中应用广泛,变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具;变声器软件,即通过软件实现变声的工具,软件类变声器,运行平台皆为电脑系统。无论是硬件变声器,还是软件变声器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,

我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。我们这里的变声器就是matlab来实现变声。 2 数字变声器的原理和算法 发音方法,发音时,喉头、口腔、鼻腔节制气流的方式和状态,包括发音时构成阻碍和克服阻碍的方式,气流强弱的情况及声带是否振动等几个方面。人类语音可分为有380声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声、童声、老人声,

数字信号处理——matlab变声器

数字信号处理——matlab变声器2013-07-09 07:44:20| 分类:数字信号| 标签:声音信号|举报|字号大中小订阅 效果不好。 项目目标:把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。 变声原理:语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。 由上可知,在进行性别变声时,主要考虑基频和共振峰频率的变化。当基频伸展,共振峰频率也同时伸展时,可由男声变成女声,女声变成童声;反之,基频收缩,共振峰频率也同时收缩时,则由童声变女声,女声变男声。为了获得自然度、真实感较好的变声效果,基频和共振峰频率通常必须各自独立地伸缩变化如下图:

共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。 设计方案: 1录入自己(小孩、女人、老人)的一段声音 2用MATLAB做fft得到其频谱 3做fft频谱分析 4搬移和改变基频、语速,实现变声 %读取语音信号 [s fs nbits] = wavread('f:\data\my.wav'); s=s/max(s); %归一化 %sound(s,fs) L = length(s) % 读入语音长度 S=fft(s,L); %画图:原始信号

相关主题
文本预览
相关文档 最新文档