语言清晰度STIPA的测量
- 格式:pdf
- 大小:903.06 KB
- 文档页数:19
语言清晰度客观评价方法——对IEC 60268-16(4.0版,2011.6)规范的解读祝培生;莫方朔;路晓东;胡沈健【摘要】语言清晰度(或可懂度)是音质评价的重要指标.但语言清晰度客观评价定义复杂,修正系数众多,测量结果也容易产生误差,因此一直没有得到有效推广.结合最新发布的IEC 60268 - 16(4.0版,2011.6)规范,介绍其推荐的语言清晰度客观评价方法即语言传输指数STI以及其他几种常见的客观评价方法,并对他们的适用条件加以说明.【期刊名称】《电声技术》【年(卷),期】2012(036)005【总页数】6页(P40-45)【关键词】语言清晰度;客观评价方法;语言传输指数【作者】祝培生;莫方朔;路晓东;胡沈健【作者单位】大连理工大学建筑与艺术学院,辽宁大连116023;同济大学声学研究所,上海200092;大连理工大学建筑与艺术学院,辽宁大连116023;大连理工大学建筑与艺术学院,辽宁大连116023【正文语种】中文【中图分类】TU112.11 引言语言清晰度(或可懂度)是音质评价的重要指标,可以用来评价厅堂或扩声系统的声音传输质量。
对语言清晰度的评价,主要包括主观评价和客观评价。
主观评价是利用发音人和听音人组成的队伍,以一定的发话语言声级和语速,在现场测听并记录由发音人按实验字表发出的字,然后加以统计分析得到语言清晰度得分。
这种方法不需要太多实验设备,能够较准确反映出语言的传输质量,但需要较多的人力物力,同时受发音人、测试队伍个人条件的影响,测试结果存在一定的不确定性。
客观评价是依据对一些物理量的测量,然后将数据加以分析得到语言清晰度参量。
对语言清晰度进行客观评价的尝试从二十世纪二三十年代就开始了,随后在四五十年代提出了第一个客观评价参量:清晰度指数 AI[1](Articulation Index,近年来发展成 SII[2],Speech Intelligibility Index),到二十世纪七十年代,又提出了语言传输指数STI[3](Speech Transmission Index) 和辅音损失比%ALcons[4](Articulation Loss of Consonants)。
实验四 语言清晰度测量(验证性:2学时)一、实验目的1. 加深对语言清晰度的理解;2. 掌握语言清晰度的客观测量方法。
二、实验原理语言清晰度的测量有主观和客观两种方法,其中主观测量是采用25个不同韵母的汉字组成发音字表,让口齿清楚、发音较准的人念,并由听众在相应的判别字表根据听音结果选择打勾。
以下为发音字表和记录表的例子。
记录表数据处理方法:首先按(1)式计算每张记录表的清晰度:)1(100(%)--=N ER T Wi (1) 其中T 为发音字数(本文取25),R 为听对字数,E 为听错字数,N 为每一行字数(本文取5)。
然后按(2)式计算清晰度的平均值:∑==ni Wi n W 11 (2)其中n 为样本数(即每组实验中记录表的总数),最后得到的清晰度平均值应该是按统计规律将异常Wi 剔除后的计算结果(本文的测量实验没发现异常数据),平均值的标准差按(3)式计算:nn 1-=δδ (3)其中1-n δ按(4)式计算: ∑=---=ni n W Wi n 121)(11δ (4)但主观测量具有测量难度大及测量结果分散的缺陷,随着技术的进步,人们试图以客观测量来代替主观测量,现在常用的指标有两个:STI 及RASTI 。
其中STI (speech transmission index )是指语言传输指数,是由调制转移函数(MTF )导出的评价语言可懂度的客观参量。
从MTF 到STI 的最主要概念是,将调制指数的作用以表观信噪比来解释,采用加权平均求出平均表观信噪比,经归一化后导出语言传输指数。
而RASTI(room acoustics speech transmission index)是指房间声学语言传输指数,它是语言传输指数法(STI 法)在某些条件下的一种简化形式,用来测定不使用通讯系统时人与人之间直接通话时与可懂度有关的语言传输质量。
RASTI 计入了噪声干扰和时域失真(回声、混响)的影响。
测量语言可懂度的STIPA法公共广播国家标准论证项目钟恭良一、语言的物理描述二、语言通过传输信道所引起的变化六、STI算法七、STIPA法八STIPA的载波三、调制转移函数MTF四、STI法五STI测量系统及信号矩阵八、STIPA的载波九、STIPA测量信号波形十、STIPA测量信号频谱五、STI测量系统及信号矩阵信号频谱参考文献IEC60286-16版权所有言物描述1、语言的物理描述连续的语言信号可以认为是一连续的语言信号可以认为是系列被称为“音位phoneme”的语音碎片组成的。
而“音位”又可以认为是一个窄带噪声被又可以认为是个窄带噪声被发音器官的极低频运动所调制而形成,在时域上表现为一个以某种窄带噪声为载波的调幅波。
因而,每一个音位都有自己的包络函数,语言所传递的信息就包含在该调幅波的包络信息就包含在该幅波的包络之中。
右图示个音位的包络及其包右图示一个音位的包络及其包络的频谱。
包络频率F约在0.2~12.5Hz之间。
频谱的相对量值是用调制指数表示的,m是各调制分量对载波的调幅度2、语言通过传输信道所引起的变化语言通过传输信道所引起的变化语言在传输过程中,语言在传输过程中混响、失真、噪声(信噪比)等因素都会导致音位的包络函数发生变化。
从而导致语言可懂度恶化。
致语言可懂度恶化研究m(或调制指数)的变化,即可确定语的变化即可确定语言可懂度恶化的程度。
右图示一个音位在传输过程中,调制指数受混响和噪声影响而发生变化的情形。
发生变化的情形3、调制转移函数MTFModulation transfer function为了确定调制度恶化的程度引入调制转移数()回声混响噪输入调制转移函数(MTF)设m ( F ) =m o /m i 回声、混响、噪声输入出1/F1/F X式中mo 语言传输信道输入端(声源处)某一包络频谱时间时间分量对噪声载波的调幅度mi 语言传输信道输出端(听音处)对应包络频谱 1.0调制转移函数m(F)I i (1+m i cos2πFt)I 0(1+m 0cos2πF(t+τ))听音处)对应包络频谱分量对噪声载波的调幅度m(F ) 是调制频率F的函数,如右图所示0.40.60.8M (F )=m 0/右图所示。
sti 声学指标随着技术的发展,声学指标作为我们测量、评价声音品质和性能的一种方法越来越受到重视。
其中,STI 声学指标是评估音响系统性能的一种常用指标。
在此,我们将从以下几个方面分步骤地阐述什么是 STI 声学指标,以及它在声学领域的应用。
1. 什么是 STI 声学指标STI 声学指标(Speech Transmission Index)是一个用于测量语音传输的质量和清晰度的指标。
它是一个 0 到 1 的标度,其中 1表示完美传输,而 0 表示完全不可理解。
STI 采用了一个音频信号进行测试,该信号模拟人类语音的典型特征(如频率变化和语音强度),然后将其传输到指定的环境中进行测试。
2. STI 声学指标的应用STI 声学指标广泛应用于许多领域,包括现代音响系统的测试和评估、语音识别等。
在现代音响系统的测试中,STI 被用来衡量语音在不同的房间和环境中的可靠性和清晰度。
基于 STI 测试的结果,我们可以了解到音响系统在现实环境中的表现,以及优化音响系统的措施。
另外,STI 声学指标在语音识别和翻译等领域也有广泛的应用。
在这些领域,STI 能够提供有关语音质量的重要信息,从而帮助我们更准确地识别和理解语音。
3. 如何进行 STI 测试STI 测试程序包括两个主要部分:语音源和环境测量。
在语音源测试中,我们使用标准的白噪声生成器来模拟人类语音的主要特征。
接下来,我们通过麦克风将该语音输出到指定的环境中。
在环境测量中,我们会测量源语音到达听者的声音传输,然后将结果与标准值进行比较。
最后,在 STI 指标中,我们需要使用一些公式进行计算。
STI的计算非常复杂,所以通常需要使用专业软件来完成。
总的来说,STI 声学指标是评估音响系统表现的一种常用指标。
它通过模拟人类语音的主要特征,测试其在不同环境下的质量和清晰度,从而提供有关声音性能的重要信息。
在不同领域中的应用也非常广泛。
低SNR下汉语单音节清晰度测量与可懂度估计刘辉;章斯宇;孟子厚【摘要】在实验室条件下测量了不同频带范围、不同信噪比条件时的语言清晰度和STI-PA,分析了清晰度,STI-PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下的最低信噪比及相应的STI-PA.【期刊名称】《电声技术》【年(卷),期】2010(034)001【总页数】4页(P60-62,66)【关键词】语言清晰度;语言传输指数;信噪比;汉语普通话【作者】刘辉;章斯宇;孟子厚【作者单位】中国传媒大学传播声学研究所,北京,100024;中国传媒大学传播声学研究所,北京,100024;中国传媒大学传播声学研究所,北京,100024【正文语种】中文【中图分类】TB541 引言语言清晰度主要受环境噪声、环境混响、系统失真三方面的影响[1]。
对于户外远距离声音广播,声音在远距离传输过程中经过衰减,到达听音人所在处时,由于环境噪声的影响,信噪比往往已经很低了,甚至低于0 dB,在如此低的信噪比条件下,语言清晰度究竟受到多大影响,是设计户外远距离声音广播系统时所关心的问题。
而对于环境混响来说,由于户外不存在过多反射界面,且自然环境中存在的吸声体较多,如树木,草地,人等,所以在户外远距离广播条件下,环境混响对语言清晰度的影响不是最主要的。
系统无明显的失真是对扩声系统的基本要求,达不到这个要求不能看作是1个合格的扩声系统。
因此,笔者主要考察的是在低信噪比条件下,噪声掩蔽对语言清晰度的影响。
研究噪声掩蔽对语言清晰度和语言传输指数的影响,应该是在大量不同的噪声环境现场实地测量,但是由于客观条件的制约,理想的测量条件几乎是不可能实现的。
笔者在实验室可控条件下,依据相关的语言清晰度测试标准[2]测量了不同频带、不同信噪比噪声条件下的汉语普通话单音节清晰度和语言传输指数STIPA,以期对研究噪声掩蔽下普通话单音节清晰度与信噪比的关系有所帮助。
建筑群中的公共广播系统必须具有在紧急情况下指导人群逃生方向的能力。
这些建筑群包括机场,火车站,购物中心或者音乐厅等。
尽管如此,如果由于广播系统质量差而导致人群不能听清楚播放的通知,而不能安全逃离,由此导致的后果可能非常悲惨。
因此设计,安装并且验证公共广播系统的语言清晰度是必不可少的。
此外,还有很多其他应用(比如法律和医疗方面),也会应用到语言清晰度为其提供佐证。
STI, RASTI 或 STI-PA 是最常用的语言清晰度测试方法。
他们都基于同样的原理,其中 RASTI 和 STI-PA 是 STI 的简化版本。
此应用手册将介绍这几种方法的区别。
目录主观分析方法 2科学方法 3STI - 语言传输指数 6RASTI - 室内声学语言传输指数 6STI-PA - 公共广播系统语言清晰度 7我需要用 TalkBox 来测试 STI-PA? 10STI-PA 测试结果 11STI-PA 测试总结 12STI-PA 后处理过程 13若环境中一直存在脉冲噪音,我该怎么量测? 14语 言 清 晰 度 STI-PA使用 XL2 音频分析仪量测相关国家标准如图1所示-这些标准需要验证电声音响系统紧急用途:根据实际情况确定最低水平的语言清晰度,以防遇到紧急情况。
因而,严格监管下的语言清晰度不是一个主观测量,而是必须是经过验证的、多少有些复杂的方法,这些测量方法在IEC 60268-16中已经被标准化。
主观分析方法尽管频率响应,混响时间,失真,信噪比,和响度都和语言清晰度相关,但是即使将这些常规参量测量出来也不能完全确定语言清晰度。
当我们将其他因素考虑进去时,比如将声波指向性和环境条件考虑进去,我们现在碰到的问题是:在不同位置上,信息可被理解的程度如何?测量语言清晰度的一个基本方法是:让一个经过训练的人读一定数目字词,而那些具有代表性的位置上的人则分别写下他们认为已经明白的字词。
然后统计分析他们记下的结果,以百分比的形式表示被理解的字词正确率。
体育馆声学设计的实质语言清晰度设计体育馆声学设计的实质——语言清晰度设计引言体育馆声学设计依据行业标准JGJ/T131—2000规范要求进行,其声学设计基本有3种:建筑声学设计、扩声设计及噪声控制设计,其实质都是为了保证体育馆比赛大厅———观众席、比赛场地的语言清晰度。
笔者在此只谈建声设计和扩声设计。
1 体育馆建筑声学设计行业标准中“比赛大厅建筑声学应以保证语言清晰度为主”[1],这一点很明确。
为了保证比赛大厅观众席和比赛场地的语言清晰度,对于比赛大厅与容积相应的满场混响时间(大厅内各空间界面吸声与反射处理)提出建声设计要求,其中必须指出:(1)理论分析和工程实践证明:语言清晰度与混响时间密切相关,混响时间太长,会使语言清晰度变差,所以混响时间的设计是建筑声学设计的重点。
如果混响时间太长,偏离相应大厅容积所允许的混响时间太多(像现在一般场馆多采用球结点网架结构,容积很大,往往混响时间偏长),在设计阶段未采取措施降低其混响时间或采用电声方法给予补偿,严重时会降低观众席语言清晰度,影响使用功能。
(2)比赛大厅内观众席和比赛场地内不得出现回声、颤动回声和声聚焦等音质缺陷。
如果声学缺陷太多,会直接影响清晰度。
而且扩声系统开大时会引起啸叫,开小则信噪比不够,听不清楚,影响正常使用。
2 体育馆扩声设计行业标准中体育场馆对扩声系统总体上有3点要求:扩声系统“应保证比赛大厅有足够声压级,声音应清晰,声场应均匀[1]”,其中:(1)“足够的声压级”:主要是相对于背景噪声而言,即应保证一定的信噪比,否则不能保证语言清晰度;(2)“声音应清晰”,不言而喻,扩声目的就在于此;(3)“声场应均匀”:一般来说,低频在场馆内各点座位上相对是较均匀的,在高频往往容易出现大的偏差。
这涉及扬声器的选取、频率响应、指向性及扬声器安装布放,而且1kHz,2kHz频率(1/3oct)对语言清晰度贡献最大。
美国人研究得,2kHz(1/3oct)对语言清晰度的贡献占11%;中国人测试得,1kHz左右对语言清晰度影响很大。