当前位置:文档之家› 环绕声录音

环绕声录音

环绕声录音
环绕声录音

环绕声技术

随着近年来,随着高密度记录媒体、家庭影院、多媒体计算机、数字信号处理等技术的发展,各种数字视听系统层出不穷,极大的提高了人们对视听效果的感受。因此环绕声技术得到较大的发展,并广泛的应用在电视,电影,家庭影院,多媒体计算机和虚拟现实等方面。

1、引言

最开始声音的录制和再现都是单声道的,很容易理解单声道只能带给听众空间中某一点的声音信息,丝毫谈不上有空间感,也不能给听众身临其境的感受。随着电子录音和扬声器的不断发展,人们对完美声音的追求也在不断提升。

在二十世纪50年代中期引入了立体声录音,随即出现了立体声重放系统,可以说60年代是立体声的黄金时期。在那个时候,唱片公司或音频生产厂商中尚未存在“环绕声”一词。众所周知双声道立体声的出现是为了真实的再现原声场的声音及其空间信息,使人们在聆听时有身临其境的听觉感受。在立体声发展的历史上,提出了声级差型、假头型和波阵面型三种不同的立体声系统。但是双声道立体声系统只能提供有限的前方声场,即提供二维空间的分辨能力,并不能还原360°的空间信息。

在二十世纪七十年代才真正进入环绕声系统的研究。环绕声首先在电影行业取得巨大成功,然后启发人们将该技术转向家庭和纯音乐领域。应该说环绕声系统比立体声系统取得的最重要的进步是对空间感的真实塑造,不仅为听众重现了前方声场,对后方声场的声音也可进行了真实还原。因此随着环绕声技术的不断发展,越来越成为关注的焦点。

2、环绕声拾音技术

环绕声拾音可以说近几年研究者关注的论题。单声道和立体声拾音技术经过了近半个世纪的研究和发展,已经进入相当成熟的阶段,形成了AB、XY、MS等多种的立体声拾音制式,并广泛的应用在录音领域。那么随着环绕声重放系统的普及,传统的拾音方式是不是也有改进的地方呢?在引入环绕声录音这个课题之前,以前环绕声节目的制作是采用分轨录制,后期利用声像电位器的分配和效果上的处理人为制作成环绕声节目,而并不是真正意义上的环绕声重现。随着这个课题的不断深入,世界各地致力于环绕声研究的单位先后提出了不同的环绕声拾音制式,这些制式的推出主要是从实践中得来,还没有很好的理论依据,相信随着理论的不断深入,将来会有一个统一的标准。

环绕声拾音制式如果能被广泛应用,除了结构简单,易于使用,还应该遵循以下的原则:

1、尽量能利用传统的传声器摆放方式

2、尽量一个传声器对应重放的一个声道

3、尽量不要对传声器拾取的声音进行再处理(时间延时,强度处理或矩阵处

理)

归纳目前出现的所有环绕声拾音制式,大概分为三大类:第一类是分层式环绕声拾音方式,分别使用点传声器,主传声器和环绕传声器;第二类是整体式(3/2)环绕声拾音方式,主传声器和环绕传声器一起使用形成传声器阵列,比如像TSRS拾音制式,Fukada Tree拾音制式和INA-5拾音制式等;第三类是声场环绕声拾音制式,例如环绕声球传声器(Surround Sphere microphone)KFM360、声场传声器(Soundfield Microphone B format)等。下面进行分类介绍。

2.1分层式环绕声拾音方式

2.1.1分层式环绕声拾音方式的声学理论基础

众所周知,音乐会现场录音的艺术表现要求是:声源有稳定的声像定位;声音能够塑造真实的空间感和现场感;音色不失真。而分层式环绕声拾音正是从音乐会现场同期录音的艺术表现要求入手而逐步出现的。传统的立体声拾音方式,虽然可以表现乐队的宽度和纵深感,但是对于在音乐厅中的空间“广阔感”表现就有些不尽人意了。因此我们应该首先分析直达声、早期反射声、混响声等声学因素对艺术表现的影响,并以此为依据来制定现场传声器的设置及摆放。

根据双耳效应,我们知道人耳可以通过双耳间的时间差,强度差,相位差和音色差对声源进行定位,这也是立体声拾音制式的重要理论依据。而这些差值主要都是由到达双耳的直达声信号不同引起的。由此可见直达声对于声源的定位起到极其重要的作用。

早期反射声,尤其是两边侧面墙壁的反射声有塑造真实声场和空间“广阔感”的作用,所谓“广阔感”是指听觉的空间扩散特性,主要是由直达声后约10至80ms时间内(最佳延时范围为15至25ms)从侧面方向到达听音者耳内的早期反射声。如果早期侧面反射声建立时间短,则可以获得准确的声源定位;而如果早期侧面反射声建立时间慢,则声像被展宽。研究发现,“广阔感”取决于早期侧面反射声的延时时间、声级、入射角度和频谱。而混响声是营造空间感最重要的因素。下表是日本录音师Hamasaki对室内声学因素影响同期录音艺术表

由此可见,直达声、早期反射声和混响声对同期录音的艺术表现有不同的作用,在实际录音中应该采用不同的录音方式来进行拾取。

2.1.2 应用延时设计

在环绕声拾音系统中,更多的采用了多只传声器甚至是传声器阵列的方式,那么由于传声器的不同摆位造成拾取到具有时间差的声音。为了实现空间印象和深度感的自然声像重现,需要布置延时效果。下面以“主传声器+辅助传声器+混响传声器”的拾音方式为例来说明如何应用延时设计,该理念也适合于其他的多传声器布置。

图1 主传声器+辅助传声器+混响传声器拾音方式

由上图可以看出辅助传声器距离声源最近,拾取到的声音要早于主传声器的声音,于是听音者会将辅助传声器信号当作直达声,而丢失了对于主传声器所期望的声像特性,使重放的声音显得不自然,缺乏空间深度。减轻这种空间定位干扰的做法就是加入人工混响,或者是适当补偿主传声器信号的延时。如果单纯的补偿延时量又会产生声音不自然的情况,即当演员走进辅助传声器时,声音会突然变大。为了避免这种不良影响并保持主传声器信号给出的空间定位感,应当对辅助传声器信号引入比所需补偿量更多的延时,使其进入早期反射声的范围内。一般来讲,早期反射声较直达声延时20ms,听音者可以无意识的能感知声音的空间大小。

混响传声器由于一般距声源较远,拾取到的声音较主传声器和辅助传声器有较大的延时。为了避免由于传声器间距过长(例如主传声器和混响传声器相距10米以上)产生回声现象,往往除了让辅助传声器较主传声器有延时外,还将这两者相对混响传声器也有延时。

2.1.2分层式环绕声拾音系统的构成

第一层:设置主传声器拾取尽可能多的直达声,获得稳定的声像定位。

第二层:设置环境传声器,通过对传声器的摆放位置和指向性进行选择与调整,使其拾取更多的反射声,以获得真实的环境感和空间感。

第三层:再使用人工混响器来补充现场混响的不足。

图2 分层式环绕声拾音系统构成

2.1.3主传声器阵列

主传声器主要起到的作用是:准确的拾取到多种声源的直达声,在重放的前方声场形成准确的定位;此外为了达到前后声场的融合性,主传声器还应拾取到一定的早期反射声和混响声,以便馈送给后方环绕声道。因此为了达到拾取直达声,获得稳定的声像,主传声器一般摆放在混响半径以内,且多使用有指向性的传声器。以下是常见的主传声器类型。

(1)OCT (Optimized Cardioid Triangle) 制式

OCT制式的发明者是德国的Guenther Theile,主要使用心型和超心型传声

器,传声器摆位如图2所示。

图3 OCT制式传声器摆放示意图

此种传声器阵列的有效拾音角度为:

该制式由于采用了超心型传声器,而且分别指向左右两边,这样可以保证在音箱L-C和C-R之间形成稳定声像,而在音箱L-R之间几乎不会形成声像,减少了左右声道间的串扰。但随之带来的问题是系统频率响应不是很好,低频会有一些损失,因此可以选择在两侧再加入两个全指向传声器,将它们拾取的信号通过一个低通滤波器滤出后也送入L、R声道,以提供从20Hz到100Hz的低频声。有如下的两种变形:

图4 OCT制式传声器的变形摆放

图5 OCT制式传声器的变形摆放

(2)INA-3心形阵列的布局 INA—Ideale Nieren Anordnung

INA-3制式是由三只心型传声器构成,传声器摆放如图5所示。

图6 INA-3制式传声器摆放

该方式是根据“威廉姆斯曲线”而设计的,可以依据所需的拾音角度计算出

传声器对L-C和R-C能够很好的将前方声场均匀的分离成左右两个立体声场,但是由于三只传声器指向性都是心形,而且距离较近,所以通道间的分离度不够,导致定位的清晰度有所下降。

(3)准同轴传声器拾音制式

该制式传声器排成一直线。外侧的传声器L、R具有超心形指向性(偏离中心角30°)。中央传声器具有心形指向特性。

L C R

17.5cm 17.5cm

图7 准同轴传声器拾音制式

由于L和R采用了超心形传声器,可以在彼此之间提供较好的声道隔离度。但是由立体声拾音原理我们知道,由于传声器对L-C和C-R间距较近,而且偏离角度较小,使得每个立体声传声器对的拾音角度都较宽,这样在左右两个声场形成了较大的重合区,影响声音定位。此外由于每对传声器中一个为心形传声器,另外一个为超心形传声器,导致声像的定位分布有些不对称。

(4)Decca Tree拾音制式

Decca Tree拾音制式由三个全方向性传声器以较宽的间隔形成三角形配置。这种制式早就出现在立体声拾音制式中,主要是以时间差进行声音的定位。由于传声器间隔较大,且为全指向性传声器,不适合于精确的立体声声像定位。该制式在保证中央声像定位的基础上,更易于产生出广阔,空间感较强的声场。

图8 Decca Tree拾音制式

2.1.4 环境传声器的设置

环境传声器的作用分为两个方面:一是充分拾取反射声和混响声,减少直达声的拾取,避免由于直达声过多造成前方声像定位的不稳定;二是拾取环境声,例如在音乐厅观众的鼓掌声。因此环境传声器一般使用有指向性的传声器,而且距主传声器阵列有一定距离,通常都放置在混响半径之外。为了能使得声音前后自然过渡,有时会将前方声道部分信号馈送到环绕声道,或将环绕声道信号馈送到前方声道。

(1)Hamasaki Square

这种制式是由日本录音师Hamasaki发明的,采用了四支八字形指向的传声器组成正方形,如图9,通常放置在音乐厅的中后部位置。之所以采用八字形传声器并且传声器主轴指向侧面,是为了减少直达声的拾取,由图可以看出正前方的声音垂直进入八字形传声器,很好的抑制了直达音的拾取,而更多的拾取侧面反射声和混响声。为了能获得良好的主观包围感,传声器阵列通常放置在较高的位置上。拾取到的四路信号,后两路馈送到环绕声声道,前两路信号馈送到L、R声道,从而保证声场的统一。

图9 Hamasaki Square拾音制式

采用八字形传声器虽然可以抑制直达声的拾取,但随之带来低频声拾取不够

的问题。因此为了改善声音的频域特性,会有下面的两种变形:

图10 Hamasaki Square变形1 图11 Hamasaki Square变形2

指向后方的心形传声器可以拾取到从后墙反射过来的反射声,从而增加空间感,改善频率特性。

(2)IRT Cross

这个制式是由德国广播技术学院发明的,四支传声器成对角线摆放,形成正方形,示意图如图11所示。传声器的指向性可以为心形或者全指向型,选择哪种指向性是与所要达到的声道间相关性多少有关。通常如果采用心形传声器,间距为25cm;如果采用全指向传声器间距为40cm,当然间距的大小可以根据具体的声学环境有所调整。实验表明,小间距可以获得更准确的环境声(掌声)的声

像定位,大间距可以获得更融合的空间感。拾取到的前L

B 、R

B

信号以一定比例馈

送到L和R声道,而L

S 、R

S

信号馈送到环绕声声道。

图11 IRT 拾音制式的示意图

IRT拾音制式除了作为环境传声器使用外,偶尔也用于主传声器阵列。因为它可以看成是两对立体声传声器,一对朝前一对朝后。

图12 IRT制式的实物图

(3)双MS制式

双MS制式是从立体声拾音技术演变来的,其实就是2对MS拾音制式的组合,一对朝前一对朝后。实际应用中常常共用一个S信号,如图13所示,传声器放置在混响半径之外。与其他环绕声制式一样,前方信号馈送至L和R声道,后方信号馈送至环绕声声道。

图13 双MS拾音制式示意图

图14 双MS制式的实物图

双MS除了作为环境传声器阵列外,还可单独作为一个整体的环绕声拾音方式。一种实现方法是共用S信号,传声器阵列位于混响半径之内,如图15所示,拾取到的信号经过声音处理器分离出L、R、LS、RS和C信号。另外一种方法是独立的两个S信号,如图16所示,图中可以看出前方的MS对位于混响半径之内,更多的拾取直达声;后方的MS对位于混响半径之外,更多的拾取混响声和反射声。该方式下只产生出了L、R、LS、RS声道的信号,建议在前方摆放一支心形

传声器获得C信号。

图15 共用S信号的双MS整体环绕声拾音制式

图16 使用2个S信号的双MS整体环绕声拾音制式

(4)PCM拾音制式

该拾音制式是由两支PCM传声器组成,将其贴在音乐厅二层的侧墙上,主要拾取侧墙的反射声和混响声。

2.2 整体式(3/2)环绕声拾音方式

整体式环绕声拾音方式不同于分层式环绕声拾音,该方式是采用一组传声器阵列,传声器间间距不大,从立体声拾音技术出发,相临的传声器之间可以通过时间差,强度差等因素实现声像定位,只要能有效的控制好传声器之间的串音就可以实现360o的声像定位。但是有实验证明整体式环绕声拾音方式并不能对侧面和后方进行准确的声像定位,所以360o声像定位的说法是值得商榷的。

根据整体式环绕声拾音方式的声学理论基础,此类拾音方式应遵循以下几点:

(1)由于传声器间距较近,为了避免串音,一般采用有指向性的传声器(2)为了保证前方中间声音的声像定位,拾取C信号的传声器应距离声源更近一些。

2.2.1TSRS(Ture Space Recording System)

TSRS拾音制式是由Mora和Jacques在1998年提出的,如图17所示。

图17 TSRS环绕声拾音制式

该制式采用了五支心形传声器,放置在混响半径之内。他们为了验证该制式

的定位准确性做了实验:首先通过标准的5.1环绕声监听系统重放定位在不同位置的噪声脉冲信号,并测量记录了听音者对不同位置的定位特性;然后同样的信号先由TSRS拾音制式拾取(位置摆放在听者的位置),再由环绕声监听系统重放让听音者判断声音的位置。他们从实验数据可以看出,两次实验都表明侧面的定位情况要普遍差于前方和后方的声源定位,而且侧面定位不准确的情况都很类似。由此反映出该拾音制式还是一种较为合理的方式。

2.2.2Fukada Tree

该制式是由日本录音师Fukada提出的,如图18所示。它采用了3支心形传声器来拾取前方的声音,应该说是Decca Tree的一种变形。两支心形传声器指向侧后方主要用来拾取反射声和混响声。另外有两支全指向性的传声器放在更宽的位置上,是为了呈现管弦乐队的宽度和增强低频特性,将LL和RR拾取到的声音以-4dB或者-6dB的电平值加入到L和R声道。声音的空间特性靠1.8米的方形来实现,传声器的间隔可以根据录制乐队的大小和队形做调整。

图18 Fukada Tree环绕声拾音制式

2.2.3INA-5心形阵列的布局

INA-5是INA-3的扩展,即在INA-3的基础上加入两支心形传声器LS和RS,如图19所示。前方的三个声道就是INA-3,使用心形的传声器。INA-5实现360o

图19 INA-5环绕声拾音制式

由表三可以看出为了保证前方180o的录音角度,L-C和R-C的间距都应该很小,而且为了保证拾取的声音在L-C-R之间有合适的声像分布,传声器必须距离声源很近,但是显然这种位置对于环绕声传声器LS和RS是不适合的。如果为了达到较好的空间声像,就要使得INA-5的位置距离声源有一定的位置,但是随之而来的问题是拾取到的声音会感觉到集中于中央扬声器周围(“中央效应”)。为了解决这一矛盾就要对前方传声器作出适当的折衷,即减少前方录音角度(90o-110o),将INA-5拉远,放置在混响半径处来得到最佳的直混比。图20是SPL 公司根据该制式生产的商业产品。该产品增加了一些灵活性,五支传声器的间距、极性和角度都是可以改变的。通过配置的信号处理器可以将五声道信号缩混成两

声道。

图20 SPL公司生产的产品

2.2.4 Williams拾音制式

Williams是“威廉姆斯曲线”的创始者,他提出的这种制式如图21所示,

采用了五支相同的心形传声器。通过调整传声器间的位置和角度,保证每支传声

器的拾音角度是“临界连接”的,每支传声器覆盖的扇区都不会相互交叠,从而涵盖360o的拾音范围。为了获得良好的声音效果,往往对拾取到的五声道信号使用适当的延时和输入电平的调节。

2.2.5 OCT-Surround制式

显而易见OCT-Surround制式是在OCT制式的基础上增加了两支拾取环绕声的传声器构成整体式拾音制式,如图21所示。

图21 OCT-Surround拾音制式

2.3 声场环绕声拾音制式

这类环绕声拾音制式是以自然逼真还原声场信息为目的,更多的是来模仿人耳听音情况,做到声场的真实重现。

2.3.1 环绕声球传声器拾音系统

环绕声球传声器拾音系统不同与其他的拾音制式,它由两部分组成:声场话筒和控制编码装置,如图22所示。声音首先由声场传声器进行拾取,然后经过控制器进行编码,同时该控制器还可以对声场传声器进行控制,例如指向性等。

图22 环绕声球传声器拾音系统的构成

声场话筒由四个近似交叉重叠的心形电容传声器组成,四个传声器振膜分别指向:左-前-上、右-后-上、左-后-下、右-前-下。该传声器具有如下特点:(1)指向性可连续调整,只需通过控制器就可完成指向性的设置,使用方便。(2)摆放位置易于调整。由于声场传声器是一体化的,不需调整传声器间的距离。在现场录音时,找到最佳听音位置放置即可。

(3)后期缩混的时候可以改变传声器的各种参数。由于声音信号已经被控制器所记录,此时可以通过软件重新调整话筒的各种参数,这种技术可以很方便的弥

补前期的过失。

(4)传声器组合形式的多样性,可以作为单声道、立体声对和环绕声传声器(在专有插件的支持下记录的信号可生成5.1声道)来使用。

该系统拾取的声音有A、B、C、D四种基本格式和G格式组成。A格式信号是声场传声器自然拾取的声源信号。B格式是声音信号的记录格式,即声音信号经过声场传声器拾取后,通过MKV控制器编码后,信号以B格式记录。C格式是B格式信号通过UHJ编码器,成为一系列分级结构的信号格式。D格式是C格式信号经过UHJ解码器解码后得到的信号。G格式信号是由B格式通过SP451解码器解码后得到的5.1环绕声信号。这五种格式信号之间的关系如图23所示。

图23 五种格式的关系

综上所述,环绕声球传声器拾音系统突出的优点是对于传声器的没有严格的限制,便于使用;根据扬声器的数量与摆位,解码器可以给出单声道、立体声和多声道的信号。但是由于该系统必须使用专用的解码器,普及率还不是很高。

2.4环绕声拾音制式的主观评价

环绕声拾音技术发展到现在虽然还没有形成统一的定论,但是不同研究者正试图通过主观评价实验来比较各种环绕声拾音制式,从主观的角度进行分析得出结论。

2001年杜赛尔多夫的Philip Heck和Christoph Riesberg对四种环绕声拾音制式进行了比较,这种环绕声拾音制式分别是:OCT+IRT;Willianms;INA-5和Fucada-tree。他们录制了两段素材:在音乐厅中录制交响乐和在教堂中录制合唱。四种拾音制式平行的进行录制,OCT+IRT被放置在离声源较近的位置上获取与其他话筒相同的距离感。Fucada-tree的L、LL、R和RR与INA-5和Willianms的中置传声器距离声源的距离是相同的,这样Fucada中置传声器与声源的距离是最近的。他们将每个传声器阵列拾取到的信号混成3/2环绕声,进行主观音质评价。对被试者提出的问题是:

(1)声源的宽度-你认为声源的宽度感如何?

(2)声源的定位-你认为声源定位的精确性如何?

(3)深度-你认为声源的深度感如何?

(4)通透感-在哪个片段中你可以更容易的找到单个乐器?

(5)空间感-在哪个片段中你可以更好的感觉到你处于这个音乐所录制的真实空间?

被试者一共有81名,每种制式都与其他三种成对比较,被试者并不知道他们听到的是来自哪种制式,然后关注相关的选项,他们有五个可选答案:(1) A比B好很多

(2) A比B好一些

(3) A比B一样

(4) B比A好一些

(5) B比A好很多

由此可以看出,INA-5是可以获得所有还音所需参数的最好系统,有时与其他的制式拾取参数一样;Williams和Fukada共同处于第二和第三的位置。除去定位和和深度感外,OCT+IRT有最差的还音参数。

2005年以中国传媒大学录音艺术学院为首联合多家单位也进行了一次主观音质评价实验。实验使用的素材是在中央音乐学院音乐厅录制的一首钢琴与乐队的协奏曲。比较的制式包括:Decca Tree +Hamasaki Square(简记为DT+H);INA3+Hamasaki Square(简记为INA3+H);OCT+Hamasaki Square(简记为OCT+H);OCT-Surround(简记为OCT-S);Decca Tree+IRT Cross(简记为DT+IRT),现场传声器的摆位如图23[1]所示。

图24 现场环绕声拾音制式的摆放

主观评价实验采用了对偶比较法,评价参数包括:临场感、包围感、乐队宽

度、单个声源的定位和乐队深度。被试者共27名,包括录音学院的学生、老师

通过上面介绍的两次音质主观评价,可以看出虽然进行比较的制式不尽相同,但是可以看出得不出主传声器+环绕声传声器的拾音方式好于整体式拾音方式,没有一种制式可以在各个评价参量上达到最佳。

3、环绕声重放系统原理与编解码技术

3.1 环绕声重放系统原理

从七十年代开始,人们就开始研究环绕声重放系统,总结看来,环绕声重

放系统主要采用以下几种不同的声学原理来实现的。

1、“声级差原理.这是应用最广的一类系统,它在双声道立体声的基础上推广而

成。利用环绕倾听者的若干个扬声器箱发出相关的声波,在倾听者双耳处声

场迭加的结果,可产生类似于空间某方向的真实声源在双耳处产生的声场信

号,从而在听觉系统中合成相应的声像。每一个通路上信号馈给的方式是分

立-对的方式。对于在任一扬声器方向上的声像,通过只将信号馈给该扬声器而馈给其他扬声器的信号为零,即用单一扬声器来产生。对于任一对相邻扬声器之间的声像,通过将信号馈给这一对扬声器而馈给其它扬声器的信号为零,利用这一对扬声器信号的声级差来产生。

2、波阵面(波场合成)原理。系统根据惠更斯-菲涅耳原理设计而成的。理论

上说,这种系统可重发与原声场完全相同的声场,但是需要太多的信号传输和重发通路,相当复杂,因而过去较少应用。但是随着近年来数字信号处理技术的发展,在波阵面型系统的基础上,发展了波场合成型声重发系统。3、听觉传输原理。它是在传统的仿真头立体声的基础上发展而成。通过处理声

波从声源到双耳的传输(HRTF)来虚拟出立体声像,从而实现声场空间信息的传输与重发。

以上三种系统可实现原声场空间信息的传输与重发,将它们称之为前处理系统。随着数字信号处理技术的发展,还出现了下面的第四类的系统:

4、模拟环绕声原理。它是在双声道立体声的基础上,利用信号处理的方法(人

工延时,混响等方法),对双声道立体声信号进行重新的处理,模拟出倾听者后方的散射声场,以增加听觉上的空间感和临场感,从而达到模拟环绕声效果的目的。这类系统并非是实现环绕声场空间信息的传输,而是实现声场空间信息的模拟,因此它仅是一类“准”的环绕声系统。

3.2 环绕声编解码技术

利用以上的声学原理,新的技术,新的系统层出不穷,目前应用在专业影院和民用产品中环绕声编解码技术主要有以下几种:

3.2.1杜比AC-3编码

杜比AC-3编码算法属于感知编码,该算法模仿人耳的听觉特性,将每个声道的音频频谱分成宽度不等的窄带,有选择性的进行量化编码,使噪声被控制停留在某一频率上,而该频率点与被编码的音频信号频率点很近,噪声从而被音频信号所掩蔽。具体的编码原理如下图所示。

图25 AC-3编码原理图

由图可以看出,输入的时域信号首先经过分析滤波器组变换为频域信号,在这个过程中使用了时域混叠抵消TDAC(t ime d omain a liasing c ancellation)技术,以防止边界效应而影响频谱分析,提高频率选择性。经变换得到的是一系列变换系数,对这些系数采用指数编码,即用二进制指数记数法表达成一个二进制指

数和一个尾数。每个音频取样都有一个指数,指数部分编码后构成了信号的大致频谱,即频谱包络,而对这些信号的尾数部分则通过心理声学模型进行归一化的量化编码。比特分配是根据信号的掩蔽效应来分析其频谱包络,从而确定将相应的比特数分配给各变换系数的尾数。整个的编码过程中采用了TDAC滤波,频谱包络编码,前/后向混合自适应比特分配,公共比特池及低码率下使用的多声道耦合等。

此外由于在编码过程中元数据(音频控制参数)的编入,使得杜比AC-3系统的音频控制能力很强,可以保证所有节目间的响度一致性,进行动态范围的控制与压缩以适应不同的听音环境和设备承受力,使声道格式进行向下兼容的适配。

杜比公司新提出的杜比E技术,弥补了杜比AC-3系统的不足。杜比E技术考虑到了与视频的同步压缩问题,从而避免了出现噪波等问题,而且它很容易与目前现有广播与通用专业音频结构相融合,可以直接在数据流上进行切换、路由选择、及组合编辑操作,十分便捷。

3.2.2 MPEGⅡ多声道编码

MPEG在1993年首次正式提出MPEGⅠ数字音频编码标准,适用于32kHz(数字卫星广播DSR),44.1kHz(CD)和48kHz(演播室)等取样频率,具有的声音编码模式:单声道编码、双声道编码、立体声编码和联合立体声编码。

1994年MPEGⅡ标准产生,目前已经成为欧洲HDTV的音频标准。它是MPEG Ⅰ标准的发展和扩展,这主要表现在:多声道环绕声编码和多语言节目编码;低取样频率低比特率编码。同时对MPEGⅡ标准的兼容性提出较高要求:要与MPEG Ⅰ系统做到向前、向后兼容;保证与较少扬声器声道的其它合理组合(例如3/1,3/0,2/2,2/1,2/0,1/0)之间的向下兼容。

MPEGⅡ标准中,声音的编码方法也分为三层,分别为LayerI,LayerⅡ,LayerIII,均是利用了心理声学中的掩蔽效应理来进行编码。LayerI和LayerⅡ中都是采用了由宽度均为750Hz的32个子频带组成的多相滤波器组完成了信号时域到频域的变换。而对于LayerIII则在32个子频带的多相滤波器组的基础上,利用改良离散余弦变换(MDCT)将每一个子带再分成18条的混合滤波器组来完成时域到频域的变换。如何精确的计算出掩蔽门限,而将量化噪声尽量整形到掩蔽门限以下是编码的关键。

LayerI和II是按照心理声学模型方式1对信号进行512点的FFT而得出的,而LayerIII是按照心理声学模型方式2对信号进行1024点的FFT而得出。对于子频带中的取样值,LayerI和II是将每12个样值作为一个块,确定每块的比例因子(最大取样值),产生归一化的信号后再进行量化编码。在LayerIII中则先采用非线性量化器,然后进行哈夫曼编码来完成。

在MPEGⅡ标准中,还采用了多种新技术,例如动态串话,自适应多声道预测,动态传输通道切换,中央声道幻象编码,预量化等,可以保证在低码率下进一步提高声音质量。

3.2.3 MPEGⅡ AAC编码

MPEGⅡ AAC是一种非向下、向后兼容的多声道编码方法,该标准主要是在MPEG 2层Ⅱ、杜比实验室的Dolby AC-3和MPEG 1层III等的音频压缩算法上发展起来的,目前是日本HDTV的音频标准。其主要目的就是要进行大码率压缩。

AAC系统支持从8kHz到96kHz的取样频率,默认的配置方式有单声道,双声道和5.1声道。根据不同的应用,AAC可提供三种类型:主要类型(Main Profile)、

低复杂度类型(Low Complexity Profile)和可缩放取样率类型(Scaleable Sampling Rate)。该系统可支持1到48路之间任意数目的音频声道组合,16路低频效果声道、16路配音/多语音声道和16路数据。AAC系统的压缩比为11:1,与MPEG 2层Ⅱ相比,压缩率可以提高1倍,而且质量更高。

AAC系统采用了多种技术来提高编码效率,其编码器框图如下。下面就主要

图26 MPEGⅡ AAC编码器方块图

(1)控制增益

控制增益只用于SSR型。音频信号通过多相正交滤波器(PQF)组进行4频带分割,然后对每一个子频带都分别进行时域增益控制。这样可以方便对小幅度信号进行放大,进行编码,在解码器端再将放大的信号进行衰减,恢复其原状。因此可以抑制小信号时产生的前回声量化噪声。

(2)滤波器组

利用滤波器组将输入的时域信号进行改良离散余弦变换(MDCT),同时也采用了时域混叠抵消技术(TDAC)。通过将相邻块的取样值重叠50%,再经TDAC处理,在合成阶段可抵消边界效应,提高频率选择性。在MDCT中使用的窗口是

Kaiser-Bessel derived (KBD)和正弦窗,两者的频谱特性不同可适应不同的信号,而且在AAC系统中允许在两者之间进行连续无缝的自适应切换。

(3)瞬时噪声整形(TNS)

TNS模块是用来控制量化噪声的瞬时形状的一种方法,解决掩蔽阈值和量化噪声的错误匹配。在AAC系统中,TNS是把频率轴上的MDCT系数,视为时间轴上的信号,在编解码器中,通过滤波器把噪声集中到时间轴上信号幅度大的地方,从而减少噪声的影响。

(4)立体声编码技术:M/S编码、强度立体声、耦合

M/S编码使用矩阵运算,不传送左右声道信号,而是使用和信号(L+R)与差信号(L-R),前者用于中央M(middle)声道,后者用于边S(side)声道。

人耳对于高频段声源的定位是通过声音信号的时间包络来完成的,因此,强度立体声是把高频率子频带的左右声道的合信号与左右声道的比例因子来进行编码的方法。

3.2.4 相干声学编码(Coherent Acoustic Coding)

相干声学编码是DTS环绕声系统所采用的编码系统。它最初主要是为了提高民用设备的重放质量,使人们能够享受到比CD音质更好的声音,可以处理取样率最高达192kHz,24bit的多声道信号。总之通过使用更加宽广的频率范围和更多的扬声器使得人们能够在家中也能享受到专业级音质。

相干声学编码器是一种感知、优化、差分子带音频编码器,它使用了多种技术对音频数据进行压缩。该算法灵活性高,可支持多种不同数据量的信号,从而满足各种不同的音质需求,见表五。此外该算法的编码器与解码器的实现是不对称的,这是由于在编码部分采用了“智能”技术,解码部分是根据编码数据流中的参数来控制的,解码器不需要做任何的计算来决定重放的音频质量。从而该算

相干声学编码算法的编码器框图如图27所示。编码过程主要分成两部分:子带滤波和自适应差分编码。当全频带线性PCM音频信号进入编码器时,系统首先对该数据进行分析,确定分割数据的时间窗。通常时间窗的选择采用折衷的办法。时间窗选取过小会使得编码效率降低,选取过大容易造成瞬态信号的失真。可选的时间窗长度有:256,512,1024,2048和4096取样点。时间窗选取好后,PCM音频数据将通过多相滤波器组分割到一定数目的子带中去。这个滤波过程是相干声学编码算法的第一个主要的计算过程,这对于分析音频信号的客观冗余度有很大影响。时域不相关的音频信号经过滤波,变换为多组频域信号分割到相应的子带中。这种滤波方式既可以消除频谱滚降较快的音频信号分量,同时又去除了感知上的冗余度。子带的个数通常情况下分为32个独立的子带。

音视频监控系统产品技术要求

音视频监控系统产品技 术要求 公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

音视频监控系统产品技术要求:一、室内智能中速球型摄像机 摄像机参数应不低于以下参数:18倍彩色摄像机, 1/4英寸HAD CCD; 75(H)*582(V),44万像素;f=-73.8mm,F=; 18倍光学*12倍电子;

480TVL,信噪比大于50dB ,彩色最低照度, 白平衡(自动/手动) 背光补偿(ON/OFF 二、16路DVR高清D1硬盘录像机 另外还需支持以下功能: 1、支持多达16路PAL/NTSC制式视频信号,每路皆可实时每秒25帧的独立硬件压缩,采用视频压缩技术,支持变码率,可设定视频图像质量,也可设定视频图像的压缩码流。 2、支持多达16路音频信号,每路音频信号独立实时压缩,采用音频压缩标准,压缩码率为16Kbps。

3、视频和音频信号压缩后生成复合的H.264码流,码流回放时视频和音频保持同步。也可设置单一视频流。 4、支持视频参数动态设置。 5、支持编码参数动态设置。 6、支持4CIF、2CIF、CIF和QCIF分辨率。 7、支持多区域移动侦测。 8、支持OSD,日期和时间的显示格式、显示位置可以设置,日期和时间自动增加。 9、支持LOGO。 10、支持水印(WATER-MARK)技术。 ◆实时监控功能 11、支持监视器或高清显示器视频输出。 12、支持虚拟键盘,每个通道均可按照需要设置相应的参数。 13、支持画面轮巡功能,并可设置轮巡的通道顺序。 14、支持语音对讲功能。 15、集成了RS485键盘的云镜控制功能,并可调用虚拟云镜控制条。 16、支持预置位、巡航、模式路径的设置及调用。 录像 17、文件记录有六种模式:定时录像、手动录像、移动侦测录像、报警录像、移动侦测录像和报警录像、移动侦测录像或报警录像。2、支持8块SATA硬盘,硬盘文件系统为EXT3格式。硬盘上文件可以选择循环和非循环两种记录方式。18、支持图像局部遮挡。

音频处理教程(全)

音频处理教程 ——从最基础的入门知识开始 音乐格式介绍 通常我们在制作课件的时候,在图文并茂的基础上,加上一些音、视频,以利于教学。但是我们在课件中需使用到的素材,有时并没有现成的,这时就需我们自己来动手进行处理。本次课程我们就着重谈谈一些音、视频的处理方法。 一、各类音频格式简介: CD格式:天籁之音 当今世界上音质最好的音频格式是什么?当然是CD了。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WA V,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。 WAV:无损的音乐 是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K 的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC 机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。 MP3:流行的风尚 MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。 MIDI:作曲家的最爱 经常玩音乐的人应该常听到MIDI(Musical Instrument Digital Interface)这个词,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。今天,MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

IP网络音视频监控系统解决方案

IP 网络音视频监控系统解决方案 1 银行属于国家的重点安全防范单位。作为当今社会货币的主要流通场所、国家经济运作的重要环节,以其独特的功能和先进的技术广泛服务于国内各行各业中。 计算机技术和网络通信技术不断发展的今天,犯罪分子作案的手段越来越呈现高科技化、高 智能化趋势。针对银行的刑事案件明显呈上升趋势,恶性案件屡屡发生,内、外作案、内外联合作案等日益增多。传统的单一模式的模拟电视监控系统,无论是从监视手段、还是录像手段上来看已经远远落后于现代商业银行的安全保卫要求。从技术角度来看,新一代的基于数字处理的数字硬盘录像监控系统,已经在技术上全面领先于传统的模拟监控技术。 银行网络化安全防范系统是根据公安部和央行联合下发的《公安机关与金融单位联网报警管理规定》的要求,为实现银行安保部门以及公安金融安保部门对各储蓄所、分理处、支行等营业场所防护区域实时图像、声音、报警数据的远程监视、监测、控制功能;为完成银行相关部门对各营业场所营业状况的实时、集中监督与管理的需求;为银行与公安系统建立联防、联建体质提供具有国际先进水平的技术支持而建设的系统。 银行监控系统包括了各储蓄所、分理处、支行等营业场所防护区域实时图像的本地远程监视、 存储现场声音与报警数据。同时系统还必须具有双向语音

功能的远程调度与管理、与公安部门应急联动系统有机结合等功 一:系统的构成 银行监控系统包括了三大部分 端监控点(包括ATM 、营业所、分理处、支行营业厅等) 二级监控中心(分行) 远程管理中心(总行) 1.1前端监控部分 银行前端监控部分主要分为三个地方:柜员制柜台、ATM 等自助设备、保安型监控等对象。主要要求是:能够对监控点视频、音频进行采集、硬盘录像存储(存储时间有具体要求),并且要具 有远程联网通讯功能。银行网络视频监控系统对于银行金库门口、点钞等一些重要的地点,需要对其进行完全的监控,将发生的所有情况进行纪录,保障银行的财物安全,并对工作人员进行有效的监督,同时在意外事件发生时,可以有效的保存现场情况的纪录。 在银行柜台可安装带音频传输的网络枪机,对现场的声音信息进行有效的分析和采集。柜台监控要求必须每个窗口对应一个摄像机与拾音器。能准确的反映每个窗口的实际情况。 在营业大厅以及银行门外采用带有音频输入网络摄像机外

录音棚系统设计方案教学总结

录音棚系统设计方案 音响网 北京恒智数码科技有限公司专业音频部设计 对录音棚系统设计过程中应坚持使整个系统具有优秀性、实用性、可靠性能、扩展性和灵活性的原则。 1、优秀性:保证采用的设备和技术具有国内领先水平,并为国际知多品牌。 2、实用性:必须严格按照国家有关标准设计,录音系统的使用对象是本公司。因此在选择工作效率高、操作便当、性能可靠优良的可维护性也是产品必须具备的特点。 3、可靠性:具有高可靠性和优良的技术服务是使用单位一个严重准则。 对白录音棚分以下几部分: 1、中央控制部分 2、音频工作站部分 3、话筒输入部分 4、控制室监听部分 下面对以上四部分加以详细论述: 一、中央控制部分: 中央控制部分是整个录音系统的心脏,它的性能好坏决定整个录音系统的好坏,为此我们选择YAMAHA推出的01V96数字调音台。之所以选用O1V96是因为他有以下优点。 YAMAHA在2003冬季NAMM展出01V96数字调音台,崭新一代01V。 01V96适合在录音棚中使用,价格也相当便宜。它能工作在44.1 kHz, 48 kHz,

88.2 kHz或96 kHz。具有16个模拟通道输入,包含12个高性能麦克风前置放大,通过ADAT光纤接口接收8数字通道。01V96可以同时混合40个通道,全部24-bit/96 kHz的音频,内部使用32-bit处理。控制面板,大型显示和用户界面给人以模拟台子的感觉。8个用户定义的按钮可以随意分配功能。 Yamaha旗舰级的数字调音台一直被公认为业界的标准机种:例如PM1D之于扩音,广播与剧院等的场合,DM2000,DM1000,与02R96之于音乐制作领域等。现在01V96以较小的体积,较低的价位提供你同等的效能与信赖度,对于个人或小型专业音乐工作室而言实为最佳选择。它拥有最大40轨输入的处理能力,而且可以平行串连成更大的混音系统以适应所需。当然,24-bit/96-kHz是标准的工作模式。混音功能与效果器均承继自顶级的DM2000,所以你可以得到最佳的音质。准备接受Yamaha数字革命的新震撼。 如果你为顶尖的数字混音与处理效能是如此的遥不可及而感到忧心,我们给你充塞的理由开始微笑。10来,YAMAHA公司以它的ProMix01、01V、02R和03D,开创了数字调音台的一个传奇时代。随着高采样和高精度数字音频标准的确立,YAMAHA又推出了PM1D和AW系列多轨机,以及02R96、DM2000和DM1000大型数字调音台。在本次NAMM展会上,它又推出了对应96KHz的 01V96小型数字调音台。 象它的前身O1V一样,O1V96也是中小型工作室和中小型演出用的理想产品,这次严重升级主要改进了音质,增加了新的计算机和ADAT接口。它将在2003年上市,预计价格为2499美元。与01V一样,01V96的机身凑巧可以放进标准的机架或是机柜中,它能够同时提供40个24-bit/96 kHz的混音声道,以及一系列32-bit处理精度的能够全自动实时控制的立体声效果器。在操作介面上,它有一个大大的显示屏以及模拟调音台风格的面板,它还提供了8个可由用户定义功能的按钮。 另外,O1V96还专门为今天基于计算机的录音和混音工作提供了一些新的功能。1-32口提供了完全独立的门限/压缩处理器、4段的全参数平衡器、延时器以及2个位于延时器之后和平衡之前的插入点。立体声输入口1-4也提供了参数平衡器。除此,它还有最多可同时使用4个的内置效果器(2个为 96kHz),多达99个的包含所有设定参数的场景记忆,以及包括平衡、动态处

MATLAB音频文件处理

实验报告 课程名称数字音视频原理 实验题目MATLAB音频文件处理专业电子信息工程 班级3班 学号 学生 实验成绩 指导教师 2012年3月

一、实验目的 1、掌握录制语音信号的基本过程; 2、掌握MATLAB编程对语音信号进行简单处理的方法并分析结果。 二、实验要求 上机完成实验题目,独立完成实验报告。 三、实验容 1、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号(序列)——可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间围定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余弦波,余弦平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 2、设计方案: 首先要对声音信号进行采集,Windows自带的录音机程序可驱动声卡来采集语音信号,并能保存成.WAV格式文件,供MATLAB相关函数直接读取、写入或播放。 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依

办公室音视频监控系统解决方案

办公室音视频监控系统解决方案思正拾音器保平安提效率 一、前言 在计算机技术和网络通信技术不断发展的今天,犯罪分子作案的手段越来越呈现高科技化、高智能化趋势。传统的单一模式的模拟电视监控系统,无论是从监视手段、还是录像手段上来看已经远远落后于现代商业的安全保卫要求。从技术角度来看,新一代的基于数字处理的数字硬盘录像监控系统,已经在技术上全面领先于传统的模拟监控技术。 为了保障办公质量、提高办公效率,越来越多的企业使用远程监控系统。办公室视频监控系统连接广域网WAN,在世界任何角落(只要能上网),都能远程连接办公室实时图像及音频,并且能够远程控制摄像头、远程存储监控视频、远程调取监控录像。广州市思正电子科技有限公司为了实现办公场所财物设施和重要资料的安全,对办公室办公区域、走廊、大门、财务室、生产车间以及仓库等场所防护区域实时图像、声音、报警数据的远程监视、检测、控制功能。为完成公司办公室财物设施和重要资料的安全,提供具有智能安全防范的建设系统。二、系统方案设计 2.1方案设计需求 系统主要满足两大部分的需求,一是企业公共区域的安全防范需要;二是企业办公场所的监控管理需求。 2.1.1企业公共区域安全防范 出入口监控:对企业出入口、厂房出入口以及其他重要区域实时监控 2.1.2企业办公场所监控管理 工作情况监视:上下班时对员工的到位情况进行监控,工作中对员工的工作表现进行监控。 生产过程监视:对于一些生产线上、操作岗位进行重点监控,记录操作过程和生产线上的生产过程,有效保证生产现场的安全规范操作。 走廊监视:对工作人员以及外来人员的活动情况进行监控。 2.2方案总体设计 企业音视频监控系统主要囊括三大部分:前端监控、控制室、远程控制室。整个系统采用全网络数字音视频监控架构,前端监控主要采用思正高保真数字拾音器和高清网络摄像机进行音、视频信息采集,将已经供电的拾音器输出信号接入到IPC(网络摄像机)上,通过IPC的网络端口直接接入到企业音视频传输网络中去,传输到本地控制室进行集中存储和管理。远程监控主要通过互联网来完成,只需要在路由器中进行简单的端口映射和动态域名的设置,即能完成将企业内所需的音、视频图像传送到远程监控室进行远程观看。系统总体设计严格遵循用户

一个小型的录音棚的设备及预算

一个小型的录音棚的设备及预算 01 电脑主要设备1级 1-2台录音用的电脑的配置不需要很高,现在P4系列的都可以使用,存256M就可以使用(建议使用双显示器),但一定要有光盘刻录机。如果您还要拍摄MTV的话,配置就一定要高了。 02 调音台主要设备1级 1 调音台是录音棚的核心组成部分。如果没有它,你基本上无法完成录音任务。即便有的系统说不用调音台,其实在声卡里面也是因为搭配上了调音台的基本功能,这是换汤不换药的做法。 03 专业声卡主要设备1级 1 声卡一定要专业的,普通民用声卡不能满足录音棚需要的音质。最好需要6进6出以上的通道,声卡不需要有太多的功能,但一定要驱动稳定,音质好! 04 监听音箱主要设备1级 1-2对专业监听音箱不同于普通民?iFi音箱,即便是价格特别贵的民用家庭影院音响也不适合与在录音棚中使用,因为它不标准。如果您想在监听音箱上省钱,那真是干什么不吆喝什么了。 05 电容话筒主要设备1级 1-2 录音棚用的是专业的电容话筒,这种话筒很灵敏,需要48V供电。演唱者需要与话筒保持一定的距离。一只话筒其实就能满足一般的录音需要了,如果您的录音棚比较大,而且有录合唱和乐器的机会,

您就要考虑买一只以上的麦克风了。 06 话筒放大器主要设备2级 1 话筒放大器其实对录音棚录制的音质有很大关系。但是一台好的放大器价格不菲,许多投资者就望而怯步了,其实如果您的资金允许,你最好买一台,虽然不买也可以用调音台上的增益实现信号放大的作用,但是,有没有专业的话筒放大器,音质相差得真是太远了! 07 人声效果器主要设备2级 1 人声效果器主要是给你录的歌声添加效果的。虽然在软件里也可以添加效果,但软件算出来的音质远没有硬件出来的声音温暖宽广。 08 耳机主要设备2级若干耳机包括录音师用的专业监听耳机和给歌手用的耳机。您可以买一只好的给录音师混音用,买几只普通的给歌手录音用。因为在录乐队或者合唱的时候,每个乐手或歌手都需要戴一付耳机,您要买上好几只了啊。 09 耳机分配器主要设备1级 1 耳机分配器在录音棚里虽然对录音的音质不会有什么影响,但它却是不可缺少的。因为所有录音歌手的耳机都必须耳机分配器上,否则耳机是没有办法出声的。一只耳机分配器可以连接4-12个耳机。 10 话筒防喷罩主要设备2级 1 话筒防喷罩是为了防止歌手的气息喷到电容话筒上而产生“噗噗”的声音。 11 话筒支架主要设备2级 1-2 这个就不用说了吧。

音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

车载视频监控系统方案

车载视频监控系统方案深圳容方电子

1.1 方案概述 随着现代化企业制度在我国的普及和深化发展,企业的信息化建设不断深入,各企业特别是大中型企业都加快了信息网络平台的建设;企业正逐步转向利用网络和计算机集中处理管理、生产、销售、物流、售后服务等重要环节的大量数据。 传统的厂区周界安全防范系统是建立高高的围墙,铁栅栏等,如果有非法入侵无法及时发现和处理,那么就需要有一套先进,科学,实用,性能稳定可靠的安全防范监控系统来实现, 为了更好的保护财产及工厂的安全, 根据企业用户实际的监控需要,一般都会在工厂周边、大门、办公楼、生产车间、仓库、机房等重点部位安装摄像机。监控系统将视频图像监控,实时监视,多种画面分割,多画面分割显示,云台镜头控制,打印等功能有机结合的新一代监控系统,同时监控主机自动将报警画面纪录,做到及时处理,提高了保卫人员的工作效率并能及时处理警情,能有效的保护工厂财产和工作人员的安全,最大程度的防范各种入侵,提高处理各种突发事件的反映速度,给保卫人员提供一个良好的工作环境,确保整个工厂的安全。 根据《道路运输车辆动态监督管理办法》危险货物运输车辆,第十三条道路运输经营者应当选购安装符合标准 的卫星定位装置的车辆,并接入符合要求的监控平台。根据《危险化学品安全管理条例》,第十六条生产、储存、使用危险化学品的,应当根据危险化学品的种类、特性,在车间、库房等作业场所设置相应的监测、通风、防晒、调温、防火、灭火、防爆、泄压、防毒、消毒、中和、防潮、防雷、防静电、防腐、防渗漏、防护围堤或者隔离操作等安全设施、设备,并按照国家标准和国家有关规定进行维护、保养,保证符合安全运行要求。 在现代化企业中,工厂实施视频监控系统,安全保卫部门可以实现在企业厂区门口、厂房、办公楼、周界围墙、仓库等目标进行实时全天候视频监控,对厂内各主要通道和生产场地进行监控,行政部门可以了解员工工作情况,加强员工考勤管理,提高工作效率,需对生产和办公场所进行视频监控,生产管理部门实现及时了解各车间的工作情况和流水线的生产情况,但视频图像必须保密,某些车间因工作环境有害人体健康,需要实现无人作业,这就需要远程监控生产过程,某些设备因安装位置不易接近,人工巡视作业危险性较大,需用摄像机进行远程监视,企业领导在办公室利用桌面微机,随时了解各主要生产环节的实时生产状况,处理突发事件,与现场进行双向语音交流,外出时可利用上网输入密码登录进入系统,随时了解生产情况,异地监控需求对于跨地区大中型企业,除本地建立网络监控系统外,还可对分支机构进行集中远程视频监控。 监控系统组成 ·车载硬盘录像机;

录音棚装修方案

录音棚装修方案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

小面积录音棚的建声设计特点 a、声学条件的差别对最终结果的影响大。比如,在具有相同混响时间、相同声源的一大一小两个房间里,再增加一块相同的吸声材料板(吸声率一定)。由于在小房间里吸声材料板与声源较近,达到吸声材料板的声音能量就较大,那么实际的吸声量也就较大。同时,由于小房间里传播距离短,所用的时间也很少。也就是说,增加吸声材料板后,小房间的混响时间将比大房间的混响时间小的多。 b、装修后,实际混响时间调节手段的制约因素大。在装修后,小房间里参数实际调整的余地都比较小,空间需求也比较高。 c、通风的设计要求高。一是要求具备良好的通风设施,二是要求对通风通道的噪声进行有效的控制。 d、小房间的简正模式影响较为突出。简正模式(某一频率驻波的一个重叠叫做一个简正模式)说明了房间固有简正频率的分布情况。小房间的长、宽、高比例要尽量避免互成或接近整数倍,以防房间内的声音在某一频率得到过分的加强或减弱。

e、小房间可颤动物件的低频声染色。在装修中装饰板、吸音板、木地板、灯罩和通风口护网都要固定稳固,否则它们随声波的振动在小房间内极易形成严重的低频声染色。 f、小房间的混响时间的计算可以不考虑空气中声波的衰减。 二、经过反复的研究与计算,最终整体设计方案如下: 1、录音棚改造方案 隔音量是指单独材料的隔音特性,其平均隔音效果为46dB。在实际应用中,隔音材料还要与原有砖墙之间保留100mm的空气间隙,实地监测隔音效果平均提高了7dB,满足了设计要求。 根据平均吸声系数的计算公式,经实地测量与计算,改造后配音建的平均吸声系数为,满足设计要求。以下是各部分构建的具体结构:

录音棚的基本构造

录音棚(recording room)主要需要:电脑,专业声卡,调音台,电容麦克风,话筒放大器,人声效果器,专业监听音箱,耳机,耳机分配器等,其他的您还要需要VCD机,DVD机,卡座,CD机,MD 机,VOD点歌机,电视机,DV摄象机等。 电脑录音用的电脑的配置不需要很高,现在P4系列的都可以使用,内存256M就可以使用(建议使用双显示器),但一定要有光盘刻录机。如果您还要拍摄MTV的话,配置就一定要高了。 调音台调音台是录音棚的核心组成部分。如果没有它,你基本上无法完成录音任务。即便有的系统说不用调音台,其实在声卡里面也是因为搭配上了调音台的基本功能,这是换汤不换药的做法。 专业声卡声卡一定要专业的,普通民用声卡不能满足录音棚需要的音质。最好需要6进6出以上的通道,声卡不需要有太多的功能,但一定要驱动稳定,音质好! 监听音箱专业监听音箱不同于普通民用HiFi音箱,即便是价格特别贵的民用家庭影院音响也不适合与在录音棚中使用,因为它不标准。如果您想在监听音箱上省钱,那真是干什么不吆喝什么了。 电容话筒录音棚用的是专业的电容话筒,这种话筒很灵敏,需要48V 供电。演唱者需要与话筒保持一定的距离。一只话筒其实就能满足一般的录音需要了,如果您的录音棚比较大,而且有录合唱和乐器的机会,您就要考虑买一只以上的麦克风了。 话筒放大器话筒放大器其实对录音棚录制的音质有很大关系。但是一台好的放大器价格不菲,许多投资者就望而却步了,其实如果您的

资金允许,你最好买一台,虽然不买也可以用调音台上的增益实现信号放大的作用,但是,有没有专业的话筒放大器,音质相差得真是太远了! 人声效果器人声效果器主要是给你录的歌声添加效果的。虽然在软件里也可以添加效果,但软件算出来的音质远没有硬件出来的声音温暖宽广。 耳机耳机包括录音师用的专业监听耳机和给歌手用的耳机。您可以买一只好的给录音师混音用,买几只普通的给歌手录音用。因为在录乐队或者合唱的时候,每个乐手或歌手都需要戴一付耳机,您要买上好几只了啊。 耳机分配器耳机分配器在录音棚里虽然对录音的音质不会有什么影响,但它却是不可缺少的。因为所有录音歌手的耳机都必须耳机分配器上,否则耳机是没有办法出声的。一只耳机分配器可以连接4-12个耳机。 话筒防喷罩话筒防喷罩是为了防止歌手的气息喷到电容话筒上而产生“噗噗”的声音。 话筒支架对讲话筒对讲话筒是放在控制室用于录音师和歌手交流用的。 VOD点歌机这是娱乐型录音棚必备之物,用于歌手点歌使用。显示器放在录音室方便歌手看字幕。 电视机主要用与和VOD点歌机使用,方便歌手看字幕。 VCD机用于VCD卡拉OK的播放。

录音棚设备说明

录音棚 拼音:lù yīn pénɡ 录音棚(recording room)主要需要:电脑,专业声卡,调音台,电容麦克风,话筒放大器,人声效果器,专业监听音箱,耳机,耳机分配器等,其他的您还要需要VCD机,DVD机,卡座,CD 机,MD机,VOD点歌机,电视机,DV摄象机等。 电脑录音用的电脑的配置不需要很高,现在P4系列的都可以使用,内存256M就可以使用(建议使用双显示器),但一定要有光盘刻录机。如果您还要拍摄MTV的话,配置就一定要高了。 调音台调音台是录音棚的核心组成部分。如果没有它,你基本上无法完成录音任务。即便有的系统说不用调音台,其实在声卡里面也是因为搭配上了调音台的基本功能,这是换汤不换药的做法。 专业声卡声卡一定要专业的,普通民用声卡不能满足录音棚需要的音质。最好需要6进6出以上的通道,声卡不需要有太多的功能,但一定要驱动稳定,音质好! 监听音箱专业监听音箱不同于普通民用HiFi音箱,即便是价格特别贵的民用家庭影院音响也不适合与在录音棚中使用,因为它不标准。如果您想在监听音箱上省钱,那真是干什么不吆喝什么了。 电容话筒录音棚用的是专业的电容话筒,这种话筒很灵敏,需要48V供电。演唱者需要与话筒保持一定的距离。一只话筒其实就能满足一般的录音需要了,如果您的录音棚比较大,而且有录合唱和乐器的机会,您就要考虑买一只以上的麦克风了。 话筒放大器话筒放大器其实对录音棚录制的音质有很大关系。但是一台好的放大器价格不菲,许多投资者就望而却步了,其实如果您的资金允许,你最好买一台,虽然不买也可以用调音台上的增益实现信号放大的作用,但是,有没有专业的话筒放大器,音质相差得真是太远了! 人声效果器人声效果器主要是给你录的歌声添加效果的。虽然在软件里也可以添加效果,但软件算出来的音质远没有硬件出来的声音温暖宽广。 耳机耳机包括录音师用的专业监听耳机和给歌手用的耳机。您可以买一只好的给录音师混音用,买几只普通的给歌手录音用。因为在录乐队或者合唱的时候,每个乐手或歌手都需要戴一付耳机,您要买上好几只了啊。 耳机分配器耳机分配器在录音棚里虽然对录音的音质不会有什么影响,但它却是不可缺少的。因为所有录音歌手的耳机都必须耳机分配器上,否则耳机是没有办法出声的。一只耳机分配器可以连接4-12个耳机。 话筒防喷罩话筒防喷罩是为了防止歌手的气息喷到电容话筒上而产生“噗噗”的声音。 话筒支架对讲话筒对讲话筒是放在控制室用于录音师和歌手交流用的。 VOD点歌机这是娱乐型录音棚必备之物,用于歌手点歌使用。显示器放在录音室方便歌手看字幕。 电视机主要用与和VOD点歌机使用,方便歌手看字幕。 VCD机用于VCD卡拉OK的播放。 DVD机用于VCD卡拉OK的播放。

音视频监控系统产品技术要求

音视频监控系统产品技术要求:一、室内智能中速球型摄像机

摄像机参数应不低于以下参数:18倍彩色摄像机, 1/4英寸HAD CCD; 75(H)*582(V),44万像素; f=-73.8mm,F=; 18倍光学*12倍电子; 480TVL,信噪比大于50dB ,彩色最低照度, 白平衡(自动/手动) 背光补偿(ON/OFF 二、16路DVR高清D1硬盘录像机

另外还需支持以下功能: 1、支持多达16路PAL/NTSC制式视频信号,每路皆可实时每秒25帧的独立硬件压缩,采用视频压缩技术,支持变码率,可设定视频图像质量,也可设定视频图像的压缩码流。 2、支持多达16路音频信号,每路音频信号独立实时压缩,采用音频压缩标准,压缩码率为16Kbps。 3、视频和音频信号压缩后生成复合的H.264码流,码流回放时视频和音频保持同步。也可设置单一视频流。 4、支持视频参数动态设置。 5、支持编码参数动态设置。 6、支持4CIF、2CIF、CIF和QCIF分辨率。

7、支持多区域移动侦测。 8、支持OSD,日期和时间的显示格式、显示位置可以设置,日期和时间自动增加。 9、支持LOGO。 10、支持水印(WATER-MARK)技术。 ◆实时监控功能 11、支持监视器或高清显示器视频输出。 12、支持虚拟键盘,每个通道均可按照需要设置相应的参数。 13、支持画面轮巡功能,并可设置轮巡的通道顺序。 14、支持语音对讲功能。 15、集成了RS485键盘的云镜控制功能,并可调用虚拟云镜控制条。 16、支持预置位、巡航、模式路径的设置及调用。 录像 17、文件记录有六种模式:定时录像、手动录像、移动侦测录像、报警录像、移动侦测录像和报警录像、移动侦测录像或报警录像。2、支持8块SATA硬盘,硬盘文件系统为EXT3格式。硬盘上文件可以选择循环和非循环两种记录方式。 18、支持图像局部遮挡。 19、可设置录像的码流类型:视频流、复合流。 20、支持预录和延迟录像功能。 21、在监视界面可直接判断录像、报警类型。 网络功能

录音棚设计方案样本

资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。 录音室建筑声学 方案 03月

一、公司简介 xxxx建筑技术有限公司的成立宗旨是以人居环境为出发点, 努力让我们城市建设得更美丽、更温馨。随着城市建设的快速发展, 人们的日常生活环境中不知不觉地加入了越来越多的噪声问题。大到工程项目, 城市交通, 小到邻里楼层隔声, 居室管道传声都会让人心烦意乱。长期生活在这样的环境里, 轻则影响人们的正常休息, 重则会引起人体大脑, 心脏等部位的各种病变。 公司针对当前城市建设中的诸多环境噪声问题, 致力于人居环境的噪声污染领域的研究以及系统集成, 为用户提供完整的解决方案。业务领域主要涉及室内建筑声学设计、建筑声环境顾问、工业噪声控制、城市环境噪声改造、声环境检测等项目, 负责包括工程项目的方案设计, 施工图设计, 现场施工, 工程验收检测等具体工作。 公司为给广大群众提供最专业化的声学服务, 把高技术、高科技的前沿知识应用到工程实践中, 依托清华大学建筑物理环境检测中心的技术和人才优势, 长年聘请清华大学教授为公司专家顾问, 参与工程项目实施的现场技术督导和技术把关。对于我们参与的工程项目从设计阶段开始, 就大量地听取清华大学专家们的意见和构想, 同时在方案选择上也要经清华大学专家予以把关; 在现场施工中, 对于局部节点的施工方案和施工过程将请专家现场指导、监督; 工程结束后还邀请专家进行现场的测试, 提供结论性意见。公司的目的就是要以最好的设计和施工质量完成客户的要求。 清华大学建筑物理实验室具有计量认证国家级CMA资质, 出具的数据、报告、评价具有权威性和法律效力, 可为社会各界提供专业的声学检测、评价、预测等服务, 公司全面代理清华大学建筑物理实验室的各项检测和测试业务, 为大众提供便利。

常用录音及后期处理软件 GoldWave 教程

常用录音及后期处理软件GoldWave 教程 一个集声音编辑,播放,录制,和转换的音频工具,体积小巧,功能却不弱。可打开的音频文件相当多,包括WAV, OGG, VOC, IFF, AIF, AFC, AU, SND, MP3,MAT, DWD, SMP, VOX, SDS, AVI, MOV等音频文件格式,你也可以从CD 或VCD 或DVD 或其它视频文件中提取声音。内含丰富的音频处理特效,从一般特效如多普勒、回声、混响、降噪到高级的公式计算(利用公式在理论上可以产生任何你想要的声音),效果多多。 GoldWave 教程 第一节:转录 我们所谓的转录,其实具体的说说,就是打开一个已经存在的音频文件,然后重新保存。当然,一般我们不会去做纯粹的转录,其过程中必然包括着对现有音频的一些处理。 不过,既然是教程嘛,我们把处理的部分放到后面说,先来看看纯粹的“转录”~ 要打开文件进行保存,首先当然是要打开一个文件了。先前我们已经看过了GoldWave 的启动界面,这里就不再重复了。 单击“打开”按钮,或者“文件”——“打开”,选择一个声音文件

经过解压、重现的过程,一个音频文件就被打开了 我们看主界面,许多本来不能选择的菜单和按钮,已经被激活了 我们打开的是一个立体声文件,所以GoldWave会分别显示两个声道的波形,绿色部分代表左声道,红色部分代表右声道 主界面最下方的状态栏是当前音频文件的一些状态,比如时间、频率等

我们点击右边的控制器中的“播放”按钮开始播放 可以看到主界面中会有一条平移的灰线,这个代表当前播放的位置在控制器中可以看到具体的波形,以及左右声道的音量等信息....

变电站音视频监控对讲解决方案

变电站音视频监控对讲解决方案 需求分析 近年来,随着电力系统管理体制不断深化改革,变电站的综合自动化技术也不断进步。目前很多变电站,特别是110KV以下变电站已逐步实现无人值班或值守。 音视频监控系统已经逐步取代值班人员成为变电站日常管理和安全防范的重要组成部分。而传统的视频监控系统单纯仅仅能满足监视或监听的需要,管理中心人员无法与变电站本地人员进行音视频同步的沟通。 在电网发生故障或检修时,本地工作人员需要配备手机或者对讲机与指挥中心进行语音沟通,影响工作效率,提高工作成本。而如果在传统音视频监控上加上双向语音对讲功能,实现工作区域内的音视频同步的监听和对讲,那么当电网发生故障或检修时,指挥中心工作人员不但可以通过监控系统随时查看各个变电站的图像信息和声音信息,而且可以通过双向语音对讲功能与各个变电站的检修人员随时沟通,及时了解现场详细信息以及做出工作部署。 系统组成 全新的音视频监控系统中仅仅是在原有的传统IPC上接入自主研发的具有声控功能的

语音对讲终端OS-500AL,该产品可实现半径达到3米的监听、对讲、报警甚至是声控报警功能。 该音频监控系统与传统的视频监控系统结合时,不需要进行系统的更改或者是复杂的布线工作,在布线后方便的实现语音对讲功能,便利电力监控中心的监控工作。 方案特点 音视频监控对讲是基于传统网络摄像机音频监控系统的一个补充,通过具有回声消除功能的语音对讲终端OS-500AL解决了传统音视频监控拾音器加喇叭实现对讲功能时的回声啸叫现象。在项目改建中无需重复布线,重复系统架设,音视频监控对讲与传统视频网络结合,统一管理,统一进行音视频同步的录音、录像以及对讲。。 音视频监控对讲是定义为监听级别的对讲,语音对讲终端自带拾音器的监听范围为半径3米,还可通过级联拾音器的方式达到100平方左右的监听面积。凡是在语音对讲终端的监听范围内,都可以进行全双工的语音对讲。工作人员可以在工作区域内任意走动,在检修排查故障的同时与管理中心工作人员进行对讲。可以极大提高了工作人员的工作效率以及与公里中心工作人员沟通的质量。 推荐型号 拾音器系列 KO-055 KO-210 语音对讲系列 OS-500 OS-550

录音棚硬件设备图文介绍之一

录音棚硬件设备图文介绍之一 Neumann U 87Ai 电容话筒 产地:德国 拥有数量:(2只) 详细说明 U87 也许是世界上最著名和应用最广泛的录音话筒。它装置了大双振膜传感器,该装置有三种指向性:全向,心型,8字型。由金属头罩下面的一个开关来进行选择。在它的后部安装有一个10 dB减弱开关。它能使话筒处理高达127dB的声压而不会变调。此外,它可消除在近距离内讲话时所产生的低频噪音。 应用: U87 Ai 电容话筒是一个大振膜录音话筒,它具有三种指向性、单一频率及瞬态反应的特点。用户能由其特点立即识别出它。对于无线广播、电影及电视演播室来说,它是最理想的选择。U87Ai录音话筒主要用作管弦乐录音,现场录音话筒,并能广泛用于各种音乐和讲话。

声音特点: ●U87Ai位于话筒头部,带有Neumann标记。 ●即使在高频范围内,心型和8字型指向性的频响也非常平坦。 ●话筒能在发声源近距离内使用而不会有刺耳之感。 ●用高通滤波器可显著减少次声和低频噪音干扰。 指向性: ●双振膜传感器是一个弹性装置并有一个大金属头罩保护。由金属头罩下的一个开关来进行三种指向性选择:全向,心型,8字型。 ●在开关上方的窗口则显示所选。 电器特点: 麦克风名字中的字母A表明与自1967年到1986年间生产的U 87 i型号录音话筒相比它更先进。它仅仅在话筒的电子部分进行了改变,而其传声器则保持不变。 电路用一个减弱阻抗为U87Ai提供偏磁电压,以增加它的工作空间。其结果是在同一声压下具有稍高10dB的灵敏度,和S/N 比增强3dB。 滤波器和衰减: 在后部的开关通过10dB降低灵敏度。当此开关打开时,扩音器可接受高达127dB(等于一个45帕的声压)的声压而不受任何干扰。 在后面的一个附加开关充许改变扩音器的开关频率。这就直接减少了话筒扩音输入时的的低频干扰。 这套设备可消除在近距离内使用话筒时产生的爆破音。 特点: ●可变的大振膜录音话筒; ●带双振膜的压力梯度传感器; ●演播室录音话筒典范; ●三个指向性:全向,心型,8字型; ●可开关的低频滚切; ●可开关的10dB衰减装置; ●可与任何产品媲美,并能支持各种不同条件下的录音 用途: ●多数设备适用; ●适于声乐者(独唱者及背景音乐者); ●适于无线广播、配音、及过渡声音; ●辅助操作; 用途: ●多数设备适用; ●适于声乐者(独唱者及背景音乐者);

音频信号处理

一、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?信号是传递信息的函数。 一、问题的提出: 数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号%26mdash;%26mdash;序列%26mdash;%26mdash;可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 于是,本课题就从频域的角度对信号进行分析,并通过分析频谱来设计出合适的滤波器。当然,这些过程的实现都是在MATLAB软件上进行的,MATLAB软件在数字信号处理上发挥了相当大的优势。 二、设计方案: 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用 MATLAB画出。我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 选择设计此方案,是对数字信号处理的一次实践。在数字信号处理的课程学习过程中,我们过多的是理论学习,几乎没有进行实践方面的运用。这个课题正好是对数字语音处理的一次有利实践,而且语音处理也可以说是信号处理在实际应用中很大众化的一方面。 这个方案用到的软件也是在数字信号处理中非常通用的一个软件%26mdash;%26mdash;MATLAB软件。所以这个课题的设计过程也是一次数字信号处理在MATLAB中应用的学习过程。课题用到了较多的MATLAB语句,而由于课题研究范围所限,真正与数字信号有关的命令函数却并不多。 三、主体部分: (一)、语音的录入与打开: [y,fs,bits]=wavread('Blip',[N1 N2]);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点

相关主题
文本预览
相关文档 最新文档