1.2.1基础音频知识
- 格式:ppt
- 大小:10.69 MB
- 文档页数:99
第1章 绪 论第二讲 声纳参数及声纳方程1.5 声纳及其工作方式声纳(Sonar):利用水下声信息进行探测、识别、定位、导航和通讯的系统。
分类:主动声纳和被动声纳主动声纳信息流程:发射系统发射携带一定信息的声信号(发射信号),在海水中传播时如遇到障碍物(潜艇、水雷、鱼雷、冰山、暗礁,统称声纳目标),产生回声信号;在某一方向上的回声信号传到接收基阵,并将其转换为电信号,经处理器处理后送到判决器,根据预先确定的原则进行判决,最后显示判决结果。
被动声纳(噪音声纳站)信息流程:被动声纳通过接收被探测目标(声源部分)如鱼雷、潜艇等的辐射噪声,来实现水下目标探测。
1.6 声纳参数主、被动声纳工作信息流程的基本组成:声信号传播介质(海水)、被探测目标和声纳设备。
声纳参数:将影响声纳设备工作的因素称为声纳参数。
1、声源级SL声源级SL 用来描述主动声纳所发射的声信号的强弱(反应发射器辐射声功率大小),定义为:10lg 10==r I ISL 式中,I 为发射器声轴方向上离声源声中心1米处的声强,0I 为参考声强(均方根声压为1微帕的平面波的声强),2180/1067.0m W I -⨯=。
为了提高主动声纳的作用距离,它的发射器做成具有一定的发射指向性,如右图所示。
解释原因:它可以提高辐射信号的强度,相应也提高回声信号强度,增加接收信号的信噪比,从而增加声纳的作用距离。
发射指向性指数DI T :NDDT I I DI lg 10=式中,D I 为指向性发射器在声轴上测得的声强度;ND I 为无指向性发射器辐射的声强度。
T DT 含义:在相同距离上,指向性发射器声轴上声级高出无指向性发射器辐射声场声级的分贝数;T DT 越大,声能在声轴方向集中的程度越高;就有利于增加声纳的作用距离。
声源级与声功率的关系:假设介质无声吸收,声源为点声源,辐射声功率为P a (W ),距声源声中心1米处声强度为:()214m W P I a r π==则可得无指向性声源辐射声功率与声源级的关系:77.170lg 10+=a P SL 有指向性声源辐射声功率与声源级的关系:Ta DI P SL ++=77.170lg 10常识:船用声纳P a 为几百瓦~几千瓦,T DI 为10~30dB ,SL 约为210~240dB 。
影音设计知识点总结大全影音设计是指通过音频和视频等媒体的合理组合和处理,来达到营造氛围、传递信息和引起观众情感共鸣等目的的一种艺术创作过程。
以下是影音设计的相关知识点总结:1. 音频设计1.1 音频的基本元素:音调、音量、音色、音质等。
1.2 音频采样率和比特率:采样率决定了音频的录制和播放质量,比特率则影响了音频的文件大小。
1.3 音频编辑软件:如Adobe Audition、GarageBand等,用于录制、剪辑和处理音频。
1.4 音频特效:包括混响、均衡器、压缩器等,用于增强音频效果或调整音频的参数。
2. 视频设计2.1 视频编码格式:如H.264、MPEG-4等,用于压缩和存储视频文件。
2.2 视频分辨率和帧率:分辨率决定了视频的清晰度,帧率则决定了视频的流畅度。
2.3 视频编辑软件:如Adobe Premiere Pro、Final Cut Pro等,用于剪辑和处理视频。
2.4 视频特效:包括颜色校正、特效叠加、转场效果等,用于增强视频效果或创造特定的视觉效果。
3. 音视频同步3.1 时间码:用于精确记录音频和视频的时间信息,以便在后期剪辑和同步时使用。
3.2 音视频关键帧:音频和视频组合中的关键事件,如口型、动作等,在剪辑和同步中需要注意准确对齐。
3.3 音频和视频的采样率和帧率要一致,并进行同步处理,确保音频和视频的播放保持一致。
4. 配乐设计4.1 配乐的选取原则:根据作品的整体风格和氛围,选择相应的音乐,并确保与画面或情节相符。
4.2 配乐的编辑和混音:根据需要进行音频的剪辑和混音处理,以达到更好的音频效果。
4.3 版权法和使用许可:使用他人的音乐作品需要遵守相关版权法规,并获得相应的使用许可或版权准许。
5. 配音设计5.1 配音演员:选择适合角色并具备声音表演能力的演员进行配音,能够匹配角色的性格和情绪。
5.2 配音录制和后期处理:使用专业的录音设备进行录制,并通过后期处理调整音频效果,以满足作品的要求。
⾳频基础知识⼀.⾳频基础知识1.⾳频编解码原理数字⾳频的出现,是为了满⾜复制、存储、传输的需求,⾳频信号的数据量对于进⾏传输或存储形成巨⼤的压⼒,⾳频信号的压缩是在保证⼀定声⾳质量的条件下,尽可能以最⼩的数据率来表达和传送声⾳信息。
信号压缩过程是对采样、量化后的原始数字⾳频信号流运⽤适,当的数字信号处理技术进⾏信号数据的处理,将⾳频信号中去除对⼈们感受信息影响可以忽略的成分,仅仅对有⽤的那部分⾳频信号,进⾏编排,从⽽降低了参与编码的数据量。
数字⾳频信号中包含的对⼈们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余。
1.1时域冗余.幅度分布的⾮均匀性:信号的量化⽐特分布是针对信号的整个动态范围⽽设定的,对于⼩幅度信号⽽⾔,⼤量的⽐特数A.幅度分布的⾮均匀性据位被闲置。
B.样值间的相关性:声⾳信号是⼀个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本⾝相⽐,数据量要⼩的多。
C.信号周期的相关性:声⾳信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作⽤,即特征频率,这些特征频率会以⼀定的周期反复出现,周期之间具有相关关系。
D.长时⾃我相关性:声⾳信息序列的样值、周期相关性,在⼀个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很⾼的相关系数。
E.静⾳:声⾳信息中的停顿间歇,⽆论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量。
1.2频域冗余.长时功率谱密度的⾮均匀性:任何⼀种声⾳信息,在相当长的时间间隔内,功率分布在低频部分⼤于⾼频部分,功率谱A.长时功率谱密度的⾮均匀性具有明显的⾮平坦性,对于给定的频段⽽⾔,存在相应的冗余。
B.语⾔特有的短时功率谱密度:语⾳信号在某些频率上会出现峰值,⽽在另⼀些频率上出现⾕值,这些共振峰频率具有较⼤的能量,由它们决定了不同的语⾳特征,整个语⾔的功率谱以基⾳频率为基础,形成了向⾼次谐波递减的结构。
数字音频知识点1、音频信号来源:携带声音信息的机械波;通过机器合成、模拟的自然声2、声音的两属性:音调:频率高、音调高响度:响度大、声音大人耳频率20HZ~20kHZ语音由声带振动男声带长厚、频率低 150HZ 女 230HZ3、人耳听觉特性:人耳判断响度,与声压级和频率有关4、与音质有关的听觉特效双耳效应:双耳距离20cm,因此有时间差、强度差、相位差,能分辨位置方向(立体声)掩蔽效应:噪音对语言的妨碍程度低音调对高音调遮掩明显高音调对低音调遮掩甚微遮掩与被遮掩声,频率接近。
遮掩效果越好哈斯效应:回声的感觉规律直达、反射声延迟超过100ms。
都能感觉到回声直达、反射声延迟超过70ms。
一半人感觉到回声直达、反射声延迟超过50ms。
都能分辨出两个方向声音直达、反射声延迟超过30ms。
一般人区分不出来直达比反射强度高10dB以上。
没人感受到回声1、数字化相比模拟化的优越性高效编码、低存储空间抗干扰强、便中继传输差错控制、传输可靠性便于加密、保密及版权便于计算机管理易于集成化和大规模生产与其他系统配合使用,控制系统功能2、PCM是数字化基本技术:步骤:取样、量化、编码。
3、数字音频存储技术类别磁存储:数字磁带录音机、硬盘录音机光盘存储:LD、CD、DVD半导体存储:RAM、Flash4、数字音频传输技术:带宽要求和传播形式带宽要求:普通语音:频率带宽<=3.4KHZ,8KHZ取样,8bit量化,数据率64kb/s高质量语音:频率带宽50HZ~7KHZ。
压缩数据率48~64kb/s CD-DA双声道立体声:频率带宽20KHZ,22.1KHZ取样,16bit 量化,压缩数据率192kb/sAC-3 5.1声道环绕立体声:频率带宽3KHZ~20KHZ,48KHZ取样,22bit量化,压缩数据率320kb/s传输延时要求:网络延迟>24ms时,应消除可听见回声干扰延时抖动要求:CD质量音频,网络延迟抖动不应超过100ms电话质量语音,网络延迟抖动不应超过400ms虚拟现实语音,网络延迟抖动不应超过20ms~30ms流媒体:流式传输的媒体称为流媒体或流式媒体流式传输方法:顺序流式传输:顺序下载,在线观看。
多媒体技术知识整理1.1.1 多媒体的含义和分类1、媒体的定义:人们用来与外界沟通和交流各种信息的载体,或者说是信息传递和信息存储的最基本的手段。
2、强调媒体的两层含义:一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。
3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体),最主要的媒体(表示媒体)。
4、表示媒体通常包含的几种媒体(多媒体数据的分类)文本:最基本声音(音频):三种表现形式(解说词、音效、背景音乐),具有很强的前后相关性,数据量大,实时性强图片、图像:图像主要以位图形式存放,是一种最基本的形式,图片一般以向量图形式存在。
视频影像:(静态和动态,真实的画面)动画:移动的主观设计的绘画(二维平面、三维立体),根据制作方法分为造型和帧动画两类。
05年高考题:分别指出WINDOWS系统中下列工具软件所处理的媒体,记事本(文本)、画图(图像)、录音机(声音)、CD唱机(声音)、媒体播放器(音频、视频)。
填空:___________、声音、图形、图像和动画等信息载体中的两个或多个的组合成为多媒体。
单:下列不属于多媒体技术中的媒体的范围是(A 存储信息的实体B 信息的载体 C 文本D 图像)A超文本是一个什么样的结构(A顺序的树形B非线性的网状C线性的层次D随机的链式)B 1.1.2 多媒体技术的概念1、多媒体技术的含义:以计算机技术为基础,综合处理图像、文本、声音、动画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统,具有集成性、交互性和实时性的特点。
2、多媒体技术的基本特征:集成性(综合性)、交互性、实时性。
集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义,基类媒体的概念。
05年高考题:多媒体作品与影视作品的主要区别是(A、共享性B集成性C交互性D传播性) C交互性是多媒体技术最基本的特征。
⾳频基础知识CODEC图1基本⾳频输⼊输出系统框图1.模拟⾳频接⼝1.13.5mm接⼝1.1.1插座⾸先要了解前置⾳频插座的结构。
根据英特尔关于AC97前置⾳频接⼝的规范,机箱的前置⾳频⾯板采⽤两种3.5毫⽶微型插座:1开关型的,2⽆开关型的,见下图:开关型的2/3,4/5端是两个开关,当没有插头插⼊时,2/3,4/5端是连通的,当插头插⼊时2/3,4/5端断开。
⽆开关的就没有3,4两个开关端。
1.1.2⼆段三段四段3.5mm插头有⼏种规格,最常见的是三段式的,四段式的则在消费电⼦中应⽤越来越多,另外也有⼆段式的,通常⽤于麦克风⼆段、三段式插头如下图所⽰:⼆芯插头⼀般⽤于麦克,三芯插头⼀般⽤于⽴体声⾳⽿机(有源⾳箱)。
现在⼆芯插头很少,所以麦克也⽤三芯插头。
⽿机和麦克插头的接线定义如下图:四段式插头根据我们市⾯上出现的不同标准的⽿机插头,⽿机市场才将不同的⽿机接头⽅式划分为2个类别:N版和i版,N版⽿机主要是适⽤于NOKIA、MOTO、OPPO、BBK等⼿机,⽽我们的i版⽿机插头则主要适⽤于iphone、HTC、魅族和PC、MP3等电⼦数码通讯设备。
要了解清楚这个问题之前,我们先要认识我们⽿机插头的结构,在市⾯上销售的⽿机插头主要分为:2.5mm和3.5mm,⼜被分为单⾳⽿机插头、⽴体⽿机插头、四极⽿机插头、五极⽿机插头,主要普遍还是3.5mm见的居多,⼀般的3.5mm 的⽿机插头⼤多都是三段式的结构,看完下图你就清楚了!图为普通⽿机插头三段式结构N版⽿机和i版⽿机同样是3.5mm的标准,她们之所以适⽤于不⽤的⼿机类型,也正是因为她们的接头设计不同,N版和i版⼜有⼀个共同点,就是都采⽤的是4段式的⽿机插针的结构,不同的是N版的⽿机插头从左到右依次是左声道、右声道、麦克、地线,i版⽿机从左到右依次是左声道、右声道、地线、麦克。
详情请看下图:NOKIA⽿机插头四段式插头结构Iphone⼿机四段式⽿机插头结构1.2RCA接⼝:RCA接头就是常说的莲花头。
多媒体技术知识整理1.1.1 多媒体的含义和分类1、媒体的定义:人们用来与外界沟通和交流各种信息的载体, 或者说是信息传递和信息存储的最基本的手段。
2、强调媒体的两层含义: 一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。
3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体), 最主要的媒体(表示媒体)。
4、表示媒体通常包含的几种媒体(多媒体数据的分类)文本: 最基本声音(音频):三种表现形式(解说词、音效、背景音乐), 具有很强的前后相关性, 数据量大, 实时性强图片、图像:图像主要以位图形式存放, 是一种最基本的形式, 图片一般以向量图形式存在。
视频影像:(静态和动态,真实的画面)动画: 移动的主观设计的绘画(二维平面、三维立体), 根据制作方法分为造型和帧动画两类。
05年高考题:分别指出WINDOWS统中下列工具软件所处理的媒体, 记事本(文本)、画图(图像)、录音机(声音)、CD唱机(声音)、媒体播放器(音频、视频)。
、声音、图形、图像和动画等信息载体中的两个或多个的填空:组合成为多媒体。
单: 下列不属于多媒体技术中的媒体的范围是(A 存储信息的实体 B 信息的载体 C 文本 D 图像)A超文本是一个什么样的结构(A 顺序的树形B 非线性的网状C 线性的层次 机的链式 )B 1.1.2 多媒体技术的概念1、多媒体技术的含义 :以计算机技术为基础 , 综合处理图像、文本、声音、画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统 有集成性、交互性和实时性的特点。
2、多媒体技术的基本特征 : 集成性(综合性) 、交互性、实时性。
集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方 面,了解创作的含义 , 基类媒体的概念。
05年高考题:多媒体作品与影视作品的主要区别是(A 、共享性B 集成性C 交 互性D 传播性)C 交互性是多媒体技术最基本的特征。
音频各个频段的基本知识[20-60Hz]影响音色的空间感,因为乐音的基音大多在这段频率以上,这段很难表现。
[60-100Hz]影响声音的混厚感,是低音的基音区。
如果这段频率很丰满,音色会显得厚实、混厚感强,如果不足,音色会变得无力;而如果过强,音色会出现低频共振声,有轰鸣声的感觉。
有大鼓、定音鼓,还有钢琴、大提琴、大号等少数存在极低频率的乐器多表现在此段。
[80-160Hz]主要表现音乐的厚实感,音响在这部分重放效果好的话,会感到音乐厚实、有底气。
这部分表现得好的话,在80Hz以下缺乏时,甚至不会感到缺乏低音。
如表现不好,音乐会有沉闷感,甚至是有气无力许多低音炮音箱的重放上限,具此可判断您的播放设备的频率上限。
[150-300Hz]影响声音的力度,尤其是男音的力度。
这段频率是男声声音的低频基音频率,同时也是乐音中和弦的根音频率。
[300-500Hz]表现人声的(唱歌、朗诵),这个频段上可以表现人声的厚度和力度,好则人声明亮、清晰,否则单薄、混浊。
[800Hz]影响音色的力度。
如果这个频率丰满,音色会显得强劲有力;如果不足,音色将会显得松弛,也就是800Hz 以下的成分特性表现突出了,低频成分就明显;而如果过多,则会产生喉音感。
如果喉音过多了,则会失掉语音的个性,适当的喉音则可以增加性感,因此,音响师把这个频率称为"危险频率",人声,打击乐多表现于此。
[1kHz]是音响器材测试的标准参考频率,通常在音响器材中给出的参数是在1kHz下测试。
这是人耳最为敏感的频率。
[1.2kHz]可以适当多一点,不宜太多,可以提高声音的明亮度,过多会使声音发硬。
[2k-4kHz]穿透力很强。
人耳耳腔的谐振频率是1∽4KHz,所以人耳对这个频率也是非常敏感的。
2-4kHz对声音的亮度影响很大,这段声音一般不宜衰减。
这段对音乐的层次影响较大。
如果空虚频率成分过少,听觉能力会变差,语音显得模糊不清了。
如果过强了,则会产生咳声的感觉。