1.2.1基础音频知识

格式：ppt
大小：10.69 MB
文档页数：99

下载文档原格式

1.2.1声纳参数及声纳方程 - 声纳参数及声纳方程

第1章绪论第二讲声纳参数及声纳方程1.5 声纳及其工作方式声纳（Sonar）：利用水下声信息进行探测、识别、定位、导航和通讯的系统。

分类：主动声纳和被动声纳主动声纳信息流程：发射系统发射携带一定信息的声信号（发射信号），在海水中传播时如遇到障碍物（潜艇、水雷、鱼雷、冰山、暗礁，统称声纳目标），产生回声信号；在某一方向上的回声信号传到接收基阵，并将其转换为电信号，经处理器处理后送到判决器，根据预先确定的原则进行判决，最后显示判决结果。

被动声纳（噪音声纳站）信息流程：被动声纳通过接收被探测目标（声源部分）如鱼雷、潜艇等的辐射噪声，来实现水下目标探测。

1.6 声纳参数主、被动声纳工作信息流程的基本组成：声信号传播介质（海水）、被探测目标和声纳设备。

声纳参数：将影响声纳设备工作的因素称为声纳参数。

1、声源级SL声源级SL 用来描述主动声纳所发射的声信号的强弱（反应发射器辐射声功率大小），定义为：10lg 10==r I ISL 式中，I 为发射器声轴方向上离声源声中心1米处的声强，0I 为参考声强（均方根声压为1微帕的平面波的声强），2180/1067.0m W I -⨯=。

为了提高主动声纳的作用距离，它的发射器做成具有一定的发射指向性，如右图所示。

解释原因：它可以提高辐射信号的强度，相应也提高回声信号强度，增加接收信号的信噪比，从而增加声纳的作用距离。

发射指向性指数DI T ：NDDT I I DI lg 10=式中，D I 为指向性发射器在声轴上测得的声强度；ND I 为无指向性发射器辐射的声强度。

T DT 含义：在相同距离上，指向性发射器声轴上声级高出无指向性发射器辐射声场声级的分贝数；T DT 越大，声能在声轴方向集中的程度越高；就有利于增加声纳的作用距离。

声源级与声功率的关系：假设介质无声吸收，声源为点声源，辐射声功率为P a （W ），距声源声中心1米处声强度为：()214m W P I a r π==则可得无指向性声源辐射声功率与声源级的关系：77.170lg 10+=a P SL 有指向性声源辐射声功率与声源级的关系：Ta DI P SL ++=77.170lg 10常识：船用声纳P a 为几百瓦~几千瓦，T DI 为10~30dB ，SL 约为210~240dB 。

数字音频基础

数字音视频技术
ISDB T(日本)或8 VSB(美国)调制方式; (2)卫星传输:采用 QPSK 调制方式; (3)有线传输:采用 M QAM 或16 VSB
高数据率调制方式,根据有线信道的不同特性,分别采用16/32/128/256 QAM 等方式。
数字音视频技术
三种。DVB－S (QPSK 调制方式)主要用于数字电视卫星广播系统;DVB －T(OFDM 调制方式)则用于地面无线发射的数字电视广播系统;DVB－C(QAM 调制方式)主要为地面 HFC(Hybrid FiberCoaxnetworks,混合光纤同轴电缆网)网络数字电视广播所采用。
数字音视频技术
• 图6－1 数字电视系统的基本原理框图
数字音视频技术
下,对反映信源全部信息的数字信号进行变换,用尽量少的数字脉冲来表示信源产生的信息,这就是压缩编码。
信道编码器包括纠错编码和数字调制,主要解决数字信号传输的可靠性问题, 故又称为抗干扰编码。经过纠错编码的传输码流具有检错和纠错的能力,其作用是最大限度地减少在信道传输中的误码率,然后将经过纠错编码后的传输码流调制成适合于在信道上传输的波形。
数字音视频技术
6.2 二进制数字调制及其抗噪声性能分析
6.2.1 二进制数字幅移键控(2ASK) 1.2ASK 调制原理数字幅度调制又称幅移键控(ASK),二进制幅移键控记作
2ASK。2ASK 是利用代表数字信息“0”或“1”的基带矩形脉冲去键控一个连续的载波,使载波时断时续地输出。有载波输出时发送“1”,无载波输出时发送“0”。
–按照声音的来源以及作用来看，可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑，感叹等；乐音也可成为音乐，是指人类通过相关乐器演奏出来的声音，如影视作品中的背景声音，一般起着渲染气氛的作用；响音是指除语言和音乐之外电影中所有声音的统称，如动作音响、自然音响、背景音响、机械音响、特殊音响。

影音设计知识点总结大全

影音设计知识点总结大全影音设计是指通过音频和视频等媒体的合理组合和处理，来达到营造氛围、传递信息和引起观众情感共鸣等目的的一种艺术创作过程。

以下是影音设计的相关知识点总结：1. 音频设计1.1 音频的基本元素：音调、音量、音色、音质等。

1.2 音频采样率和比特率：采样率决定了音频的录制和播放质量，比特率则影响了音频的文件大小。

1.3 音频编辑软件：如Adobe Audition、GarageBand等，用于录制、剪辑和处理音频。

1.4 音频特效：包括混响、均衡器、压缩器等，用于增强音频效果或调整音频的参数。

2. 视频设计2.1 视频编码格式：如H.264、MPEG-4等，用于压缩和存储视频文件。

2.2 视频分辨率和帧率：分辨率决定了视频的清晰度，帧率则决定了视频的流畅度。

2.3 视频编辑软件：如Adobe Premiere Pro、Final Cut Pro等，用于剪辑和处理视频。

2.4 视频特效：包括颜色校正、特效叠加、转场效果等，用于增强视频效果或创造特定的视觉效果。

3. 音视频同步3.1 时间码：用于精确记录音频和视频的时间信息，以便在后期剪辑和同步时使用。

3.2 音视频关键帧：音频和视频组合中的关键事件，如口型、动作等，在剪辑和同步中需要注意准确对齐。

3.3 音频和视频的采样率和帧率要一致，并进行同步处理，确保音频和视频的播放保持一致。

4. 配乐设计4.1 配乐的选取原则：根据作品的整体风格和氛围，选择相应的音乐，并确保与画面或情节相符。

4.2 配乐的编辑和混音：根据需要进行音频的剪辑和混音处理，以达到更好的音频效果。

4.3 版权法和使用许可：使用他人的音乐作品需要遵守相关版权法规，并获得相应的使用许可或版权准许。

5. 配音设计5.1 配音演员：选择适合角色并具备声音表演能力的演员进行配音，能够匹配角色的性格和情绪。

5.2 配音录制和后期处理：使用专业的录音设备进行录制，并通过后期处理调整音频效果，以满足作品的要求。

91248-数字音频技术基础-第二讲

听小骨
1.2 声音的物理特性（频率）
11
• 频率即每秒钟内来回往复振动的次数。 • 频率的单位通常用Hz（赫兹）来表示，简称赫。 • 声波的频率就是声源振动的频率。
岭南师范学院
1.2 声音的物理特性（振幅）
12
• 振动物体（声音）离开平衡位置的最大距离叫振幅。 • 振幅越大，振动物体（声音）释放的能量越多。 • 振幅决定声音的高低。
岭南师范学院
小提琴
钢琴
1.4 声音的录制与重现
19
唱片
岭南师范学院
数识（下） 20
掌握数字音频的四要素掌握数字音频的常见格式
第2课数字音频基础知识（下）
21
岭南师范学院
1.5 数字音频的概念（音频数字化）
22
数字世界中的声音 • 数字世界中的声音以0和1的形式存储。
0–5,512 Hz
22,050 Hz
Near FM radio
0–11,025 Hz
32,000 Hz Better than FM radio
0–16,000 Hz
44,100 Hz
CD
0–22,050 Hz
48,000 Hz
Standard DVD
0–24,000 Hz
96,000 Hz
Blu-ray DVD
1.6 数字音频的常见格式
41
岭南师范学院
无损
wav
flac
ape
有损
mp3
wma
aac
1.6 数字音频的常见格式（Audition支持） 42
岭南师范学院
43
The End
岭南师范学院
9
• 由计算机通过专门定义的语言来驱动音乐合成器产生的声音（如电子乐器）

(完整版)多媒体技术知识点整理

PCD:电子照片文件格式,一般存在CD-ROM上 WMF:位图和矢量图的混合体,Office中的剪贴画 3、动态图像的存取格式
A VI:Video for Windows视频文件格式,采用Indeo有损压缩技术将视频、音频混合存储,目前流行
MOV格式:QuickTime for Windows视频文件格式,采用有损压缩技术将视频、音频混合存储
2、多媒体技术的基本特征:集成性(综合性)、交互性、实时性。集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义,基类媒体的概念。 05年高考题:多媒体作品与影视作品的主要区别是(A、共享性B集成性C交互性 D传播性) C交互性是多媒体技术最基本的特征。简:请回答单:多媒体技术的主要特性有(A、多样性B集成性C交互性D可扩充性)ABC 填空:多媒体技术具有__________、实时性、交互性、高质量等特性。 1.1.3 多媒体技术的发展和应用 1、多媒体技术的发展简史:1986年,世界上第一台多媒体计算机AMGIA;1985年 ,只读光盘的问世;多媒体PC机标准MPC-1,MPC-2,MPC-3。 2、多媒体计算机的应用:了解性内容,注意几个符号简称的意义 1.2 多媒体计算机系统组成 1.2.1 硬件组成
3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体),最主要的媒体(表示媒体)。
4、表示媒体通常包含的几种媒体(多媒体数据的分类)
文本:最基本
声音(音频):三种表现形式(解说词、音效、背景音乐),具有很强的前后相关性,数据量大,实时性强
图片、图像:图像主要以位图形式存放,是一种最基本的形式,图片一般以向量图形式存在。视频影像:(静态和动态,真实的画面)

数字音频基础知识

MID文件主要用于原始乐器作品，流行歌曲的业余表演，游戏音轨以及电子贺卡等。＊.mid文件重放的效果完全依赖声卡的档次。
数字音频专业知识
WMA格式——最具实力的敌人
WMA (Windows Media Audio) 由微软开发。音质要强于MP3格式，更远胜于RA格式，它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的，WMA的压缩率一般都可以达到1：18左右。
低音：音色深沉浑厚，擅于表现庄严雄伟和苍劲沉着的感情。（鼓声）
声音基础知识
响度（loudness ）响度：又称音量、音强，指人主观上感觉声音的
大小，由―振幅（amplitude）和人离声源的距离决定，振幅越大响度越大，人和声源的距离越小，响度越大。（单位：分贝dB）
声音基础知识
音色（music quality）音色：又称音品，由发声物体本身材料、结构决定。每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音，都是由音色不同造成的。
数字音频专业知识
3.6 常见的数字音频文件格式常见的数字音频文件格式有很多，每种格式都有自己的优
点、缺点及适用范围。 CD格式——天籁之音 CD音轨文件的后缀名为：cda 标准CD格式是的采样频率，速率88K/秒，16位量化位
数，近似无损的。 CD光盘可以在CD唱机中播放，也能用电脑里的各种播放
特点：音质好，压缩比比较高，被大量软件和硬件支持，应用广泛。
适用于：适合用于一般的以及比较高要求的音乐欣赏。
数字音频专业知识
MIDI——作曲家的最爱
MIDI（Musical Instrument Digital Interface）乐器数字接口 MIDI数据不是数字的音频波形，而是音乐代码或称电子乐谱。MIDI文件每存1分钟的音乐只用大约5～ 10KB。

音频基础知识

⾳频基础知识⼀.⾳频基础知识1.⾳频编解码原理数字⾳频的出现，是为了满⾜复制、存储、传输的需求，⾳频信号的数据量对于进⾏传输或存储形成巨⼤的压⼒，⾳频信号的压缩是在保证⼀定声⾳质量的条件下，尽可能以最⼩的数据率来表达和传送声⾳信息。

信号压缩过程是对采样、量化后的原始数字⾳频信号流运⽤适，当的数字信号处理技术进⾏信号数据的处理，将⾳频信号中去除对⼈们感受信息影响可以忽略的成分，仅仅对有⽤的那部分⾳频信号，进⾏编排，从⽽降低了参与编码的数据量。

数字⾳频信号中包含的对⼈们感受信息影响可以忽略的成分称为冗余，包括时域冗余、频域冗余和听觉冗余。

1.1时域冗余．幅度分布的⾮均匀性：信号的量化⽐特分布是针对信号的整个动态范围⽽设定的，对于⼩幅度信号⽽⾔，⼤量的⽐特数A．幅度分布的⾮均匀性据位被闲置。

B．样值间的相关性:声⾳信号是⼀个连续表达过程，通过采样之后，相邻的信号具有极强的相似性，信号差值与信号本⾝相⽐，数据量要⼩的多。

C．信号周期的相关性:声⾳信息在整个可闻域的范围内，每个瞬间只有部分频率成分在起作⽤，即特征频率，这些特征频率会以⼀定的周期反复出现，周期之间具有相关关系。

D．长时⾃我相关性:声⾳信息序列的样值、周期相关性，在⼀个相对较长的时间间隔也会是相对稳定的，这种稳定关系具有很⾼的相关系数。

E．静⾳:声⾳信息中的停顿间歇，⽆论是采样还是量化都会形成冗余，找出停顿间歇并将其样值数据去除，可以减少数据量。

1.2频域冗余．长时功率谱密度的⾮均匀性：任何⼀种声⾳信息，在相当长的时间间隔内，功率分布在低频部分⼤于⾼频部分，功率谱A．长时功率谱密度的⾮均匀性具有明显的⾮平坦性，对于给定的频段⽽⾔，存在相应的冗余。

B．语⾔特有的短时功率谱密度:语⾳信号在某些频率上会出现峰值，⽽在另⼀些频率上出现⾕值，这些共振峰频率具有较⼤的能量，由它们决定了不同的语⾳特征，整个语⾔的功率谱以基⾳频率为基础，形成了向⾼次谐波递减的结构。

数字音频知识点

选择话筒以内部结构、功能特点来选择
首选，声电转换模块主要由膜版构成，面积与数量决定性能
大面积膜片：低频好、灵敏度与最大输入声压级较高——舞台拾音
小面积膜片：高频好、灵敏度与最大输入声压级较低
其次，阻抗变换器来看，采用电子管比效应管音色更好。但体积大
数字音频工作站：将软硬件实现的后期音频制作功能模块，通过计算机集中控制，形成系统化、模块化，可在计算机中进行专业编辑、处理、混合、录音的系统
五、计算机音频制作系统组成
硬件：计算机、音频接口卡、话筒、数字音频录放设备、数字调音台和监听设备。
软件：音频设备驱动程序、操作系统、数字音频工具软件、数字音频应用软件
再次，传输方式来看，有线话筒移动不便，传输质量高。无线话筒移动方便，传输质量低。
最后，其他特性，如指向性、有无输入限幅衰减等
选择话筒以厂家型号来选择
爱科技（AKG）奥地利
拜亚动力（Beyer Dynamic）德国
铁三角（Audiio-Technica）日本
IEEE1394：苹果的高速串行总线接口标准。又称火线
ADAT：美国Alesis公司开发的数字音频接口
5、对音频系统的接地：
保护接地：防止触电，分为接零和接地两种
过压保护地：防雷
屏蔽地：防止电子设备的交流和高频产生的干扰
信号地：基准电位。同设备的信号输出、输入地不能互连，前级输出地必须和后级输入地相连。
后期配音不受拍摄画面现场条件影响。EFP受录音画面制约
后期配音对音频处理要求高
3、同步信号包括：时间码、MIDI实时信息、字时钟
4、数字音频接口标准：模拟接口（平衡式和非平衡式）数字接口

《音频技术基础知识》PPT课件

(dB )
▪ 人耳的对数特性 0dB-140dB
0.00002Pa-200Pa
2021/6/10
10
一、声学基本概念
2021/6/10
11
一、声学基本概念
听觉物理属性 2、频率与倍频程
（音调）
▪ 次声
20——————20kHz
低
高
▪ 超声
▪ 人耳的对数特性
2021/6/10
1/n=lo２g
f2 f1
▪ 波长：
λ m（频率）
▪ 频率：
f Hz（周期）
C=λ/T=λf
C=331.5+0.61t (m/s) t=℃
2021/6/10
9
一、声学基本概念
听觉物理属性 1、声压与声压级
（音量）
▪ 基准声压（绝对值）2×10-5Pa(Pr) 1Pa=1N/㎡
▪ 声压级
有效声压
Pc
L= 基准声压 =20lg Pr
功放的基本指标
▪ 功率 ▪ 频率响应 ▪ 最大输入电平 ▪ 最大输出电压 ▪ 本底噪声 ▪ 放大倍数 ▪ 总谐波失真 ▪ 重量
2021/6/10
28
一、声学基本概念
话筒的基本指标
▪ 频率响应 ▪ 换能方式 ▪ 最大声压级 ▪ 灵敏度 ▪ 本1/6/10
29
二、扩声系统基本构成
2021/6/10
音频技术基础知识
1
电子学基础知识
2021/6/10
2
欧姆定律
--- R=U/I
电功率
--- P=U×I=I×I×R=U×U/R
2021/6/10
3
电阻R
--- R=U/I
阻抗

数字音频知识点

数字音频知识点1、音频信号来源：携带声音信息的机械波；通过机器合成、模拟的自然声2、声音的两属性：音调：频率高、音调高响度：响度大、声音大人耳频率20HZ~20kHZ语音由声带振动男声带长厚、频率低 150HZ 女 230HZ3、人耳听觉特性：人耳判断响度，与声压级和频率有关4、与音质有关的听觉特效双耳效应：双耳距离20cm，因此有时间差、强度差、相位差，能分辨位置方向（立体声）掩蔽效应：噪音对语言的妨碍程度低音调对高音调遮掩明显高音调对低音调遮掩甚微遮掩与被遮掩声,频率接近。

遮掩效果越好哈斯效应：回声的感觉规律直达、反射声延迟超过100ms。

都能感觉到回声直达、反射声延迟超过70ms。

一半人感觉到回声直达、反射声延迟超过50ms。

都能分辨出两个方向声音直达、反射声延迟超过30ms。

一般人区分不出来直达比反射强度高10dB以上。

没人感受到回声1、数字化相比模拟化的优越性高效编码、低存储空间抗干扰强、便中继传输差错控制、传输可靠性便于加密、保密及版权便于计算机管理易于集成化和大规模生产与其他系统配合使用，控制系统功能2、PCM是数字化基本技术：步骤：取样、量化、编码。

3、数字音频存储技术类别磁存储：数字磁带录音机、硬盘录音机光盘存储：LD、CD、DVD半导体存储：RAM、Flash4、数字音频传输技术：带宽要求和传播形式带宽要求：普通语音：频率带宽<=3.4KHZ,8KHZ取样，8bit量化，数据率64kb/s高质量语音：频率带宽50HZ~7KHZ。

压缩数据率48~64kb/s CD-DA双声道立体声：频率带宽20KHZ，22.1KHZ取样，16bit 量化，压缩数据率192kb/sAC-3 5.1声道环绕立体声：频率带宽3KHZ~20KHZ，48KHZ取样，22bit量化，压缩数据率320kb/s传输延时要求：网络延迟>24ms时，应消除可听见回声干扰延时抖动要求：CD质量音频，网络延迟抖动不应超过100ms电话质量语音，网络延迟抖动不应超过400ms虚拟现实语音，网络延迟抖动不应超过20ms~30ms流媒体：流式传输的媒体称为流媒体或流式媒体流式传输方法：顺序流式传输：顺序下载，在线观看。

多媒体技术知识点整理

多媒体技术知识整理1.1.1 多媒体的含义和分类1、媒体的定义:人们用来与外界沟通和交流各种信息的载体,或者说是信息传递和信息存储的最基本的手段。

2、强调媒体的两层含义:一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。

3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体),最主要的媒体(表示媒体)。

4、表示媒体通常包含的几种媒体(多媒体数据的分类)文本:最基本声音(音频):三种表现形式(解说词、音效、背景音乐),具有很强的前后相关性,数据量大,实时性强图片、图像:图像主要以位图形式存放,是一种最基本的形式,图片一般以向量图形式存在。

视频影像:(静态和动态,真实的画面)动画:移动的主观设计的绘画(二维平面、三维立体),根据制作方法分为造型和帧动画两类。

05年高考题:分别指出WINDOWS系统中下列工具软件所处理的媒体,记事本(文本)、画图(图像)、录音机(声音)、CD唱机(声音)、媒体播放器(音频、视频)。

填空:___________、声音、图形、图像和动画等信息载体中的两个或多个的组合成为多媒体。

单:下列不属于多媒体技术中的媒体的范围是(A 存储信息的实体B 信息的载体 C 文本D 图像)A超文本是一个什么样的结构(A顺序的树形B非线性的网状C线性的层次D随机的链式)B 1.1.2 多媒体技术的概念1、多媒体技术的含义:以计算机技术为基础,综合处理图像、文本、声音、动画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统,具有集成性、交互性和实时性的特点。

2、多媒体技术的基本特征:集成性(综合性)、交互性、实时性。

集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义,基类媒体的概念。

05年高考题:多媒体作品与影视作品的主要区别是(A、共享性B集成性C交互性D传播性) C交互性是多媒体技术最基本的特征。

音频基础知识讲解

0.4 0
0.9
1
语言清晰度和其它声学概念的关系
语言清晰度和可懂度的关系
单句可懂度高于单词可懂度。
语言清晰度和声压级的关系在一定声压级范围内，语言清晰度是随声压级的增大而提高的，但达到一定值后，声压级的增大反而会使清晰度下降。语言清晰度和信噪比的关系在背景噪声较强的情况下，利用一定的手段提高信号的信噪比，可以使语言清晰度得以提高。
反射的规则：
1）入射线、反射线法线在同一侧。
2）入射线和反射线分别在法线两侧。 3）入射角等于反射角。Li=L
声波的折射
声波在传播途中，遇到不同介质的分界面时，除了发生反射外，还会发生折射。一般来说，只要是介质的密度、压强、温度或声阻不同，就应看做是两种介质，在其传播的速度就会发生变化，声波就会产生折射。
音色
音色又称音品，由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得最清楚的音称为基音，各次谐波的微小振动所产生的声音称泛音。单一频率的音称为纯音，具有谐波的音称为复音。
扩声系统指标——效果
主观：声音好听吗？舒服吗？——音色、音质客观：A、够响吗？——声压级 B、所有人都能听到吗？——覆盖范围、均匀度 C、听得清楚吗？——清晰度 D、反馈回授吗？——传声增益
混响声
混响声是指声源发出的声波经过室内界面多次反射，迟于早期反射声到达听音点的声音。
室内声音反射的几种情况
混响时间
混响时间（Reverberation Time），表示声音混响程度的参量，声源停止发声后，声压级减少60分贝所需要的时间，单位为秒。用T60或 RT表示。混响时间对音质有着很大的影响。混响时间短，有利于听音的清晰度，但过短则会感觉到声音干涩和响度变弱；混响时间长，有利于声音的丰满感，但过于长则会感到前后声音分辨不清，降低了听音的清晰度。

音频基础知识

⾳频基础知识CODEC图1基本⾳频输⼊输出系统框图1.模拟⾳频接⼝1.13.5mm接⼝1.1.1插座⾸先要了解前置⾳频插座的结构。

根据英特尔关于AC97前置⾳频接⼝的规范，机箱的前置⾳频⾯板采⽤两种3.5毫⽶微型插座：1开关型的，2⽆开关型的，见下图：开关型的2/3，4/5端是两个开关，当没有插头插⼊时，2/3，4/5端是连通的，当插头插⼊时2/3，4/5端断开。

⽆开关的就没有3，4两个开关端。

1.1.2⼆段三段四段3.5mm插头有⼏种规格，最常见的是三段式的，四段式的则在消费电⼦中应⽤越来越多，另外也有⼆段式的，通常⽤于麦克风⼆段、三段式插头如下图所⽰：⼆芯插头⼀般⽤于麦克，三芯插头⼀般⽤于⽴体声⾳⽿机（有源⾳箱）。

现在⼆芯插头很少，所以麦克也⽤三芯插头。

⽿机和麦克插头的接线定义如下图：四段式插头根据我们市⾯上出现的不同标准的⽿机插头，⽿机市场才将不同的⽿机接头⽅式划分为2个类别：N版和i版，N版⽿机主要是适⽤于NOKIA、MOTO、OPPO、BBK等⼿机，⽽我们的i版⽿机插头则主要适⽤于iphone、HTC、魅族和PC、MP3等电⼦数码通讯设备。

要了解清楚这个问题之前，我们先要认识我们⽿机插头的结构，在市⾯上销售的⽿机插头主要分为：2.5mm和3.5mm，⼜被分为单⾳⽿机插头、⽴体⽿机插头、四极⽿机插头、五极⽿机插头，主要普遍还是3.5mm见的居多，⼀般的3.5mm 的⽿机插头⼤多都是三段式的结构，看完下图你就清楚了！图为普通⽿机插头三段式结构N版⽿机和i版⽿机同样是3.5mm的标准，她们之所以适⽤于不⽤的⼿机类型，也正是因为她们的接头设计不同，N版和i版⼜有⼀个共同点，就是都采⽤的是4段式的⽿机插针的结构，不同的是N版的⽿机插头从左到右依次是左声道、右声道、麦克、地线，i版⽿机从左到右依次是左声道、右声道、地线、麦克。

详情请看下图：NOKIA⽿机插头四段式插头结构Iphone⼿机四段式⽿机插头结构1.2RCA接⼝：RCA接头就是常说的莲花头。

多媒体技术知识点整理

多媒体技术知识整理1.1.1 多媒体的含义和分类1、媒体的定义：人们用来与外界沟通和交流各种信息的载体, 或者说是信息传递和信息存储的最基本的手段。

2、强调媒体的两层含义: 一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。

3、国际通用定义媒体的分类：感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体（感觉媒体）, 最主要的媒体（表示媒体）。

4、表示媒体通常包含的几种媒体（多媒体数据的分类）文本: 最基本声音（音频）：三种表现形式（解说词、音效、背景音乐）, 具有很强的前后相关性, 数据量大, 实时性强图片、图像：图像主要以位图形式存放, 是一种最基本的形式, 图片一般以向量图形式存在。

视频影像：（静态和动态,真实的画面）动画: 移动的主观设计的绘画（二维平面、三维立体）, 根据制作方法分为造型和帧动画两类。

05年高考题：分别指出WINDOWS统中下列工具软件所处理的媒体, 记事本（文本）、画图（图像）、录音机（声音）、CD唱机（声音）、媒体播放器（音频、视频）。

、声音、图形、图像和动画等信息载体中的两个或多个的填空:组合成为多媒体。

单: 下列不属于多媒体技术中的媒体的范围是（A 存储信息的实体 B 信息的载体 C 文本 D 图像）A超文本是一个什么样的结构（A 顺序的树形B 非线性的网状C 线性的层次机的链式）B 1.1.2 多媒体技术的概念1、多媒体技术的含义 :以计算机技术为基础 , 综合处理图像、文本、声音、画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统有集成性、交互性和实时性的特点。

2、多媒体技术的基本特征 : 集成性（综合性）、交互性、实时性。

集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义 , 基类媒体的概念。

05年高考题:多媒体作品与影视作品的主要区别是（A 、共享性B 集成性C 交互性D 传播性）C 交互性是多媒体技术最基本的特征。

音频各个频段的基本知识

音频各个频段的基本知识[20－60Hz]影响音色的空间感，因为乐音的基音大多在这段频率以上，这段很难表现。

[60-100Hz]影响声音的混厚感，是低音的基音区。

如果这段频率很丰满，音色会显得厚实、混厚感强，如果不足，音色会变得无力；而如果过强，音色会出现低频共振声，有轰鸣声的感觉。

有大鼓、定音鼓，还有钢琴、大提琴、大号等少数存在极低频率的乐器多表现在此段。

[80－160Hz]主要表现音乐的厚实感，音响在这部分重放效果好的话，会感到音乐厚实、有底气。

这部分表现得好的话，在80Hz以下缺乏时，甚至不会感到缺乏低音。

如表现不好，音乐会有沉闷感，甚至是有气无力许多低音炮音箱的重放上限，具此可判断您的播放设备的频率上限。

[150－300Hz]影响声音的力度，尤其是男音的力度。

这段频率是男声声音的低频基音频率，同时也是乐音中和弦的根音频率。

[300－500Hz]表现人声的（唱歌、朗诵），这个频段上可以表现人声的厚度和力度，好则人声明亮、清晰，否则单薄、混浊。

[800Hz]影响音色的力度。

如果这个频率丰满，音色会显得强劲有力;如果不足，音色将会显得松弛，也就是800Hz 以下的成分特性表现突出了，低频成分就明显；而如果过多，则会产生喉音感。

如果喉音过多了，则会失掉语音的个性，适当的喉音则可以增加性感，因此，音响师把这个频率称为"危险频率"，人声，打击乐多表现于此。

[1kHz]是音响器材测试的标准参考频率，通常在音响器材中给出的参数是在1kHz下测试。

这是人耳最为敏感的频率。

[1.2kHz]可以适当多一点，不宜太多，可以提高声音的明亮度，过多会使声音发硬。

[2k-4kHz]穿透力很强。

人耳耳腔的谐振频率是1∽4KHz，所以人耳对这个频率也是非常敏感的。

2-4kHz对声音的亮度影响很大，这段声音一般不宜衰减。

这段对音乐的层次影响较大。

如果空虚频率成分过少，听觉能力会变差，语音显得模糊不清了。

如果过强了，则会产生咳声的感觉。

Adobe-Audition数字音频制作教程PPT完整全套教学课件精选全文

本章要点：
数字音频技术基础数字音频广播概述广播节目的录音要求音频采集设备广播节目音频制作流程
1.1 数字音频技术基础
数字音频技术是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术，它是随着数字信号处理技术、计算机技术以及多媒体技术的发展而形成的一种全新的声音处理手段。
1.1.1 音频技术的发展
第一个阶段是 20 世纪 50 年代出现的晶体管技术，代表着音频放大技术的巨大飞跃。
第二个发展阶段是 20 世纪 60 年代开始的集成电路技术的发展，它在降低成本的同时为音质的提高创造了条件。
第三个发展阶段是随着数字时代的新信号源的出现，人们对音质的需求更高了，同时对播放设备的小型化要求日益明显，此阶段，以 MP3 为代表的音频压缩技术被新型媒体广泛接受使用。
1．调幅广播质量的音频压缩编码技术 2．MPEG-1 3．MPEG-2 4．杜比AC-3
1.2 数字音频广播概述
广播技术有着很长的发展历史，传统的广播主要有 AM 调幅广播与 FM 调频广播，两者均是模拟广播方式，也是我国目前正在使用的广播方式。随着互联网和通信技术的发展，广播的接收质量和广播内容的丰富程度等指标被人们重视起来，而传统的模拟广播方式相关的指标参数并不优秀。由此看来，采用新的技术来改善模拟广播的缺陷或直接取代模拟广播有重大意义。
1.录音师广播节目的录音制作是一项综合性比较强的技术工作，录音师不仅要具有较高的文学艺术修养，还需要具有较全面的电声专业知识。
2.录音环境一档高质量的广播节目，除了要求录音师具备较高的综合素质之外，还
要根据节目性质选择具有符合声学特性的录音棚或者演播室。
1.4 音频采集设备
音频采集设备包括麦克风、录音笔、采访机、调音台、专业录音声卡等。 1.4.1 麦克风

声学基础知识学习(培训使用)

S=房间表面积的总和，单位为m2 a=房间表面的平均系声系数
混响时间
TR60<0.5s(500Hz) 声音清晰，但太:”干“，适宜于录音室。 TR60=0.6s～0.8s(500Hz) 声音清晰，干净，适合于电影院和会议室。 TR60=0.8s～1.2s(500Hz) 声音清晰，声音丰满，适合于带有小型演出和带有演出多功能会议室。 TR60=1.2s～1.4s(500Hz) 声音丰满，有气魄，空间感强，适合于音乐厅，大型演艺场所。 TR60>2s(500Hz) 声音丰满、语言清晰度差，声音发嗡，有回声感。
响度
响度定义：频率为1kHz、声压级为40dB的一个纯音所产生的响度为1宋。
人耳对响度的感觉与响度级并非成正比，如响度及增加10方，响度感觉
才增高了1倍。40方等于1宋。单位Sone(宋）。 N=20.1（LN-40) N—响度，单位宋（sone) LN—响度级，单位为方（phon)
响度曲线
声音的三要素：音调、音色、音量频率响应特性对音质的影响： 1、低频 150 以下的频率范围，是音频的基础部分，决定声音的丰满度 2、中低音150-500Hz,是声音的结构部门，决定声音的力度和低音的硬度 3、中高音500～4000Hz,是声音信息和声音清晰度的主要来源部分，它还决定声音的明亮度 4、高音 4000～12000Hz,是影响声音音质的主要部分，是声音的细节所在
梳妆滤波器产生的问题
梳状滤波器产生的问题 1、使系统的频响特性变得不平坦，系统音质发生变调 2、增强的频率容易引起声反馈，降低了系统传声增益如何改正梳状滤波器频响特性？
1、在一个建声条件活跃的房间中，梳状滤波器效应是无法避免的，为此，改进房间的建声
设计是减少梳状滤波器影响的最根本的措施 2、在分区式供声的多声源系统中，利用可调延时器，把格声源到达观众区的时间差尽量减到最小和尽量减小延时信号的振幅 3、采用集中供声方法可减少声源之间的声干涉 4、扬声器组或扬声器阵列中的高音扬声器尽量紧靠在一起，减小高频声波的形成差。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

的区域。声染色：由于房间频率相应的问题，原始声音在传播过程中被赋予了额外的声音特征。
倍频程
倍频程：通常将可闻频率范围内20~20KHz分为十个倍频带，其中心频率按2倍增长，共十一个，为： 16 31.5 63 125 500 1K 2K 4K 8K 16K
1/3倍频程：将倍频程再分成三个更窄的频带，使频率划分更加细化，其中心频率按倍频的1/3增长，为： 12.5 16 20 25 31.5 40 50 63
声音的三要素
响度
响度又称声强或音量，它表示的是声音能量的强弱程度，主要取决于声波振幅的大小。响度是听觉的基础。正常人听觉的强度范围为0dB—140dB。
音高
音高也称音调，表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低，频率高则音调高，反之则低，单位用赫兹(Hz)表示。
声波的基本量
声压
疏密波压力的大小称为声压。压力变化的幅度越大，听觉上声音越大，振幅小的声音小。单位Pa。引起人耳听到声音时的声压为可闻阈，它与声源的频率及人的年龄有关。使人的耳膜感到疼痛时的声压为痛阈。
声强
单位面积，单位时间内通过声音的能量称为声强(能量密度），单位w/m² 。
声功率
声源在单位时间内所发出的声能称为声功率，单位W（瓦）。
早期反射声
早期反射声是指延迟直达声50毫秒以内到达听音点的反射次数较少的声音，包括一次、二次或少数三次反射声。
混响声
混响声是指声源发出的声波经过室内界面多次反射，迟于早期反射声到达听音点的声音。
混响时间
混响时间（Reverberation Time），表示声音混响程度的参量，声源停止发声后，声压级减少60分贝所需要的时间，单位为秒。用T60或RT 表示。
常见声源的声压级-分贝
窃窃私语：20dB~35dB 人声语言：30dB~80dB 女高音：35dB~105dB 男高音：40dB~95dB 小提琴：40dB~100dB 打击乐：55dB~105dB 交响乐：20dB~120dB
本底噪声
在厅堂声学设计中，本底噪声是指房间内部自身振动或外来干扰而形成固有的噪声，大小仍以声压级dB的方式表示。
声音的基本性质
“声”由声源发出，“音”在传播介质中向外传播。
声音在固体中的传播速度最快，其次是液体，声音在气体中传播的速度最慢。
声波的基本量
f：频率，每秒钟振动的次数，单位Hz(赫兹）频率高的声音称为高音，
频率低的声音称为低音。声音是声波作用于人耳引起的主观感受，人耳对声波频率的主观感觉范围为20Hz~20kHz，通常称此范围为音频；低于20Hz为次声波，高于20kHz为超声波。
声波的反射
当声波遇到一块尺寸比波长大得多的障碍时，声波将被反射。类似于光在镜子上的反射。反射的规则： 1）入射线、反射线法线在同一侧。 2）入射线和反射线分别在法线两侧。 3）入射角等于反射角。Li=L
声波的反射
室内声音反射的几种情况
声波的散射
当障碍物的尺寸与声波相当时，将不会形成定向反射，而以障碍物为一子波源，形成扩散。
音色
音色又称音品，由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得最清楚的音称为基音，各次谐波的微小振动所产生的声音称泛音。单一频率的音称为纯音，具有谐波的音称为复音。
声音的叠加
单频率的正弦波称为纯音，声音是由基波和高次谐波组成
当两上或多个具有相同频率和振幅的正弦波信号叠加在一起，其合成的信号还具有同样的频率，其振幅由两原信号的相位关系所决定。当相位相同，振幅则会增加。当两个信号完全相反时，则全部抵消。
混响时间过短，声音发干，枯燥无味，不亲切自然。
混响时间过长，会使声音含混不清；合适时声音圆润动听。
参考混响时间
厅堂类型电影院参考混响时间 1.0 ~ 1.2 Sec
会议厅
音乐厅电视演播室语言录音室
1.0 ~ 1.4 Sec
1.5 ~ 1.8 Sec 0.8 ~ 1.0 Sec 0.3 ~ 0.4 Sec
分贝
分贝（decibel）dB 分贝是以美国发明家亚历山大·格雷厄姆·贝尔命名的，他因发明电话而闻名于世。因为贝尔的单位太粗略而不能充分用来描述我们对声音的感觉，因此前面加了“分”字，代表十分之一。一贝尔等于十分贝。声学领域中，分贝的定义是声源功率与基准声功率比值的对数乘以10的数值;其简单表达式lgA/B。而分贝，即dB＝10 lgA/B。单位为dB。根据公式计算以及工作中的经验，我们得出以下结论。功率增加一倍，声压增加3dB。距离增加一倍，声压减少6dB(自由声场的情况下) 在电声领域中，分贝这个量的变化关系恰恰和人耳的听觉强弱感受非常吻合，这也给声学计算打下了一个良好的基础。
分贝（dB） 120 110 100 场所
90 80 70 60 50 40 30
飞机起飞着路时，正下方列车通过铁路桥时，正下方地铁行车时，车厢内公共汽车内白天十字路口普通讲话安静的街头安静的办公室安静的住宅小区，白天安静的住宅小区，夜晚
声波的绕射
声波在传播过程中遇到障碍或孔洞时将发生绕射。绕射的情况与声波的波长和障碍物（或孔）的尺寸有关。
等响度曲线
人耳对不同频率的声音敏感程度是不一样的，对于底于 1000Hz和高于4000Hz的声音，灵敏度降低。不同频率，相同声压级的声音，人听起来的响度感觉不一样。以1000Hz连续纯音作基准，测听起来和它同样响的其他频率的纯音的各自声压级构成一条曲线叫“等响曲线”。响度单位是“方”。随着声压级的提高，对频率的相对敏感度也不同声压级高，相对变化感觉小；声压级低，相对变化感觉大。
：波长，在传播途径上，两相邻同相位质点距离。单位m(米)。声波完
成一次振动所走的距离。
C：声速，声波在某一介质中1秒钟传播的距离。单位m/s。
声速受温度的影响，用下式表示为：C=331.5+0.6t (m/s)
声波的/f
通过计算波长我们可知道最高可听声和最低可听声的范围
的能力，还能够分辨出声像的方向和深度，并感受到
空间感及纵深感。
人耳的结构
人耳的结构：外耳、中耳、内耳、骨传导
听觉范围
最高最低频率可听极限
一般地，青少年20~20KHz,中年30~15KHz,老年 100~10KHz。
最小最大可听极限
人耳有一定的适应性，常人上限为120dB,经常噪声暴露的人有可能达到135~140dB。下限频率与频率有关。最小可辩阈（差阈）声压级变化的察觉：一般是1dB 3dB以上有明显感觉频率变化的察觉：一般是3%，低频时3Hz。
80 100 125 160 ...
频谱与音质的关系
在评价乐器或声音时，频谱结构在很大程度上决定声音的音质。了解声音频谱与音质的内在关系，有助于声音的调整和修饰。这对声音的前期处理喝后期加工都是十分必要
的。
频谱划分高频段：7kHz以上中高频段：2kHz~7kHz 中低频段：500Hz~2kHz 低频段：500Hz以下
不同材料，不同的构造对声音具有不同的性能。在隔声中希望用透射系数小的材料防止噪声。在音质设计中需要选择吸声材料，控制室内声场。
声音在室内传播
当一个声源在室内发声，任一点听到的声音按照先后顺序分为直达声、早期反射声和混响声。
声音在室内传播
直达声
直达声是室内任一点直接接收到声源发出的声音，是接收声音的主体，不受空间界面的影响。
0.16V RT 60 Sa
V:房间的容积,单位为立方米(M3) S:房间表面积的总和,单位为(M2) ā :房间表面的平均吸声系数,百分率，
ā=S1a1+S2a2+…Snan÷S1+S2+…SN
S1…Sn和a1…an：分别代表房间表面的每个面的面积和它们的吸声系数
混响时间
房间的混响长短是由它的吸音量和体积大小所决定的，体积大且吸音量小的房间，混响时间长，吸收强且体积小的房间，混响时间就短。
良
优
0
0.1
0.2
0.3
0.4 0.5
0.6
0.7
0.8
0.9
1
语言清晰度和其它声学概念的关系
语言清晰度和可懂度的关系
单句可懂度高于单词可懂度。
语言清晰度和声压级的关系
在一定声压级范围内，语言清晰度是随声压级的增大而提高的，但达到一定值后，声压级的增大反而会使清晰度下降。
语言清晰度和信噪比的关系
频谱与音质的关系
低频声音的低频成分多，声音有气魄、厚实、有力、有温暖
感、柔和、圆润、丰满；低频成分过多，声音浑浊、沉重、
有隆隆声；低频成分适中，声音丰满低沉、坚实；低频成分过少，声音可能会比较干净，但是单薄无力。
人耳听觉特性和有关问题
声音是一种物理现象，人耳听到后的感受则是一种心理现象。人耳具有分辨声音的强度、音调及音色
厅堂的本底噪声是建筑声学设计以及专业音响工程需要涉及和控制的一个基本物理量，它的大小、处理方式对厅堂的声学环境有着重要意义。由于本底噪声主要来自于外界环境噪声和振动、设备噪声和振动两个方面。在音响工程中，这两方面的内容都会不同程度上的涉及：一是在建筑上进行隔声，二是在设备上降低噪声。
十一、各种场所的噪声级
录音控制室多轨录音棚
0.3 ~ 0.4 Sec 0.6 Sec
回声
比听到直达声迟50毫秒以上，可以从直达声中分离出来的反射声叫做回声。
混响是来自于很多的反射声，听到的是连续的衰减声音。回声是可以清晰的分离出来听到的反射声。回声使声音的清晰度明显下降，房间越大，墙壁反射性越强越容易产生，增加墙壁的吸声能力，改变墙壁的角度可以防止回声。
语言清晰度（可懂度）

1.2.1基础音频知识

合集下载

1.2.1声纳参数及声纳方程 - 声纳参数及声纳方程

数字音频基础

影音设计知识点总结大全

91248-数字音频技术基础-第二讲

(完整版)多媒体技术知识点整理

数字音频基础知识

音频基础知识

数字音频知识点

《音频技术基础知识》PPT课件

数字音频知识点

多媒体技术知识点整理

音频基础知识讲解

音频基础知识

多媒体技术知识点整理

音频各个频段的基本知识

Adobe-Audition数字音频制作教程PPT完整全套教学课件精选全文

声学基础知识学习(培训使用)

文档推荐

最新文档