数字音频基础

格式：pptx
大小：1.70 MB
文档页数：54

下载文档原格式

第03章_数字音频基础

3.2.2 量化（Quantization）
量化是指用若干比特表示一个样本的过程；表示一个样本所使用的比特数称为量化深度（bit depth）。常见的量化深度有 4 比特、8 比特、16 比特、32 比特等等。不难理解，量化实际上是一个对声音样本的幅值进行离散化处理的一个过程。虽然采样已经在时间上将模拟信号离散化了，但是样本的大小（即幅值）仍然有无限种可能的取值（所以本质上还是连续量），而数字系统只能表示有限种状态，例如，用 8 个比特表示样本大小的话，则只能有 256 种取值。所以，量化是一个将无限多种可能取值归结为有限多个数字值的过程。通常，系统会将一个样本以最接近其值大小的数字表示。总之，采样是时间上的离散化，而量化则是空间上的离散化。需要强调的是，量化深度也是影响数字音频信号质量的重要因素。4 比特只有 16 种取值，显然，试图通过这样少数几个状态来恢复原始模拟音频信号是十分困难的。但是，量化深度越多，数据量也会越大，传输和存储的压力自然越大。所以，也需要根据实际应用环境来采用合适的量化深度。例如，一般的网络音频应用采用了 8 位的量化深度，CD 音频的量化深度则是 16 比特，而有些高级数字音频系统采用了 32 位的量化深度。 3.2.3 编码（Coding）在采样、量化处理后，模拟音频数字化的第三个步骤是编码。编码实际上是以某种格式最终生成数字音频数据流的过程，所得到的数字音频数据将会被存储、传输或者进行各种处理。本章第 3 节将介绍几种重要的音频编码技术。需要读者注意的是，把数字化过程分解成采样、量化、编码三个阶段实际上是一种简化描述，各种不同的数字音频技术会有不同的采样、量化与编码机制，特别是量化与编码往往是同步进行的，而且编码还包括后续的数据流格式化。因此，多数介绍数字音频技术的教科书或学术著作在提到音频编码的时候，都将这三个步骤合称为编码系统或编码技术，并在编码系统的框架下对整个模数转换过程进行整体性介绍。本教程下面的阐述也沿用了这一模式。

数字音频基础知识

第一章数字音频基础知识重要内容⏹声音基础知识⏹结识数字音频⏹数字音频专业知识第1节声音基础知识1.1 声音旳产生⏹声音是由振动产生旳。

物体振动停止，发声也停止。

当振动波传到人耳时，人便听到了声音。

⏹人能听到旳声音，涉及语音、音乐和其他声音（环境声、音效声、自然声等），可以分为乐音和噪音。

✦乐音是由规则旳振动产生旳，只包具有限旳某些特定频率，具有拟定旳波形。

✦噪音是由不规则旳振动产生旳，它包具有一定范畴内旳多种音频旳声振动，没有拟定旳波形。

1.2 声音旳传播⏹声音靠介质传播，真空不能传声。

✦介质：可以传播声音旳物质。

✦声音在所有介质中都以声波形式传播。

⏹音速✦声音在每秒内传播旳距离叫音速。

✦声音在固体、液体中比在气体中传播得快。

✦15ºC 时空气中旳声速为340m/s 。

1.3 声音旳感知⏹外界传来旳声音引起鼓膜振动经听小骨及其他组织传给听觉神经，听觉神经再把信号传给大脑，这样人就听到了声音。

⏹双耳效应旳应用：立体声⏹人耳能感受到（听觉）旳频率范畴约为20Hz~20kHz，称此频率范畴内旳声音为可听声(audible sound)或音频(audio)，频率<20Hz声音为次声，频率>20kHz声音为超声。

⏹人旳发音器官发出旳声音（人声）旳频率大概是80Hz～3400Hz。

人说话旳声音（话音voice / 语音speech）旳频率一般为300Hz～3000 Hz（带宽约3kHz）。

⏹老式乐器旳发声范畴为16Hz (C2)～7kHz(a5)，如钢琴旳为27.5Hz (A2)～4186Hz(c5)。

1.4 声音旳三要素⏹声音具有三个要素：音调、响度（音量/音强）和音色⏹人们就是根据声音旳三要素来辨别声音。

音调（pitch ）⏹音调：声音旳高下（高音、低音），由“频率”（frequency）决定，频率越高音调越高。

✦声音旳频率是指每秒中声音信号变化旳次数，用Hz 表达。

例如，20Hz 表达声音信号在1 秒钟内周期性地变化20 次。

数字音频基础

采样量化
编码
压缩
音频文件
100101100011101
模拟信号的数字化过程
一、声音的数字化过程
1. 采样（Sampling） • 对振幅随时间连续变化的模拟信号波形按一定的时间间隔取出样值，形成在时间上不连续的脉冲序列，称之为采样。 2. 量化（Quantization） • 将采样值相对于振幅进行离散的数值化的操作称为量化。即将模拟信号的幅度，在动态范围内划分为相等间隔的若干层次，把采样输出的信号电平按照四舍五入的原则归入最靠近的量值。 3. 编码（Coding） • 把采样、量化所得的量值变换为二进制数码的过程称为编码。 4. 压缩（Compress）目的是减少数据量与提高传输效率。依据：声音信息中存在着多种冗余；听觉器官的不敏感性；采样的标本中存在着相关性。
例2
例3
一般播音员的播音频率是４kHz，采用8bit的采用精度单声道进行采样的时候，计算该播音员播音１０分钟的数据量为：
８kHz＊１０＊６０ ≈ 4.5MB
例4
以CD音质（44.1kHz的采样频率，16位立体声形式）记录一首５分钟的乐曲所需的存储容量为： 44 100（Hz）×（16/8）（B）×2×５×60 ≈ 51600kB
705.6
立体声
1411.2
立体声
1536
第2节常用音频格式介绍
• WAV文件(.wav)
– WAV——Wave，波形文件 – 由Microsoft和IBM联合开发的音频文件格式 – 特点：层次丰富、还原性好、表现力强；数据量大；应用广泛
• CD-DA文件(.cda)
– 标准激光盘文件 – 特点：数据量大，音质好
• AIFF文件(.aif/.aiff)

数字音频基础知识

一般来说，无损压缩比率在源文件的50–60%左右，而有损压缩可以达到原文件的5–20%。
3.6常见的数字音频文件格式
常见的数字音频文件格式有很多，每种格式都有自己的优点、缺点及适用范围。
CD格式——天籁之音
CD音轨文件的后缀名为：cda
标准CD格式是44.1K的采样频率，速率88K/秒，16位量化位数，近似无损的。
数字音频基础知识
转换（A/D）技术将模拟音频转化为二进制数，这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号，模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。
3.2采样
采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本，把连续的模拟量用一个个离散的点表示出来，使其成为时间上离散的脉冲序列。
特点：音质好，压缩比比较高，被大量软件和硬件支持，应用广泛。
适用于：适合用于一般的以及比较高要求的音乐欣赏。
MIDI——作曲家的最爱
MIDI（Musical Instrument Digital Interface）乐器数字接口。
MIDI数据不是数字的音频波形，而是音乐代码或称电子乐谱。
MIDI文件每存1分钟的音乐只用大约5～10KB。
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用。
我们希望音质越高越好，磁盘存储空间越少越好，这本身就是一个矛盾。必须在音质和磁盘存储空间之间取得平衡。数据量与上述三要素之间的关系可用下述公式表示：
3.4编码
采样和量化后的信号还不是数字信号，需要把它转换成数字编码脉冲，这一过程称为编码。最简单的编码方式是二进制编码，即将已经量化的信号幅值用二进制数表示，计算机内采用的就是这种编码方式。

数字音频基础

数字音视频技术
ISDB T(日本)或8 VSB(美国)调制方式; (2)卫星传输:采用 QPSK 调制方式; (3)有线传输:采用 M QAM 或16 VSB
高数据率调制方式,根据有线信道的不同特性,分别采用16/32/128/256 QAM 等方式。
数字音视频技术
三种。DVB－S (QPSK 调制方式)主要用于数字电视卫星广播系统;DVB －T(OFDM 调制方式)则用于地面无线发射的数字电视广播系统;DVB－C(QAM 调制方式)主要为地面 HFC(Hybrid FiberCoaxnetworks,混合光纤同轴电缆网)网络数字电视广播所采用。
数字音视频技术
• 图6－1 数字电视系统的基本原理框图
数字音视频技术
下,对反映信源全部信息的数字信号进行变换,用尽量少的数字脉冲来表示信源产生的信息,这就是压缩编码。
信道编码器包括纠错编码和数字调制,主要解决数字信号传输的可靠性问题, 故又称为抗干扰编码。经过纠错编码的传输码流具有检错和纠错的能力,其作用是最大限度地减少在信道传输中的误码率,然后将经过纠错编码后的传输码流调制成适合于在信道上传输的波形。
数字音视频技术
6.2 二进制数字调制及其抗噪声性能分析
6.2.1 二进制数字幅移键控(2ASK) 1.2ASK 调制原理数字幅度调制又称幅移键控(ASK),二进制幅移键控记作
2ASK。2ASK 是利用代表数字信息“0”或“1”的基带矩形脉冲去键控一个连续的载波,使载波时断时续地输出。有载波输出时发送“1”,无载波输出时发送“0”。
–按照声音的来源以及作用来看，可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑，感叹等；乐音也可成为音乐，是指人类通过相关乐器演奏出来的声音，如影视作品中的背景声音，一般起着渲染气氛的作用；响音是指除语言和音乐之外电影中所有声音的统称，如动作音响、自然音响、背景音响、机械音响、特殊音响。

91248-数字音频技术基础-第二讲

听小骨
1.2 声音的物理特性（频率）
11
• 频率即每秒钟内来回往复振动的次数。 • 频率的单位通常用Hz（赫兹）来表示，简称赫。 • 声波的频率就是声源振动的频率。
岭南师范学院
1.2 声音的物理特性（振幅）
12
• 振动物体（声音）离开平衡位置的最大距离叫振幅。 • 振幅越大，振动物体（声音）释放的能量越多。 • 振幅决定声音的高低。
岭南师范学院
小提琴
钢琴
1.4 声音的录制与重现
19
唱片
岭南师范学院
数识（下） 20
掌握数字音频的四要素掌握数字音频的常见格式
第2课数字音频基础知识（下）
21
岭南师范学院
1.5 数字音频的概念（音频数字化）
22
数字世界中的声音 • 数字世界中的声音以0和1的形式存储。
0–5,512 Hz
22,050 Hz
Near FM radio
0–11,025 Hz
32,000 Hz Better than FM radio
0–16,000 Hz
44,100 Hz
CD
0–22,050 Hz
48,000 Hz
Standard DVD
0–24,000 Hz
96,000 Hz
Blu-ray DVD
1.6 数字音频的常见格式
41
岭南师范学院
无损
wav
flac
ape
有损
mp3
wma
aac
1.6 数字音频的常见格式（Audition支持） 42
岭南师范学院
43
The End
岭南师范学院
9
• 由计算机通过专门定义的语言来驱动音乐合成器产生的声音（如电子乐器）

数字音频与视频处理基础概述

数字音频与视频处理基础概述数字音频和视频处理是指将音频和视频信号转换为数字数据，在数字领域中进行编辑、处理、存储和传输的过程。

随着技术的发展，数字音频和视频处理已经成为了现代娱乐、广告、电影、音乐制作和通信等行业的重要组成部分。

本文将为读者介绍数字音频和视频处理的基本概念、技术原理和应用领域。

数字音频处理通过采样和量化将连续的模拟音频信号转换为离散的数字信号。

采样是指在一定的时间间隔内对音频信号进行采集，量化是指将采集到的连续数值转换为离散数值。

音频的采样率和位深度是影响数字音频质量的重要参数。

采样率是指每秒钟采集的样本数，常用的采样率有44.1kHz。

位深度指的是每个样本的精度，常用的位深度有16位和24位。

采样率和位深度的提高可以增加音频的精度和还原度。

数字音频的处理技术包括音频编辑、音频合成、音频效果处理等。

音频编辑是指对音频进行剪切、拼接、淡入淡出等操作，以达到制作和编辑音频的目的。

音频合成是指通过合成器、乐器或录音等手段将不同声音信号进行合成，生成新的音频文件。

音频效果处理包括均衡器、混响、压缩、去噪、变调等，可以改变音频的频谱、声音质量和音量。

数字视频处理涉及到视频的采集、编码、解码、编辑和特效处理等。

数字视频的采集是使用像素阵列传感器将连续的光学图像转换为数字信号。

编码是指将视频信号压缩成较小的数据量，并通过某种编码标准将视频流保存或传输。

解码是指将编码后的视频信号恢复为原始的像素数据。

常见的视频编码标准包括H.264、H.265和MPEG-4等。

视频编辑是指对视频进行剪切、拼接、添加字幕、调整速度和色彩等操作。

视频特效处理包括调色、去噪、特效添加、画面稳定等，可以改变视频的视觉效果和质量。

数字音频和视频处理广泛应用于各个领域。

在娱乐领域，数字音频和视频处理使得音乐和电影制作变得更加简便和高效。

音频的数字处理技术可以对乐器音色进行调整，添加声音效果，使得音乐制作更富有个性和创意。

视频的数字处理技术可以对电影进行后期制作，包括特效制作和颜色分级。

数字音频技术基础

27
音频的基础知识
MIDI基本简介
MIDI仅仅是一个通信标准，它是由电子乐器制造商们建立起来的，用以确定电脑音乐程序、合成器和其他电子音响的设备互相交换信息与控制信号的方法。 MIDI系统实际就是一个作曲、配器、电子模拟的演奏系统。从一个MIDI设备转送到另一个MIDI设备上去的数据就是MIDI信息。MIDI数据不是数字的
25
音频的基础知识
音频文件格式简介
*.MID、*.RMI、*.CMF、*.RCP 这些文件格式属于MIDI文件范畴，这类文件主要应用于计算机音乐创作，用户可以通过专业的音频创作软件实现谱曲，
或直接通过声卡MIDI接口将外部音序器演奏的乐曲输入到计算
机中完成音乐创作 MOD MOD的结构类似于MIDI，是一种类似于波表的音乐格式，
•音频信号的数字处理
（2）量化
采样只是在时间上实现了离散化。其音频脉冲信号的幅度仍然是模拟的，因此，还必须对幅度进行离散化处理，这个过程称为量化。
量化的过程如下：
16
音频的基础知识
•音频信号的数字处理
（3）编码
编码：采样和量化之后的音频信号还必需转换为数字编码脉冲才是数字信号，这一转换过程称为编码。最简
杂波不会积累
12
音频的基础知识
音频信号的A/D和D/A变换：
• A/D变换模拟信号变换成数字信号
• D/A变换数字信号转换为模拟信号
2).声音数字化过程
模拟信号
采样
量化
A/D ADC D/A DAC
编码
数字信号
模拟信号
声音是如何数字化的呢？
数字信号
图1-10 模拟信号的数字处理过程
13

数字音频技术基础

20~20000 20~20000
脉冲编码调制（PCM）
PCM的特点

概念最简单、理论最完善的编码系统；最早研制、使用最广泛的编码系统；数据量最大的编码系统。
原理
模拟声音信号输入防失真滤波器波形编码器 (采样器) PCM样本
÷
量化器
量化

分为均匀量化和非均匀量化。采用的量化方法不同，量化后的数据量不同，可以说量化是一种压缩数据的方法
数字音频技术基础
Part Part 1 1 数字音频技术基础
数字音频技术基础声音声音信号数字化
采样与量化
音频质量与数据量音频文件的存储格式语音合成与语音识别技术
声音
声波是由机械振动产生的波。当声波进入人耳，鼓膜振动导致内耳里的微细感骨的振动，将神经冲动传向大脑，听者感觉到的这些冲动就 A 是声音。周期

声道数：一次采样的声音波形个数。采样频率指计算机每秒钟采集多少个声音样本。
采样
音频是连续的时间函数X(t),对连续信号采样，即按一定的时间间隔(T)取值，得到X(nT)(n为整数)，T称为采样周期、1/T称为采样频率。

X(0)、X(T)、X(2T)称为采样值。
采样频率与声音频率之间有一定的关系，根据奈奎斯特（Nyquist）理论，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原成为原来的声音。
频域——声音的频率范围
声音的方向
以振动波的形式从声源向四周传播。
1.
从声源直接到达人类听觉器官的声音称为“ 直达声”，直达声的方向辨别最容易。
2.
现实生活中，森林、建筑、各种地貌和景物存在于人们的周围，声音从声源发出后，一般须经过多次反射才能被人们听到，这就是 “反射声”。

音频基础知识

一. 音频基础知识1. 音频编解码原理数字音频的出现，是为了满足复制、存储、传输的需求，音频信号的数据量对于进行传输或存储形成巨大的压力，音频信号的压缩是在保证一定声音质量的条件下，尽可能以最小的数据率来表达和传送声音信息。

信号压缩过程是对采样、量化后的原始数字音频信号流运用适，当的数字信号处理技术进行信号数据的处理，将音频信号中去除对人们感受信息影响可以忽略的成分，仅仅对有用的那部分音频信号，进行编排，从而降低了参与编码的数据量。

数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余，包括时域冗余、频域冗余和听觉冗余。

1.1 时域冗余A．幅度分布的非均匀性：信号的量化比特分布是针对信号的整个动态范围而设定的，对于小幅度信号而言，大量的比特数据位被闲置。

B．样值间的相关性:声音信号是一个连续表达过程，通过采样之后，相邻的信号具有极强的相似性，信号差值与信号本身相比，数据量要小的多。

C．信号周期的相关性:声音信息在整个可闻域的范围内，每个瞬间只有部分频率成分在起作用，即特征频率，这些特征频率会以一定的周期反复出现，周期之间具有相关关系。

D．长时自我相关性:声音信息序列的样值、周期相关性，在一个相对较长的时间间隔也会是相对稳定的，这种稳定关系具有很高的相关系数。

E．静音:声音信息中的停顿间歇，无论是采样还是量化都会形成冗余，找出停顿间歇并将其样值数据去除，可以减少数据量。

1.2 频域冗余A．长时功率谱密度的非均匀性：任何一种声音信息，在相当长的时间间隔内，功率分布在低频部分大于高频部分，功率谱具有明显的非平坦性，对于给定的频段而言，存在相应的冗余。

B．语言特有的短时功率谱密度:语音信号在某些频率上会出现峰值，而在另一些频率上出现谷值，这些共振峰频率具有较大的能量，由它们决定了不同的语音特征，整个语言的功率谱以基音频率为基础，形成了向高次谐波递减的结构。

1.3 听觉冗余根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型，将通过听觉领悟信息的复杂过程，包括接受信息，识别判断和理解信号内容等几个层次的心理活动，形成相应的连觉和意境，由此构成声音信息集合中的所以数据，并非对人耳辨别声音的强度、音调、方位都产生作用，形成听觉冗余，由听觉冗余引出了降低数据率，实现更高效率的数字音频传输的可能。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

–二是采样频率，即采样点之间的时间间隔。
• 两者与音质还原的关系是：采样频率越高，量化深度越大，声音质量越好。
数字音视频技术
2020/11/19
13
1.1.2音频的数字化过程
• 横坐标是时间轴（采样频率），纵坐标是幅度值（量化分辨率），曲线代表的是模拟信号对应的波动曲线，带颜色的方格是采样量化后的所得结果。
数字音视频技术
采样量化
2020/11/19
14
1.1.2音频的数字化过程
• 由图中可以得知，当频率越小（时间间隔越短），量化深度（量化分辨率）越大，二者的轮廓越吻合，这也说明数字化的信号能更好的保持模拟音频信号的形状，有利于保持原始声音的真实情况。
数字音视频技术
2020/11/19
15
1.1.2音频的数字化过程
• 振幅是指发声物体在振动时偏离中心位置的幅度，代表发声物体振动时动势能的大小。振幅是由物体振动时所产生的声音的能量或声波压力的大小所决定的。声能或声压愈大，引起人耳主观感觉到的响度也愈大。
• 音色是指声音的纯度，它由声波的波形形状所决定。即使某种声音它们的振动和频率都一样，也就是说它们的音调高低，声音强弱都相同，但它们的波形不一样，所以听起来就会有明显的区别。
• 音频数字化一般经过三个阶段“采样——量化——编码”。
数字音视频技术
2020/11/19
11
1.1.2音频的数字化过程
音频数字化过程的具体步骤包括：
第一步，将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集，这个过程就叫采样；
第二步，将采集到的样本电压或电流值进行等级量化处理，这个过程就是量化；
–按照声音的来源以及作用来看，可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑，感叹等；乐音也可成为音乐，是指人类通过相关乐器演奏出来的声音，如影视作品中的背景声音，一般起着渲染气氛的作用；响音是指除语言和音乐之外电影中所有声音的统称，如动作音响、自然音响、背景音响、机械音响、特殊音响。
• 在数字音频的衡量指标中，采样频率的单位是 HZ，量化深度一般用比特（Bit）来度量。例如：某一音频的数字化指标是44.1kHZ，8个比特位。那么这里的44.1kHZ比较容易理解，但8 比特位并不是说把某一单位的电压（电流）值成8份，而是分成28＝256份；同理16位是把纵坐标分成216＝65536份。
数字音视频技术
2020/11/19
9
1.1.2数字音频
• 数字音频是指用一连串二进制数据来保存的声音信号。
数字音视频技术
2020/11/19
10
1.1.2音频的数字化过程
• 数字化的音频信号两种途径：
–第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频；
–第二种途径就是在数字化设备中创作出数字音频，比如电子作曲。
1.4 数字音频的格式以及转换
1.4.1 常见的数字音频格式 1.4.2 不同音频格式间的转换 1.4.3 音频格式转换应用实例
1.5 数字音频编辑软件
数字音视频技术
2020/11/19
1
1.1数字音频基础
2.1.1音频的概念及特性
• 物理学上，声音被看成一种波动的能量，即声波。同时在物理学上，一般用声音的三个基本特性来描述声音，即频率、振幅和波形。
• 通常情况下，在音频数字化的过程中，设置的采集频率可已选择三种：32kHz、44kHz、 48kHz。特别是在CD制作过程中，一般的采样频率是44.1kHz，那么为什么会设置这三个档次呢？
数字音视频技术
2020/11/19
16
1.1.2音频的数字化过程
• 如图，上半部分表示原始音频的波形；下半部分表示录制后的波形；红色的点表示采样点。
数字音视频技术
2020/11/19
6
数字音视频技术
2020/11/19
7
数字音视频技术
2020/11/19
8
1.1.2 音频数字化
• 模拟音频信号。一般，模拟信号在时间或者空间维度上可以无限制的细分下去。模拟信号最大的特点就是它是一种连续的不间断的信号。
• 对音频模拟信号进行处理时，一般采用模拟的技术手段。电器元件是将连续的原始信号的变化形式原封不动的传递给下一单元，这就是模拟的处理方式。
数字音视频技术
采样频率对波形的影响
2020/11/19
17
1.1.2音频的数字化过程
• 上下波形之所以不吻合，是因为采样点不够多，或是采样频率不够高。这种情况关于合理的采样频率这一问题在Nyquist（奈奎斯特）定理中早已有明确的答案：要想不产生低频失真，则采样频率至少是录制的最高频率的两倍（上图中，采样频率只是录制频率的4/3倍）。这个频率通常称作Nyquist极限。，称之为低频失真。
数字音视频技术
2020/11/19
4
1.1.1音频的概念及特性
数字音视频技术
2020/11/19
5
1.1.1音频的概念及特性
• 声音的分类
–按照人耳可听到的频率范围，声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20～ 20000赫兹间。声音高于20000赫兹为超声波，低于 20赫兹为次声波。
第三步将等级值变换成对应的二进制表示值（0和1），并进行存储，这个过程就是“编码”。
通过这三个环节，连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。
数字音视频技术
2020/11/19
12
1.1.2音频的数字化过程
• 数字化过程两个指标：
–一是量化深度，也可称之为量化分辨率，是指单位电压值和电流值之间的可分等级数；
第1章数字音频基础
• 1.1数字音频基础
1.1.1 音频的概念以及特征 1.1.2 音频数字化
1.2 音频的处理设备
1.2.1 模拟音频处理设备 1.2.2 数字音频处理设备
1.3 数字音频的获取
1.3.1 使用录音笔录音 1.3.2 在计算机录音工作室中录音 1.3.3 从Internet上搜索和下载
• 生理学上，声音是指声波作用于听觉器官所引起的一种主观感觉。如响度、音调、音色和音长等。
数字音视频技术
2020/11/19Fra bibliotek2数字音视频技术
2020/11/19
3
1.1.1音频的概念及特性
• 在物理学上声音的三个基本特性：频率、振幅和波形，对应到人耳的主观感觉就是音调、响度和音色。
• 所谓频率即发声物体在振动时，单位时间内的振动的次数，单位为赫兹（HZ）。

数字音频基础

合集下载

第03章_数字音频基础

数字音频基础知识

数字音频基础

数字音频基础知识

数字音频基础

91248-数字音频技术基础-第二讲

数字音频与视频处理基础概述

数字音频技术基础

数字音频技术基础

音频基础知识

文档推荐

最新文档