数字音频基础
- 格式:pptx
- 大小:1.70 MB
- 文档页数:54
第一章数字音频基础知识重要内容⏹声音基础知识⏹结识数字音频⏹数字音频专业知识第1节声音基础知识1.1 声音旳产生⏹声音是由振动产生旳。
物体振动停止,发声也停止。
当振动波传到人耳时,人便听到了声音。
⏹人能听到旳声音,涉及语音、音乐和其他声音(环境声、音效声、自然声等),可以分为乐音和噪音。
✦乐音是由规则旳振动产生旳,只包具有限旳某些特定频率,具有拟定旳波形。
✦噪音是由不规则旳振动产生旳,它包具有一定范畴内旳多种音频旳声振动,没有拟定旳波形。
1.2 声音旳传播⏹声音靠介质传播,真空不能传声。
✦介质:可以传播声音旳物质。
✦声音在所有介质中都以声波形式传播。
⏹音速✦声音在每秒内传播旳距离叫音速。
✦声音在固体、液体中比在气体中传播得快。
✦15ºC 时空气中旳声速为340m/s 。
1.3 声音旳感知⏹外界传来旳声音引起鼓膜振动经听小骨及其他组织传给听觉神经,听觉神经再把信号传给大脑,这样人就听到了声音。
⏹双耳效应旳应用:立体声⏹人耳能感受到(听觉)旳频率范畴约为20Hz~20kHz,称此频率范畴内旳声音为可听声(audible sound)或音频(audio),频率<20Hz声音为次声,频率>20kHz声音为超声。
⏹人旳发音器官发出旳声音(人声)旳频率大概是80Hz~3400Hz。
人说话旳声音(话音voice / 语音speech)旳频率一般为300Hz~3000 Hz(带宽约3kHz)。
⏹老式乐器旳发声范畴为16Hz (C2)~7kHz(a5),如钢琴旳为27.5Hz (A2)~4186Hz(c5)。
1.4 声音旳三要素⏹声音具有三个要素:音调、响度(音量/音强)和音色⏹人们就是根据声音旳三要素来辨别声音。
音调(pitch )⏹音调:声音旳高下(高音、低音),由“频率”(frequency)决定,频率越高音调越高。
✦声音旳频率是指每秒中声音信号变化旳次数,用Hz 表达。
例如,20Hz 表达声音信号在1 秒钟内周期性地变化20 次。
数字音频与视频处理基础概述数字音频和视频处理是指将音频和视频信号转换为数字数据,在数字领域中进行编辑、处理、存储和传输的过程。
随着技术的发展,数字音频和视频处理已经成为了现代娱乐、广告、电影、音乐制作和通信等行业的重要组成部分。
本文将为读者介绍数字音频和视频处理的基本概念、技术原理和应用领域。
数字音频处理通过采样和量化将连续的模拟音频信号转换为离散的数字信号。
采样是指在一定的时间间隔内对音频信号进行采集,量化是指将采集到的连续数值转换为离散数值。
音频的采样率和位深度是影响数字音频质量的重要参数。
采样率是指每秒钟采集的样本数,常用的采样率有44.1kHz。
位深度指的是每个样本的精度,常用的位深度有16位和24位。
采样率和位深度的提高可以增加音频的精度和还原度。
数字音频的处理技术包括音频编辑、音频合成、音频效果处理等。
音频编辑是指对音频进行剪切、拼接、淡入淡出等操作,以达到制作和编辑音频的目的。
音频合成是指通过合成器、乐器或录音等手段将不同声音信号进行合成,生成新的音频文件。
音频效果处理包括均衡器、混响、压缩、去噪、变调等,可以改变音频的频谱、声音质量和音量。
数字视频处理涉及到视频的采集、编码、解码、编辑和特效处理等。
数字视频的采集是使用像素阵列传感器将连续的光学图像转换为数字信号。
编码是指将视频信号压缩成较小的数据量,并通过某种编码标准将视频流保存或传输。
解码是指将编码后的视频信号恢复为原始的像素数据。
常见的视频编码标准包括H.264、H.265和MPEG-4等。
视频编辑是指对视频进行剪切、拼接、添加字幕、调整速度和色彩等操作。
视频特效处理包括调色、去噪、特效添加、画面稳定等,可以改变视频的视觉效果和质量。
数字音频和视频处理广泛应用于各个领域。
在娱乐领域,数字音频和视频处理使得音乐和电影制作变得更加简便和高效。
音频的数字处理技术可以对乐器音色进行调整,添加声音效果,使得音乐制作更富有个性和创意。
视频的数字处理技术可以对电影进行后期制作,包括特效制作和颜色分级。
一. 音频基础知识1. 音频编解码原理数字音频的出现,是为了满足复制、存储、传输的需求,音频信号的数据量对于进行传输或存储形成巨大的压力,音频信号的压缩是在保证一定声音质量的条件下,尽可能以最小的数据率来表达和传送声音信息。
信号压缩过程是对采样、量化后的原始数字音频信号流运用适,当的数字信号处理技术进行信号数据的处理,将音频信号中去除对人们感受信息影响可以忽略的成分,仅仅对有用的那部分音频信号,进行编排,从而降低了参与编码的数据量。
数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余,包括时域冗余、频域冗余和听觉冗余。
1.1 时域冗余A.幅度分布的非均匀性:信号的量化比特分布是针对信号的整个动态范围而设定的,对于小幅度信号而言,大量的比特数据位被闲置。
B.样值间的相关性:声音信号是一个连续表达过程,通过采样之后,相邻的信号具有极强的相似性,信号差值与信号本身相比,数据量要小的多。
C.信号周期的相关性:声音信息在整个可闻域的范围内,每个瞬间只有部分频率成分在起作用,即特征频率,这些特征频率会以一定的周期反复出现,周期之间具有相关关系。
D.长时自我相关性:声音信息序列的样值、周期相关性,在一个相对较长的时间间隔也会是相对稳定的,这种稳定关系具有很高的相关系数。
E.静音:声音信息中的停顿间歇,无论是采样还是量化都会形成冗余,找出停顿间歇并将其样值数据去除,可以减少数据量。
1.2 频域冗余A.长时功率谱密度的非均匀性:任何一种声音信息,在相当长的时间间隔内,功率分布在低频部分大于高频部分,功率谱具有明显的非平坦性,对于给定的频段而言,存在相应的冗余。
B.语言特有的短时功率谱密度:语音信号在某些频率上会出现峰值,而在另一些频率上出现谷值,这些共振峰频率具有较大的能量,由它们决定了不同的语音特征,整个语言的功率谱以基音频率为基础,形成了向高次谐波递减的结构。
1.3 听觉冗余根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型,将通过听觉领悟信息的复杂过程,包括接受信息,识别判断和理解信号内容等几个层次的心理活动,形成相应的连觉和意境,由此构成声音信息集合中的所以数据,并非对人耳辨别声音的强度、音调、方位都产生作用,形成听觉冗余,由听觉冗余引出了降低数据率,实现更高效率的数字音频传输的可能。