AAC音频编码格式简介
- 格式:doc
- 大小:31.00 KB
- 文档页数:4
AAC(Advanced Audio Coding),中文称为高级音频编码,出现于1997年,基于 MPEG-2的音频编码技术。
由Fraunhofer IIS、杜比实验室、AT&T、Sony(索尼)等公司共同开发,目的是取代MP3格式。
2000年,MPEG-4标准出现后,AAC 重新集成了其特性,加入了SBR 技术和PS技术,为了区别于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。
Advanced Audio Coding。
一种专为声音数据设计的文件压缩格式,与Mp3不同,它采用了全新的算法进行编码,更加高效,具有更高的性价比。
利用AAC格式,可使人感觉声音质量没有明显降低的前提下,更加小巧。
AAC格式可以用苹果iTunes转换或千千静听(六组件)苹果ipod、诺基亚手机和Sony随身听也支持AAC格式的音频文件。
优点:相对于mp3等有损格式,AAC格式的音质更佳,文件更小。
不足:AAC属于有损压缩的格式,与时下流行的APE、FLAC等无损格式相比音质存在本质上的差距。
加之,目前传输速度更快的USB3.0和16G以上大容量MP3正在加速普及,也使得AAC头上小巧的光环不复存在了。
前景:以发展的眼光来看,正如高清正在被越来越多的人所接受一样,无损必定是未来音乐格式的绝对主流。
AAC这种有损格式的前景不容乐观。
从MP3到AAC早在1987年,Fraunhofer IIS就开始了EUREKA project EU147,Digital Audio Broadcasting (DAB)的研发,而这就是MP3的前身。
通过和Dieter Seitzer教授的合作,他们开发出了著名的ISO-MPEG Audio Layer-3压缩算法。
1993年这个算法被整合到MPEG-1标准中,从此MP3被投入使用。
1996年底Fraunhofer IIS在美国获得MP3的专利,并在1998年对外声明将收取MP3的专利使用费。
音频编码流程:硬件采集→PCM编码[原始量化点|样值] →分帧[960|1024][生成原始帧raw frame|原始数据块] →封装[ADTS|LATM(较主流)] 待续Ps:原始数据块以帧的形式存在,故又称为原始帧。
AAC:最初为MPEG-2音频编码标准,后来经过优化又被加入到MPEG-4音频标准之中;相对于mp3,wmv,mp2,ac3,等在相同播放质量码率更低,有效地节约了传输带宽,在移动广播领域,互联网流媒体,IPTV中有着很广泛的应用。
其最常见的封装格式为:ADTS AND LATM这是广播电视、通信领域常用的封装格式。
RTP 协议采用的AAC封装格式是LATM格式,这里ADTS LATM间的转换尤为重要,AAC格式压缩编码标准:AAC编码规格:LC-AAC:地复杂度编码HE-ACC:高效率编码,这里引入了SBR[频段复制技术]技术,又称为AAC+技术HE-AAC-V2:在AAC+的基础之上又引入了PS[参数化立体声]技术封装格式:ADTS格式:short for :audio data transform stream对前述原始帧进行ADTS封装就形成ADTS帧,ADTS帧:帧头+帧净荷组成,帧头存储了音频的相关参数信息:采样率,声道数,帧长度等关键信息[用帧净荷数据的解析解码]。
帧净荷主要有原始帧组成[960|1024个样值]。
可包含1~4个原始帧。
LATM格式:Low overhead MPEG-4 audio transport Multiplex.[低开销因音频传输复用] LATM也以帧为单位,组成为:AudioSpecificConfig+音频负载组成。
AudioSpecificConfig描述了一个LATM帧的信息,音频负载主要由PayloadLengthInfo及音频负载组成[多组]。
AudioSpecificConfig可以是带内传输也可以带外传输,AudioSpecificConfig一般不变,所以只需发送一次,由此可见AudioSpecificConfig采用带内传输可以适应编码信息不断变化的情况,而采用带外传输,可以节省音频传输码率,带内和带外由muxConfigPresent标志决定[0:带外|1:带内]。
AAC音频格式分析与解码AAC(Advanced Audio Coding)是一种高级音频编码格式,它是MPEG-2音频的继承者,广泛应用于数字音频传输和存储中。
在本文中,我们将对AAC音频格式进行分析和解码。
AAC音频格式是一种有损压缩格式,它能够提供与其他音频格式相同的音频质量,但文件大小更小。
AAC通过采用一些先进的编码技术,如感知音频编码(Perceptual Audio Coding)、熵编码等,对音频信号进行压缩。
这样一来,就能够在相同的比特率下提供更高的音频质量。
AAC格式的音频文件通常以文件扩展名".aac"或".m4a"存储。
这些文件可以在许多不同的设备和平台上播放,如音频播放器、个人电脑、智能手机和流媒体服务等。
下面我们来分析AAC的编码和解码过程。
编码过程:1.音频采样:首先,原始音频信号通过麦克风或其他音频设备进行采样。
采样率通常为44.1kHz,与标准的CD音质相同。
2.信号预处理:采样的音频信号经过预处理步骤,如重采样、滤波等,以准备好用于编码的信号。
3.频域分析:音频信号通过傅立叶变换等方法转换为频域信号。
4.感知音频编码:这是AAC编码的核心步骤。
通过对频域信号进行感知编码,过滤掉人耳听觉不敏感的频率成分,从而减少编码数据量。
5. 熵编码:对感知编码后的信号进行熵编码,使用Adaptive Huffman Coding等算法进行数据压缩。
6.输出压缩数据:将编码后的数据写入AAC文件。
解码过程:1.读取AAC文件:首先,解码器读取存储在AAC文件中的压缩数据。
2.数据解压:对读取的压缩数据进行解压缩,恢复为编码前的数据。
3.熵解码:对解压后的数据进行熵解码,还原为感知编码后的频域信号。
4.逆变换:通过逆傅立叶变换等方法将频域信号转换回时域信号。
5.音频重构:将逆变换得到的时域信号进行音频重构处理,还原为原始的音频信号。
6.输出音频:将重构的音频信号输出到音频设备进行播放。
1,什么是AAC?AAC代表Advanced Audio Coding(高级音频编码),是一种由MPEG-4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主要的贡献者。
在使用MP4作为各种内容的容器格式的新多媒体MPEG-4标准中,它是MPEG Layer III / MP3的天然后继者。
AAC能够在一条音轨中包括48条全带宽(直到96khz)音频声道,加上15条低频增强(LFE,限制到120Hz)声道,直到15条数据流并且更多。
2,什么是HE-AAC和LC-AAC?两者是符合MPEG4 AAC标准的不同的Profile(类)。
LC意思是"low complexity"(低复杂性)而HE意思是"high efficiency"(高效性)。
HE-AAC也称之为AAC SBR/AAC+/aacplus等。
注意HE-AAC注重于低码流的编码并很适合多声道文件(更小的文件尺寸)。
对于HE-AAC文件,也需要一个可用的HE解码器,请看Q6。
如果你想要用AAC与其他流行音频编码在64kbps下做比较,请看这里(感谢rjamorim)。
从学术上讲,HE-AAC混合了AAC与SBR技术。
SBR代表的是Spectral Band Replication(频段复制)。
SBR的关键是在低码流下提供全带宽的编码而不会产生产生多余的信号。
传统认为音频编码在低码流下意味着减少带宽和降低采样率(见MP3 FAQ #7)或产生令人不快的噪音信号。
SBR解决问题的方法是让核心编码去编码低频信号,而SBR解码器通过分析低频信号产生高频信号和一些保留在比特流中的指导信号(通常码流极低,~2 kbps)。
这就是采用无SBR解码器的原因,这样你的带宽(frequency response/频率响应)会被严重浪费。
这也是为什么被叫做Spectral Band Replication的原因,它只是增加音频的带宽,而非重建。
AAC⾳频编码转载AAC(Advanced Audio Coding),中⽂名:⾼级,出现于1997年,基于的⾳频编码技术。
由、、、等公司共同开发,⽬的是取代格式。
2000年,标准出现后,AAC重新集成了其特性,加⼊了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC⼜称为 AAC。
定义AAC,全称Advanced Audio Coding,是⼀种专为声⾳数据设计的⽂件压缩格式。
与不同,它采⽤了全新的算法进⾏编码,更加⾼效,具有更⾼的“性价⽐”。
利⽤AAC格式,可使⼈感觉声⾳质量没有明显降低的前提下,更加⼩巧。
、⼿机⽀持AAC格式的⾳频⽂件。
优点:相对于mp3,AAC格式的⾳质更佳,⽂件更⼩。
不⾜:AAC属于有损压缩的格式,与时下流⾏的、等⽆损格式相⽐⾳质存在“本质上”的差距。
加之,传输速度更快的和16G以上⼤容量正在加速普及,也使得AAC头上“⼩巧”的光环不复存在。
特点①提升的压缩率:可以以更⼩的⽂件⼤⼩获得更⾼的⾳质;②⽀持多声道:可提供最多48个全⾳域声道;③更⾼的解析度:最⾼⽀持96KHz的采样频率;④提升的解码效率:解码播放所占的资源更少;杜⽐实验室的结论①128Kbps的AAC⽴体声⾳乐被专家认为不易察觉到与原来未压缩⾳源的区别;②AAC格式在96Kbps码率的表现超过了128Kbps的MP3格式;③同样是128Kbps,AAC格式的⾳质明显好于MP3;④AAC是唯⼀⼀个,能够在所有的EBU试听测试项⽬的获得“优秀”的⽹络⼴播格式。
总的来讲,AAC可以说是极为全⾯的编码⽅式,⼀⽅⾯,多声道和⾼采样率的特点使得它⾮常适合未来的DVD-Audio;另⼀⽅⾯,低码率下的⾼⾳质则使它也适合移动通讯、⽹络电话、在线⼴播等领域,真是全能的编码⽅式。
AAC 规格介绍AAC共有9种规格,以适应不同的场合的需要:MPEG-2 AAC LC 低复杂度规格(Low Complexity)--⽐较简单,没有增益控制,但提⾼了编码效率,在中等码率的编码效率以及⾳质⽅⾯,都能找到平衡点MPEG-2 AAC Main 主规格MPEG-2 AAC SSR 可变采样率规格(Scaleable Sample Rate)MPEG-4 AAC LC 低复杂度规格(Low Complexity)------现在的⼿机⽐较常见的MP4⽂件中的⾳频部份就包括了该规格⾳频⽂件MPEG-4 AAC Main 主规格 ------包含了除增益控制之外的全部功能,其⾳质最好MPEG-4 AAC SSR 可变采样率规格(Scaleable Sample Rate)MPEG-4 AAC LTP 长时期预测规格(Long Term Predicition)MPEG-4 AAC LD 低延迟规格(Low Delay)MPEG-4 AAC HE ⾼效率规格(High Efficiency)-----这种规格适合⽤于低码率编码,有Nero ACC 编码器⽀持AAC⾳频⽂件格式AAC的⾳频⽂件格式有ADIF & ADTS:ADIF:Audio Data Interchange Format ⾳频数据交换格式。
AAC音频编码格式,完整名称叫做"高级音频编码(Advanced Audio Codec)”。
这种先进而高级的编码规范,是由Fraunhofer IIS公司(前MP3标准的制定者)、Dolby、AT&T、索尼、苹果等产业巨头共同开发的。
AAC音频编码技术早在1997年就制定成型,当时在MPEG-2中作为了MPEG2-AAC 音频编码规格之一,后来,在2000年被用在MPEG-4中(ISO 14496-3 Audio),所以现在变更为MPEG-4 AAC标准,也就是说,AAC已经成为MPEG4家族的主要成员之一,它是MPEG4第三部分中的音频编码系统。
AAC可提供最多48个全音域音频通道。
其中,AAC音频编码在不同的领域,分为九种规格:MPEG-2 AAC MainMPEG-2 AAC LC (Low Complexity)MPEG-2 AAC SSR (Scalable Sampling Rate)MPEG-4 AAC MainMPEG-4 AAC LC (Low Complexity)MPEG-4 AAC SSR (Scalable Sample Rate)MPEG-4 AAC LTP (Long Term Predicition)MPEG-4 AAC LD (Low Delay)MPEG-4 AAC HE (High Efficiency) AACPlusV1/V2(3GPP)其中,前三种估计很难用到,后六种中,LC和HE两种比较常用,因此就主要介绍这两种:MPEG-4 AAC LC (Low Complexity) 是最常用的规格,我们叫“低复杂度规格”,我们简称“LC-AAC”,这种规格在中等码率的编码效率以及音质方面,都能找到平衡点。
所谓中等码率,就是指:96kbps-192kbps之间的码率。
因此,如果要使用LC-AAC规格,请尽可能把码率控制在之前说的那个区间内。
AAC格式介绍AAC格式介绍AAC(Advanced Audio Coding),中文称为“高级音频编码”,出现于1997年,最初是基于MPEG-2的音频编码技术,目的是取代MP3格式。
2000年,MPEG-4标准出台,AAC重新集成了其特性,加入了SBR技术和PS技术,为区别于传统的MPEG-2 AAC,故含有SBR或PS特性的AAC又称为MPEG-4 AAC。
作为一种高压缩比的音频压缩算法,远胜MP3;在音质方面,由于采用多声道,和使用低复杂性的描述方式,使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。
一般来说,AAC可以在对比MP3文件缩小30%的前题下提供更好的音质。
AAC是目前唯一一个,能够在所有的EBU试听测试项目的获得“优秀”的网络广播格式。
AAC格式扩展名.AAC - 基于MPEG-2的音频编码技术,属于传统的AAC编码。
.MP4 - 基于MPEG-4的音频编码技术。
.M4A - 苹果(Apple)公司对纯音频MP4文件采用的扩展名,本质和音频MP4相同。
(包含视频的MP4文件为".M4V")支持AAC的播放器及设备支持AAC的音乐播放器(部分)(点击下载)iTunes | 千千静听 | Windows Media Player 11 | foobar2000支持视频AAC(M4V)的音乐播放器(部分)(点击下载)iTunes & Quicktime | Windows Media Player 11 | 暴风影音支持AAC的设备:苹果的全线iPod和iPhone产品;国内外各大品牌的主流随身听机型,如索尼、艾利和、创新、三星、爱国者、纽曼等;各大手机品牌的主流机型,如诺基亚、索尼爱立信、三星、摩托罗拉、夏普等。
AAC与MP3规格对比比特率:AAC - 最高超过400kbps / MP3 - 32~320kbps采样率:AAC - 最高96kHz / MP3 - 最高48kHz声道数:AAC - (5.1)六声道 / MP3 - 两声道采样精度:AAC - 最高32bit / MP3 - 最高16bit。
AAC(Advanced Audio Coding)是一种音频压缩编码标准,FDKAAC 是AAC的一种实现方式,它基于固定点数运算来降低运算复杂度和耗电。
对于AAC编码,参数设置是非常重要的。
以下是一些常见的AAC编码参数:
1. 采样率(Sampling Rate):音频信号每秒采样的次数,常见的采样率包括44100Hz、48000Hz等。
2. 声道数(Channels):音频信号的通道数量,常见的声道数包括立体声(双通道)、单声道(一通道)等。
3. 音频对象类型(Audio Object Type):AAC支持多种音频对象类型,每种类型对应不同的音频编码方式和压缩比。
常见的音频对象类型包括AAC_LC、HE_AAC等。
4. 比特率(Bitrate):音频编码的比特率越高,音质越好,但文件大小也会相应增加。
常见的比特率包括128kbps、192kbps、320kbps等。
5. 编码模式(Coding Mode):AAC支持多种编码模式,包括CBR (恒定比特率)和VBR(可变比特率)。
6. 封装格式(Packaging Format):AAC编码后的数据需要封装成特定的格式才能播放,常见的封装格式包括ADTS(Advanced ADTS Transport Stream)和LATM(LOAS AAC Transport Multiplex)等。
对于FDKAAC编码,参数设置与AAC类似,但FDKAAC是基于固定点数运算的实现方式,因此需要注意一些特殊的参数设置,如量化精度、运算精度等。
具体的参数设置可以参考FDKAAC的文档或相关教程。
aac编码原理AAC编码原理AAC音频编码(Advanced Audio Coding)是一种用于压缩音频的数字音频编码格式。
它是MPEG-2和MPEG-4标准中的一部分,是ISO/IEC国际标准的一部分。
与其他压缩格式相比,AAC编码器具有更高的数据压缩比率和更好的音频质量。
下面是AAC编码原理的详细介绍:1. 概述:AAC格式使用有损压缩算法,能够将采样率高达96kHz 的音频信号压缩至比原始数据少90%的数据量,同时还能保证音频质量的高保真。
AAC编码器通常使用在数字广播、移动音乐播放器和互联网音乐传输等领域。
2. 压缩原理:AAC编码器中使用了多种技术来优化音频压缩。
其核心是基于时-频分解的滤波器组合。
这个滤波器组合利用了特定的原理:对频域内相邻的谐波进行编码,而同时忽略非常小的波动。
3. 比特率控制:为了控制音频质量和压缩比率,AAC编码器支持多种比特率控制(Bit Rate Control)技术。
比特率控制有助于改善低码率下的音频质量,同时还可减少数据流的噪声和失真。
4. 频率适应性:为了处理人类听觉系统对音频信号的不同响应,AAC编码器还可以基于音频信号的特征进行动态的频率适应性处理,这种技术可以根据音频信号的不同特性调整压缩方式,为音频提供更好的保真度和质量。
5. 低延迟编码:低延迟编码是一种特殊的AAC编码方式,它可以在低比特率下实现很高的音频质量。
这种编码方式可以节省网络流量,并确保所传输的音频信号的实时性,因此广泛应用于语音通信、远程监控和网络游戏等领域。
总的来说,AAC编码原理是通过基于时-频分解的滤波器组合,高效率地压缩音频信号,同时保证音频质量的高保真。
通过使用多种技术如比特率控制和频率适应性来优化AAC编码过程,它成为了数字广播、移动音乐播放器和互联网音乐传输等领域中的首选音频编码格式。
aac编码标准(一)AAC编码标准概述AAC是一种先进的音频编码格式,由ISO/IEC-MPEG标准化委员会开发。
AAC技术可以实现更高的音质和更小的文件大小。
编码算法AAC采用一种基于MDCT的循环预测算法进行编码,该算法可以有效地减少冗余数据并提高音频质量。
同时,AAC还支持多种编码模式和加密技术,以满足不同的应用需求。
标准规范AAC编码的标准规范包括MPEG-2和MPEG-4,其中MPEG-4为最新的版本。
AAC标准规范还包括一些压缩器和解压器的需求,如码率、采样率和数据格式等。
应用场景AAC编码技术被广泛应用于数字音频附加应用程序(如MPEG-4、3GPP和Adobe Flash Player),以及互联网音频和音乐下载,以提供更高质量的音频流。
总结AAC编码标准的出现使得音频编码技术得到了大幅度提升,同时也适应了各种应用场景的需求。
AAC标准将会在这个数字化的时代继续发挥着重要作用。
AAC编码的优势与其他音频编码技术相比,AAC最大的优势在于其更小的文件大小和更高的音质。
这得益于AAC采用的独特编码算法,以及可变比特率(VBR)技术,使得文件大小大大减小。
同时,AAC的码率范围广泛,可以支持多种音频质量的需求。
AAC编码的应用1.移动音频应用:AAC被广泛应用于数码音频播放器、智能手机等移动终端设备。
它可以在较小的存储容量下实现更高质量的音频播放。
2.数字电视:AAC已成为数字电视广播中的最佳音频编码格式。
采用AAC技术,数字电视可以提供更稳定和更清晰的声音。
3.互联网广播:越来越多的网站采用AAC技术提供高质量的音频流,以便用户在网上收听电台和在线音乐。
AAC编码的发展趋势随着技术的不断发展,AAC编码技术也在不断演进和完善。
未来发展方向包括: 1. 更高的编码效率和更小的文件大小。
2. 实时音频传输和网络音频应用的完善。
3. 与视频编码技术的深度融合,以实现更多功能。
结论AAC编码标准是一种先进的音频编码格式,具有更小的文件大小和更高的音质。
iTunes Plus 和AAC 格式的说明AAC格式介绍AAC(Advanced Audio Coding),中文称为“高级音频编码”,出现于1997年,最初是基于MPEG-2的音频编码技术,目的是取代MP3格式。
2000年,MPEG-4标准出台,AAC重新集成了其特性,加入了SBR技术和PS 技术,为区别于传统的MPEG-2 AAC,故含有SBR或PS特性的AAC又称为MPEG-4 AAC。
作为一种高压缩比的音频压缩算法,远胜MP3;在音质方面,由于采用多声道,和使用低复杂性的描述方式,使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。
一般来说,AAC可以在对比MP3文件缩小30%的前题下提供更好的音质。
AAC是目前唯一一个,能够在所有的EBU试听测试项目的获得“优秀”的网络广播格式。
AAC与MP3规格对比比特率:AAC - 最高超过400kbps / MP3 - 32~320kbps采样率:AAC - 最高96kHz / MP3 - 最高48kHz声道数:AAC - (5.1)六声道/ MP3 - 两声道采样精度:AAC - 最高32bit / MP3 - 最高16bitAAC格式扩展名.AAC - 基于MPEG-2的音频编码技术,属于传统的AAC编码。
.MP4 - 基于MPEG-4的音频编码技术。
.M4A - 苹果(Apple)公司对纯音频MP4文件采用的扩展名,本质和音频MP4相同。
(包含视频的MP4文件为".M4V")iTunes Store和iTunes Plus介绍iTunes Store是一个由苹果公司营运的在线数字媒体商店,需要使用iTunes软件连接。
在2003年4月28日开幕,目前是美国排名第一的音乐商店。
至2009年1月为止,iTunes Store已经售出超过60亿首歌曲,占有全球线上音乐销售量超过70%。
之前,由于唱片公司的规定,下载的音乐档案有使用上的限制,由苹果公司的“FairPlay”数位著作权管理技术保护。
音频AAC的各种格式AAC的各种规格一、规格(profile)问题:wiki上说到,AAC共有9种规格,以适应不同的场合的需要:●MPEG-2 AAC LC 低复杂度规格(Low Complexity)--比较简单,没有增益控制,但提高了编码效率,在中等码率的编码效率以及音质方面,都能找到平衡点●MPEG-2 AAC Main 主规格●MPEG-2 AAC SSR 可变采样率规格(Scaleable Sample Rate)●MPEG-4 AAC LC 低复杂度规格(Low Complexity)------现在的手机比较常见的MP4文件中的音频部份就包括了该规格音频文件●MPEG-4 AAC Main 主规格------包含了除增益控制之外的全部功能,其音质最好●MPEG-4 AAC SSR 可变采样率规格(Scaleable Sample Rate)●MPEG-4 AAC LTP 长时期预测规格(Long Term Predicition)●MPEG-4 AAC LD 低延迟规格(Low Delay)●MPEG-4 AAC HE 高效率规格(High Efficiency)-----这种规格适合用于低码率编码,有Nero ACC 编码器支持后来也看了14496-3标准,里面定义的profile除了上述的一些规格,还有如Scalable 、TwinVQ、CELP、HVXC等更多其他的profile。
目前听到用的比较多的应该是LC和HE(适合低码率)。
流行的Nero AAC的命令行编码程序就支持LC,HE,HEv2这三种,试用后,用MediaInfo分析了编码后的AAC音频,发现规格显示都是LC,当时就感到奇怪,不是说支持三种规格吗?然后才又查资料发现,原来HE其实就是AAC(LC)+SBR技术,HEv2就是AAC(LC)+SBR+PS技术,难怪用MediaInfo分析后,HE规格的文件即显示:,哈哈,既然说到了这里,就再简单的说下HE吧:HE:“high efficiency”(高效性)。
ffmpeg aac参数FFmpeg是一个开源的跨平台视频、音频解、编码器,提供了很多的参数,可以修改视频、音频的大小、码率、分辨率等,这里主要介绍一下FFmpeg中使用AAC音频编码参数。
一、AAC音频格式介绍AAC全称是Advanced Audio Coding,是MPEG(Moving Picture Experts Group)的一种音频编码格式,规定了多种编码类型,包括LC (Low Complexity)、HE(High Efficiency)和LD(Low Delay)。
其中LC常用于普通音频和手机铃声中,HE常用于网络流媒体中,LD则用于语音信号的编码。
二、AAC编码参数介绍1. -b:a 参数-b:a 指定音频比特率,取值范围一般在32kb/s到320kb/s之间。
值越大声音质量越好,同时文件大小也会越大。
比如-b:a 128k表示使用128kb/s的比特率进行AAC编码。
2. -cutoff 参数-cutoff 表示音频编码时的带宽截止频率,取值范围为0到0.99 (0.99MHz),一般不需要设定,默认值为原始频率的0.7倍。
3. -aac_coder 参数-aac_coder 指定使用哪种AAC编码器,一般有3类可选择:aac - 普通AAC CBR(恒定比特率)编码器libfdk_aac - Fraunhofer AAC 编码器aac_latm - LD AAC 编码器4. -aac_profile 参数-aac_profile 设定音频的输出类型,AAC有多种profile,包括:AAC LC: Low Complexity,最常用的标准格式HE-AAC: High Efficiency,提供更好的音频质量在更低的码率下HE-AACv2:计算复杂度更高,提供比HE-AAC更好的音质LC-SBR: Low Complexity-Spectral Band Replication,采用SBR技术在更低的码率下提供类似HE-AAC的音质三、使用FFmpeg编码AAC音频命令示例1. 利用FFmpeg将wav格式的音频文件编码为AAC音频文件,比特率128kb/s,保存为mp4格式:ffmpeg -i input.wav -vn -cutoff 15000 -b:a 128k -profile:a aac_low output.mp42. 将mp4格式的视频文件中的音频文件提取出来,采用Fraunhofer AAC编码器进行重新编码,采取原比特率:ffmpeg -i input.mp4 -vn -acodec libfdk_aac -vbr 3 output.m4a以上仅是两个示例,FFmpeg的参数以及应用场景非常多,希望大家可以根据需求更加自由地使用。
aac格式介绍AAC编码后数据打包到FLV很简单。
1. FLV⾳频Tag格式字节位置意义0x08, // 0, TagType0xzz, 0xzz, 0xzz, // 1-3, DataSize,0xzz, 0xzz, 0xzz, 0xzz, // 4-6, 7 TimeStamp | TimeStampExtend0x00, 0x00, 0x00, // 8-10, StreamID0xzz, // 11, AudioTag Header0x0b, // 12, AACPacketType (如果不是AAC编码没有这个字节)0xzz ... 0xzz // ⾳频数据2. AudioTagHeader⾳频Tag头⼀般由⼀个字节定义(AAC⽤两个字节),第⼀个字节的定义如下:⾳频格式 4bits | 采样率 2bits | 采样精度 1bits | 声道数 1bits|⾳频格式 4bits0x00 = Linear PCM, platform endian0x01 = ADPCM0x02 = MP30x03 = Linear PCM, little endian0x04 = Nellymoser 16-kHz mono0x05 = Nellymoser 8-kHz mono0x06 = Nellymoser0x07 = G.711 A-law logarithmic PCM0x08 = G.711 mu-law logarithmic PCM0x09 = reserved0x0A = AAC0x0B = Speex0x0E = MP3 8-Khz0x0F = Device-specific sound采样率 2bits0 = 5.5-kHz1 = 11-kHz2 = 22-kHz3 = 44-kHz对于AAC总是3,这⾥看起来FLV不⽀持48K AAC,其实不是的,后⾯还是可以定义为48K。
采样精度 1bits0 = snd8Bit1 = snd16Bit压缩过的⾳频都是16bit声道数 1bits0 = sndMono1 = sndStereo对于AAC总是1综上,如果是AAC 48K 16⽐特精度双声道编码,该字节为 0b1010 1111 = 0xAF。
AAC编码基本说明Advanced Audio Coding (AAC) 是 MP3 的后继格式,它被定义於 MPEG-4 part 3 (ISO/IEC 14496-3)。
它通常使用在 MP4 容器内;对于音乐习惯上使用 .m4a 副档名。
第二常见使用是在MKV (Matroska) 档内,因为它比 MP4 支援更多以文字为基础的软字幕 (例如 ass, ssa…)。
本文中的范例将使用 MP4 与 M4A 副档名。
FFmpeg 可以支援 4 个 AAC-LC 编码器 (aac, libfaac, libfdk_aac, libvo_aacenc) 与两个 AAC-HE 编码器 (libaacplus, libfdk_aac)。
libaacplus, libfaac, libfdk_aac 的授权不与 GPL 相容,所以当GPU 授权源代码也包含在内时 GPU 不允许包含源代码授权依据这些授权的二进位档的发布。
因此这些编码器被指定为 “non-free”,且你不能下载内建它们的 ffmpeg。
这可以透过自行编译ffmpeg 来解决。
libfdk_aacThe Fraunhofer FDK AAC 编解码程式库。
这是目前 ffmpeg 所能提供的最高品质 AAC 编码器。
需要 ffmpeg 组态 (configuration) 中含有 –enable-libfdk-aac (如果也使用 –enable-gpl 则还需要 –enable-nonfree)。
详细资料: Fraunhofer FDK AAC – HydrogenaudConstant Bit Rate (CBR, 常数位元速率) 模式指定一个目标位元速率。
它可以让你精準控制输出档案大小 (= 位元率 * 时间长度),且它与 HE-AAC profile 相容。
由经验得知,双声道推荐位元率 >= 128kbps,6 声道则推荐位元率 >=384kbps (由双声道位元率 * 声道数 / 2)。
aac编码参数范文AAC(Advanced Audio Coding)是一种高级音频编码格式,广泛应用于数字音频压缩和传输领域。
下面将介绍AAC编码参数的相关知识。
1. 采样率(Sample Rate):表示在一秒钟内对音频信号进行采样的次数。
常见的采样率有44.1 kHz(CD音质)、48 kHz(DVD音质)等,较高的采样率可以提供更高的音频质量,但同时也会增加文件大小。
2. 位深度(Bit Depth):表示用于记录每个采样点的位数。
常见的位深度有16位、24位等,较高的位深度可以提供更高的动态范围和更低的噪音水平。
3. 声道数(Channels):表示同时播放的音频源的数量。
常见的声道数有单声道(Mono)、立体声(Stereo)、5.1声道(Surround Sound)等。
4. 比特率(Bit Rate):表示每秒传输的比特数。
比特率直接影响到音频文件的大小和质量,一般以kbps(千比特每秒)为单位。
较高的比特率可以提供更高的音质,但同时也会增加文件大小。
5. 编码模式(Encode Mode):指定AAC编码器的行为模式,常见的编码模式有CBR(固定比特率)和VBR(可变比特率)等。
CBR模式会以固定的比特率对音频文件进行编码,适合网络传输和存储空间有限的情况下使用;VBR模式会根据音频信号的复杂程度动态调整比特率,可以提供更好的音频质量。
6. 低延迟编码(Low Delay Encoding):用于实时通信等对延迟要求较高的场景,可以将音频的编码延迟控制在较低的水平,以提供更好的交互体验。
7. 通道配置(Channel Configuration):用于指定声道的布局方式,包括单声道、立体声、双单声道、双声道等。
8. 码率控制(Bit Rate Control):用于控制编码器的输出比特率,可以选择固定比特率、可变比特率或平均比特率等。
9. 编码精度(Encoding Precision):用于控制AAC编码器的编码精度,包括标准精度(AAC-LC)和高精度(AAC-HE、AAC-HEv2)等。
AAC音频编码格式,完整名称叫做"高级音频编码(Advanced Audio Codec)”。
这种先进而高级的编码规范,是由Fraunhofer IIS公司(前MP3标准的制定者)、Dolby、AT&T、索尼、苹果等产业巨头共同开发的。
AAC音频编码技术早在1997年就制定成型,当时在MPEG-2中作为了MPEG2-AAC 音频编码规格之一,后来,在2000年被用在MPEG-4中(ISO 14496-3 Audio),所以现在变更为MPEG-4 AAC标准,也就是说,AAC已经成为MPEG4家族的主要成员之一,它是MPEG4第三部分中的音频编码系统。
AAC可提供最多48个全音域音频通道。
其中,AAC音频编码在不同的领域,分为九种规格:
MPEG-2 AAC Main
MPEG-2 AAC LC (Low Complexity)
MPEG-2 AAC SSR (Scalable Sampling Rate)
MPEG-4 AAC Main
MPEG-4 AAC LC (Low Complexity)
MPEG-4 AAC SSR (Scalable Sample Rate)
MPEG-4 AAC LTP (Long Term Predicition)
MPEG-4 AAC LD (Low Delay)
MPEG-4 AAC HE (High Efficiency) AACPlusV1/V2(3GPP)
其中,前三种估计很难用到,后六种中,LC和HE两种比较常用,因此就主要介绍这两种:
MPEG-4 AAC LC (Low Complexity) 是最常用的规格,我们叫“低复杂度规格”,我们简称“LC-AAC”,这种规格在中等码率的编码效率以及音质方面,都能找到平衡点。
所谓中等码率,就是指:96kbps-192kbps之间的码率。
因此,如果要使用LC-AAC规格,请尽可能把码率控制在之前说的那个区间内。
在这个区间内,LC-AAC 可以完全打败同码率的用LAME最高质量慢速编码模式的MP3。
我认为,不论是随身听,还是互联网音乐传播,
都建议采用128kbps-192kbps规格的LC-AAC编码规格。
MPEG-4 AAC HE (High Efficiency) AACPlusV1/V2(3GPP),我们叫“高效性规格”,我们简称为“HE-AAC”或者“AACPlus”,这种规格适合用于低码率编码,因为这种规格也融入了Mp3Pro中的那种SBR技术。
当您需要编码32kbps-96kbps之间的音频文件时,建议首选“HE-AAC”编码规格。
使用这种规格,在相同码率下,在这个区间内,您可以轻易把WMA9以及WMAPro等微软的格式给干掉。
如果您是有声小说爱好者,或者广播剧爱好者,不妨考虑He-AAC规格,即使很低的码率,也能提供非常清晰的人声对白效果。
那么,如果您需要编码相对较高码率的AAC(192kbps-384kbps,或更高),应该如何选择?如果您的码率不超过256kbps(如:192kbps-256kbps),“LC-AAC”同样可以适用。
如果实在需要更高的码率,请选择Main(主规格)编码。
在高码率下,AAC同样可以轻易战胜那个炒得很火热的Lame MP3,即使320kbps CBR的MP3,也根本不是Mian-AAC的对手。
甚至不少人认为,中码率的LC-AAC,192kbps CBR已经达到了320 CBR Lame MP3的音质。
当然,能和高码率AAC抗衡的,也只有MPC格式,不过MPC格式通用性太差了。
话说回来,其实没必要用高码率的AAC,而且Main- AAC在某些通用的播放器或解码器会存在问题,因为之前说的LC-AAC音质已经足够好了,并且通用性好,如果您是发烧友,干脆直接用无损,比如FLAC 等。
MPEG4-AAC音频编码家族如此优秀,因此比较有前景,而且很多“大腕”商家都极力支持。
比如如今比较火热的H.264(包含X.264)视频编码的最佳搭档就是MPEG4-AAC音频编码。
同时,高端的主流移动音乐平台,比如:苹果的iPod、iPhone;索尼的PSP游戏机;以及诺基亚、索爱等等多媒体手机;大部分山寨多媒体手机也开始支持了;甚至不少高端的MP4视频播放器都提供AAC音频格式支持。
还有,高清视频(720P/1080P等)播放器以及蓝光设备,同样会大量使用AAC音频编码去配合H.264的高清视频编码方案。
一些高清视频播放机器和游戏机(PS3等),也提供
支持。
您在互联网下载的一些高清电影(X.264),有相当多的是用AAC音频编码的。
即X.264+AAC 封装于MKV容器或者MP4容器之中。
当然,我们在这里,主要是谈在家用PC中去欣赏AAC音频格式的音乐,以及使用了AAC音轨的电影,于是,只要考虑如何在电脑去播放和编码就行了。
很幸运的是,目前非常主流的音频播放软件都非常轻易的支持AAC音频文件的解码,比如:
国产的“千千静听”
国外的“Foobar2000”
我估计您的机器一定有它们的存在吧?因此,播放AAC音频绝对不是问题。
如果您需观看H.264+AAC的电影,也不必担心,目前的“完美解码”和“终极解码”两种主流的高清视频解码包都提供完美的支持。
因此,只要下载这两种工具的其中之一,就行了。
据说“暴风影音”也是可以支持的。
说完了如何放AAC,就简单说说AAC编码器。
因为AAC的优秀,因此关于AAC的编码器也是相当多(Fraunhofer IIS FHG AAC、NERO AAC、QuickTime/iTune AAC、Psytel、Coding Technologies、Dolby AAC、FAAC等等..),其中有商业性质的编码器,也有公用性质的,同时还有开源免费的。
同时,AAC的扩展名也有好几种,比如:mp4、m4a、aac等等,因功能不同(ADTS、ADIF等文件头)以及容器不同,会有所差异。
注:*.aac扩展名不属于MPEG4-AAC规格,而是MPEG2-AAC,现在应该很少用了。
官方定义的扩展名为*.MP4 ,MP4容器可以装载形如H.264视频以及AAC音频,也可只装载没有声音的视频(单独H.264等),或者装载没有图像的音频(单独AAC)。
不过,苹果把只包含音频的AAC扩展名定义为*.M4a,当然,用*.MP4作为AAC扩展名也是可以的,说明是没有视频部分的MP4音频文件。
如果只有音频部分,那么MP4和M4a二者可以互相安全改名。
接下来,我主要介绍在常用的软件中如何编码AAC音频。
主要介绍如下编码器:
在Adobe Audition 3.0 中使用NERO AAC 或FAAC 编码AAC音频文件;在千千静听播放器中使用NERO AAC 编码;
在Foobar2000中使用NERO AAC命令行编码。