aac编码介绍
- 格式:doc
- 大小:327.00 KB
- 文档页数:3
AAC和M4A以及MP3区别在什么地方其实AAC的技术早在1997年就成型了,AAC(Advanced Audio Coding),中文称为“高级音频编码”,当时被称为MPEG-2 AAC,由Fraunhofer IIS、杜比实验室、AT&T、Sony(索尼)等公司共同开发,目的是取代MP3格式。
但是随着2000年,MPEG-4标准出现后,AAC 重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。
.M4A - 为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名,Apple iTunes 对纯音频MP4文件采用了".M4A"命名。
M4A的本质和音频MP4相同,故音频MP4文件亦可直接更改扩展名为M4A。
AAC是一种高压缩比的音频压缩算法,它的压缩比可达20:1,远远超过了AC-3、MP3等较老的音频压缩算法。
一般认为,AAC格式在96Kbps码率的表现超过了128Kbps的MP3音频。
AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨和15个低频音轨。
除此之外,AAC最高支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并论,因此,它得到了DVD论坛的支持,成为了下一代DVD的标准音频编码。
AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。
它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。
总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质,被手机界称为“21世纪数据压缩方式”。
AAC是一种音频编码形式,m4a是一种封装形式。
打个比方,如同橙汁可以被封装在易拉罐里一样,aac如同橙汁,m4a如同易拉罐。
m4a是一种多功能的封装工具,可以装进无损的 Apple Lossless 音乐(就是苹果手机里的无损音乐),甚至MP3也可以封装进m4a里。
AAC⾳频编码转载AAC(Advanced Audio Coding),中⽂名:⾼级,出现于1997年,基于的⾳频编码技术。
由、、、等公司共同开发,⽬的是取代格式。
2000年,标准出现后,AAC重新集成了其特性,加⼊了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC⼜称为 AAC。
定义AAC,全称Advanced Audio Coding,是⼀种专为声⾳数据设计的⽂件压缩格式。
与不同,它采⽤了全新的算法进⾏编码,更加⾼效,具有更⾼的“性价⽐”。
利⽤AAC格式,可使⼈感觉声⾳质量没有明显降低的前提下,更加⼩巧。
、⼿机⽀持AAC格式的⾳频⽂件。
优点:相对于mp3,AAC格式的⾳质更佳,⽂件更⼩。
不⾜:AAC属于有损压缩的格式,与时下流⾏的、等⽆损格式相⽐⾳质存在“本质上”的差距。
加之,传输速度更快的和16G以上⼤容量正在加速普及,也使得AAC头上“⼩巧”的光环不复存在。
特点①提升的压缩率:可以以更⼩的⽂件⼤⼩获得更⾼的⾳质;②⽀持多声道:可提供最多48个全⾳域声道;③更⾼的解析度:最⾼⽀持96KHz的采样频率;④提升的解码效率:解码播放所占的资源更少;杜⽐实验室的结论①128Kbps的AAC⽴体声⾳乐被专家认为不易察觉到与原来未压缩⾳源的区别;②AAC格式在96Kbps码率的表现超过了128Kbps的MP3格式;③同样是128Kbps,AAC格式的⾳质明显好于MP3;④AAC是唯⼀⼀个,能够在所有的EBU试听测试项⽬的获得“优秀”的⽹络⼴播格式。
总的来讲,AAC可以说是极为全⾯的编码⽅式,⼀⽅⾯,多声道和⾼采样率的特点使得它⾮常适合未来的DVD-Audio;另⼀⽅⾯,低码率下的⾼⾳质则使它也适合移动通讯、⽹络电话、在线⼴播等领域,真是全能的编码⽅式。
AAC 规格介绍AAC共有9种规格,以适应不同的场合的需要:MPEG-2 AAC LC 低复杂度规格(Low Complexity)--⽐较简单,没有增益控制,但提⾼了编码效率,在中等码率的编码效率以及⾳质⽅⾯,都能找到平衡点MPEG-2 AAC Main 主规格MPEG-2 AAC SSR 可变采样率规格(Scaleable Sample Rate)MPEG-4 AAC LC 低复杂度规格(Low Complexity)------现在的⼿机⽐较常见的MP4⽂件中的⾳频部份就包括了该规格⾳频⽂件MPEG-4 AAC Main 主规格 ------包含了除增益控制之外的全部功能,其⾳质最好MPEG-4 AAC SSR 可变采样率规格(Scaleable Sample Rate)MPEG-4 AAC LTP 长时期预测规格(Long Term Predicition)MPEG-4 AAC LD 低延迟规格(Low Delay)MPEG-4 AAC HE ⾼效率规格(High Efficiency)-----这种规格适合⽤于低码率编码,有Nero ACC 编码器⽀持AAC⾳频⽂件格式AAC的⾳频⽂件格式有ADIF & ADTS:ADIF:Audio Data Interchange Format ⾳频数据交换格式。
一、介绍ffmpeg编码器ffmpeg是一个开源的音视瓶处理工具,可以进行音视瓶的编解码、转换和流媒体的处理。
在使用ffmpeg进行编码时,我们可以选择不同的编码器来实现不同的功能,比如压缩、转换、解码等。
本文将介绍一些常见的编码器,并说明它们的使用方法。
二、常见的音频编码器1. AAC编码器AAC(Advanced Audio Coding)是一种高级音频编码格式,常用于音乐和音频流媒体的编码。
在ffmpeg中,可以使用libfaac库来支持AAC编码,具体命令如下:ffmpeg -i input.wav -c:a libfaac -b:a 128k output.aac参数说明:-i input.wav:指定输入文件为input.wav-c:a libfaac:选择使用libfaac库进行音频编码-b:a 128k:设置音频比特率为128kbpsoutput.aac:指定输出文件为output.aac2. MP3编码器MP3(MPEG-1 Audio Layer 3)是一种广泛使用的有损音频压缩格式,适用于音乐和语音的编码。
在ffmpeg中,可以使用libmp3lame库来支持MP3编码,具体命令如下:ffmpeg -i input.wav -c:a libmp3lame -q:a 2 output.mp3参数说明:-i input.wav:指定输入文件为input.wav-c:a libmp3lame:选择使用libmp3lame库进行音频编码-q:a 2:设置音频质量因子为2(取值范围0-9,数值越大,音质越低)output.mp3:指定输出文件为output.mp3三、常见的视瓶编码器1. H.264编码器H.264(又称AVC)是一种高效的视瓶编码格式,适用于视瓶会议、高清电视等场景。
在ffmpeg中,可以使用libx264库来支持H.264编码,具体命令如下:ffmpeg -i input.mp4 -c:v libx264 -crf 23 -preset slowoutput.mp4参数说明:-i input.mp4:指定输入文件为input.mp4-c:v libx264:选择使用libx264库进行视瓶编码-crf 23:设置视瓶质量因子为23(取值范围0-51,数值越小,视瓶质量越高)-preset slow:设置编码速度为slow(速度越慢,压缩效率越高)output.mp4:指定输出文件为output.mp42. H.265编码器H.265(又称HEVC)是一种更高效的视瓶编码格式,可以实现更好的压缩效果和视瓶质量。
各种音频编码方式的对比内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。
PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方式:Free备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。
因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
WMA(Windows Media Audio)类型:Audio制定者:微软公司所需频宽:320~112kbps(压缩10~12倍)特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
缺点:当Bitrate大于128K时,WMA音质损失过大。
WMA标准不开放,由微软掌握。
应用领域:voip版税方式:按个收取备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。
AAC(Advanced Audio Coding)是一种音频压缩编码标准,FDKAAC 是AAC的一种实现方式,它基于固定点数运算来降低运算复杂度和耗电。
对于AAC编码,参数设置是非常重要的。
以下是一些常见的AAC编码参数:
1. 采样率(Sampling Rate):音频信号每秒采样的次数,常见的采样率包括44100Hz、48000Hz等。
2. 声道数(Channels):音频信号的通道数量,常见的声道数包括立体声(双通道)、单声道(一通道)等。
3. 音频对象类型(Audio Object Type):AAC支持多种音频对象类型,每种类型对应不同的音频编码方式和压缩比。
常见的音频对象类型包括AAC_LC、HE_AAC等。
4. 比特率(Bitrate):音频编码的比特率越高,音质越好,但文件大小也会相应增加。
常见的比特率包括128kbps、192kbps、320kbps等。
5. 编码模式(Coding Mode):AAC支持多种编码模式,包括CBR (恒定比特率)和VBR(可变比特率)。
6. 封装格式(Packaging Format):AAC编码后的数据需要封装成特定的格式才能播放,常见的封装格式包括ADTS(Advanced ADTS Transport Stream)和LATM(LOAS AAC Transport Multiplex)等。
对于FDKAAC编码,参数设置与AAC类似,但FDKAAC是基于固定点数运算的实现方式,因此需要注意一些特殊的参数设置,如量化精度、运算精度等。
具体的参数设置可以参考FDKAAC的文档或相关教程。
aacld支持的标准
我认为你可能打错了"aacld",可能是指"AAC-LD"或"AAC-LC"。
1.AAC-LD(Advanced Audio Coding-Low Delay):AAC-LD是一种低延迟的音频编解码标准,主要用于实时通信和音频传输领域,如视频会议、语音通话等。
AAC-LD提供高质量的音频编解码,并且在网络传输时具有较低的延迟。
2.AAC-LC(Advanced Audio Coding-Low Complexity):AAC-LC是一种低复杂度的音频编解码标准,主要用于音乐存储和传输。
它是MPEG-4Part3标准的一部分,提供了更高的音频质量和更低的比特率,相比于之前的音频编码标准如MP3。
在技术上,AAC(Advanced Audio Coding)是一种高效的音频编码标准,广泛应用于数字音频存储、传输和广播领域。
AAC-LD和AAC-LC是其不同的配置之一。
AAC支持多种配置,可以根据具体应用场景选择不同的配置。
这些配置通常都是MPEG-4标准的一部分。
AAC音频编码格式,完整名称叫做"高级音频编码(Advanced Audio Codec)”。
这种先进而高级的编码规范,是由Fraunhofer IIS公司(前MP3标准的制定者)、Dolby、AT&T、索尼、苹果等产业巨头共同开发的。
AAC音频编码技术早在1997年就制定成型,当时在MPEG-2中作为了MPEG2-AAC 音频编码规格之一,后来,在2000年被用在MPEG-4中(ISO 14496-3 Audio),所以现在变更为MPEG-4 AAC标准,也就是说,AAC已经成为MPEG4家族的主要成员之一,它是MPEG4第三部分中的音频编码系统。
AAC可提供最多48个全音域音频通道。
其中,AAC音频编码在不同的领域,分为九种规格:MPEG-2 AAC MainMPEG-2 AAC LC (Low Complexity)MPEG-2 AAC SSR (Scalable Sampling Rate)MPEG-4 AAC MainMPEG-4 AAC LC (Low Complexity)MPEG-4 AAC SSR (Scalable Sample Rate)MPEG-4 AAC LTP (Long Term Predicition)MPEG-4 AAC LD (Low Delay)MPEG-4 AAC HE (High Efficiency) AACPlusV1/V2(3GPP)其中,前三种估计很难用到,后六种中,LC和HE两种比较常用,因此就主要介绍这两种:MPEG-4 AAC LC (Low Complexity) 是最常用的规格,我们叫“低复杂度规格”,我们简称“LC-AAC”,这种规格在中等码率的编码效率以及音质方面,都能找到平衡点。
所谓中等码率,就是指:96kbps-192kbps之间的码率。
因此,如果要使用LC-AAC规格,请尽可能把码率控制在之前说的那个区间内。
AAC解码算法原理详解原作者:龙帅)此文章为便携式多媒体技术中心提供,未经站长授权,严禁转载,但欢迎链接到此地址。
本文详细介绍了符合ISO/IEC 13818-7(MPEG2 AAC audio codec) , ISO/IEC 14496-3(MPEG4 Audio Codec AAC Low Complexity)进行压缩的的AAC音频的解码算法。
1、程序系统结构下面是AAC解码流程图:AAC解码流程图在主控模块开始运行后,主控模块将AAC比特流的一部分放入输入缓冲区,通过查找同步字得到一帧的起始,找到后,根据ISO/IEC 13818-7所述的语法开始进行Noisless Decoding(无噪解码),无噪解码实际上就是哈夫曼解码,通过反量化(Dequantize)、联合立体声(Joint Stereo),知觉噪声替换(PNS),瞬时噪声整形(TNS),反离散余弦变换(IMDCT),频段复制(SBR)这几个模块之后,得出左右声道的PCM码流,再由主控模块将其放入输出缓冲区输出到声音播放设备。
2. 主控模块主控模块的主要任务是操作输入输出缓冲区,调用其它各模块协同工作。
其中,输入输出缓冲区均由DSP控制模块提供接口。
输出缓冲区中将存放的数据为解码出来的PCM数据,代表了声音的振幅。
它由一块固定长度的缓冲区构成,通过调用DSP控制模块的接口函数,得到头指针,在完成输出缓冲区的填充后,调用中断处理输出至I2S接口所连接的音频ADC芯片(立体声音频DAC和DirectDrive 耳机放大器)输出模拟声音。
3. 同步及元素解码同步及元素解码模块主要用于找出格式信息,并进行头信息解码,以及对元素信息进行解码。
这些解码的结果用于后续的无噪解码和尺度因子解码模块。
AAC的音频文件格式有以下两种:ADIF:Audio Data Interchange Format 音频数据交换格式。
这种格式的特征是可以确定的找到这个音频数据的开始,不需进行在音频数据流中间开始的解码,即它的解码必须在明确定义的开始处进行。
音频编码流程:
硬件采集→PCM编码[原始量化点|样值] →分帧[960|1024][生成原始帧raw frame|原始数据块] →封装[ADTS|LATM(较主流)] 待续
Ps:原始数据块以帧的形式存在,故又称为原始帧。
AAC:最初为MPEG-2音频编码标准,后来经过优化又被加入到MPEG-4音频标准之中;相对于mp3,wmv,mp2,ac3,等在相同播放质量码率更低,有效地节约了传输带宽,在移动广播领域,互联网流媒体,IPTV中有着很广泛的应用。
其最常见的封装格式为:ADTS AND LATM这是广播电视、通信领域常用的封装格式。
RTP 协议采用的AAC封装格式是LATM格式,这里ADTS LATM间的转换尤为重要,
AAC格式压缩编码标准:
AAC编码规格:
LC-AAC:地复杂度编码
HE-ACC:高效率编码,这里引入了SBR[频段复制技术]技术,又称为AAC+技术HE-AAC-V2:在AAC+的基础之上又引入了PS[参数化立体声]技术
封装格式:
ADTS格式:short for :audio data transform stream
对前述原始帧进行ADTS封装就形成ADTS帧,
ADTS帧:帧头+帧净荷组成,帧头存储了音频的相关参数信息:采样率,声道数,帧长度等关键信息[用帧净荷数据的解析解码]。
帧净荷主要有原始帧组成[960|1024个样值]。
可包含1~4个原始帧。
LATM格式:Low overhead MPEG-4 audio transport Multiplex.[低开销因音频传输复用] LATM也以帧为单位,组成为:AudioSpecificConfig+音频负载组成。
AudioSpecificConfig描述了一个LATM帧的信息,音频负载主要由PayloadLengthInfo及音频负载组成[多组]。
AudioSpecificConfig可以是带内传输也可以带外传输,AudioSpecificConfig一般不变,所以只需发送一次,由此可见AudioSpecificConfig采用带内传输可以适应编码信息不断变化的情况,而采用带外传输,可以节省音频传输码率,带内和带外由muxConfigPresent标志决定[0:带外|1:带内]。
例如流媒体中可设置muxConfigPresent 为0,这样LATM帧将不含哟AudioSpecificConfig部分,LATM通过RTP包发送,而
AudioSpecificConfig通过SDP发送一次[针对编码信息不变的情况]就行。
AudioSpecificConfig 主要参数如下:
LATM帧组成:AudioSpecificConfig+音频负载
其中音频负载主要由若干子帧组成,每个子帧组成:
PayloadLengthInfo+PayloadMux[净荷]
PayloadMux可以复用多个节目的音频流
由于每个原始帧没有起始信息,需要PayloadLengthInfo来描述
***ADTS与LATM帧的转换
这两种格式之间的转换是十分重要的。
ADTS转换为LATM举例:
1 读取ADTS帧头信息,获得采样率,声道配置,aac算法方面的参数,帧长信息等
2 提取原始帧并保存
3 按照提取的ADTS头参照AAC标准,生成对应的LATM头,即:AudioSpecificConfig头根据原始帧长度信息生成PayloadLengthInfo信息,再由PayloadLengthInfo信息与原始帧数据生成LATM音频负载,再与AudioSpecificConfig联合生成LATM帧。
Add: CMMB目前是唯一被国家广电总局颁布为行业标准的自主知识产权移动多媒体广播标准。
一、什么是CMMB?
CMMB是英文China Mobile Multimedia Broadcasting (中国移动多媒体广播)的简称。
它是国内自主研发的第一套面向手机、PDA、MP3、MP4、数码相机、笔记本电脑多种移动终端的系统,利用S波段卫星信号实现“天地”一体覆盖、全国漫游,支持25套电视节目和30套广播节目,2006年10月24日,国家广电总局正式颁布了中国移动多媒体广播(俗称手机电视)行业标准,确定采用我国自主研发的移动多媒体广播行业标准。
中国移动多媒体广播系统(简称CMMB)行业标准,规定了在广播业务频率范围内,移动多媒体广播系统广播信道传输信号的帧结构、信道编码和调制,该标准适用于30MHz 到3000MHz频率范围内的广播业务频率,通过卫星和/或地面无线发射电视、广播、数据信息等多媒体信号的广播系统,可以实现全国漫游,传输技术采用STiMi技术。