各类音频格式介绍
- 格式:pdf
- 大小:129.02 KB
- 文档页数:9
音频文件格式全介绍作者:苏信时间:2021年7月本文已经刊登于《新电脑》2021年7月号,请勿转载.自从PC支持多以来,陆陆续续地出现了许多音频格式.这些格式既有流行的也有不那么流行的,它们的,本文向你一一道来。
主流目前的主流音频格式其实不少。
不同的格式有自己的用途,比如大家都应该很熟悉的MP3格式就是用于聆听用途的。
下面我们逐一介绍:存在便是永恒—WW是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
不客气地说,它实际上是Apple电脑的AIFF格式的克隆。
通常我们使用W格式都是用来保存一些没有压缩的音频,但实际上W格式的设计是非常灵活(非常复杂)的,该格式本身与任何数据都不冲突,换句话说,只要有软件支持,你甚至可以在W格式里面存放图像。
之所以能这样,是因为W文件里面存放的每一块数据都有自己的标识,通过这些标识可以告诉用户究竟这是什么数据。
在WINDOWS平台上通过ACM(Audio press ion Manager)结构及相应的驱动程序(在这里通常称为CODEC,编码/),可以在W文件中存放超过20种的压缩格式,比如ADPCM、G、CCITT G。
711、G.723等等,当然也包括MP3格式。
图表-使用音频编辑软件WeCN()列出Windows安装了的ACM驱动信息虽然W文件可以存放压缩音频甚至mp3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。
目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。
这些软件包括:Sound Forge,Cool Edit Pro, WeLab等等。
由于W的支持实在是太广泛了,可以说,即使Windows退出历史舞台,W格式也不会.老当益壮– mp3第二个要提到的就是改变了世界的mp3了。
这个比喻相信大家都**意。
24bit音乐和16bit音乐及多音乐编码格式的解析24bit音乐和16bit音乐及多音乐编码格式的解析现在绝大部分音乐CD,是16bit的。
声音信息是以16bit形式记录在唱片上的。
播放音乐CD,也就是16bit声音信息的重放。
16bit能处理的最大的声音与最小的声音的倍数是96db(db是分贝,声响的单位)。
夜深人静,我们的房间里声音的响度大约是20db,交通繁忙时市中心的街口,是100db,喷气式飞机飞天时,声响可达140db。
正常说话的声音响度约是50db,大声说话,声音响度会有60-70db,军事教官操练士兵时发的口号声可达90-100db。
所以16bit的CD唱片的信息不能完全记录实际世界的声音变化---16bit,最多可记录96db的声音差别。
并且由于数字化,声音的变化最小是1bit,难以细分声音的微小差别:以最大的声音16个1来比较,最小的声音变化1bit,是2的16次方分之一;以平均声响(10bit)来比较,则只有2的10次方分之一了,2的10次方约1000,也就是说16bit的CD唱片只有千分之一的分辨度,所以听CD唱片,有时候感觉甚至不如听卡式磁带“好听”。
卡式磁带录音机,是前CD时代的音乐载体。
磁带,由于磁粉的非均匀度等原因,噪声很大,整体上说,信号与噪声之比最多能达到60db,做了非线性处理以后,信噪比能达到70db。
单从信噪比上,磁带是不能与CD唱片相比(CD唱片的信噪比,轻松达到90db),但是,从声音的变化分辩度上,磁带记录的是模拟信号,不是象CD的数字信号,不是人能够听到的声音变化,所以感觉有时候卡式磁带比CD要细一些。
这个问题,一般称为“数码声”,就是CD的声音是“数码声”,不细,有些“空”。
注:信噪比(Signal/Noise),通常以S/N表示,单位为分贝(dB)。
模拟的时代,还有一种记录介质叫---LP,信噪比约80db。
LP,黑胶唱片(不是指黑胶CD),Long Playing唱片。
音质最好的音频格式介绍APE与FLA C音质是最好的,我现在爱上有A PE,在国内应用比较广泛,歌曲资源易获得。
APE与FLA C的比较在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩!我们常见到的M P3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。
另一种音频压缩被称为无损压缩,也就是我们今天所要说的主题内容。
无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。
目前无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossl ess、AppleLo ssless、La、OptimF R OG、Shorten,而常见的、主流的无损压缩格式目前只有A PE、FLAC。
下面就针对这两种无损压缩格式进行一下对比!APE是M's Audio,一种无损压缩格式。
这种格式的压缩比远低于其他音频格式,但能够做到真正无损,同时其开放源码的特性,也获得了不少音乐发烧友的青睐。
在现有不少无损压缩方案中,A PE是一种有着突出性能的格式,令人满意的压缩比以及飞快的压缩速度,在国内应用比较广泛,成为了不少朋友私下交流发烧音乐的选择之一。
目前,基于国产炬力A TJ 2097解码芯片的MP3大厂中,已有厂商如:昂达的VX939、台电科技的C133+、oppo支持A P E格式!FLAC是Free Lossless Audio Codec的简称,是一种非常成熟的无损压缩格式,名气不在APE之下!该格式的源码完全开放,而且兼容几乎所有的操作系统平台。
它的编码算法相当成熟,已经通过了严格的测试,当在编码损坏时依然能正常播放。
MPEG音频文件格式(包括MP3文件格式)详解MP3 文件是由帧(frame)构成的,帧是MP3 文件最小的组成单位。
MP3 的全称应为MPEG1 Layer-3 音频文件,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标准,MPEG 音频文件是MPEG1 标准中的声音部分,也叫MPEG 音频层,它根据压缩质量和编码复杂程度划分为三层,即 Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3 这三种声音文件,并根据不同的用途,使用不同层次的编码。
MPEG 音频编码的层次越高,编码器越复杂,压缩率也越高,MP1 和MP2 的压缩率分别为4:1 和6:1-8:1,而MP3 的压缩率则高达10:1-12:1,也就是说,一分钟CD 音质的音乐,未经压缩需要10MB的存储空间,而经过MP3 压缩编码后只有1MB 左右。
不过MP3 对音频信号采用的是有损压缩方式,为了降低声音失真度,MP3 采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3 文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
一、MPEG音频压缩基础在众多音频压缩方法中,这些方法在保持声音质量的同时尽量压缩数字音频使之占用更小的存储空间。
MPEG压缩是该领域中效果最好的一个。
这种压缩是有损压缩,这意味着,当运用这一方法压缩时肯定会丢失一部分音频信息。
但是,由于压缩方法的控制很难发现这种损失。
使用几个非常复杂和苛刻的数学算法,使得只有原始音频中几乎听不到的部分损失掉。
这就给重要的信息剩下了更多的空间。
通过这种方法可以将音频压缩12倍(可以选择压缩率),效果显著。
正是应为他的质量,MPEG音频变得流行起来。
MPEG-1,MPEG-2和MPEG-4都是人们熟悉的MPEG标准,MP3只涉及到前两中,另外还有一个非官方标准MPEG-2.5用于扩展MPEG-2/LSF到更低的采样率。
常用的视频、音频、图像文件格式及其特点一、视频文件格式(1)、AVI格式:AVI它于1992年被Microsoft公司推出,AVI是非编中最常用的视音文件格式,可以被称为影音格式的鼻祖。
它的英文全称为Audio Video Interleaved,即音频视频交错格式,所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。
这种视频格式的优点是图像质量好,可以跨越多平台使用,其缺点是体积过于庞大,而且更糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频。
在我们的非编中,不论早期的DVStorm还是现如今的EDIUS所使用的视频文件都是AVI 格式,因为它兼容性好,调用方便,图像质量好。
另外还有DV-AVI格式(摄像机采集常用),DV的英文全称是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。
目前非常流行的数码摄像机就是使用这种格式记录视频数据的。
它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。
这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI 格式。
(2)、MPEG格式:它的英文全称为Moving Picture Expert Group,即运动图像专家组,家里常看的VCD、SVCD、DVD就是这种格式。
MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息而达到高压缩比的目的,当然这是在保证影像质量的基础上进行的。
MPEG的平均压缩比为50∶1,最高可达200∶1,压缩效率之高由此可见一斑。
MPEG已成功应用于电视节目存储、传输和播出领域。
目前MPEG格式有三个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4。
电脑音频编码格式介绍选择适合你的格式随着科技的不断发展,电脑音频编码格式成为我们日常生活中不可或缺的一部分。
音频编码格式的选择对于我们使用电脑、手机、平板等设备来播放音频文件所产生的影响非常重要。
本文将介绍几种常见的电脑音频编码格式并分享一些选择适合个人需求的技巧。
一、无损音频编码格式1. WAV(Waveform Audio File Format)WAV是一种无损音频编码格式,它以其高音质和对音频数据的准确性而闻名。
WAV文件通常较大,因为它们没有经过任何压缩处理,但其音质优秀。
尤其适合那些追求高保真音质的专业音频工作者。
2. FLAC(Free Lossless Audio Codec)FLAC是一种免费的无损音频编码格式,其压缩率较高,能够将音频文件压缩至原始文件大小的一半或更小。
FLAC文件不损失音频质量,但同时也保留了足够的空间,可供音频编辑和后期处理使用。
对于音频发烧友以及需要经常编辑音频文件的个人用户而言,FLAC是一个不错的选择。
二、有损音频编码格式1. MP3(MPEG Audio Layer-3)MP3是一种有损音频编码格式,它选择性地删除人耳听觉上不敏感的音频内容,从而实现了对音频文件的压缩。
MP3文件较小,适合用于网络传输和存储,同时也在各种设备上广泛使用。
然而,由于其压缩算法的特性,MP3会损失一些细节和音频质量。
2. AAC(Advanced Audio Coding)AAC是一种高效的有损音频编码格式,它提供了更好的音频质量和更低的比特率(音频数据传输速率)。
与MP3相比,AAC在相同比特率下能够提供更好的音质。
由于其优质的音频表现,AAC已成为许多移动设备和音频播放器的首选格式。
三、选择适合个人需求的音频编码格式的技巧1. 根据存储空间进行选择如果您拥有较大的存储空间并且追求最高的音频质量,无损音频编码格式如WAV或FLAC是较好的选择。
如果您的存储空间有限,可以考虑使用有损音频编码格式如MP3或AAC来节省空间。
mmdb格式介绍摘要:一、MMDB格式简介二、MMDB文件结构与组成三、MMDB格式应用场景四、MMDB格式优缺点五、MMDB格式与其他音频格式的比较六、如何将文件转换为MMDB格式七、如何使用MMDB格式播放器八、总结正文:【一、MMDB格式简介】MMDB(MPEG-4 Audio Lossless)是一种无损音频编码格式,由德国Fraunhofer IIS研发。
它主要用于存储和传输高品质音频,尤其在高清音频领域具有广泛的应用。
MMDB格式支持高比特率、多声道和环绕声,能够提供出色的音质。
【二、MMDB文件结构与组成】MMDB文件采用标准的MPEG-4文件结构,包含文件头和数据块。
文件头包含文件版本、编码器信息、容器格式等信息。
数据块包含音频数据和元数据,如采样率、比特深度、声道数等。
【三、MMDB格式应用场景】MMDB格式适用于各类音频录制、编辑和播放场景,尤其适合高清视频、数字广播和音乐制作等领域。
由于其无损特性,MMDB格式广泛应用于音频发烧友和专业音频工程师之间。
【四、MMDB格式优缺点】优点:1.无损压缩,音质损失小;2.高质量音频再现,适合专业应用;3.兼容多种设备和支持多声道;4.高效传输和存储。
缺点:1.文件较大,占用存储空间;2.编码和解码速度较其他格式慢;3.兼容性较差,部分设备和支持软件不支持。
【五、MMDB格式与其他音频格式的比较】1.与MP3格式相比,MMDB具有更高的音质和无损特性;2.与WAV格式相比,MMDB格式在提供相同音质的情况下,文件体积更小;3.与FLAC格式相比,MMDB格式具有更好的兼容性和更广泛的应用场景。
【六、如何将文件转换为MMDB格式】要将音频文件转换为MMDB格式,可以使用专业音频转换软件如Adobe Audition、Audacity等。
用户只需导入音频文件,选择MMDB格式输出,并根据需求设置采样率、比特深度等参数。
【七、如何使用MMDB格式播放器】要播放MMDB格式音频,需要使用支持MMDB格式的播放器。
音乐格式五花八门,多如牛毛,但不外乎分为两大类:一类为音乐指令文件(如MIDI),一般由音乐创作软件制作而成,它实质上是一种音乐演奏的命令,不包括具体的声音数据,故文件很小;另一类为声音文件,是通过录音设备录制的原始声音,其实质上是一种二进制的采样数据,故文件较大。
从播放形式上,声音文件还可以分为“音频流”和“非音频流”两种,前者能够一边下载一边收听,比如“.WMA”、“.RA”、“.MOV”等,后者则不能。
所谓流媒体技术就是把连续的影像和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不需要等整个压缩文件全部下载到自己机器后才可以观看的技术。
下面,将各种音乐文件的格式收集整理如下:流式音频:Windows Media Audio(WMA)WMA就是Windows Media Audio的缩写,是微软自己开发的Windows Midea Audio技术。
它和Windows Midea Video一样,经历了几代改良后,变得非常出色。
比起老掉牙的MP3压缩技术,WMA无论从技术性能(支持音频流)还是压缩率(比MP3高一倍)都远远把MP3抛在后面了。
据微软声称,用它来制作接近CD品质的音频文件,其体积仅相当于MP3的1/3。
在48Kbps的传送速率下即可得到接近CD品质(Near -CD Quality)的音频数据流,在64Kbps的传送速率下可以得到与CD相同品质的音乐,而当连接速率超过96Kbps后则可以得到超过CD 的品质。
流式音频:RealMedia(RA/RM/RAM)RealMedia采用的是RealNetworks公司自己开发的Real G2Codec,它具有很多先进的设计,例如,SVT(Scalable Video Technology),该技术可以让速度较慢的电脑不需要解开所有的原始图像数据也能流畅观看节目;双向编码(Two-Encoding)技术类似于VBR,它可通过预先扫描整个影片,根据带宽的限制选择最优化压缩码率。
RealMedia音频部分采用的是RealAudio,它具有21种编码方式,可实现声音在单声道、立体声音乐不同速率下的压缩。
流式音频:QuickTime(MOV)QuickTimeApple的QuickTime是最早的视频工业标准,在1999年发布的QuickTime4.0版本后开始支持真正的实时播放,其格式为“.mov”。
它的视频压缩部分采用Sorenson Video技术,该技术支持VBR(Variable Bit Rate),也就是我们常说的动态码率,它可以动态地分配带宽以尽可能小的文件获得最好的播放效果,并能使在解压缩时获得平滑流畅的画面。
音频部分QuickTime采用一种名为QDesiglMusic的技术,据说是一种比MP3更好的音频流技术。
VQFVQF即TwinVQ(Transform-domain Weighted Interleave VectorQuantization),是由NTT(Nippon Telegraph and Telephone)与Yamaha共同开发的一种音频压缩技术。
VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到18:1左右甚至更高。
也就是说把一首4分钟的歌曲(WAV文件)压成MP3,大约需要4MB左右的硬盘空间,而同一首歌曲,如果使用VQF音频压缩技术的话,那只需要2MB左右的硬盘空间。
因此,在音频压缩率方面,MP3和RA都不是VQF的对手。
如此之高的压缩率是否会影响音质呢?实际聆听的结果告诉我们——不会。
当VQF以44KHz、80kbit/s的音频采样率压缩音乐时,它的音质优于44KHz、128kbit/s的MP3,当VQF以44KHz、96kbit/s的频率压缩时,它的音质几乎等于44KHz、256kbit/s的MP3!经SoundVQ 压缩后的音频文件在进行回放效果试听时,几乎没有人能听出它与原音频文件的差异。
AIFF(AIF/AIFF)AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是Apple公司开发的一种声音文件格式,被Macintosh平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI及其它专业音频软件包也同样支持AIFF格式。
AIFF支持ACE2、ACE8、MAC3和MAC6压缩,支持16位44.1kHz立体声。
Audio(AU)Audio文件是Sun微系统公司推出的一种经过压缩的数字声音格式。
AU文件原先是UNIX操作系统下的数字声音文件。
由于早期Internet 上的Web服务器主要是基于UNIX的,所以.AU格式的文件在如今的Internet中也是常用的声音文件格式,Netscape Navigator浏览器中的LiveAudio也支持Audio格式的声音文件。
Voice(VOC)Voice文件是新加坡著名的多媒体公司Creative Labs开发的声音文件格式,多用于保存Creative Sound Blaster系列声卡所采集的声音数据,被Windows平台和DOS平台所支持,支持CCITTA Law和CCITT μLaw等压缩算法。
在DOS程序和游戏中常会遇到这种文件,它是随声卡一起产生的数字声音文件,它与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
Module(MOD、S3M、XM、MTM、FAR、KAR、IT)模块(Module)格式同时具有MIDI与数字音频的共同特性——既包括如何演奏乐器的指令,又保存了数字声音信号的采样数据。
因此,其声音回放质量对音频硬件的依赖性较小,也就是说,在不同的机器上可以获得基本相似的声音回放质量。
模块文件根据不同的编码方法有MOD、S3M、XM、MTM、FAR、KAR、IT等多种不同格式。
MIDI(MID/CMF/RMI)MIDI是乐器数字接口(Musical Instrument Digital Interface)的英文缩写,是数字音乐/电子合成乐器的统一国际标准。
MIDI规范由美、日几家著名电子乐器厂商于1983年共同制定,目的是解决各种电子乐器间存在的兼容性问题。
MIDI规范不仅定义了电脑音乐程序、音乐合成器及其它电子音乐设备交换音乐信号的方式,而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,能很容易地模拟钢琴、小提琴等传统乐器的声音。
MIDI本身并不能发出声音,它是一个协议,只包含用于产生特定声音的指令,而这些指令则包括调用何种MIDI 设备的音色、声音的强弱及持续的时间等。
电脑把这些指令交由声卡去合成相应的声音(如依指令发出钢琴声或小提琴声等)。
最初,因为不同MIDI设备的乐器音色排列方法不一,所以会造成同一MIDI文件在不同的设备上会出现完全不同的放音效果(比如一个钢琴音色的MIDI文件,在不同设备上播放时会变成小提琴或者小号的音色)。
为避免出现这种混乱情况,GM(General MIDI,通用MIDI)标准被提出并得到了Windows操作系统的支持,得到了相当广泛的应用。
它规定了前128种常用乐器音色的编排方式,例如1号是钢琴、66号是萨克斯管等等。
GM标准还描述了成为GM兼容格式的硬件设备应具有的其它特征,如GM标准音源同时发音数不少于24,MIDI通道为16,第10通道为打击乐声部等等,它实际上是对MIDI规范的补充。
Roland公司提出的GS标准在兼容GM标准的基础上,对其进行了发展,增强了音乐的表现力——它提供比GM标准数量更多的打击乐器组和更多的特殊音效。
GS标准具有广泛的软硬件适应性,包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等。
后来,Yamaha公司又提出了基于GM标准的XG标准。
相对于保存真实采样数据的声音文件,MIDI文件显得更加紧凑,其文件的大小要比WAV文件小得多——一分钟的WAV文件约要占用10MB的硬盘空间,而一分钟的MIDI却只有区区的3.4KB。
现在,MIDI已经成为电脑音乐的代名词。
电脑播放MIDI文件时,有两种方法合成声音:FM合成和波表合成。
FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出来产生声音。
采用波表合成技术可以产生更逼真的声音。
MIDI文件有几个变通的格式,其中CMF文件是随声卡一起使用的音乐文件,与MIDI文件非常相似,只是文件头略有差别;另一种MIDI 文件是Windows使用的RIFF文件的一种子格式,称为RMID,扩展名为RMI。
声音波形文件(WAV)由Microsoft公司开发的一种WAV声音文件格式,是如今电脑上最为常见的声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。
Wave格式支持MSADPCM、CCITTALaw、CCITTμLaw和其它压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大(一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间),所以不适合长时间记录。
MPEC音频文件(MP1/MP2/MP3)MPEG(Moving Picture Experts Group,活动图像专家组)代表的是MPEG活动影音压缩标准,MPEG音频文件指的是MPEG标准中的声音部分,即MPEG音频层(MPEG Audio Layer)。
MPEG音频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer1/2/3),分别与MP1、MP2和MP3这三种声音文件相对应。
MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。
因此,目前Internet上的音乐格式以MP3最为常见。
MP3为降低声音失真采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。
MP4MP3问世不久,就凭着较高的压缩比(12:1)和较好的音质创造了一个全新的音乐领域。